• 软考2021高级架构师下午案例分析第4题:关于反规范化设计、数据不一致问题


    【说明】

    ​ 某医药销售企业因业务发展,需要建立线上药品销售系统,为用户提供便捷的互联网药品销售服务、该系统除了常规药品展示、订单、用户交流与反馈功能外,还需要提供当前热销产品排名、评价分类管理等功能。

    ​ 通过对需求的分析,在数据管理上初步决定采用关系数据库(MySQL)和数据库缓存(Redis)的混合架构实现。

    ​ 经过规范化设计之后,该系统的部分数据库表结构如下所示:

    ​ 供应商(供应商ID,供应商名称,联系方式,供应商地址);

    ​ 药品(药品ID,药品名称,药品型号,药品价格,供应商ID);

    ​ 药品库存(药品ID,当前库存数量);

    ​ 订单(订单号码,药品ID,供应商ID,药品数量,订单金额)。

    【问题1】

    ​ 在系统初步运行后,发现系统数据访问性能较差。经过分析,刘工认为原来数据库规范化设计之后,关系表过于细分,造成了大量的多表关联查询,影响了性能。例如当用户查询商品信息时,需要同时显示该药品的信息、供应商的信息、当前库存等信息。

    ​ 为此,刘工认为可以采用反规范化设计来改造药品关系的结构,以提高查询性能。修改后的药品关系结构为:

    ​ 药品(药品ID,药品名称,药品型号,药品价格,供应商ID,供应商名称,当前库存数量);

    ​ 请用 200 字以内的文字说明常见的反规范化设计方法,并说明用户查询商品信息应该采用哪种反规范化设计方法。

    答案:

    常见反规范化技术如下:

    (1)增加冗余列:在多个表中保留相同的列,通过增加数据冗余减少或避免查询时的连接操作。

    (2)增加派生列:在表中增加可以由本表或其他表中数据计算生成的列,减少查询时的连接操作并避免计算或使用集合函数。

    (3)重新组表:如果许多用户需要查看两个表连接出来的结果数据,则把这两个表重新组成一个表来减少连接而提高性能。

    (4)水平分表:根据一列或多列数据的值,把数据放到多个独立的表中,主要用于表数据规模很大、表中数据相对独立或数据需要存放到多个介质上时使用。

    (5)垂直分割表:对表进行分割,将主键与部分列放到一个表中,主键与其他列放到另一个表中,在查询时减少 I/O 次数。

    用户查询商品信息采用的是增加冗余列的方式。

    【问题2】

    ​ 王工认为,反规范化设计可提高查询的性能,但必然会带来数据的不一致性问题。请用 200 字以内的文字说明在反规范化设计中,解决数据不一致性问题的三种常见方法,并说明该系统应该采用哪种方法。

    答案:

    解决数据不一致性问题的三种常见方法:批处理维护、应用逻辑、触发器。

    (1)批处理维护:指对复制列或派生列的修改积累一定的时间后,运行一批处理作业或存储过程对复制或派生列进行修改,这只能在对实时性要求不高的情况下使用。

    (2)应用逻辑:要求必须在同一事务中对所有设计的表进行增、删、改操作。用应用逻辑来实现数据的完整性风险较大,因为同一逻辑必须在所有的应用中使用和维护,容易遗漏,特别是在需求变化时,不易于维护。

    (3)触发器:对数据的任何修改立即触发对复制列或派生列的相应修改。触发器是实时的,而且相应的处理逻辑只在同一地方出现,易于维护。一般来说,是解决这类问题比较好的办法。

    该系统应该采用触发器。

    【问题3】

    ​ 该系统采用了 Redis 来实现某些特定功能(如当前热销药品排名等),同时将药物关系数据放到内存以提高商品查询的性能,但必然会造成 Redis 和 MySQL 的数据实时同步问题。

    (1)Redis 的数据类型包括 String、Hash、List、Set 和 ZSet 等,请说明实现当前热销药品排名的功能应该选择哪种数据类型。

    (2)请用 200 字以内的文字解释说明解决 Redis 和 MySQL 数据实时同步问题的常见方案。

    答案:

    (1)ZSet

    (2)一、对强一致要求比较高的,应采用实时同步方案,即查缓存查不到再去 DB 查询,然后保存到缓存;更新缓存时,先更新数据库,再将缓存的设置过期(建议不要去更新缓存内容,直接设置过期)。

    二、对于并发程度较高的,可采用异步队列的方式同步,可采用 kafka 等消息中间件处理消息生产和消费。

    三、使用阿里的同步工具 cannal,cannal 实现方式是模拟 mysql slave 和 master 的同步机制,监控 DB binlog 的日志更新来触发缓存的更新,此种方法可以解放程序员双手、减少工作量,但再使用时有些局限性。

    四、采用 UDF 自定义函数的方式,面对 mysql 的 API 进行编程,利用触发器进行缓存同步。

    (补充:UDF(User-Defined Function)用户定义函数,用于在数据库中自定义函数使用。)

    整理完毕,完结撒花~

  • 相关阅读:
    CCF刷题计划——训练计划(反向拓扑排序)
    携手并进 | 云畅科技与华商智造院签署战略合作协议
    【中移芯昇】5. spi接口测试tf卡
    python可视化分析(六)-绘制发散型柱状图
    python开发之个人微信号的二次开发
    PyTorch合集2
    智能井盖的工作原理是什么?万宾科技智能井盖传感器效果
    Python中定义Mittag-Leffler函数
    知名工业企业代表团赴实在智能交流,共同推动企业数字化转型
    智云谷再获AR HUD新项目定点,打开HUD出口海外新通道
  • 原文地址:https://blog.csdn.net/qq_33204709/article/details/127838030