缓存架构设计

chensi

2017-09-14

缓存架构设计

需求分析

缓存是一种提高系统读性能的常见技术，对于读多写少的应用场景，我们经常使用缓存来进行优化。

例如对于用户的余额信息表account(uid, money)，业务上的需求是：

查询用户的余额，SELECT money FROM account WHERE uid=XXX，占99%的请求
更改用户余额，UPDATE account SET money=XXX WHERE uid=XXX，占1%的请求

缓存架构设计
由于大部分的请求是查询，我们在缓存中建立uid到money的键值对，能够极大降低数据库的压力。

读操作流程

有了数据库和缓存两个地方存放数据之后（uid->money），每当需要读取相关数据时（money），操作流程一般是这样的：

读取缓存中是否有相关数据，uid->money
如果缓存中有相关数据money，则返回【这就是所谓的数据命中“hit”】
如果缓存中没有相关数据money，则从数据库读取相关数据money【这就是所谓的数据未命中“miss”】，放入缓存中uid->money，再返回

缓存的命中率 = 命中缓存请求个数/总缓存访问请求个数 = hit/(hit+miss)

上面举例的余额场景，99%的读，1%的写，这个缓存的命中率是非常高的，会在95%以上。

问题

当数据money发生变化的时候：

是更新缓存中的数据，还是淘汰缓存中的数据呢？
是先操纵数据库中的数据再操纵缓存中的数据，还是先操纵缓存中的数据再操纵数据库中的数据呢？
缓存与数据库的操作，在架构上是否有优化的空间呢？

更新缓存 VS 淘汰缓存

什么是更新缓存：数据不但写入数据库，还会写入缓存
什么是淘汰缓存：数据只会写入数据库，不会写入缓存，只会把数据淘汰掉

更新缓存的优点：缓存不会增加一次miss，命中率高
淘汰缓存的优点：简单

选择的关键：更新缓存的复杂度

情况一：只是简单的把余额money设置成一个值

淘汰缓存的操作为deleteCache(uid)
更新缓存的操作为setCache(uid, money)

更新缓存的代价很小，此时我们应该更倾向于更新缓存，以保证更高的缓存命中率。

情况二：如果余额是通过很复杂的数据计算得出来的，例如业务上除了账户表account，还有商品表

product，折扣表discount

account(uid, money)

product(pid, type, price, pinfo)

discount(type, zhekou)

业务场景是用户买了一个商品product，这个商品的价格是price，这个商品从属于type类商品，type类商品在做促销活动要打折扣zhekou，购买了商品过后，这个余额的计算就复杂了，需要：

先把商品的品类，价格取出来：SELECT type, price FROM product WHERE pid=XXX
再把这个品类的折扣取出来：SELECT zhekou FROM discount WHERE type=XXX
再把原有余额从缓存中查询出来money = getCache(uid)
再把新的余额写入到缓存中去setCache(uid, money-price*zhekou)

更新缓存的代价很大，此时我们应该更倾向于淘汰缓存。

建议

淘汰缓存操作简单，并且带来的副作用只是增加了一次cache miss，建议作为通用的处理方式。

先操作数据库 vs 先操作缓存

这个比较主要是针对写操作的，最根本性的问题就是保证数据的一致性，因为操作数据库和缓存不是原子性的，所以一旦中间出现什么错，有可能会导致数据不一致的情况，就要从下面情况来细说：

add数据时，应该先写数据库，还是先写缓存？
update数据时，如果选择淘汰cache，应该先更新数据库还是缓存？
update数据时，如果选择更新cache，应该先更细数据库还是缓存？

add数据时，怎么选择？

很显然，这是啥先写数据库，然后再写缓存，即使后面写缓存失败，顶多出现一次cache miss，最起码数据库已经持久化了；如果反过来，一旦写数据失败，那么缓存将会是脏数据，除非自己加上写缓存失败时，delete掉数据库的数据，这样太麻烦了。

update数据时，选择淘汰cache，那应该先更新哪个？

记住这个准则，如果出现不一致，谁先做对业务的影响较小，就谁先执行。下面对两种情况进行业务上的比较：

假设先写数据库，再淘汰缓存：第一步写数据库操作成功，第二步淘汰缓存失败，则会出现DB中是新数据，Cache中是旧数据，数据不一致。

缓存架构设计

假设先淘汰缓存，再写数据库：第一步淘汰缓存成功，第二步写数据库失败，则只会引发一次Cache miss。

缓存架构设计
结论

先淘汰缓存，再写数据库。

update数据时，选择更新cache，那应该先更新哪个？

细想，无论是先更新数据库再更新缓存，还是先更新缓存再更新数据库，一旦后面的操作失败，都有可能出现数据不一致。所以，根据上面的解决方法，进行了改进：

情况一：更新或新增缓存代价比较大

先删除缓存
然后更新数据库
等下次查询时，首先cache miss，查询出数据后再增加缓存

情况二：更新或新增缓存代价小

先删除缓存
然后更新数据库
再将新数据新增到缓存

情况三：如果缓存服务器很稳定，基本上能够保证修改或查询不会出问题

更新数据库
然后更新缓存

缓存架构优化

前面提到的缓存架构有一个缺点：业务方需要同时关注缓存与DB，有没有进一步的优化空间呢？有两种常见的方案，一种主流方案，一种非主流方案。

主流优化方案

服务化：加入一个服务层，向上游提供帅气的数据访问接口，向上游屏蔽底层数据存储的细节，这样业务线不需要关注数据是来自于cache还是DB。

缓存架构设计

非主流方案

异步缓存更新：业务线所有的写操作都走数据库，所有的读操作都总缓存，由一个异步的工具来做数据库与缓存之间数据的同步，具体细节是：

缓存架构设计

要有一个init cache的过程，将需要缓存的数据全量写入cache
如果DB有写操作，异步更新程序读取binlog，更新cache

在（1）和（2）的合作下，cache中有全部的数据，这样：

业务线读cache，一定能够hit（很短的时间内，可能有脏数据），无需关注数据库
业务线写DB，cache中能得到异步更新，无需关注缓存

缺点

这样将大大简化业务线的调用逻辑，存在的缺点是，如果缓存的数据业务逻辑比较复杂，async-update异步更新的逻辑可能也会比较复杂。

架构设计缓存 font-size 数据库

chensi

0 关注 0 粉丝 0 动态

相关推荐

13张IT架构图！从数字化转型，到数据架构

今天给大家上13个架构图，不说一些文字。我一直觉得，从架构图上可以学到很多东西，这相比于文字更能理解，而且很多人在做事的时候，是想不清楚具体要怎么做的，都是一开始直接上手，然后后面也不知道怎么改。这篇文章，是我在读了2本书之后，哪2本书呢？是《IT结构治理

evolone 2020-10-29

什么是真正的架构设计？十年Java经验让我总结出了这些，不愧是我

在软件行业，对于什么是架构，都有很多的争论，每个人都有自己的理解。此君说的架构和彼君理解的架构未必是一回事。因此我们在讨论架构之前，我们先讨论架构的概念定义，概念是人认识这个世界的基础，并用来沟通的手段，如果对架构概念理解不一样，那沟通起来自然不顺畅。

yinren 2020-03-11

软件架构设计分层模型和构图思考

对于架构思维本身仍然是类似系统思维，结构化思维，编程思维等诸多思维模式的一个合集。由于架构的核心作用是在业务现实世界和抽象的IT实现之间建立起一道桥梁，因此架构思维最核心的就是要理解到业务驱动技术，技术为最终的业务服务。要真正通过架构设计来完成业务和技术，

rise 2020-11-22

10个微服务架构设计的最佳实践

微服务极大的改变了服务端引擎的架构方式。微服务不是一个单一的巨型的用来托管应用程序所有业务逻辑的代码库，而是反映了分布式系统模型，在该模型中，一组应用程序组件协同工作来满足业务需求。通过遵循十项基本的微服务最佳实践，你可以实现一个高效的微服务生态系统，从而

DreamDev 2020-08-07

Kubernetes架构设计与核心组件工作流

Kubernetes是谷歌开源的容器编排引擎，架构和设计思想来源于谷歌内部使用调度工具——Borg。Borg是谷歌一个久负盛名的的内部使用的大规模集群管理系统，它基于Linux Container技术，提供了面向应用的容器集群部署和管理系统。Kubern

niyuelin0 2020-08-06

从架构到流程

架构设计师从主体问题出发、整体出发，进行整体的切分与沟通机制的建立，而建立的顶层结构即架构。架构中需要有主体、对象及对象交换机制等。做架构设计是为了降低人们对复杂系统的认识，方便沟通，其次做架构是为了分工合作。架构设计任务就是为了划分模块，设计模块交互方式

jiangziya 2020-07-18

一次教科书级别的Redis高可用架构设计实践

Redis Server 节点：每个节点有一主一从两个实例，多个节点组成一份完整的集群数据，其中每个节点只有主库对外提供服务，从库仅仅用于节点高可用、数据持久化及定时备份。Zookeeper 集群：由五个 zk 节点组成，Redis 集群配置变更后，通知客

有梦就能飞 2020-07-14

Java互联网安全项目架构设计第一篇

互联网安全项目架构设计。这次是自己从零开始搭建一个后台项目，所有的架构设计都是自己设计的。这次从中学到了很多，我记录一下。在开始设计之前，肯定是需要看需求文档的。必须是琢磨清楚之后，再做设计。

helencoder 2020-06-26

浅谈一下可扩展性网站架构设计

扩展性-指对现有系统影响最小的情况下，系统功能可持续扩展或者提升的能力，表现在系统基础设施稳定不需要经常变更，应用之间较少依赖和耦合，对需求变更可以敏捷响应。它是系统架构设计层面的开闭原则，架构设计考虑未来功能扩展，当系统增加新功能时，不需要对现有系统的结

mikesno 2020-06-17

一线架构师阅读指南-阅读感想02

通过第一次阅读我对什么是架构，什么是概念架构和细化架构有了更加深入的了解。在课上又通过老师的实例讲解让我有了很大的启发。其中“3个阶段”是指预备架构阶段、概念架构阶段、细化架构阶段，“1个贯穿环节”是指对非功能目标的考虑。

架构技术交流 2020-06-11

Kafka的生产者优秀架构设计

Kafka 是一个高吞吐量的分布式的发布订阅消息系统，在全世界都很流行，在大数据项目里面使用尤其频繁。笔者看过多个大数据开源产品的源码，感觉 Kafka 的源码是其中质量比较上乘的一个，这得益于作者高超的编码水平和高超的架构设计能力。

mbcsdn 2020-06-04

Kafka的生产者优秀架构设计

Kafka 是一个高吞吐量的分布式的发布订阅消息系统，在全世界都很流行，在大数据项目里面使用尤其频繁。笔者看过多个大数据开源产品的源码，感觉 Kafka 的源码是其中质量比较上乘的一个，这得益于作者高超的编码水平和高超的架构设计能力。

源码物语 2020-06-03

从概念到底层技术，一文看懂区块链架构设计！

区块链作为一种架构设计的实现，与基础语言或平台等差别较大。区块链是加密货币背后的技术，是当下与 VR 虚拟现实等比肩的热门技术之一，本身不是新技术，类似 Ajax，可以说它是一种技术架构，所以我们从架构设计的角度谈谈区块链的技术实现。无论你擅长什么编程语言

lookat 2020-05-29

架构设计 | 缓存管理模式，监控和内存回收策略

在业务系统中，查询时最容易出现性能问题的模块，查询面对的数据量大，筛选条件复杂，所以在系统架构中引入缓存层，则是非常必要的，用来缓存热点数据，达到快速响应的目的。所有缓存数据，必须设置过期时间；缓存层移除，不影响现有流程；归档数据不实时查询；基于消息消费服

yuanxiaogang 2020-05-27

细谈8种架构设计模式

我想这个问题，十个人回答得有十一个答案，因为另外的那一个是大家妥协的结果，哈哈，我理解，架构就是骨架。人类的身体的支撑是主要由骨架来承担的，然后是其上面的肌肉、神经、皮肤。架构对于软件的重要性不亚于骨架对人类身体的重要性。这样可以大大节省我们的设计时间，提

acaoye 2020-05-14

史上最强Dubbo面试28题答案详解：核心功能+服务治理+架构设计等

Dubbo 是一个分布式、高性能、透明化的 RPC 服务框架，提供服务自动注册、自动发现等高效服务治理方案，可以和 Spring 框架无缝集成。RPC 指的是远程调用协议，也就是说两个服务器交互数据。互联网的快速发展，Web应用程序的规模不断扩大，一般会

Iamthedoctor 2020-05-06

陈睿：架构设计之数据库拆分六大原则

比如淘宝中期开始的数据库端按照业务垂直拆分：按照业务交易数据库、用户数据库、商品数据库、店铺数据库等进行拆分。分库分表需要涉及到对应的SQL路由规则主库备库等，例如：淘宝设计了一套TDDL来解决这些问题，应用端只需配置对应的规则即可，对应用端的没有任何侵入

JavaWDB 2020-05-06

接触软件体系架构设计（三）

2008年进入CZ/XM，前后服务了近10年，非常感谢这家公司的包容和学习。最初一个产品，是属于SNS社交类型网站，典型的三层架构，就职时，服务于项目的DAL数据访问层的开发。Model，模型层，用于封装与应用程序的业务逻辑相关的数据以及对数据的处理方法。

IT小小鸟 2020-04-30

浅析流量洪峰下的云开发高可用架构设计

疫情期间，随着返岗复工人员大幅流动，疫情扩散传播风险巨大，疫情防控也面临新的严峻挑战。为了更好地统计流动人口信息，云南省公安厅面向社会公共场所推出“云南抗疫情”小程序，对公共场所的流动人口进行信息登记。二维码里面有单位及相关负责人的关联信息，人员进出公共场

caishancai 2020-04-22

硬核”实战分享：企业微服务架构设计及实施的六大难点剖析

现如今不管是传统企业还是互联网公司都在谈论微服务，微服务架构已经成为了互联网的热门话题，同时，微服务的开发框架比如Dubbo、SpringCloud等也是在高频迭代中，以满足层出不穷的技术需求。当企业遇到系统性能瓶颈、项目进度推进乏力、系统运维瓶颈的时候，

rise 2020-04-22

chensi

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号