如果是一读(线程B)一写(线程A)操作,「先操作缓存,再操作数据库」。流程图如下所示:
1.线程A发起一个写操作,第一步del cache
2.线程A第二步写入新数据到DB
3.线程B发起一个读操作,cache miss缓存失效了。
4.线程B从DB获取最新数据
5.线程B执行set cache,把从DB读到的数据,更新到缓存。
「这样看,没啥问题」。我们再看第二个流程图,如下:
1.线程A发起一个写操作,第一步del cache
2.此时线程B发起一个读操作,cache miss
3.线程B继续读DB,读出来一个老数据
4.然后老数据设置入cache
5.线程A写入DB最新的数据
OK,酱紫,就有问题了吧,老数据入到缓存了,「每次读都是老数据啦,缓存与数据与数据库数据不一致了」。
上个方案是一读一写,如果是双写操作,「先操作缓存,再操作数据库」,会怎么样呢?
1.线程A发起一个写操作,第一步set cache
2.线程A第二步写入新数据到DB
3.线程B发起一个写操作,set cache
4.线程B第二步写入新数据到DB
「这样看,也没啥问题。」,但是有时候可能事与愿违,我们再看第二个流程图,如下:
1.线程A发起一个写操作,第一步set cache
2.线程B发起一个写操作,第一步set cache
3.线程B写入数据库到DB
4.线程A写入数据库到DB
执行完后,缓存保存的是B操作后的数据,数据库是A操作后的数据,「缓存和数据库数据不一致」。
一写(线程A)一读(线程B)操作,「先操作数据库,再操作缓存」。
1.线程A发起一个写操作,第一步write DB
2.线程A第二步del cache
3.线程B发起一个读操作,cache miss
4.线程B从DB获取最新数据
5.线程B同时set cache
「有些朋友可能认为,在第2步删除缓存之前,线程B读过来呢?这时候,读到的是缓存老数据,这个可以认为是正常业务逻辑呀,下次再读取就是正确数据了。」
这种方案**「没有明显的并发问题」,但是有可能「步骤二删除缓存失败」,虽然概率比较小,「优于方案一和方案二」**,平时工作中也是使用方案三。
综上对比,我们一般采用方案三,但是有没有完美全解决方案三的弊端的方法呢?
这个是方案三的改进方案,都是先操作数据库再操作缓存,我们来看一下流程图:
通过数据库的**「binlog」来「异步淘汰key」,以mysql为例 可以「使用阿里的canal将binlog日志采集发送到MQ队列」里面,然后「通过ACK机制 确认处理」** 这条更新消息,删除缓存,保证数据缓存一致性。
但是呢还有个问题,「如果是主从数据库呢」?
主从DB问题:因为主从DB同步存在延时时间。如果删除缓存之后,数据同步到备库之前已经有请求过来时,「会从备库中读到脏数据」,如何解决呢?解决方案如下流程图:
综上所述,在分布式系统中,缓存和数据库同时存在时,如果有写操作的时候,「先操作数据库,再操作缓存」。如下:
既然选择这个行业,选择了做一个程序员,也就明白只有不断学习,积累实战经验才有资格往上走,拿高薪,为自己,为父母,为以后的家能有一定的经济保障。
学习时间都是自己挤出来的,短时间或许很难看到效果,一旦坚持下来了,必然会有所改变。不如好好想想自己为什么想进入这个行业,给自己内心一个答案。
面试大厂,最基本的就是夯实的基础,不然面试官随便一问你就凉了;其次会问一些技术原理,还会看你对知识掌握的广度,最重要的还是你的思路,这是面试官比较看重的。
最后,上面这些大厂面试真题都是非常好的学习资料,通过这些面试真题能够看看自己对技术知识掌握的大概情况,从而能够给自己定一个学习方向。包括上面分享到的学习指南,你都可以从学习指南里理顺学习路线,避免低效学习。
领取上述资料,只需点击这里即可免费下载
大厂Java架构核心笔记(适合中高级程序员阅读):
习指南里理顺学习路线,避免低效学习。
领取上述资料,只需点击这里即可免费下载
大厂Java架构核心笔记(适合中高级程序员阅读):