新浪微博redis优化历程

下载 4

fishermen

发布于

2273

人观看

#信息技术

redis凭借超高的性能、丰富的数据结构被广泛使用，俨然成为国内外大中型互联网应用的标配。新浪微博从2010年底引入redis以来，也已构建了庞大的redis集群，目前新浪微博有近3700个redis实例，存储超过24T的数据，满足每天万亿+的读写请求。然而在实际生产中，redis也暴露出了不少问题，如运维的复杂性、内存冗余、容量瓶颈等，而且在不少场景中，redis当前的数据结构也无法满足业务需求。为此新浪微博根据业务发展的需要，不仅对redis做了不少优化与增强，而且基于redis做了一系列的扩展和改造，在满足实际生产对高可用性、运维性的苛刻要求的同时，满足海量数据（via ssd）、更丰富存储结构的需求。

展开查看详情

1 .新浪微博 redis 优化历程陈波 @fishermen

2 .大纲业务场景 Redis 存储架构演进一些经验 Q&A

3 .业务场景 - 业务 Redis 在新浪微博的应用计数 ( counter) 关系 (graph) 通知提醒

4 .业务场景 - 数据一些数据 6 IDC 500+ servers 3700+ instances 千亿条记录 24T+ 内存 7 千亿 cmds/ day 1.2 万亿 read/ day 2 千亿 write/day

5 .Redis 存储前时代

6 .Redis 前时代热数据 mc 全量落地 mysql 数据量不大： Graph mc 10G，计数器 mc 2G 开发速度

7 .问题出现 2010 年， Graph mc 3 0G+ ，峰值 10wTPS Mysql 成为瓶颈线程阻塞，访问卡顿 List 类型业务不适合 mysql 新的关系计算需求实现困难大量关系计算：从 MC 取全量 + 本地计算 -> 超时

8 .解决方案初期方案增大 mc 容量到 4 0G，Graph db 增至一主六从监控并及时清理僵死线程关系计算性能问题暂时无解最终方案引入 Redis 做 storage (graph/counter) 关系计算在redis实现 O(1) 促进更多复杂需求 Graph db 恢复一主三从

9 .小结项目初期 3 0G - 日PV5kw - 技术选型熟悉度拼的是开发速度产品需求与新技术相互促进

10 .Redis 存储初期

11 .Redis 初期 Redis 2.0 Graph 存 hash，40G 10w TPS ， 4 Server Counter: 2 0G 2w TPS，2 Server

12 .问题出现 2011 年，初期使用经验不足数据分片过少，扩容困难部分数据类型使用不当，内存超预期多业务混放，拆分不便可用性不够小业务初期没有slave， server 故障 服务异常大业务挂载 3-4 个 slave ，高峰期 write 超时，请求失败重启耗时， 10-20 分钟服务异常

13 .解决方案容量规划提前预估容量，上线前预拆足够的数据分片选择合适的数据类型，慎用 zset 业务独立存储，拒绝混放

14 .解决方案提高可用性所有 Redis 全部增加 Slave Master 挂载 slave 不超过 2 个，采用 M-S-S 方式挂载多 IDC 单 Master ，复制同步凌晨低峰升级，访问 IP  域名不完美，但基本可 work

15 .问题升级 2011 年底， Graph 1 00G + 灵异事件凌晨 3 点低峰期， redis 无征兆崩溃批量升级、扩容拆分，引发其他业务异常报警多个slave严重负载不均，请求数最大差1-2个数量级，峰值响应从不足1ms->3ms 在线版本增多最多 6 个版本 BUG 重复修复，运维困难

16 .问题分析崩溃：读写会用 pageCache ，导致redis进swap而崩溃其他服务报警：复制全量推送导致网络阻塞负载不均： client 通过域名访问，域名解析返回随机 ip ，结果连接不均衡，最终导致负载不均衡

17 .问题解决紧急方案超过物理内存 3/5  迁移端口错峰升级/ 扩容对网络仍然有一定冲击开发 ClientBalancer 组件，保持域名下 IP 连接均衡，负载均衡进一步优化方案：及时清理pagecache，减少对正常业务影响 Aof去掉rewrite，改用rotate 类似 mysql ，独立 IO 线程对rdb 、 aof转发复制（社区版p s ync , repl-backlog-size, repl-backlog-ttl）支持热升级，避免重启，提高可运维性 Others…

18 .小结小规模 50G 1 -2 个集群人肉运维中规模 100 G+ ， 3+ 集群可运维性 -> 重要开源组件 -> 熟悉架构实现

19 .Redis 存储爆发期

20 .Redis 存储爆发期完全增量复制在线热升级 SLAVE 均衡访问大量子业务切入单业务数百 G 稳定

21 .问题出现 2013 年， Graph海量规模数据T级，MS 十 T级数百台server ，而且还在快速增加 Graph 用 Hash 结构，存储效率不高

22 .问题出现 Counter 业务增加，增长迅猛日增：计数亿条内存 5G+ 总数据百 G 级， MS T 级 Feed请求计数近百倍读放大，高峰超时报警存储效率低 <30% 2013000001.cmt 360 2013000001.like 1000 2013000001.rep 800 2013000001.read 10000

23 .问题出现占用机器增加迅猛，成本合理性需要考虑部分机房机架饱和

24 .解决方案 Graph 定位： storage  cache 定制： hash  Longset Counter 定制 cdb，通过table分段存储计数一个KV存多个计数 2013000001.cmt 360 2013000001.like 1000 2013000001.rep 800 2013000001.read 10000 2013000001 800|360|1000|10000

25 .解决方案 Counter 存储结构 cdb=schema+tables 计数 double -hash寻址，消除冗余robj存储结构冲突过多aux_dict 数值过大extend_dict 多管齐下，节省数百台机器下线低配server ，寻找廉价新机房

26 .小结量变->质变，极端业务定制大规模集群 T 级 3 +idc 成本单个请求成本总拥有成本

27 .Redis 存储高速稳定期

28 .Redis 存储高速稳定期 Graph 定位 cache 定制longset 内存降为 1/10 性能接近 Counter 定制cdb 内存降为 1/5 - 性能增3-5倍

29 .Redis 存储高速稳定期继续定制 Counter 落地 SSD ，容量提升 20 倍， 8 个月  10 年 Vector Others…

2点赞

1收藏

4下载