Redis计数在新浪微博的应用

jopen 11年前

　　微博业务的迅速发展，对基础架构层面的要求也越来越高。新浪作为国内最早使用 redis，并且是国内最大的 redis 使用者，在 redis 的使用上，也在逐步优化和提高。

　　作为微博中一项重要的数据，计数类业务在微博业务中占的比重和重要性逐步提高。计数结果的准确度直接影响用户体验，并且很容易引起用户的投诉。在计数业务上，在不断的优化和改进中，我们主要经历了以下三个阶段：

　　初级阶段

　　从 2010 年开始，使用 redis-2.0 版本。在最初业务数据比较少的时候，表现相当不错。但随着数据量和请求量的不断增加，一些问题逐渐暴露出来。

主从同步问题

首先遇到的是主从的同步问题。它的原理是当 master 接收到 slave 的同步请求后，把内存的数据 fork 出一个子进程 dump 出来，形成 rdb 文件，然后传到 slave，slave 再把这个文件加载到内存，之后的增量更新由 master 在执行完每条修改命令后立即同步给 slave。在网络出现问题时，比如瞬断，会导致 slave 里的数据全部重传。对单个端口来说，如果数据量小，那么这个影响不大，而如果数据量比较大的话，就会导致网络流量暴增，同时 slave 在加载 rdb 时无法响应任何请求。
持久化问题

计数业务中多数使用 redis 作为存储，因此都开启了 aof，并配置为每秒做一次 fsync 操作将写操作刷新到磁盘。随着 aof 的增长，需要定期 rewrite。Rewrite 的机制和生成 rdb 的过程类似，都是 fork 出一个子进程来完成的，子进程对于磁盘的持续写入会导致父进程的 fsync 操作阻塞，造成大量请求超时。
版本升级问题

由于 redis 在使用初期 bug 较多，版本迭代频繁，而版本升级需要关闭 redis 进程并重新加载 aof。对于大量使用 redis 的微博业务来讲，这样的升级成本也越来越难以承受。
内存使用问题

2. 0 版本的 redis，在内存使用上相对比较粗放，对于计数这样一个简单的 key-value，占用的内存达到 100 字节以上，存在比较多的优化空间。

　　进阶阶段

　　针对 redis 使用初期存在的问题，我们逐个进行了改进。主从复制参考 mysql 的同步方式，使用 rdb+aof 结合的方式，解决了网络瞬断引起的重传问题，同时限制子进程做后台 dump 时对磁盘的写入，期间暂停主进程的 fsync 操作，解决了慢请求的问题。

　　针对计数业务，我们开发了专用的版本 redisscounter，单个 key-value 占用的内存 key 的长度加 4 个字节的 value，将内存的使用量降低到原来的1/4 以下。通过预先分配内存数组和 double hash 技术，消除了 redis 中 hash 表的大量指针开销。

　　对于版本升级的问题，我们将 redis 的核心处理逻辑封装到动态库，内存中的数据保存在全局变量里，通过外部程序来调用动态库里的相应函数来读写数据。版本升级时只需要替换成新的动态库文件即可，无须重新载入数据。通过这样的方式，版本升级只需执行一条指令，即可在毫秒级别完成代码的升级，同时对客户端请求无任何影响。

　　有了上面的改进后，新版本开始大量应用，多数业务都可以作为完整的存储替代以前的 mysql+memcached 组合。对于微博的评论数和转发数，由于微博条目不断增加，无法保存全量数据，因此采用 mysql+redisscounter 组合的方式，mysql 保存全量数据，使用两组 redisscounter 保存最近几个月的热数据，通过定期滚动两组 redisscounter 里的数据来清理冷数据。

　　高级阶段

　　随着微博的发展，针对单条微博的计数也不断增加，从原来的评论数、转发数，又增加了表态数，2013 年还上线了阅读数。Redisscounter 不能很好的解决这类扩展问题，同时上面的 mysql+redisscounter 的滚动方式也过于复杂，定期的滚动操作很容易出现问题。针对这类问题，我们再度做出改进，将 key 由原先的字符串改成微博 id，同时对于每条微博的评论转发等计数，我们统计发现，绝大多数微博的计数都可以用 10~15 个 bit 来保存，因此可以将多个计数保存到一个 4 字节的 value 里，过大的计数值在内存中另外开辟一块空间来保存。这样通过一条 get 命令即可获取该微博的所有计数。同时针对微博业务的特点，越老的微博被访问的次数就会越少，在内存使用多个数组保存不同范围的微博，内存不足时将最老的一组微博 dump 到 ssd 上，内部自动实现的滚动可以保证热微博全部在内存里。对于落到 ssd 上的老数据的访问，通过异步的 io 线程来读写，经过这样的改进后，去掉了原先的 mysql 存储，降低了业务开发成本和运维成本。

　　从 redis 在计数业务上的发展经历可以看出，技术的进步是由业务的需求推动的。随着业务的发展，还会遇到更多新的挑战。希望我们走过的这些改进之路对于读者在使用 redis 的过程中能有所帮助。

来自: InfoQ

Redis计数在新浪微博的应用

相关资讯