基本信息

编辑推荐
资深 Redis 技术专家撰写,深入了解 Redis 技术内幕的必读之作。 从源码角度解析 Redis 的架构设计、实现原理和工作机制,为高效使用 Redis 提供原理性指导。
内容简介
计算机书籍
《Redis设计与实现》全面而完整地讲解了Redis的内部机制与实现方式,对Redis的大多数单机功能以及所有多机功能的实现原理进行了介绍,展示了这些功能的核心数据结构以及关键的算法思想,图示丰富,描述清晰,并给出大量参考信息。通过阅读本书,读者可以快速、有效地了解Redis的内部构造以及运作机制,更好、更高效地使用Redis。
《Redis设计与实现》主要分为四大部分。第一部分“数据结构与对象”介绍了Redis中的各种对象及其数据结构,并说明这些数据结构如何影响对象的功能和性能。第二部分“单机数据库的实现”对Redis实现单机数据库的方法进行了介绍,包括数据库、RDB持久化、AOF持久化、事件等。第三部分“多机数据库的实现”对Redis的Sentinel、复制、集群三个多机功能进行了介绍。第四部分“独立功能的实现”对Redis中各个相对独立的功能模块进行了介绍,涉及发布与订阅、事务、Lua脚本、排序、二进制位数组、慢查询日志、监视器等。本书作者专门维护了www.redisbook.com网站,提供带有详细注释的Redis源代码,以及本书相关的更新内容。
作译者
目录
前言
致谢
第1章 引言 1
1.1 Redis版本说明 1
1.2 章节编排 1
1.3 推荐的阅读方法 4
1.4 行文规则 4
1.5 配套网站 5
第一部分 数据结构与对象
第2章 简单动态字符串 8
2.1 SDS的定义 9
2.2 SDS与C字符串的区别 10
2.3 SDS API 17
2.4 重点回顾 18
2.5 参考资料 18
第3章 链表 19
3.1 链表和链表节点的实现 20
3.2 链表和链表节点的API 21
3.3 重点回顾 22
前言
举个例子,假设huangz关注了peter、tom、jack三个用户,而john关注了peter、tom、bob、david四个用户,那么当huangz访问john的页面时,共同关注功能就会计算并打印出类似“你跟john都关注了peter和tom”这样的信息。
从集合计算的角度来看,共同关注功能本质上就是计算两个用户关注集合的交集,因为交集这个概念是如此的常见,所以我很自然地认为共同关注这个功能可以很容易地实现,但现实却给了我当头一棒:我所使用的关系数据库并不直接支持交集计算操作,要计算两个集合的交集,除了需要对两个数据表执行合并(join)操作之外,还需要对合并的结果执行去重复(distinct)操作,最终导致交集操作的实现变得异常复杂。
是否存在直接支持集合操作的数据库呢?带着这个疑问,我在搜索引擎上面进行查找,并最终发现了Redis。在我看来,Redis正是我想要找的那种数据库——它内置了集合数据类型,并支持对集合执行交集、并集、差集等集合计算操作,其中的交集计算操作可以直接用于实现我想要的共同关注功能。
得益于Redis本身的简单性,以及Redis手册的详尽和完善,我很快学会了怎样使用Redis的集合数据类型,并用它重新实现了整个用户关系模块:重写之后的关系模块不仅代码量更少,速度更快,更重要的是,之前需要使用一段甚至一大段SQL查询才能实现的功能,现在只需要调用一两个Redis命令就能够实现了,整个模块的可读性得到了极大的提高。
自此之后,我开始在越来越多的项目里面使用Redis,与此同时,我对Redis的内部实现也越来越感兴趣,一些问题开始频繁地出现在我的脑海中,比如:
Redis的五种数据类型分别是由什么数据结构实现的?
Redis的字符串数据类型既可以存储字符串(比如"hello world"),又可以存储整数和浮点数(比如10086和3.14),甚至是二进制位(使用SETBIT等命令),Redis在内部是怎样存储这些值的?
Redis的一部分命令只能对特定数据类型执行(比如APPEND只能对字符串执行,HSET只能对哈希表执行),而另一部分命令却可以对所有数据类型执行(比如DEL、TYPE和EXPIRE),不同的命令在执行时是如何进行类型检查的?Redis在内部是否实现了一个类型系统?
Redis的数据库是怎样存储各种不同数据类型的键值对的?数据库里面的过期键又是怎样实现自动删除的?
除了数据库之外,Redis还拥有发布与订阅、脚本、事务等特性,这些特性又是如何实现的?
Redis使用什么模型或者模式来处理客户端的命令请求?一条命令请求从发送到返回需要经过什么步骤?
为了找到这些问题的答案,我再次在搜索引擎上面进行查找,可惜的是这次搜索并没有多少收获:Redis还是一个非常年轻的软件,对它的最好介绍就是官方网站上面的文档,但是这些文档主要关注的是怎样使用Redis,而不是介绍Redis的内部实现。另外,网上虽然有一些博客文章对Redis的内部实现进行了介绍,但这些文章要么不齐全(只介绍了Redis中的少数几个特性),要么就写得过于简单(只是一些概述性的文章),要么关注的就是旧版本(比如2.0、2.2或者2.4,而当时的最新版已经是2.6了)。
综合来看,详细而且完整地介绍Redis内部实现的资料,无论是外文还是中文都不存在。意识到这一点之后,我决定自己动手注释Redis的源代码,从中寻找问题的答案,并通过写博客的方式与其他Redis用户分享我的发现。在积累了七八篇Redis源代码注释文章之后,我想如果能将这些博文汇集成书的话,那一定会非常有趣,并且我自己也会从中学到很多知识。于是我在2012年年末开始创作《Redis设计与实现》,并最终于2013年3月8日在互联网发布了本书的第一版。
尽管《Redis设计与实现》第一版顺利发布了,但在我的心目中,这个第一版还是有很多不完善的地方:
比如说,因为第一版是我边注释Redis源代码边写的,如果有足够时间让我先完整地注释一遍Redis的源代码,然后再进行写作的话,那么书本在内容方面应该会更为全面。
又比如说,第一版只介绍了Redis的内部机制和单机特性,但并没有介绍Redis多机特性,而我认为只有将关于多机特性的介绍也包含进来,这本《Redis设计与实现》才算是真正的完成了。
就在我考虑应该何时编写新版来修复这些缺陷的时候,机械工业出版社的吴怡编辑来信询问我是否有兴趣正式地出版《Redis设计与实现》,能够正式地出版自己写的书一直是我梦寐以求的事情,我找不到任何拒绝这一邀请的理由,就这样,在《Redis设计与实现》第一版发布几天之后,新版《Redis设计与实现》的写作也马不停蹄地开始了。
从2013年3月到2014年1月这11个月间,我重新注释了Redis在unstable分支的源代码(也即是现在的Redis 3.0源代码),重写了《Redis设计与实现》第一版已有的所有章节,并向书中添加了关于二进制位操作(bitop)、排序、复制、Sentinel和集群等主题的新章节,最终完成了这本新版的《Redis 设计与实现》。本书不仅介绍了Redis的内部机制(比如数据库实现、类型系统、事件模型),而且还介绍了大部分Redis单机特性(比如事务、持久化、Lua脚本、排序、二进制位操作),以及所有Redis多机特性(如复制、Sentinel和集群)。
虽然作者创作本书的初衷只是为了满足自己的好奇心,但了解Redis内部实现的好处并不仅仅在于满足好奇心:通过了解Redis的内部实现,理解每一个特性和命令背后的运作机制,可以帮助我们更高效地使用Redis,避开那些可能会引起性能问题的陷阱。我衷心希望这本新版《Redis设计与实现》能够帮助读者更好地了解Redis,并成为更优秀的Redis使用者。
媒体评论
——杨卫华(@TimYang),新浪微博技术总监
近几年Redis以其高性能,高灵活性的优点,变得越来越流行。但很多人在使用Redis时,还仅仅停留在比较表层的功能性认识上,缺乏对内部机制原理的深入理解。本书汇集了huangz同学长期对Redis源码的阅读心得,书中对Redis的各个方面都进行了详细且深入的讲解,将复杂的原理用最简单的方式进行解构和分析,强烈推荐给每一位Redis的使用者。
—— iammutex,NoSQLFan站长,乐视网技术经理
Redis 是近些年来特别火爆的 NoSQL 之一。纵观中外各种书籍还没有一本能对 Redis 内部机制进行深入剖析,本书可谓开此先河。我常和作者在网上交流,知道他为这本书付出了大量的心血。这本书行文流畅,思路清晰,详细地介绍了 Redis 源码的方方面面。无论是想了解 NoSQL、网络编程的初学者,还是源码控的进阶者,本书都会有很大的帮助。
—— 阮若夷,支付宝高级专家这本书描述的知识点很丰富,覆盖很全,里面提到的特性较多,有不少我们也没用过:) 每个命令内部机制的介绍很不错,估计很多也是首次有详细文档介绍。
——杨卫华(@TimYang),新浪微博技术总监
近几年Redis以其高性能,高灵活性的优点,变得越来越流行。但很多人在使用Redis时,还仅仅停留在比较表层的功能性认识上,缺乏对内部机制原理的深入理解。本书汇集了huangz同学长期对Redis源码的阅读心得,书中对Redis的各个方面都进行了详细且深入的讲解,将复杂的原理用最简单的方式进行解构和分析,强烈推荐给每一位Redis的使用者。
—— iammutex,NoSQLFan站长,乐视网技术经理
Redis 是近些年来特别火爆的 NoSQL 之一。纵观中外各种书籍还没有一本能对 Redis 内部机制进行深入剖析,本书可谓开此先河。我常和作者在网上交流,知道他为这本书付出了大量的心血。这本书行文流畅,思路清晰,详细地介绍了 Redis 源码的方方面面。无论是想了解 NoSQL、网络编程的初学者,还是源码控的进阶者,本书都会有很大的帮助。
—— 阮若夷,支付宝高级专家
\t
书摘
引 言
本书对Redis的大多数单机功能以及所有多机功能的实现原理进行了介绍,力图展示这些功能的核心数据结构以及关键的算法思想。
通过阅读本书,读者可以快速、有效地了解Redis的内部构造以及运作机制,这些知识可以帮助读者更好地、也更高效地使用Redis。
为了让本书的内容保持简单并且容易读懂,本书会尽量以高层次的角度来对Redis的实现原理进行描述,如果读者只是对Redis的实现原理感兴趣,但并不想研究Redis的源代码,那么阅读本书就足够了。
另一方面,如果读者打算深入了解Redis实现原理的底层细节,本书在RedisBook.com提供了一份带有详细注释的Redis源代码,读者可以先阅读本书对某一功能的介绍,然后再阅读该功能对应的实现代码,这有助于读者更快地读懂实现代码,也有助于读者更深入地了解该功能的实现原理。
1.1 Redis版本说明
本书是基于Redis 2.9——也即是Redis 3.0的开发版来编写的,因为Redis 3.0的更新主要与Redis的多机功能有关,而Redis 3.0的单机功能则与Redis 2.6、Redis 2.8的单机功能基本相同,所以本书的内容对于使用Redis 2.6至Redis 3.0的读者来说应该都是有用的。
另外,因为Redis通常都是渐进地增加新功能,并且很少会大幅地修改已有的功能,所以本书的大部分内容对于Redis 3.0之后的几个版本来说,应该也是有用的。
1.2 章节编排
本书由“数据结构与对象”、“单机数据库的实现”、“多机数据库的实现”、“独立功能的实现”四个部分组成。
第一部分“数据结构与对象”
Redis数据库里面的每个键值对(key-value pair)都是由对象(object)组成的,其中:
数据库键总是一个字符串对象(string object);
而数据库键的值则可以是字符串对象、列表对象(list object)、哈希对象(hash object)、集合对象(set object)、有序集合对象(sorted set object)这五种对象中的其中一种。
比如说,执行以下命令将在数据库中创建一个键为字符串对象,值也为字符串对象的键值对:
redis> SET msg "hello world"
OK
而执行以下命令将在数据库中创建一个键为字符串对象,值为列表对象的键值对:
redis> RPUSH numbers 1 3 5 7 9