01 认识redis

redis特性

速度快：正常情况下，Redis执行命令的速度非常快，官方给出的数字是读写性能可以达到10万/秒，当然这也取决于机器的性能，是什么造就了Redis除此之快的速度，可以大致归纳为以下四点：


Redis的所有数据都是存放在内存中的

Redis是用C语言实现的，一般来说C语言实现的程序“距离”操作系统更近，执行速度相对会更快。

Redis使用了单线程架构，预防了多线程可能产生的竞争问题

基于键值对的数据结构服务器：与很多键值对数据库不同的是，Redis中的值不仅可以是字符串，而且还可以是具体的数据结构，这样不仅能便于在许多应用场景的开发，同时也能够提高开发效率


Redis的全称是REmote Dictionary Server，

它主要提供了5种数据结构：字符串、哈希、列表、集合、有序集合，

同时在字符串的基础之上演变出了位图（Bitmaps）和HyperLogLog两种神奇的“数据结构”，

并且随着LBS（Location Based Service，基于位置服务）的不断发展，

Redis3.2版本中加入有关GEO（地理信息定位）的功能

丰富的功能


·提供了键过期功能，可以用来实现缓存
·提供了发布订阅功能，可以用来实现消息系统。
·支持Lua脚本功能，可以利用Lua创造出新的Redis命令。
·提供了简单的事务功能，能在一定程度上保证事务特性。
·提供了流水线（Pipeline）功能，这样客户端能将一批命令一次性传到Redis，减少了网络的开销。

简单稳定：Redis的简单主要表现在三个方面


1. 首先，Redis的源码很少，早期版本的代码只有2万行左右，3.0版本以后由于添加了集群特性，
   代码增至5万行左右，相对于很多NoSQL数据库来说代码量相对要少很多，也就意味着普通
   的开发和运维人员完全可以“吃透”它
2. Redis使用单线程模型，这样不仅使得Redis服务端处理模型变得简单，
   而且也使得客户端开发变得简单
3. Redis不需要依赖于操作系统中的类库（例如Memcache需要依赖libevent这样的系统类库），
   Redis自己实现了事件处理的相关功能

客户端语言多
持久化：将数据放在内存中是不安全的，一旦发生断电或者机器故障，重要的数据可能就会丢失，因此Redis提供了两种持久化方式：RDB和AOF，即可以用两种策略将内存的数据保存到硬盘中（如图1-1所示），这样就保证了数据的可持久性。

7. 主从复制：Redis提供了复制功能，实现了多个相同数据的Redis副本（如图1-2所示），复制功能是分布式Redis的基础。

8. 高可用和分布式：Redis从2.8版本正式提供了高可用实现Redis Sentinel，它能够保证Redis节点的故障发现和故障自动转移。Redis从3.0版本正式提供了分布式实现Redis Cluster，它是Redis真正的分布式实现，提供了高可用、读写和容量的扩展性。

redis使用场景

redis可以做什么

缓存

redis提供了键值过期时间设置，并且也提供了灵活控制最大内存和内存溢出后的淘汰策略

排行榜系统

例如按照热度排名的排行榜，按照发布时间的排行榜，按照各种复杂维度计算出的排行榜，

Redis提供了列表和有序集合数据结构，合理地使用这些数据结构可以很方便地构建各种排行榜系统。

计数器应用

计数器在网站中的作用至关重要，例如视频网站有播放数、电商网站有浏览数，

为了保证数据的实时性，每一次播放和浏览都要做加1的操作，如果并发量很大对于传统关系型数据的性能是一种挑战。

Redis天然支持计数功能而且计数的性能也非常好，可以说是计数器系统的重要选择。

社交网络

赞/踩、粉丝、共同好友/喜好、推送、下拉刷新等是社交网站的必备功能，

由于社交网站访问量通常比较大，而且传统的关系型数据不太适合保存这种类型的数据，

Redis提供的数据结构可以相对比较容易地实现这些功能。

消息队列系统

消息队列系统可以说是一个大型网站的必备基础组件，

因为其具有业务解耦、非实时业务削峰等特性。

Redis提供了发布订阅功能和阻塞队列的功能，虽然和专业的消息队列比还不够足够强大，

但是对于一般的消息队列功能基本可以满足

redis不可以做什么

我们可以站在数据规模和数据冷热的角度来进行分析

站在数据规模的角度看

数据可以分为大规模数据和小规模数据，

我们知道Redis的数据是存放在内存中的，虽然现在内存已经足够便宜，

但是如果数据量非常大，例如每天有几亿的用户行为数据，使用Redis来存储的话，基本上是个无底洞，经济成本相当的高。

站在数据冷热的角度看

数据分为热数据和冷数据，

热数据通常是指需要频繁操作的数据，反之为冷数据，

例如对于视频网站来说，视频基本信息基本上在各个业务线都是经常要操作的数据，

而用户的观看记录不一定是经常需要访问的数据，

这里暂且不讨论两者数据规模的差异，单纯站在数据冷热的角度上看，视频信息属于热数据，

用户观看记录属于冷数据。

如果将这些冷数据放在Redis中，基本上是对于内存的一种浪费，

但是对于一些热数据可以放在Redis中加速读写，也可以减轻后端存储的负载，可以说是事半功倍。

用好redis的建议

切勿当作黑盒使用，开发与运维同样重要


很多线上的故障和问题都是由于完全把Redis当做黑盒造成的，

如果不了解Redis的单线程模型，有些开发者会在有上千万个键的Redis上执行keys*操作，

如果不了解持久化的相关原理，会在一个写操作量很大的Redis上配置自动保存RDB

阅读源码

正确安装并启动redis

安装redis

配置、启动、操作、关闭Redis

这里有三点需要注意一下：

Redis关闭的过程：断开与客户端的连接、持久化文件生成，是一种相对优雅的关闭方式。
除了可以通过shutdown命令关闭Redis服务以外，还可以通过kill进程号的方式关闭掉Redis，但是不要粗暴地使用kill-9强制杀死Redis服务，不但不会做持久化操作，还会造成缓冲区等资源不能被优雅关闭，极端情况会造成AOF和复制丢失数据的情况。
shutdown还有一个参数，代表是否在关闭Redis前，生成持久化文件

redis重大版本

1.Redis2.6

服务端支持Lua脚本。
去掉虚拟内存相关功能。
放开对客户端连接数的硬编码限制。
键的过期时间支持毫秒。
从节点提供只读功能。
两个新的位图命令：bitcount和bitop。
增强了redis-benchmark的功能：支持定制化的压测，CSV输出等功能。
基于浮点数自增命令：incrbyfloat和hincrbyfloat。
redis-cli可以使用--eval参数实现Lua脚本执行。
shutdown命令增强。
info可以按照section输出，并且添加了一些统计项。
重构了大量的核心代码，所有集群相关的代码都去掉了，cluster功能将会是3.0版本最大的亮点。
sort命令优化

2.Redis2.8

添加部分主从复制的功能，在一定程度上降低了由于网络问题，造成频繁全量复制生成RDB对系统造成的压力。
尝试性地支持IPv6。
可以通过config set命令设置maxclients。
可以用bind命令绑定多个IP地址。
Redis设置了明显的进程名，方便使用ps命令查看系统进程。
config rewrite命令可以将config set持久化到Redis配置文件中。
发布订阅添加了pubsub命令。
Redis Sentinel第二版，相比于Redis2.6的Redis Sentinel，此版本已经变成生产可用。

3.Redis3.0

Redis Cluster：Redis的官方分布式实现。
全新的embedded string对象编码结果，优化小对象内存访问，在特定的工作负载下速度大幅提升。
lru算法大幅提升。
migrate连接缓存，大幅提升键迁移的速度。
migrate命令两个新的参数copy和replace。
新的client pause命令，在指定时间内停止处理客户端请求。
bitcount命令性能提升。
config set设置maxmemory时候可以设置不同的单位（之前只能是字节），例如config set maxmemory1gb。
Redis日志小做调整：日志中会反应当前实例的角色（master或者slave）。
incr命令性能提升

4.Redis3.2

添加GEO相关功能。
SDS在速度和节省空间上都做了优化。
支持用upstart或者systemd管理Redis进程。
新的List编码类型：quicklist。
从节点读取过期数据保证一致性。
添加了hstrlen命令。
增强了debug命令，支持了更多的参数。
Lua脚本功能增强。
添加了Lua Debugger。
config set支持更多的配置参数。
优化了Redis崩溃后的相关报告。
新的RDB格式，但是仍然兼容旧的RDB。
加速RDB的加载速度。
spop命令支持个数参数。
cluster nodes命令得到加速。
Jemalloc更新到4.0.3版本

Redis4.0

提供了模块系统，方便第三方开发者拓展Redis的功能，更多模块详见：http://redismodules.com。
PSYNC2.0：优化了之前版本中，主从节点切换必然引起全量复制的问题。
提供了新的缓存剔除算法：LFU（Last Frequently Used），并对已有算法进行了优化。
提供了非阻塞del和flushall/flushdb功能，有效解决删除bigkey可能造成的Redis阻塞。
提供了RDB-AOF混合持久化格式，充分利用了AOF和RDB各自优势。
提供memory命令，实现对内存更为全面的监控统计。
提供了交互数据库功能，实现Redis内部数据库之间的数据置换。
Redis Cluster兼容NAT和Docker。

个人遇到的问题

单线程比多线程快吗？

在某些情况下，单线程可能会比多线程更快，这取决于具体的应用场景和问题需求。以下是一些可能导致单线程比多线程更快的情况：

简单的计算密集型任务： 在某些简单的计算密集型任务中，单线程可能比多线程更快，因为线程切换和线程间通信的开销可能会降低多线程的性能。
I/O 密集型任务： 对于某些 I/O 密集型任务，如文件读写、网络请求等，单线程模型可能表现更好，因为在这种情况下，多线程可能面临竞争条件和同步开销。
避免并发问题： 使用单线程可以避免一些并发问题，如竞争条件、死锁等，因为单线程只有一个执行路径。

然而，在许多情况下，多线程可以提高系统的性能和吞吐量，特别是对于需要同时处理多个任务或需要利用多核处理器的情况。多线程可以充分利用多核处理器的优势，同时执行多个任务，提高系统的并发性能。

总的来说，要根据具体的应用场景和需求来选择单线程还是多线程。在实际开发中，需要综合考虑任务类型、系统资源、并发需求等因素，选择最适合的处理方式来达到最佳性能和效率。

吞吐量和 I/O密集型任务一样吗？

吞吐量和 I/O 密集型任务并不完全相同，但它们之间存在一定的关联。

吞吐量（Throughput） 是指在单位时间内系统处理的任务数量或数据量。它可以用来衡量系统的处理能力和效率，通常以每秒钟处理的请求数、数据量或事务数来衡量。

I/O 密集型任务 涉及大量的输入/输出操作，如文件读写、网络传输等。在这种情况下，系统的性能受限于 I/O 操作的速度，而不是计算能力。因此，对于 I/O 密集型任务来说，优化 I/O 操作的吞吐量是非常重要的。

虽然吞吐量和 I/O 密集型任务不是完全相同的概念，但它们之间存在一定的联系。对于 I/O 密集型任务来说，提高系统的吞吐量可以意味着更有效地利用系统资源，例如减少 I/O 等待时间、提高并发处理能力，从而加快任务的完成速度。

因此，针对 I/O 密集型任务，通过优化系统的吞吐量，可以提高系统整体的性能和效率，使得系统能够更好地处理大量的 I/O 操作，从而提高整体的响应速度和处理能力。

多线程有什么好处？

多线程具有许多好处，特别是在需要同时执行多个任务或利用多核处理器的情况下。以下是多线程的一些主要好处：

提高并发性能： 多线程可以允许多个任务同时执行，从而提高系统的并发性能。通过利用多核处理器和同时处理多个任务，可以更有效地利用系统资源，加快任务的完成速度。
提高响应性： 在需要同时处理多个用户请求或事件的情况下，多线程可以使系统更加响应快速。每个线程可以处理一个请求或事件，从而减少用户等待时间，提高系统的响应性和用户体验。
充分利用多核处理器： 随着计算机硬件的发展，多核处理器已经成为主流。多线程可以充分利用多核处理器的优势，同时执行多个线程，提高系统的整体性能。
任务分解和模块化： 使用多线程可以将复杂的任务分解为多个较小的子任务，每个子任务由一个线程处理。这样可以使代码更具模块化和可维护性，同时降低编程复杂度。
提高资源利用率： 多线程可以提高系统资源的利用率，如 CPU、内存等。通过同时执行多个任务，可以更有效地利用系统资源，避免资源空闲浪费。
实时性能： 在一些需要实时响应的应用场景中，多线程可以帮助实现更高的实时性能。例如，多线程可以用于实时数据处理、实时监控等应用。

总的来说，多线程可以提高系统的并发性能、响应性能，充分利用多核处理器的优势，提高系统的整体性能和效率。然而，多线程编程也需要注意线程安全、竞态条件等并发问题，需要谨慎设计和管理。

Lua如何结合redis使用

Lua可以与Redis结合使用，以执行复杂的原子操作或在服务器端执行脚本。这种结合可以提高性能并减少网络开销，因为Lua脚本可以在Redis服务器上执行，而无需将数据发送到客户端进行处理。

在Redis中，可以使用EVAL命令执行Lua脚本。该命令允许您在Redis服务器上运行Lua脚本，并且脚本可以访问Redis数据和执行操作。

以下是一个简单的示例，演示如何使用Lua脚本在Redis中执行一些操作：

lua
-- 例子：将列表中所有元素增加1
local len = redis.call('llen', KEYS[1]) -- 获取列表长度
for i=1, len do
    local val = redis.call('lindex', KEYS[1], i) -- 获取列表中的值
    val = tonumber(val) + 1 -- 值加1
    redis.call('lset', KEYS[1], i, val) -- 将修改后的值写回列表
end
return redis.status_reply('OK')

在这个示例中，我们定义了一个Lua脚本，它接受一个键作为参数，然后对该键对应的列表中的所有元素进行加一操作。然后，我们可以使用EVAL命令在Redis中执行这个脚本：

bash
EVAL "lua脚本内容" 1 key_name

其中，第一个参数是要执行的Lua脚本，第二个参数是脚本中用到的键的数量，后面跟着这些键的名字。

需要注意的是，虽然Lua脚本可以在Redis服务器上执行，但是它们也会影响Redis服务器的性能。因此，在编写Lua脚本时，需要考虑脚本的性能和效率，避免引起不必要的性能问题。

总之，通过结合Lua脚本和Redis，可以在服务器端执行复杂的操作，提高性能并减少网络开销。这种结合方式在处理复杂逻辑或需要原子操作的场景下特别有用。

redis支持Lua脚本的作用

Redis支持Lua脚本的作用非常多样，主要包括以下几个方面：

原子性操作： 使用Lua脚本可以实现原子性操作，即一系列操作要么全部执行成功，要么全部失败，这在并发环境下非常有用。通过在Lua脚本中使用Redis的事务功能，可以确保一系列操作的原子性，避免了多个客户端同时对同一数据进行修改可能引发的问题。
复杂数据处理： Lua脚本可以在Redis服务器端执行，因此可以更高效地处理大量数据。这对于复杂的数据处理任务，比如对大型数据集进行排序、过滤、聚合等操作，特别有用。
自定义命令： 可以使用Lua脚本实现自定义命令，这些命令可以对数据进行更灵活的处理，符合特定业务逻辑需求。通过将一系列操作封装在Lua脚本中，并在Redis中注册为自定义命令，可以简化客户端代码，并提高代码的复用性。
复杂计算： 在需要对数据进行复杂计算或处理时，可以使用Lua脚本在Redis服务器端执行。这样可以减少客户端与服务器之间的数据传输量，并降低系统的负载。
事务控制： Lua脚本可以与Redis事务一起使用，实现更复杂的事务控制逻辑。通过Lua脚本可以在事务中执行条件判断、循环等操作，从而实现更灵活的事务控制逻辑。

总的来说，Redis支持Lua脚本的作用非常广泛，可以用于实现原子性操作、复杂数据处理、自定义命令、复杂计算以及事务控制等多种场景，为开发者提供了强大的工具来实现各种需求。

示例

下面是一个示例，演示如何使用Lua脚本在Redis中实现原子性操作。假设我们有一个计数器，我们想要在不使用Redis的自增命令的情况下，通过Lua脚本来实现原子性地增加计数器的值。

首先，我们创建一个计数器并初始化为0：

bash
SET counter 0

然后，我们编写一个Lua脚本来实现原子性地增加计数器的值：

lua
-- Lua脚本：原子性地增加计数器的值
local current = tonumber(redis.call('GET', KEYS[1])) or 0 -- 获取当前计数器的值
local increment = tonumber(ARGV[1]) -- 获取增加的值
local new_value = current + increment -- 计算新的值
redis.call('SET', KEYS[1], new_value) -- 更新计数器的值
return new_value -- 返回新的值

在这个脚本中，我们首先获取当前计数器的值，然后将增加的值加上当前值，计算出新的值，最后更新计数器的值。脚本返回的是新的计数器值。

现在，我们可以使用EVAL命令来执行这个Lua脚本，并传入计数器的键名和增加的值作为参数：

bash
EVAL "lua脚本内容" 1 counter 5

这将会使计数器的值增加5，并且这个操作是原子性的，即使有多个客户端同时执行这个操作，也不会出现竞态条件。

总的来说，这个示例展示了如何使用Lua脚本在Redis中实现原子性操作，这种操作方式可以确保数据的一致性，并且避免了并发操作可能引发的问题。

python可以实现原子性的增加计数器吗？

在Python中，通过使用Redis的事务功能，你可以实现类似原子性增加计数器的操作。虽然Python本身没有像Redis那样的原子操作，但是通过使用Redis的事务机制，可以保证一系列操作要么全部执行成功，要么全部失败，从而实现原子性。

下面是一个使用Python和Redis实现原子性增加计数器的示例代码：

python
import redis

# 连接到Redis服务器
r = redis.StrictRedis(host='localhost', port=6379, db=0)

# 定义增加计数器的函数
def increment_counter(key, increment):
    # 开始Redis事务
    pipe = r.pipeline()
    # 在事务中执行命令
    pipe.watch(key)
    current_value = int(pipe.get(key) or 0)  # 获取当前计数器的值
    new_value = current_value + increment    # 计算新的值
    pipe.multi()  # 开始事务
    pipe.set(key, new_value)  # 更新计数器的值
    pipe.execute()  # 执行事务
    return new_value

# 测试增加计数器
counter_key = 'counter'
increment = 5
new_counter_value = increment_counter(counter_key, increment)
print("新的计数器值:", new_counter_value)

在这个示例中，我们首先定义了一个increment_counter函数，它接受计数器的键名和增加的值作为参数。在这个函数中，我们使用Redis的事务机制，通过watch命令来监视计数器的键，然后在事务中执行获取当前值、计算新值和更新值的操作，最后通过execute命令来执行事务。这样就确保了这一系列操作是原子性的，即使有多个客户端同时调用这个函数，也不会出现竞态条件。

总的来说，虽然Python本身没有原子操作，但是通过使用Redis的事务机制，可以在Python中实现类似原子性增加计数器的操作。

redis如何实现社交网络的功能？

Redis可以作为社交网络应用的后端存储来实现各种功能。下面是一些基本的示例：

用户数据存储：使用Redis的Hash数据结构来存储用户的基本信息，例如用户名、密码哈希、电子邮件等。每个用户可以用一个唯一的ID作为键名，将用户信息存储在对应的Hash中。
用户关系存储：使用Redis的Set数据结构来存储用户之间的关系，例如关注关系、好友关系等。可以为每个用户创建一个Set，其中包含他们关注的用户的ID。另外，可以使用有序集合（Sorted Set）来存储带有时间戳的关注关系，以便按时间排序。
发布和订阅：使用Redis的发布/订阅功能来实现实时消息推送。当用户发布新的内容时，将该内容发送到相应的频道，订阅该频道的用户将会收到推送消息。
时间线管理：使用有序集合来管理用户的时间线，以便他们可以看到关注用户发布的最新内容。将每个用户的时间线存储在一个有序集合中，以时间戳作为分数，内容ID作为成员，根据时间戳进行排序。
Feed生成：使用Redis的交集运算来生成用户的Feed。将用户关注的所有用户的时间线合并成一个Feed，以便用户可以看到他们关注的所有用户的最新内容。
用户活动记录：使用Redis的列表数据结构来记录用户的活动历史，例如点赞、评论、分享等操作。每个用户可以有一个对应的活动列表，将用户的活动记录存储在该列表中。

这些是一些基本的功能，实际的社交网络应用可能还会涉及到更多复杂的功能和业务逻辑。通过合理地设计数据结构和使用Redis提供的各种功能，可以实现一个高效、可扩展的社交网络应用。

Feed是什么？

在社交网络应用中，"Feed"通常指的是用户所关注的人或实体发布的最新内容的集合。这些内容可以包括文本消息、照片、视频、链接等。

用户的Feed通常以时间顺序呈现，最新发布的内容会显示在最前面，用户可以通过浏览Feed来获取他们关注的人或实体的最新动态。这样设计的目的是让用户能够方便地看到他们感兴趣的内容，与朋友和关注对象保持联系，并对他们发布的内容进行互动。

在社交网络应用中，生成用户个性化的Feed是一项重要的功能，需要考虑用户的关注列表、时间线、内容类型和用户偏好等因素，以便为每个用户定制最符合其兴趣的内容流。

例如，在Twitter上，用户的Feed由他们关注的账号所发布的最新推文组成；在Instagram上，用户的Feed则包括他们关注的人或标签发布的最新照片和视频。

总的来说，Feed是社交网络应用中用于展示用户关注对象最新内容的一种界面和功能，是用户获取个性化内容的重要途径。

redis如何实现业务削峰的逻辑

Redis可以通过一些方法来实现业务削峰的逻辑，主要包括限流、队列和缓存三种方式：

限流（Rate Limiting）：
- 使用Redis的有序集合（Sorted Set）或计数器（Counter）功能，可以记录每个用户或每个请求的访问频率，并设置一个阈值，当请求达到阈值时进行限流。可以使用Redis的INCR命令来实现计数，并结合Lua脚本来确保原子性操作。通过限制每个时间窗口内的请求数量，可以有效地平滑请求流量，从而避免系统被突发大量请求压垮。
队列（Queue）：
- 使用Redis的列表（List）或消息队列（Message Queue），将请求按顺序排队，然后通过多个工作进程或线程逐个处理请求。这种方式可以使系统按照自身处理能力有序地处理请求，避免瞬时高并发压力对系统的影响。常见的实现方式包括使用Redis的LPUSH和BRPOP命令实现队列的生产和消费。
缓存（Cache）：
- 使用Redis作为缓存存储，缓存热门数据或计算结果，减轻后端数据库或计算资源的压力。通过缓存数据，可以减少对数据库或其他后端服务的访问频率，降低系统负载，提高响应速度。Redis支持设置缓存的过期时间，可以根据业务需求来动态调整缓存策略，使得热门数据保持在缓存中，从而减少对后端资源的访问压力。

综合利用这些功能，可以有效地实现业务削峰的逻辑。例如，可以通过限流来控制请求的访问频率，通过队列来平滑请求流量，通过缓存来减轻后端资源的压力，从而保证系统在高并发情况下的稳定运行。

一个写操作量很大的Redis上配置自动保存RDB的风险

如果不了解持久化的相关原理，而在一个写操作量很大的Redis上配置自动保存RDB（Redis Database Backup）可能会导致一些潜在的问题：

性能影响：在写操作量很大的情况下，频繁地进行RDB持久化可能会对Redis的性能产生较大的影响。每次进行RDB持久化都需要将内存中的数据写入磁盘，这会占用大量的I/O资源和CPU资源，导致Redis服务器在进行持久化时性能下降，甚至出现阻塞现象，影响正常的读写操作。
数据丢失风险：如果配置了自动保存RDB，并且保存的频率过高，那么在持久化之间的时间段内，如果发生了宕机或其他故障，可能会导致数据丢失。因为RDB持久化是在指定的时间点进行的，如果最后一次持久化到宕机的时间点之间有大量的数据写入，那么这部分数据就有可能丢失。
磁盘空间占用：RDB文件会占用磁盘空间，如果频繁进行RDB持久化，可能会导致大量的磁盘空间被占用，进而影响其他系统的正常运行。

综上所述，如果不了解持久化的相关原理，特别是在一个写操作量很大的Redis上配置自动保存RDB可能会带来性能、数据一致性和磁盘空间占用等方面的问题。因此，在配置自动保存RDB之前，建议先深入了解Redis的持久化机制，评估业务需求和系统负载，再根据需求合理地配置持久化策略，以避免潜在的问题。

目录