Redis_10_Redis集群实现RedisCluster应对大数据量-CFANZ编程社区

文章目录

一、前言
二、CentOS 7 单机安装Redis Cluster6.0.9（3主3从伪集群）

2.1 CentOS 7 单机安装Redis Cluster6.0.9（3主3从伪集群）
2.2 实践：redisCluster 安装
2.3 redisCluster管理命令

三、Redis Cluster原理

3.1 Redis Cluster架构
3.2 数据分布
3.3 RedisCluster让相关的数据落到同一个节点上
3.4 客户端重定向
3.5 数据迁移
3.6 Redis Cluster 故障转移/高可用
3.7 Redis Cluster 特点

四、尾声

一、前言

问题：单机Redis会有瓶颈，那你们是怎么解决这个瓶颈的？

回答：集群(永远的永远，处理单机的性能瓶颈就是分布式集群架构，Redis也是这样)

解释：在Redis中，使用的集群的部署方式也就是Redis cluster，并且是主从同步读写分离，类似Mysql 的主从同步，Redis cluster 支撑 N 个 Redis master node，每个master node都可以挂载多个 slave node。这样整个 Redis 就可以横向扩容了。如果你要支撑更大数据量的缓存，那就横向扩容更多的 master 节点，每个 master 节点就能存放更多的数据了。

二、CentOS 7 单机安装Redis Cluster6.0.9（3主3从伪集群）

2.1 CentOS 7 单机安装Redis Cluster6.0.9（3主3从伪集群）

为了节省机器，我们直接把6个Redis实例安装在同一台机器上（3主3从），只是使用不同的端口号。
机器IP 192.168.100.138
可以跟单机的redis安装在同一台机器上，因为数据目录不同，没有影响。

cd /usr/local/soft/redis-6.0.9
mkdir redis-cluster
cd redis-cluster
mkdir 7291 7292 7293 7294 7295 7296

复制redis配置文件到7291目录

cp

修改7291的redis.conf配置文件，内容：

cd /usr/local/soft/redis-6.0.9/redis-cluster/7291
vim

port 7291
daemonize yes
protected-mode no
dir /usr/local/soft/redis-6.0.9/redis-cluster/7291/
cluster-enabled yes
cluster-config-file nodes-7291.conf
cluster-node-timeout 5000
appendonly yes

注意，外网集群要添加这个配置(如果是自己vmware安装就不需要)：

# 实际给各节点网卡分配的IP（公网IP）
cluster-announce-ip 47.xx.xx.xx
# 节点映射端口
cluster-announce-port ${PORT}
# 节点总线端口
cluster-announce-bus-port 1${PORT}

把7291下的redis.conf复制到其他5个目录。

cd /usr/local/soft/redis-6.0.9/redis-cluster/7291
cp redis.conf ../7292
cp redis.conf ../7293
cp redis.conf ../7294
cp redis.conf ../7295
cp redis.conf ../7296

批量替换内容

cd /usr/local/soft/redis-6.0.9/redis-cluster
sed -i 's/7291/7292/g' 7292/redis.conf
sed -i 's/7291/7293/g' 7293/redis.conf
sed -i 's/7291/7294/g' 7294/redis.conf
sed -i 's/7291/7295/g' 7295/redis.conf
sed -i 's/7291/7296/g' 7296/redis.conf

启动6个Redis节点

cd

是否启动了6个进程

ps -ef|grep

六个进程都启动起来了，但是现在它们六个都是独立运行的，需要将他们关联起来，三主三从结构

redisCluster的引入解决了高并发、高可用、大数据量三个问题。
三主结构：使用三个机器来存放所有数据，保证大数据量水平扩展
三主就有三从：一个主节点就带有一个从节点，保证了主从复制/读写分离，保证高并发
三主就有三从：一个主节点就带有一个从节点，主节点宕机后从节点顶上，保证高可用
六个节点变成了三主三从是因为 redis-cli --cluster create 命令中，指定 --cluster-replicas 1 表示一个主节点只有一个从节点，所以 6 /2 = 3个主节点

cd /usr/local/soft/redis-6.0.9/src/
redis-cli --cluster create 192.168.100.138:7291 192.168.100.138:7292 192.168.100.138:7293 192.168.100.138:7294 192.168.100.138:7295 192.168.100.138:7296 --cluster-replicas 1

注意执行 redis-cli --cluster create 命令的时候，用绝对IP，不要用127.0.0.1

Redis会给出一个预计的方案，对6个节点分配3主3从，如果认为没有问题，输入yes确认

批量写入值

cd /usr/local/soft/redis-6.0.9/redis-cluster/
vim

脚本内容

#!/bin/bash
for ((i=0;i<20000;i++))
do
echo -en "helloworld" | redis-cli -h 192.168.44.181 -p 7291 -c -x set name$i >>redis.log
done

chmod

连接到客户端

redis-cli -p 7291
redis-cli -p 7292
redis-cli -p 7293

每个节点分布的数据

127.0.0.1:7291> dbsize
(integer) 6652
127.0.0.1:7292> dbsize
(integer) 6683
127.0.0.1:7293> dbsize
(integer) 6665

2.2 实践：redisCluster 安装

Redis_10_Redis集群实现RedisCluster应对大数据量_redis

Redis_10_Redis集群实现RedisCluster应对大数据量_redis_02

Redis_10_Redis集群实现RedisCluster应对大数据量_客户端_03

Redis_10_Redis集群实现RedisCluster应对大数据量_数据库_04

执行完创建集群之后，就往这个三主三从的集群里面插入数据，如下：

Redis_10_Redis集群实现RedisCluster应对大数据量_数据_05

Redis_10_Redis集群实现RedisCluster应对大数据量_数据库_06

2.3 redisCluster管理命令

cluster管理命令
其他命令，比如添加节点、删除节点，重新分布数据：

redis-cli --cluster help
Cluster Manager Commands:
  create         host1:port1 ... hostN:portN
                 --cluster-replicas <arg>
  check          host:port
                 --cluster-search-multiple-owners
  info           host:port
  fix            host:port
                 --cluster-search-multiple-owners
  reshard        host:port
                 --cluster-from <arg>
                 --cluster-to <arg>
                 --cluster-slots <arg>
                 --cluster-yes
                 --cluster-timeout <arg>
                 --cluster-pipeline <arg>
                 --cluster-replace
  rebalance      host:port
                 --cluster-weight <node1=w1...nodeN=wN>
                 --cluster-use-empty-masters
                 --cluster-timeout <arg>
                 --cluster-simulate
                 --cluster-pipeline <arg>
                 --cluster-threshold <arg>
                 --cluster-replace
  add-node       new_host:new_port existing_host:existing_port
                 --cluster-slave
                 --cluster-master-id <arg>
  del-node       host:port node_id
  call           host:port command arg arg .. arg
  set-timeout    host:port milliseconds
  import         host:port
                 --cluster-from <arg>
                 --cluster-copy
                 --cluster-replace
  help           

For check, fix, reshard, del-node, set-timeout you can specify the host and port of any working node in

Redis_10_Redis集群实现RedisCluster应对大数据量_redis_07

集群命令
cluster info ：打印集群的信息
cluster nodes ：列出集群当前已知的所有节点（node），以及这些节点的相关信息。

节点命令
cluster meet ：将 ip 和 port 所指定的节点添加到集群当中，让它成为集群的一份子。
cluster forget <node_id> ：从集群中移除 node_id 指定的节点(保证空槽道)。
cluster replicate <node_id>

槽slot命令
cluster addslots [slot …] ：将一个或多个槽（slot）指派（assign）给当前节点。
cluster delslots [slot …] ：移除一个或多个槽对当前节点的指派。
cluster flushslots ：移除指派给当前节点的所有槽，让当前节点变成一个没有指派任何槽的节点。
cluster setslot node <node_id> ：将槽 slot 指派给 node_id 指定的节点，
如果槽已经指派给另一个节点，那么先让另一个节点删除该槽>，然后再进行指派。
cluster setslot migrating <node_id> ：将本节点的槽 slot 迁移到 node_id 指定的节点中。
cluster setslot importing <node_id>

键命令
cluster keyslot ：计算键 key 应该被放置在哪个槽上。
cluster countkeysinslot ：返回槽 slot 目前包含的键值对数量。
cluster getkeysinslot ：返回 count 个 slot 槽中的键

三、Redis Cluster原理

3.1 Redis Cluster架构

Redis Cluster 可以看到是由多个 Redis 实例组成的数据集合。客户端不需要关注数据的自己到底存储在哪个节点，只需要关注这个集合整体。以三主三从为例，节点之间两两交互，共享数据分片、节点状态等信息。

Redis_10_Redis集群实现RedisCluster应对大数据量_数据库_08

3.2 数据分布

Redis 既没有用哈希取模，也没有用一致性话下，而是通过虚拟槽来实现的。
Redis 创建了 16384 个槽slot，每个节点负责一个区间的 slot 。比如节点1负责 0 -5460 ，Node2 负责 5461 - 10922 ，Node3 负责 10923 - 16383.

Redis_10_Redis集群实现RedisCluster应对大数据量_数据_09

当然一个Redis Group节点也不一定是 1主1从，可以是 1主N从，如下：

Redis_10_Redis集群实现RedisCluster应对大数据量_客户端_10

对象分布到 Redis 节点的时候，对 key 使用 CRC16算法计算再 % 16384，得到一个slot的值，数据就落到负责这个slot的redis节点上。

Redis 的每个master节点都会维护自己负责的slot。用一个bit序列实现，比如：序列的第0位是1，就代表第一个slot是它负责的；序列的第1位是0，就代表第二个slot不是它负责的。对于开发者来说，在redis-cli 连接的时候，需要指定连接那个端口，因为有了六个redis，如下：

./redis-cli -p 7291
./redis-cli -p 7292
./redis-cli -p 7293

三者联系：节点时实际使用的机器(个数)，slot是16384固定不会改变，N个节点平均的管理 16384 个slot，key是通过算法直接分配到 slot 上，然后间接分配到节点上的。

三者联系
查看一个节点下管理哪些slot？redis-cli cluster create 命令就可以看到
查看一个节点下管理哪些key？key * 可以看到所有键，dbsize 可以看到键的数量。
查看一个key下在哪个slot？在redis-cli中，使用 cluster keyslot keyname 就可以得到了。

Redis_10_Redis集群实现RedisCluster应对大数据量_数据库_11

注意：就算是节点/机器增加和减少，slot的个数是不会改变的，“key通过CRC运算然后取模16384得到槽序号”这个算法也是不会改变的，所以，三者联系中，key和slot的关系是永远不会改变，某个key永远只分配到某个slot上去(无论这个key的value如何改变，除非这个key的名称发生改变，但是没有这种操作)，某个slot永远只管理某些key。但是，slot和节点的关系是会发生改变，如果节点新增或减少，但是slot的数量 16384 是不变的，从而 slot 会迁移，所以一个key会从一个机器上到了另外一个机器上。

slot对开发者不可见，开发者可见的只有 key 和节点/机器，所以节点增加后减少，对于开发者而言，还需需要关注一个key会从一个机器上到了另外一个机器上。

3.3 RedisCluster让相关的数据落到同一个节点上

问题：RedisCluster中，如何让相关的数据落到同一个节点上？这也是现实的业务需求，比如有一些 multi key 操作是不能跨节点的，例如用户 2673 的基本信息和金融信息？

回答：在 key 里面加入{hash tag} 即可。Redis 在计算槽编号时候，只会获取 {} 之间字符串进行槽编号计算，这样由于上面两个不同的键，{} 里面的字符串是相同的，因此他们可以被计算出相同的槽。实践如下：

Redis_10_Redis集群实现RedisCluster应对大数据量_缓存_12

3.4 客户端重定向

问题：客户端怎么知道应该连接到哪台机器上？如果访问的数据不在当前节点上，怎么办？

127.0.0.1:7293> set aa aa1
(error) MOVED 1180 192.168.100.138:7291

回答：服务端返回MOVED，也就是根据 key 计算出来是slot不归当前端口管理，而是归属于 7591 端口管理，这个时候客户端应该更换连接端口，用 ./redis-cli -p 7291 操作，才会返回 OK。但是这样的会就需要客户端连接两次服务端。

其实，Jedis 等客户端会在本地维护一份(slot,node)的映射关系。大部分时间不需要重定向，所以叫 smart jedis (需要客户端的支持)。

Redis最常用的三个客户端：Jedis Lettuce Redission
其中，使用redisTemplate的就是三种中选择一个使用，根据redisTemplate的不同版本选择不同的。

3.5 数据迁移

问题：新增或下线了Master节点，数据怎样迁移（就是重新分配slot）？
回答：因为key和slot的关系是永远不变的，当新增了节点的时候，需要把原有的slot分配给新的节点负责，并将相关的数据迁移过来（就是将相关的key迁移过来），内部的迁移 redis 的设计者搞好了的，其实对于开发者来说，就是一行命令的事，如下：

# 步骤1：新增一个7297端口的redis（先启动一个7297端口的redis，再使用下面这条命令加入到 RedisCluster 即可）
./redis-cli --cluster add-node 127.0.0.1:7291 127.0.0.1:7297

# 步骤2：由于新增一个7297端口的redis还没有任何哈希槽，不能分布数据，所以在原来的人一个节点上执行
./redis-cli --cluster reshard 127.0.0.1:7291

# 输入需要分配的哈希槽的数据（比如500），和哈希槽的来源节点（可以输入all或者id）,就是这500个槽从之前哪个节点拿来。

3.6 Redis Cluster 故障转移/高可用

问题：只有主节点可以写操作，如果一个主节点宕机，从节点怎样变成主节点？
回答：当从节点发现自己的主节点变成 fail 状态的时候，便尝试进行 failover，期望自己成为新的主节点。由于挂掉的主节点可能有多个从节点，从而存在多个从节点竞争成为主节点的过程，过程如下：

1.slave发现自己的master变为FAIL
2.将自己记录的集群currentEpoch1，并广播FAILOVER_AUTH_REQUEST信息
3.其他节点收到该信息，只有master响应，判断请求者的合法性，并发送FAILOVER_AUTH_ACK，对每一个epoch只发送一次ack
4.尝试failover的slave收集FAILOVER_AUTH_ACK
5.超过半数后变成新Master
6.广播Pong通知其他集群节点。

小结：RedisCluster既能是实现主从复制，又能实现主从切换，相当于集成Replication 和Sentinel 的功能。

3.7 Redis Cluster 特点

Redis Cluster 特点

无中心架构。
数据按照slot存储分布在多个节点，节点间数据共享，可动态调整数据分布。
可扩展性，可线性扩展到1000个节点（官方推荐不超过1000个），节点可动态添或删除。
高可用性，部分节点不可用时，集群仍可用。通过增Slave做standby数据副本，能够实现故障自动failover，节点之间通过gossip协议交换状态信息，用投票机制完成Slave到Master的角色提。
降低运维成本，提高系统的扩展性和可用性。