资料来源:【尚硅谷】Redis 6 入门到精通 超详细 教程
全程为Not Only SQL,泛指非关系型的数据库。
特点:
应用场景:用不着SQL和用了SQL也不行的场景
下载安装地址:Download | Redis
从源码编译安装:Install Redis from Source | Redis
1、执行make
- cd /../redis-6.2.7
- make
2、执行make install
- cd /../redis-6.2.7
- make install
默认会将redis-server 和redis-cli安装在 /usr/local/bin下
前台启动:当此窗口关闭,Redis进程即关闭
redis-server
后台启动:以后台进程的方式运行
1、修改redis.conf,允许后台运行:daemonize yes
- cd /../redis-6.2.7
- vi redis.conf
2、启动时指定redis.conf文件
redis-server redis.conf
方式一:kill process
方式二:在redis-cli中使用shutdown命令
默认端口
Redis默认端口是6379,对应MERZ在九宫格键盘上的数字。
16个数据库
Redis有16个数据库,索引【0,15】,默认连接使用的是一个索引为【0】的数据库。
可使用select 进行切换:
单线程+多路复用
多路复用是指使用一个线程来检查多个文件描述符(Socket)的就绪状态。比如调用 select 和 poll 函数,传入多个文件描述符,如果有一个文件描述符就绪,则返回,否则阻塞直到超时。得到就绪状态后进行真正的操作可以在同一个线程里执行,也可以启动线程执行(比如使用线程池)。
操作 | 说明 |
keys * | 查看当前库匹配的key |
exists key | 判断key是否存在 |
type key | 查看key的类型 |
del key | 删除key |
unlink key | 非阻塞式删除key |
expire key 10 | 设置key过期时间(单位:s) |
ttl key | 查看key有效期:-1永不过期、-2已过期 |
select 0 | 切换库 |
dbsize | 查看数据库键数量 |
flushdb | 清空当前库 |
flushall | 清空所有库 |
最基本的类型,一个key对应一个value
是二进制安全的,string可以包含任何数据,比如jps图片或序列化的对象
一个字符串最大可以是512M。
操作 | 说明 |
set [key] [value] | 赋值 |
get [key] | 取值 |
append [key] [value] | 追加值 |
strlen [key] | 获取长度 |
setnx [key] [value] | 当不存在时设置值 |
incr [key] | 值自增1,仅可对整数操作 |
decr [key] | 值自减1,仅可对整数操作 |
incrby [key] [step] | 值自增step,仅可对整数操作 |
decrby [key] [step] | 值自减step,仅可对整数操作 |
mset [key1] [value1] [key2] [value2] | 批量赋值 |
mget [key1] [key2] | 批量取值 |
msetnx [key1] [value1] [key2] [value2] | 当不存在时设置值,批量赋值。一旦一个存在,所有都失败 |
getrange [key] [start] [end] | 获取子字符串。含头也含尾 |
setrange [key] [start] [value] | 从start处开始赋值 |
setex [key] [expire] [value] | 赋值&设置有效期 |
getset [key] [value] | 取老值赋新值 |
String 的数据结构为简单动态字符串 (Simple Dynamic String, 缩写 SDS),是可以修改的字符串,内部结构实现上类似于 Java 的 ArrayList,采用预分配冗余空间的方式来减少内存的频繁分配.
如图中所示,内部为当前字符串实际分配的空间 capacity 一般要高于实际字符串长度 len。当字符串长度小于 1M 时,扩容都是加倍现有的空间,如果超过 1M,扩容时一次只会多扩 1M 的空间。
需要注意的是字符串最大长度为 512M。
列表List,一个双向链表。
操作 | 说明 |
lpush [key] [value] [value] | 从左侧添加元素 |
rpush [key] [value] [value] | 从右侧添加元素 |
lrange [key] [start] [end] | 遍历获取元素 |
lpop [key] | 从左侧抛出元素(元素全部删除后该列表也删除) |
rpop [key] | 从右侧抛出元素(元素全部删除后该列表也删除) |
lindex [key] [index] | 获取索引位置元素 |
linsert [key] [before|after] [value] [value] | 在指定元素前插入元素(只插入一个) |
lrem [key] [count] [value] | 从左侧删除元素(删除count个) |
lset [key] [index] [value] | 设置索引处元素值 |
List的数据结构为快速链表quickList。
首先在列表元素较少的情况下会使用一块连续的内存存储,这个结构是ziplist,也即是压缩列表。它将所有的元素紧挨着一起存储,分配的是一块连续的内存。
当数据量比较多的时候才会改成quicklist。因为普通的链表需要的附加指针空间太大,会比较浪费空间。比如这个列表里存的只是int类型的数据,结构上还需要两个额外的指针prev和next。
集合,不重复的元素
操作 | 说明 |
sadd [set] [value] [value] | 集合添加添加元素 |
smembers [set] | 全部元素 |
sismember [set] value] | 判断元素是否在集合中 |
scard [set] | 集合数量 |
srem [set] value] | 删除元素(元素全部删除后该集合也删除) |
spop [set] | 随机抛出元素 |
srandmember [set] [count] | 随机获取元素 |
sinter [set1] [set2] [set3] | 获取交集 |
sunion [set1] [set2] [set3] | 获取并集 |
sdiff [set1] [set2] [set3] | 获取差集 |
底层结构是dict字典,字典使用哈希表实现的。
Java中的Set的内部实现是用HashMap,只不过所有的value都指向了同一个对象。Redis的set结构也是一样,它的内部结构也是hash,所有的value都指向了同一个内部值。
操作 | 说明 |
hset [map] [key] [value] | 赋值 |
hget [map] [key] | 取值 |
hlen [map] | 容量 |
hexists [map] key] | 是否存在 |
hkeys [map] | 所有键值 |
hincrby [map] [key] [len] | 为某个键增加步长 |
Hash类型对应的数据结构是两种:ziplist(压缩列表),hashtable(哈希表)。
当field-value长度较短且个数较少时,使用ziplist,否则使用hashtable。
Redis有序集合zset与普通集合set非常相似,是一个没有重复元素的字符串集合。
不同之处是有序集合的每个成员都关联了一个评分(score),这个评分(score)被用来按照从最低分到最高分的方式排序集合中的成员。集合的成员是唯一的,但是评分可以是重复了 。
因为元素是有序的,所以可以很快的根据评分(score)或者次序(position)来获取一个范围的元素。
访问有序集合的中间元素也是非常快的,因此够使用有序集合作为一个没有重复成员的智能列表。
操作 | 说明 |
zadd [zset] [score] [key] | 添加元素 |
zrange [zset] [start] [end] | 遍历元素 |
zange [zset] [start] [end] withscores | 遍历元素(展示分值) |
zrangebyscore [zset] [start] [end] | 按分值排序(从小到大) |
zrangebyscore [zset] [start] [end] withscores | 按分值排序 |
zrevrangebyscore [zset] [start] [end ] | 按分值倒排(从大到小) |
zrem [zset] [key] | 移除元素 |
zincrby [zset] [step] [key] | 增加元素分值 |
zrank [zset] [key] | 获取元素排名 |
zrank [zset] [key] withscores | 获取元素排名 |
SortedSet(zset)是Redis提供的一个非常特别的数据结构,一方面它等价于Java的数据结构Map<String, Double>,可以给每一个元素value赋予一个权重score,另一方面它又类似于TreeSet,内部的元素会按照权重score进行排序,可以得到每个元素的名次,还可以通过score的范围来获取元素的列表。
zset底层使用了两个数据结构:
hash,hash的作用就是关联元素value和权重score,保障元素value的唯一性,可以通过元素value找到相应的score值。
跳跃表,跳跃表的目的在于给元素value排序,根据score的范围获取元素列表。
简介
有序集合在生活中比较常见,例如根据成绩对学生排名,根据得分对玩家排名等。
对于有序集合的底层实现,可以用数组、平衡树、链表等。
数组不便元素的插入、删除;平衡树或红黑树虽然效率高但结构复杂;链表查询需要遍历所有效率低。
Redis采用的是跳跃表,跳跃表效率堪比红黑树,实现远比红黑树简单。
实例
对比有序链表和跳跃表,从链表中查询出51:
有序链表:
要查找值为51的元素,需要从第一个元素开始依次查找、比较才能找到。共需要6次比较。
跳跃表:
从此可以看出跳跃表比有序链表效率要高。
redis.conf
单位,配置大小单位,开头定义了一些基本的度量单位,只支持 bytes,不支持 bit。大小写不敏感。
比如设置内存大小:
//设置Redis最大占用内存大小为500M maxmemory 500mb
包含,多实例的情况可以把公用的配置文件提取出来。
网络相关配置
参数 | 格式 | 说明 |
bind | bind=127.0.0.1 | 不写的情况下,无限制接受任何 ip 地址的访问。 如果开启了protected-mode,那么在没有设定 bind ip 且没有设密码的情况下,Redis 只允许接受本机的响应。 |
protected-mode | protected-mode no | 是否开机本机保护模式 |
port | port 6379 | 端口号 |
tcp-backlog | tcp-backlog 511 | 设置 tcp 的 backlog,backlog 其实是一个连接队列,backlog 队列总和 $=$ 未完成三次握手队列 $+$ 已经完成三次握手队列。 在高并发环境下需要一个高 backlog 值来避免慢客户端连接问题。 |
timeout | timeout 0 | 一个空闲的客户端维持多少秒会关闭,0 表示关闭该功能。即永不关闭。 |
tcp-keepalive | tcp-keepalive 300 | 对访问客户端的一种心跳检测,每个 n 秒检测一次。 单位为秒,如果设置为 0,则不会进行 Keepalive 检测。 |
通用
参数 | 格式 | 说明 |
daemonize | daemonize yes | 是否为后台进程 |
pidfile | pidfile /var/run/redis_6379.pid | 记录pid的文件 |
loglevel | loglevel notice | 日志级别 |
logfile | logfile "" | 日志文件 |
database | databases 16 | 数据库数量 |
访问密码的查看、设置和取消。
在命令中设置密码,只是临时的。重启 redis 服务器,密码就还原了。永久设置,需要在配置文件中进行设置。
参数 | 格式 | 说明 |
maxclients | maxclients 10000 | 设置 redis 同时可以与多少个客户端进行连接。 如果达到了此限制,redis 则会拒绝新的连接。 |
maxmemory | maxmemory 1gb | 最大占用内存。 超过这个限制就会开始清除数据、或者对新增数据命令返回失败。 |
maxmemory-policy | maxmemory-policy noeviction | 最大内存限制后数据清除方式: volatile-lru:使用 LRU 算法移除 key,只对设置了过期时间的键(最近最少使用)。 allkeys-lru:在所有集合 key 中,使用 LRU 算法移除 key。 volatile-random:在过期集合中移除随机的 key,只对设置了过期时间的键。 allkeys-random:在所有集合 key 中,移除随机的 key。 volatile-ttl:移除那些 TTL 值最小的 key,即那些最近要过期的 key。 noeviction:不进行移除。针对写操作,只是返回错误信息 |
maxmemory-samples | maxmemory-samples 5 | 设置样本数量,LRU 算法和最小 TTL 算法都并非是精确的算法,而是估算值,所以你可以设置样本的大小,redis 默认会检查这么多个 key 并选择其中 LRU 的那个。 一般设置 3 到 7 的数字,数值越小样本越不准确,但性能消耗越小。 |
Redis支持的一种消息通讯方式:
订阅端订阅渠道消息,一旦有发布端往渠道中推送消息,订阅端能立即接收到消息。
弊端:
Redis提供了Bitmaps这个“数据类型”可以实现对位的操作:
Bitmaps本身不是一种数据类型, 实际上它就是字符串(key-value) , 但是它可以对字符串的位进行操作。
Bitmaps单独提供了一套命令, 所以在Redis中使用Bitmaps和使用字符串的方法不太相同。 可以把Bitmaps想象成一个以位为单位的数组, 数组的每个单元只能存储0和1, 数组的下标在Bitmaps中叫做偏移量。
BitMaps最大占用512M.
即最大的长度可为: 512 * 1024 * 1024 * 8 = 4294967296
操作
操作 | 说明 |
setbit key offset value | 位赋值 |
getbit key offset | 位取值 |
bitcount key | 计算位1数 |
bitop [and|or] [destkey] [key1] [key2] [key3] | 位操作 |
示例:
- 127.0.0.1:6379> setbit visit1 1 1
- (integer) 0
- 127.0.0.1:6379> setbit visit1 4 1
- (integer) 0
- 127.0.0.1:6379> setbit visit2 1 1
- (integer) 0
- 127.0.0.1:6379> setbit visit2 10 1
- (integer) 0
- 127.0.0.1:6379> bitcount visit1
- (integer) 2
- 127.0.0.1:6379> bitcount visit2
- (integer) 2
- 127.0.0.1:6379> bitop and visit1&2 visit1 visit2
- (integer) 2
- 127.0.0.1:6379> bitcount visit1&2
- (integer) 1
- 127.0.0.1:6379> bitop or visit1|2 visit1 visit2
- (integer) 2
- 127.0.0.1:6379> bitcount visit1|2
- (integer) 3
Bitmaps与set对比
假设网站有1亿用户, 每天独立访问的用户有5千万, 如果每天用集合类型和Bitmaps分别存储活跃用户可以得到表:
set和Bitmaps存储一天活跃用户对比 | |||
数据类型 | 每个用户id占用空间 | 需要存储的用户量 | 全部内存量 |
集合 | 64位 | 50000000 | 64位*50000000 = 400MB |
Bitmaps | 1位 | 100000000 | 1位*100000000 = 12.5MB |
很明显, 这种情况下使用Bitmaps能节省很多的内存空间, 尤其是随着时间推移节省的内存还是非常可观的。
set和Bitmaps存储独立用户空间对比 | |||
数据类型 | 一天 | 一月 | 一年 |
集合 | 400M | 12GB | 144GB |
Bitmaps | 12.5MB | 375MB | 4.5GB |
但Bitmaps并不是万金油, 假如该网站每天的独立访问用户很少, 例如只有10万(大量的僵尸用户) , 那么两者的对比如下表所示, 很显然, 这时候使用Bitmaps就不太合适了, 因为基本上大部分位都是0。
set和Bitmaps存储一天活跃用户对比 | |||
数据类型 | 每个用户id占用空间 | 需要存储的用户量 | 全部内存量 |
集合 | 64位 | 100000 | 64位*100000 = 800KB |
Bitmaps | 1位 | 100000000 | 1位*100000000 = 12.5MB |
在工作当中经常会遇到与统计相关的功能需求,比如统计网站 PV(PageView 页面访问量),可以使用 Redis 的 incr、incrby 轻松实现。但像 UV(UniqueVisitor 独立访客)、独立 IP 数、搜索记录数等需要去重和计数的问题如何解决?这种求集合中不重复元素个数的问题称为基数问题。
解决基数问题有很多种方案:
以上的方案结果精确,但随着数据不断增加,导致占用空间越来越大,对于非常大的数据集是不切实际的。能否能够降低一定的精度来平衡存储空间?Redis 推出了 HyperLogLog。
Redis HyperLogLog 是用来做基数统计的算法,HyperLogLog 的优点是:在输入元素的数量或者体积非常非常大时,计算基数所需的空间总是固定的、并且是很小的。
在 Redis 里面,每个 HyperLogLog 键只需要花费 12 KB 内存,就可以计算接近 2^64 个不同元素的基数。这和计算基数时,元素越多耗费内存就越多的集合形成鲜明对比。
但是,因为 HyperLogLog 只会根据输入元素来计算基数,而不会储存输入元素本身,所以 HyperLogLog 不能像集合那样,返回输入的各个元素。
什么是基数?
比如数据集 {1, 3, 5, 7, 5, 7, 8},那么这个数据集的基数集为 {1, 3, 5 ,7, 8},基数 (不重复元素) 为 5。 基数估计就是在误差可接受的范围内,快速计算基数。
操作
操作 | 说明 |
pfadd [key] [value1] [value2] [value3] | 添加基数元素 |
pfcout [key] | 计算基数数量 |
pfmerge [destkey] [source1] [source2] [source3] | 合并基数 |
示例:
- 127.0.0.1:6379> pfadd skill java mysql
- (integer) 1
- 127.0.0.1:6379> pfadd skill c
- (integer) 1
- 127.0.0.1:6379> pfcount skill
- (integer) 3
- 127.0.0.1:6379> pfadd skill2 chinese english
- (integer) 1
- 127.0.0.1:6379> pfcount skill2
- (integer) 2
- 127.0.0.1:6379> pfmerge allskill skill skill2
- OK
- 127.0.0.1:6379> pfcount allskill
- (integer) 6
Redis 3.2 中增加了对 GEO 类型的支持。GEO,Geographic,地理信息的缩写。
该类型就是元素的 2 维坐标,在地图上就是经纬度。
redis 基于该类型,提供了经纬度设置,查询,范围查询,距离查询,经纬度 Hash 等常见操作。
操作
操作 | 说明 |
geoadd [key] [lon1] [lat1] [pos1] [lon2] [lat2] [pos2] | 添加经纬度 |
geopos [key] [pos] | 获取地区经纬度 |
geodist [key] [pos1] [pos2] [unit] | 获取两个点的距离 |
georadius [key] [lon1] [lat1] [radius] [unit] | 获取某坐标点范围内的地区 |
示例:
- 127.0.0.1:6379> geoadd china:city 121.47 31.23 shanghai
- (integer) 1
- 127.0.0.1:6379> geoadd china:city 106.50 29.53 chongqing 114.52 22.52 shenzhen 116.38 39.90 beijing
- (integer) 3
- 127.0.0.1:6379> geopos china:city shanghai beijing
- 1) 1) "121.47000163793564"
- 2) "31.229999039757836"
- 2) 1) "116.38000041246414"
- 2) "39.900000091670925"
- 127.0.0.1:6379> geodist china:city shanghai beijing km
- "1068.1535"
- 127.0.0.1:6379> geodist china:city beijing chongqing m
- "1462950.5002"
- 127.0.0.1:6379> georadius china:city 110 30 1000 km
- 1) "chongqing"
- 2) "shenzhen"
- 127.0.0.1:6379> type china:city
- zset
同Jdbc,Java也提供了Jedis这类工具包进行redis连接及操作。
项目中,我们引入Jedis依赖即可使用。
- <dependency>
- <groupId>redis.clients</groupId>
- <artifactId>jedis</artifactId>
- <version>3.3.0</version>
- </dependency>
示例:
- public class JedisDemo1 {
- public static void main(String[] args) {
- Jedis jedis = new Jedis("127.0.0.1", 6379);
- String ping = jedis.ping();
- System.out.println(ping);
- }
-
- @Test
- public void demo() {
- Jedis jedis = new Jedis("127.0.0.1", 6379);
- String s = jedis.flushDB();
- System.out.println(s);
- }
-
- @Test
- public void demo1() {
- Jedis jedis = new Jedis("127.0.0.1", 6379);
- Set<String> keys = jedis.keys("*");
- System.out.println(keys);
- }
-
- @Test
- public void demo2() {
- Jedis jedis = new Jedis("127.0.0.1", 6379);
- String set = jedis.set("name", "xiang");
-
- String name = jedis.get("name");
- System.out.println(name);
-
- jedis.mset("k1", "v1", "k2", "v2");
-
- List<String> mGet = jedis.mget("k1", "k2");
- System.out.println(mGet);
- }
-
- @Test
- public void demo3() {
- Jedis jedis = new Jedis("127.0.0.1", 6379);
- Long lpush = jedis.lpush("list", "v1", "v2", "v3");
- System.out.println(lpush);
-
- List<String> list = jedis.lrange("list", 0, -1);
- System.out.println(list);
- }
-
- @Test
- public void demo4() {
- Jedis jedis = new Jedis("127.0.0.1", 6379);
- jedis.sadd("family", "xiang");
- jedis.sadd("family", "yuan");
-
- Set<String> set = jedis.smembers("family");
- System.out.println(set);
- }
-
-
- @Test
- public void demo5() {
- Jedis jedis = new Jedis("127.0.0.1", 6379);
- jedis.hset("desc", "price", "12");
- jedis.hset("desc", "height", "140");
-
- jedis.hincrBy("desc", "price", 12);
- Map<String, String> desc = jedis.hgetAll("desc");
- System.out.println(desc);
- }
-
- @Test
- public void demo6() {
- Jedis jedis = new Jedis("127.0.0.1", 6379);
-
- jedis.zadd("city", 90, "nanjing");
- jedis.zadd("city", 95, "shanghai");
- jedis.zadd("city", 99, "beijing");
-
- Set<Tuple> city = jedis.zrangeByScoreWithScores("city", 0, 100);
- System.out.println(city);
- }
- }
与Springboot整合只需要引入启动器即可
- <dependency>
- <groupId>org.springframework.boot</groupId>
- <artifactId>spring-boot-starter-data-redis</artifactId>
- </dependency>
在application.yml中配置具体redis连接信息:
- spring:
- redis:
- port: 6379
- host: 127.0.0.1
示例:
- @Slf4j
- @RestController
- public class MyController {
-
- @Autowired
- private RedisTemplate<String, String> redisTemplate;
-
- @GetMapping("test")
- public String test(){
- redisTemplate.opsForValue().set("name1","xiang");
- String name1 = redisTemplate.opsForValue().get("name1");
- log.info("name:{}", name1);
- return name1;
- }
- }
根据需要自定义redisTemplate:
- @EnableCaching
- @Configuration
- public class RedisConfig extends CachingConfigurerSupport {
- @Bean
- public RedisTemplate<String, Object> redisTemplate(RedisConnectionFactory factory) {
- RedisTemplate<String, Object> template = new RedisTemplate<>();
- RedisSerializer<String> redisSerializer = new StringRedisSerializer();
- Jackson2JsonRedisSerializer jackson2JsonRedisSerializer = new Jackson2JsonRedisSerializer(Object.class);
- ObjectMapper om = new ObjectMapper();
- om.setVisibility(PropertyAccessor.ALL, JsonAutoDetect.Visibility.ANY);
- om.enableDefaultTyping(ObjectMapper.DefaultTyping.NON_FINAL);
- jackson2JsonRedisSerializer.setObjectMapper(om);
- template.setConnectionFactory(factory);
- template.setKeySerializer(redisSerializer);
- template.setValueSerializer(jackson2JsonRedisSerializer);
- template.setHashValueSerializer(jackson2JsonRedisSerializer);
- return template;
- }
-
- @Bean
- public CacheManager cacheManager(RedisConnectionFactory factory) {
- RedisSerializer<String> redisSerializer = new StringRedisSerializer();
- Jackson2JsonRedisSerializer jackson2JsonRedisSerializer = new Jackson2JsonRedisSerializer(Object.class);
- ObjectMapper om = new ObjectMapper();
- om.setVisibility(PropertyAccessor.ALL, JsonAutoDetect.Visibility.ANY);
- om.enableDefaultTyping(ObjectMapper.DefaultTyping.NON_FINAL);
- jackson2JsonRedisSerializer.setObjectMapper(om);
- RedisCacheConfiguration config = RedisCacheConfiguration.defaultCacheConfig().entryTtl(Duration.ofSeconds(600))
- .serializeValuesWith(RedisSerializationContext.SerializationPair.fromSerializer(jackson2JsonRedisSerializer))
- .disableCachingNullValues();
- RedisCacheManager cacheManager = RedisCacheManager.builder(factory)
- .cacheDefaults(config)
- .build();
- return cacheManager;
- }
- }
Redis 事务是一个单独的隔离操作:事务中的所有命令都会序列化、按顺序地执行。事务在执行的过程中,不会被其他客户端发送来的命令请求所打断。
但它有区别与数据库的事务,类似的隔离性能够满足,但就无法满足原子性。
Redis的三个命令需要搭配使用:multi、exec、discard
Redis批量提交命令与Mysql事务命令对比 | ||
功能 | Redis命令 | Mysql命令 |
开启 | multi | start transaction |
提交 | exec | commit |
取消 | discard | rollback |
举例:
- 127.0.0.1:6379> multi
- OK
- 127.0.0.1:6379(TX)> set k1 v1
- QUEUED
- 127.0.0.1:6379(TX)> set k2 v2
- QUEUED
- 127.0.0.1:6379(TX)> exec
- 1) OK
- 2) OK
redis的事务其实是两段式:
1、命令入队
2、队列命令执行(或取消)
需要注意的是:
若命令在入队时报错,则整队命令都不会执行;
若命令在执行时失败,则该条命令失败,不会影响前面或后面的语句执行。
入队时失败示例:
- 127.0.0.1:6379> multi
- OK
- 127.0.0.1:6379(TX)> set k1 v1
- QUEUED
- 127.0.0.1:6379(TX)> set k2
- (error) ERR wrong number of arguments for 'set' command
- 127.0.0.1:6379(TX)> exec
- (error) EXECABORT Transaction discarded because of previous errors.
执行时失败示例:
- 127.0.0.1:6379> multi
- OK
- 127.0.0.1:6379(TX)> set k1 v1
- QUEUED
- 127.0.0.1:6379(TX)> incr k1
- QUEUED
- 127.0.0.1:6379(TX)> set k2 v2
- QUEUED
- 127.0.0.1:6379(TX)> exec
- 1) OK
- 2) (error) ERR value is not an integer or out of range
- 3) OK
想想一个场景:有很多人有你的账户,同时去参加双十一抢购。
例子:
最终我们可以发现,总共金额是 10000,如果请求全部执行,那最后的金额变为 - 4000,很明显不合理。
悲观锁
悲观锁 (Pessimistic Lock),顾名思义,就是很悲观,每次去拿数据的时候都认为别人会修改,所以每次在拿数据的时候都会上锁,这样别人想拿这个数据就会 block 直到它拿到锁。
传统的关系型数据库里边就用到了很多这种锁机制,比如行锁,表锁等,读锁,写锁等,都是在做操作之前先上锁。
乐观锁
乐观锁 (Optimistic Lock),顾名思义,就是很乐观,每次去拿数据的时候都认为别人不会修改,所以不会上锁,但是在更新的时候会判断一下在此期间别人有没有去更新这个数据,可以使用版本号等机制。
乐观锁适用于多读的应用类型,这样可以提高吞吐量。Redis 就是利用这种 check-and-set 机制实现事务的。
watch key [key …]
在执行 multi 之前,先执行 watch key1 [key2],可以监视一个 (或多个) key 。
如果在事务执行之前这个 (或这些) key 被其他命令所改动,那么事务将被打断。
示例:
1、预置balance参数
- 127.0.0.1:6379> set balance 100
- OK
2、打开两个客户端同时监视balance值
后执行exec的那个会失败
- 127.0.0.1:6379> watch balance
- OK
- 127.0.0.1:6379> multi
- OK
- 127.0.0.1:6379(TX)> incrby balance 10
- QUEUED
- 127.0.0.1:6379(TX)> exec
- 1) (integer) 110
- 127.0.0.1:6379> watch balance
- OK
- 127.0.0.1:6379> multi
- OK
- 127.0.0.1:6379(TX)> incrby balance 10
- QUEUED
- 127.0.0.1:6379(TX)> exec
- (nil)
unwatch
取消 WATCH 命令对所有 key 的监视。
如果在执行 WATCH 命令之后,EXEC 命令或 DISCARD 命令先被执行了的话,那么就不需要再执行 UNWATCH 了。
Redis 事务三特性
单独的隔离操作 :事务中的所有命令都会序列化、按顺序地执行。事务在执行的过程中,不会被其他客户端发送来的命令请求所打断。
没有隔离级别的概念 :队列中的命令没有提交之前都不会实际被执行,因为事务提交前任何指令都不会被实际执行。
不保证原子性 :事务中如果有一条命令执行失败,其后的命令仍然会被执行,没有回滚 。
解决计数器和人员记录的事务操作
秒杀代码流程
- public static boolean flashSale(String pid, String uid) {
- if (pid == null || uid == null) {
- System.out.println("用户ID或商品ID不得为空");
- return false;
- }
-
- try (Jedis jedis = new Jedis("127.0.0.1", 6379)) {
- String kcKey = "sk:" + pid + ":kc";
- String usersKey = "sk:" + pid + ":users";
- String kc = jedis.get(kcKey);
- if (kc == null) {
- System.out.println("秒杀活动尚未开始");
- return false;
- }
- if (Integer.parseInt(kc) <= 0) {
- System.out.println("秒杀活动已结束");
- return false;
- }
- if (jedis.sismember(usersKey, uid)) {
- System.out.println("用户不得重复进行秒杀");
- return false;
- }
-
- jedis.incrBy(kcKey, -1);
- jedis.sadd(usersKey, uid);
- System.out.println(uid + "用户成功秒杀");
- return true;
- }
- }
上述代码未考虑并发处理,存在超卖问题
解决超卖问题
利用乐观锁解决超卖问题,监视库存键。
- public static boolean flashSale(String pid, String uid) {
- if (pid == null || uid == null) {
- System.out.println("用户ID或商品ID不得为空");
- return false;
- }
-
- try (Jedis jedis = new Jedis("127.0.0.1", 6379)) {
- String kcKey = "sk:" + pid + ":kc";
- String usersKey = "sk:" + pid + ":users";
- String kc = jedis.get(kcKey);
- if (kc == null) {
- System.out.println("秒杀活动尚未开始");
- return false;
- }
- if (Integer.parseInt(kc) <= 0) {
- System.out.println("秒杀活动已结束");
- return false;
- }
- if (jedis.sismember(usersKey, uid)) {
- System.out.println("用户不得重复进行秒杀");
- return false;
- }
-
- //此处增加监视
- jedis.watch(kcKey);
- Transaction multi = jedis.multi();
- multi.incrBy(kcKey, -1);
- multi.sadd(usersKey, uid);
- List<Object> result = multi.exec();
- if(result == null || result.size() == 0){
- System.out.println(uid + "秒杀失败");
- return false;
- }
- System.out.println(uid + "用户成功秒杀");
- return true;
- }
- }
由于乐观锁导致同批次请求处理失败,同时刻的请求会处理失败。虽然请求数量远大于库存数量,但却会存在库存剩余问题。
解决库存剩余问题
上述问题由于乐观锁导致,那考虑使用悲观锁,让请求顺序处理。
Redis需要结合LUA脚本才能保证请求顺序执行。
LUA 脚本在 Redis 中的优势
LUA脚本:
- local userid=KEYS[1];
- local prodid=KEYS[2];
- local qtkey="sk:"..prodid..":kc";
- local usersKey="sk:"..prodid..":users";
- local userExists=redis.call("sismember",usersKey,userid);
- if tonumber(userExists)==1 then
- return 2;
- end
- local num = redis.call("get",qtkey);
- if tonumber(num)<=0 then
- return 0;
- else
- redis.call("decr",qtkey);
- redis.call("sadd",usersKey,userid);
- end;
- return 1;
使用LUA脚本处理秒杀:
- public static boolean flashSale(String pid, String uid) {
- try (Jedis jedis = new Jedis("127.0.0.1", 6379)) {
- String sha1 = jedis.scriptLoad(flushSaleScript);
- Object result = jedis.evalsha(sha1, 2, uid, pid);
- String resultStr = String.valueOf(result);
- if("0".equals(resultStr)){
- System.out.println("已抢空");
- return false;
- }else if("1".equals(resultStr)){
- System.out.println("抢购成功");
- return true;
- }else if("2".equals(resultStr)){
- System.out.println("已经抢购过");
- return false;
- }else{
- System.out.println("抢购异常");
- return false;
- }
- }
- }
官网介绍:Redis
Redis 提供了 2 个不同形式的持久化方式:
在指定的时间间隔内将内存中的数据集快照写入磁盘, 也就是Snapshot快照,它恢复时是将快照文件直接读到内存里。
备份是如何执行的
Redis 会单独创建(fork)一个子进程来进行持久化,首先会将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。
整个过程中,主进程是不进行任何 IO 操作的,这就确保了极高的性能。
如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感, RDB 方式要比 AOF 方式更加的高效。
RDB 的缺点是最后一次持久化后的数据可能丢失。
Fork
Fork 的作用是复制一个与当前进程一样的进程。新进程的所有数据(变量、环境变量、程序计数器等) 数值都和原进程一致,但是是一个全新的进程,并作为原进程的子进程。
在 Linux 程序中,fork () 会产生一个和父进程完全相同的子进程,但子进程在此后多会 exec 系统调用,出于效率考虑,Linux 中引入了 “写时复制技术”。
一般情况父进程和子进程会共用同一段物理内存,只有进程空间的各段的内容要发生变化时,才会将父进程的内容复制一份给子进程。
问题:在进行bgsave的时,新写入的数据会被保存到RDB中吗?
不会,执行bgsave时,会把父进程内存进行快照一份,然后子进程用自己的快照来遍历写入RDB。
作者:天龙
链接:https://www.zhihu.com/question/449947403/answer/1787213651
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
bgsave 的原理是 fork() + copyonwrite 。
fork()是unix和linux这种操作系统的一个api,而不是Redis的api。
当bgsave执行时,Redis主进程会判断当前是否有fork()出来的子进程,若有则忽略,若没有则会fork()出一个子进程来执行rdb文件持久化的工作,子进程与Redis主进程共享同一份内存空间,所以子进程可以搞他的rdb文件持久化工作,主进程又能继续他的对外提供服务,二者互不影响。
我们说了他们之后的修改内存数据对彼此不可见,但是明明指向的都是同一块内存空间,这是咋搞得?肯定不可能是fork()出来子进程后顺带复制了一份数据出来。
主进程fork()子进程之后,内核把主进程中所有的内存页的权限都设为read-only,然后子进程的地址空间指向主进程。这也就是共享了主进程的内存,当其中某个进程写内存时(这里肯定是主进程写,因为子进程只负责rdb文件持久化工作,不参与客户端的请求),CPU硬件检测到内存页是read-only的,于是触发页异常中断(page-fault),陷入内核的一个中断例程。
中断例程中,内核就会把触发的异常的页复制一份(这里仅仅复制异常页,也就是所修改的那个数据页,而不是内存中的全部数据),于是主子进程各自持有独立的一份。
所以就是更改数据的之前进行copy一份更改数据的数据页出来,比如主进程收到了set k 1请求(之前k的值是2),然后这同时又有子进程在rdb持久化,那么主进程就会把k这个key的数据页拷贝一份,并且主进程中k这个指针指向新拷贝出来的数据页地址上,然后进行更改值为1的操作,这个主进程k元素地址引用的新拷贝出来的地址,而子进程引用的内存数据k还是修改之前的。
dump.rdb 文件
在 redis.conf 中配置文件名称,默认为 dump.rdb。
rdb 文件的保存路径,也可以修改。默认为 Redis 启动时命令行所在的目录下 “dir ./”
如何触发 RDB 快照;保持策略
配置文件中默认的快照配置
- save 3600 1
- save 300 100
- save 60 10000
命令 save VS bgsave
flushall 命令
优势
劣势
如何停止
动态停止 RDB:redis-cli config set save “”#save 后给空值,表示禁用保存策略。
以日志的形式来记录每个写操作(增量保存),将 Redis 执行过的所有写指令记录下来 (读操作不记录), 只许追加文件但不可以改写文件。
redis启动时会执行AOF每一条写指令恢复数据。
AOF 默认不开启
可以在 redis.conf 中配置文件名称默认为 appendonly.aof 文件中开启,AOF 文件的保存路径,同 RDB 的路径一致。
- vi redis.conf
-
- //...
- appendonly yes
AOF 和 RDB 同时开启,redis 听谁的?
AOF 和 RDB 同时开启,系统默认取 AOF 的数据(数据不会存在丢失)。
AOF 启动、修复、恢复
AOF 的备份机制和性能虽然和 RDB 不同,但是备份和恢复的操作同 RDB 一样,都是拷贝备份文件,需要恢复时再拷贝到 Redis 工作目录下,启动系统即加载。
正常恢复
异常恢复
AOF 同步频率设置
Rewrite 压缩是什么
AOF 采用文件追加方式,文件会越来越大。
为避免出现此种情况,新增了重写机制,当 AOF 文件的大小超过所设定的阈值时,Redis 就会启动 AOF 文件的内容压缩,只保留可以恢复数据的最小指令集。
可以使用命令 bgrewriteaof。
重写原理,如何实现重写
AOF 文件持续增长而过大时,会 fork 出一条新进程来将文件重写 (也是先写临时文件最后再 rename)。
redis4.0 版本后的重写,是把 rdb 的快照以二进制的形式附在新的 aof 头部,作为已有的历史数据,替换掉原来的流水账操作。(所以aof的实际大小并不会比rbd大很多)
no-appendfsync-on-rewrite:
触发机制,何时重写
Redis 会记录上次重写时的 AOF 大小,默认配置是当 AOF 文件大小是上次 rewrite 后大小的一倍且文件大于 64M 时触发。
重写虽然可以节约大量磁盘空间,减少恢复时间。但是每次重写还是有一定的负担的,因此设定 Redis 要满足一定条件才会进行重写。
重写流程
bgrewriteaof完后生成的文件为两部分:
优势
劣势
优劣势总结:
官方推荐两个都启用:
官网建议