Redis的所有数据都存储在内存中,但是他也提供对这些数据的持久化。
Redis是一个支持持久化的内存数据库,Redis需要经常将内存中的数据同步到磁盘来保证持久化。Redis支持四种持久化方式,一种是 Snapshotting
(快照)也是默认方式 ,另一种是 Append-only file
(aof)的方式 。
RDB持久化方式
Snapshotting方式是将内存中数据以快照的方式写入到二进制文件中,默认的文件名为dump.rdb。可以通过配置设置自动做快照持久化。例如可以配置redis在n秒内如果超过m个key被修改就自动做快照。
实现机制
Redis调用fork子进程。
父进程继续处理client请求,子进程负责将内存内容写入到临时文件。由于os的实时复制机制(copy on write)父子进程会共享相同的物理页面,当父进程处理写请求时os会为父进程要修改的页面创建副本,而不是写共享的页面。所以子进程地址空间内的数据是fork时刻整个数据库的一个快照。
当子进程将快照写入临时文件完毕后,用临时文件替换原来的快照文件,然后子进程退出。client也可以使用save或者bgsave命令通知redis做一次快照持久化。save操作是在主线程中保存快照的,由于redis是用一个主线程来处理所有client的请求,这种方式会阻塞所有clien:请求。所以不推荐使用。另一点需要注意的是,每次快照持久化都是完整写入到磁盘一次并不是增量的只同步变更数据。如果数据量大的话,而且写操作比较多,必然会引起大量的磁盘IO操作,可能会严重影响性能。
缺点:
快照方式是在一定间隔时间做一次的,所以如果redis意外down掉的话,就会丢失最后一次快照后的所有修改。如果应用要求不能丢失任何修改的话,可以采用aof持久化方式。
相关配置
|
|
持久化测试
|
|
生成dump.rdb文件
|
|
关闭服务删除dump.rdb文件重新启动redis服务
|
|
将dump.rdb.bk文件恢复成dump.rdb。再启动服务器。
|
|
手工强制刷新
|
|
此时服务器端消息
|
|
AOF存储介绍
Append-Only-File(追加式的操作日志记录)
由于快照方式是在一定间隔时间做一次的,所以如果redis意外down掉的话,就会丢失最后一次快照后的所有修改。如果应用要求不能丢失任何修改的话,可以采用aof持久化方式。
aof比快照方式有更好的持久化性,是由于在使用aof持久化方式时,redis会将每一个收到的写命令都通过write函数追加到文件中(默认是appendonly.aof)。当redis重启时会通过重新执行文件中保存的写命令来在内存中重建整个数据库的内容。当然由于os会在内核中缓存write做的修改,所以可能不是立即写到磁盘上。这样aof方式的持久化也还是有可能会丢失部分修改.不过我们可以通过配置文件告诉redis我们想要通过fsync函数强制os写入到磁盘的时机。
实现机制
以日志的形式来记录每个写操作,将Redis执行过的所有写指令记录下来(不记录读操作),只许追加文件但不可以改写文件,redis启动之初会读取该文件重新构建数据。当 Redis 重启时,它会优先使用AOF文件来还原数据,因为AOF文件保存的数据集通常比RDB文件所保存的数据集更完整。你甚至可以关闭持久化功能,让数据只在服务器运行时存在。在redis中这种存储方式默认是关闭的,需要在redis.conf文件中开启。
相关配置
|
|
测试
使用for循环批量更改一个key的值
|
|
此时redis服务端的信息
|
|
此时日志文件大小
|
|
手动生成新的AOF文件
|
|
日志重写
aof的方式也同时带来了另一个问题。持久化文件会变的越来越大。例如我们调用incr test命令100次,文保中必须保存全部的100条命令,其实有99条都是多余的。因为要恢复数据库的状态其实文件中保存一条set test 100就够了。为了压缩aof的持久化文件,Redis提供了bgrewriteaof命令.收到此命令Redis将使用与快照类似的方式将内存中的数据以命令的方式保存到临时文件中,最后替换原来的文件。
自动bgrewriteaof参数设置
|
|
如何选择RDB和AOF ?
一般来说,如果想达到足以媲美 PostgreSQL 的数据安全性,你应该同时使用两种持久化功能。如果你非常关心你的数据,但仍然可以承受数分钟以内的数据丢失,那么你可以只使用 RDB 持久化。有很多用户都只使用 AOF 持久化,并不推荐这种方式: 因为定时生成 RDB 快照(snapshot)非常便于进行数据库备份, 并且RDB恢复数据集的速度也要比AOF恢复的速度要快, 除此之外, 使用RDB还可以避免之前提到的AOF程序的bug 。因为以上提到的种种原因, 未来Redis可能会将AOF和RDB整合成单个持久化模型。(这是一个长期计划)。