Mysql 锁学习记录
Mysql 锁设计的初衷是处理并发问题。根据加锁的范围,MySQL 里面的锁大致可以分成全局锁、表级锁和行锁三类。
由于自己基本没有使用过锁,对锁的理解不够深刻,大都仅限于概念,所以需要多多实践。
全局锁
全局锁就是对整个数据库实例加锁。MySQL 提供了一个加全局读锁的方法,命令是:
1 | Flush tables with read lock; |
当你需要让整个库处于只读状态的时候,可以使用这个命令,之后其他线程的以下语句会被阻塞:数据更新语句(数据的增删改)、数据定义语句(包括建表、修改表结构等)和更新类事务的提交语句。
当我在第一个终端设置后,第二个终端增加一行会被阻塞。
全局锁的典型使用场景是,做全库逻辑备份。也就是把整库每个表都 select 出来存成文本。
这里说明一下物理备份和逻辑备份的区别(逻辑备份很少用到,之前说过的备份整个库就是指的逻辑备份,恢复到任意时间点就是使用逻辑备份+bin log):
- 物理备份:物理备份就是转储数据库物理文件(如数据文件、控制文件、归档日志文件等)。如 bin log 就是物理备份。
- 逻辑备份:逻辑备份就是对数据库对象(如用户、表、存储过程等)利用工具进行导出工作,可以利用工具把逻辑备份文件导入到数据库。
但是让整库都只读,听上去就很危险:
- 如果你在主库上备份,那么在备份期间都不能执行更新,业务基本上就得停摆。
- 如果你在从库上备份,那么备份期间从库不能执行主库同步过来的 bin log,会导致主从延迟。
但是不备份也不行,其实还可以用 MVCC 的可重复读来备份,官方自带工具 mysqldump,但是有些引擎不支持 MVCC(InnoDB 支持),所以还是得用上面命令(现在基本都是 InnoDB,mysqldump 挺方便的)。
既然要全库只读,为什么不使用 set global readonly=true 的方式呢?确实 readonly 方式也可以让全库进入只读状态,但我还是会建议你用 FTWRL 方式,主要有两个原因:
- 一是,在有些系统中,readonly 的值会被用来做其他逻辑,比如用来判断一个库是主库还是备库。因此,修改 global 变量的方式影响面更大,不建议使用。
- 二是,在异常处理机制上有差异。如果执行 FTWRL 命令之后由于客户端发生异常断开,那么 MySQL 会自动释放这个全局锁,整个库回到可以正常更新的状态。而将整个库设置为 readonly 之后,如果客户端发生异常,则数据库就会一直保持 readonly 状态,这样会导致整个库长时间处于不可写状态,风险较高。
(补充:set global readonly=true 基本没见用过了,所以上面的了解就好。)
表级锁
MySQL 里面表级别的锁有两种:一种是表锁,一种是元数据锁(meta data lock,MDL)。
(表锁锁的是表里边的数据,元数据锁锁的是表的结构。)
表锁的语法是 lock tables … read/write。与 FTWRL 类似,可以用 unlock tables 主动释放锁,也可以在客户端断开的时候自动释放。需要注意,lock tables 语法除了会限制别的线程的读写外,也限定了本线程接下来的操作对象。
举个例子, 如果在某个线程 A 中执行 lock tables t1 read, t2 write; 这个语句,则其他线程写 t1、读写 t2 的语句都会被阻塞。同时,线程 A 在执行 unlock tables 之前,也只能执行读 t1、读写 t2 的操作。连写 t1 都不允许,自然也不能访问其他表。
上面的意思是:如果对一个表使用了lock tables * read
,那么此时限制这个线程只能读这个 tables(别的线程既可以读,也可以写这个 tables),但是不能读写别的 tables(就是限制到这一个中);如果对一个表使用lock tables * write
,那么这个线程只能读写这个 tables,别的线程不能读写这个 tables。
使用lock tables * read
:
使用lock tables * write
:
此时第二个终端阻塞:
在还没有出现更细粒度的锁的时候,表锁是最常用的处理并发的方式。而对于 InnoDB 这种支持行锁的引擎,一般不使用 lock tables 命令来控制并发,毕竟锁住整个表的影响面还是太大。
另一类表级的锁是MDL(metadata lock)。MDL 不需要显式使用,在访问一个表的时候会被自动加上。MDL 的作用是,保证读写的正确性。你可以想象一下,如果一个查询正在遍历一个表中的数据,而执行期间另一个线程对这个表结构做变更,删了一列,那么查询线程拿到的结果跟表结构对不上,肯定是不行的。
因此,在 MySQL 5.5 版本中引入了 MDL,当对一个表做增删改查操作的时候,加 MDL 读锁;当要对表做结构变更操作的时候,加 MDL 写锁。
- 读锁之间不互斥,因此你可以有多个线程同时对一张表增删改查。
- 读写锁之间、写锁之间是互斥的,用来保证变更表结构操作的安全性。因此,如果有两个线程要同时给一个表加字段,其中一个要等另一个执行完才能开始执行。
虽然 MDL 锁是系统默认会加的,但却是你不能忽略的一个机制。比如下面这个例子,我经常看到有人掉到这个坑里:给一个小表加个字段,导致整个库挂了。
我们可以看到 session A 先启动,这时候会对表 t 加一个 MDL 读锁。由于 session B 需要的也是 MDL 读锁,因此可以正常执行。
之后 session C 会被 blocked,是因为 session A 的 MDL 读锁还没有释放,而 session C 需要 MDL 写锁,因此只能被阻塞。
如果只有 session C 自己被阻塞还没什么关系,但是之后所有要在表 t 上新申请 MDL 读锁的请求也会被 session C 阻塞。前面我们说了,所有对表的增删改查操作都需要先申请 MDL 读锁,就都被锁住,等于这个表现在完全不可读写了。
如果某个表上的查询语句频繁,而且客户端有重试机制,也就是说超时后会再起一个新 session 再请求的话,这个库的线程很快就会爆满。
你现在应该知道了,事务中的 MDL 锁,在语句执行开始时申请,但是语句结束后并不会马上释放,而会等到整个事务提交后再释放。
如何解决?
在 alter table 语句里面设定等待时间,如果在这个指定的等待时间里面能够拿到 MDL 写锁最好,拿不到也不要阻塞后面的业务语句,先放弃。之后开发人员或者 DBA 再通过重试命令重复这个过程。
行锁
行锁就是针对数据表中行记录的锁。比如事务 A 更新了一行,而这时候事务 B 也要更新同一行,则必须等事务 A 的操作完成后才能进行更新。
在 InnoDB 事务中,行锁是在需要的时候才加上的,但并不是不需要了就立刻释放,而是要等到事务结束时才释放。这个就是两阶段锁协议。
终端 1,开启事务不自动提交:
终端 2:
知道了这个设定,对我们使用事务有什么帮助呢?那就是,如果你的事务中需要锁多个行,要把最可能造成锁冲突、最可能影响并发度的锁尽量往后放(因为如果有锁冲突,这样会使锁冲突的时间最小)。
但是如果此时还有死锁怎么办?
简单说两种:
消息队列,把相同行的更新放入队列中,一次只能执行一个。缺点是代码不好编写。
将一行改成逻辑上的多行来减少锁冲突。比如一行值记录总钱数,可以考虑分成 10 行来记录。缺点是需要有一些额外的逻辑。
想起之前的一个需求,leader 说这个需求涉及到钱,需要用行锁,当时我以为行锁很麻烦,就没有使用,而是多加了几层循环保证尽量落入数据库。现在回想起来,行锁会在需要的时候自动添加,我只需要保证这行数据尽可能的成功落入数据库就可以了。