第 10 章 事务基础知识

作者: Brinnatt 分类: mysql 经验专题 发布时间: 2023-01-13 16:18

10.1、数据库事务概述

10.1.1、存储引擎支持情况

SHOW ENGINES 命令来查看当前 MySQL 支持的存储引擎都有哪些,以及这些存储引擎是否支持事务。

mysql> show engines;
+--------------------+---------+----------------------------------------------------------------+--------------+------+------------+
| Engine             | Support | Comment                                                        | Transactions | XA   | Savepoints |
+--------------------+---------+----------------------------------------------------------------+--------------+------+------------+
| ndbcluster         | NO      | Clustered, fault-tolerant tables                               | NULL         | NULL | NULL       |
| FEDERATED          | NO      | Federated MySQL storage engine                                 | NULL         | NULL | NULL       |
| MEMORY             | YES     | Hash based, stored in memory, useful for temporary tables      | NO           | NO   | NO         |
| InnoDB             | DEFAULT | Supports transactions, row-level locking, and foreign keys     | YES          | YES  | YES        |
| PERFORMANCE_SCHEMA | YES     | Performance Schema                                             | NO           | NO   | NO         |
| MyISAM             | YES     | MyISAM storage engine                                          | NO           | NO   | NO         |
| ndbinfo            | NO      | MySQL Cluster system information storage engine                | NULL         | NULL | NULL       |
| MRG_MYISAM         | YES     | Collection of identical MyISAM tables                          | NO           | NO   | NO         |
| BLACKHOLE          | YES     | /dev/null storage engine (anything you write to it disappears) | NO           | NO   | NO         |
| CSV                | YES     | CSV storage engine                                             | NO           | NO   | NO         |
| ARCHIVE            | YES     | Archive storage engine                                         | NO           | NO   | NO         |
+--------------------+---------+----------------------------------------------------------------+--------------+------+------------+
11 rows in set (0.00 sec)

能看出在 MySQL 中,只有 InnoDB 是支持事务的。

10.1.2、基本概念

事务:一组逻辑操作单元,使数据从一种状态变换到另一种状态。

事务处理的原则:保证所有事务都作为 一个工作单元 来执行,即使出现了故障,都不能改变这种执行方式。当在一个事务中执行多个操作时,要么所有的事务都被提交( commit ),那么这些修改就 永久 地保 存下来;要么数据库管理系统将 放弃 所作的所有 修改,整个事务回滚( rollback )到最初状态。

# 案例:AA用户给BB用户转账100
update account set money = money - 100 where name = 'AA';
# 服务器宕机
update account set money = money + 100 where name = 'BB';

10.1.3、事物的 ACID 特性

1、原子性(atomicity)

原子性是指事务是一个不可分割的工作单位,要么全部提交,要么全部失败回滚。即要么转账成功,要么转账失败,是不存在中间的状态。如果无法保证原子性会怎么样?就会出现数据不一致的情形,A 账户减去 100 元,而 B 账户增加 100 元操作失败,系统将无故丢失 100 元。

2、一致性(consistency)

根据定义,一致性是指事务执行前后,数据从一个 合法性状态 变换到另外一个 合法性状态 。这种状态是 语义上 的而不是语法上的,跟具体的业务有关。

那什么是合法的数据状态呢?满足 预定的约束 的状态就叫做合法的状态。通俗一点,这状态是由你自己来定义的(比如满足现实世界中的约束)。满足这个状态,数据就是一致的,不满足这个状态,数据就是不一致的!如果事务中的某个操作失败了,系统就会自动撤销当前正在执行的事务,返回到事务操作之前的状态。

举例 1:A 账户有 200 元,转账 300 元出去,此时 A 账户余额为 -100 元。你自然就发现此时数据是不一致的,为什么呢?因为你定义了一个状态,余额这列必须 >=0。

举例 2:A 账户有 200 元,转账 50 元给 B 账户,A 账户的钱扣了,但是 B 账户因为各种意外,余额并没有增加。你也知道此时的数据是不一致的,为什么呢?因为你定义了一个状态,要求 A+B 的总余额必须不变。

举例 3:在数据表中我们将 姓名 字段设置为 唯一性约束,这时当事务进行提交或者事务发生回滚的时候,如果数据表的姓名不唯一,就破坏了事物的一致性要求。

3、隔离型(isolation)

事务的隔离性是指一个事务的执行 不能被其他事务干扰,即一个事务内部的操作及使用的数据对 并发 的其他事务是隔离的,并发执行的各个事务之间不能相互干扰。

如果无法保证隔离性会怎么样?假设 A 账户有 200 元,B 账户 0元。A 账户往 B 账户转账两次,每次金额为 50 元,分别在两个事务中执行。如果无法保证隔离性,会出现下面的情形:

UPDATE accounts SET money = money - 50 WHERE NAME = 'AA';
UPDATE accounts SET money = money + 50 WHERE NAME = 'BB';

mysql_transaction_isolation

4、持久性(durability)

持久性是指一个事务一旦被提交,它对数据库中数据的改变就是永久性的,接下来的其他操作和数据库故障不应该对其有任何影响。

持久性是通过 事务日志 来保证的。日志包括了 重做日志回滚日志。当我们通过事务对数据进行修改的时候,首先会将数据库的变化信息记录到重做日志中,然后再对数据库中对应的行进行修改。这样做的好处是,即使数据库系统崩溃,数据库重启后也能找到没有更新到数据库系统中的重做日志,重新执行,从而使事务具有持久性。

ACID 是事务的四大特征,在这四个特性中,原子性是基础,隔离性是手段,一致性是约束条件,而持久性是我们的目的。

数据库事务,其实就是数据库设计者为了方便起见,把需要保证 原子性隔离性一致性持久性 的一个或多个数据库操作称为一个事务。

10.1.4、事务的状态

我们现在知道 事务 是一个抽象的概念,它其实对应着一个或多个数据库操作,MySQL 根据这些操作所执行的不同阶段把 事务 大致划分成几个状态:

  • 活动的(active)

    事务对应的数据库操作正在执行过程中时,我们就说该事务处在 活动的 状态。

  • 部分提交的(partially committed)

    当事务中的最后一个操作执行完成,但由于操作都在内存中执行,所造成的影响并 没有刷新到磁盘 时,我们就说该事务处在 部分提交的 状态。

  • 失败的(failed)

    当事务处在 活动的 或者部分提交的状态时,可能遇到了某些错误(数据库自身的错误、操作系统错误或者直接断电等)而无法继续执行,或者人为的停止当前事务的执行,我们就说该事务处在失败的状态。

  • 中止的(aborted)

    如果事务执行了一部分而变为 失败的 状态,那么就需要把已经修改的事务中的操作还原到事务执行前的状态。换句话说,就是要撤销失败事务对当前数据库造成的影响。我们把这个撤销的过程称之为 回滚。当 回滚 操作执行完毕时,也就是数据库恢复到了执行事务之前的状态,我们就说该事务处在了 中止的 状态。

  • 提交的(committed)

    当一个处在 部分提交的 状态的事务将修改过的数据都 同步到磁盘 上之后,我们就可以说该事务处在了 提交的 状态。

    一个基本的状态转换图如下所示:

    mysql_transaction_status

    图中可见,只有当事物处于 提交的 或者 中止的 状态时,一个事务的生命周期才算是结束了。对于已经提交的事务来说,该事务对数据库所做的修改将永久生效,对于处于中止状态的事物,该事务对数据库所做的所有修改都会被回滚到没执行该事物之前的状态。

10.2、如何使用事务

使用事务有两种方式,分别为 显式事务隐式事务

10.2.1、显式事务

步骤 1:START TRANSACTION 或者 BEGIN,作用是显式开启一个事务。

mysql> BEGIN;
#或者
mysql> START TRANSACTION;

START TRANSACTION 语句相较于 BEGIN 特别之处在于,后边能跟随几个 修饰符

  1. READ ONLY:标识当前事务是一个 只读事务,也就是属于该事务的数据库操作只能读取数据,而不能修改数据。
    • 只读事务中只是不允许修改那些其他事务也能访问到的表中的数据,对于临时表来说(我们使用 CREATE TMEPORARY TABLE 创建的表),由于它们只能在当前会话中可见,所有只读事务其实也是可以对临时表进行增、删、改操作的。
  2. READ WRITE:标识当前事务是一个 读写事务,也就是属于该事务的数据库操作既可以读取数据,也可以修改数据。
  3. WITH CONSISTENT SNAPSHOT:启动一致性读。

比如:

START TRANSACTION READ ONLY; # 开启一个只读事务
START TRANSACTION READ ONLY, WITH CONSISTENT SNAPSHOT # 开启只读事务和一致性读
START TRANSACTION READ WRITE, WITH CONSISTENT SNAPSHOT # 开启读写事务和一致性读

注意:

  • READ ONLYREAD WRITE 是用来设置所谓的事物 访问模式 的,就是以只读还是读写的方式来访问数据库中的数据,一个事务的访问模式不能同时即设置为 只读 的也设置为 读写 的,所以不能同时把 READ ONLYREAD WRITE 放到 START TRANSACTION 语句后边。
  • 如果我们不显式指定事务的访问模式,那么该事务的访问模式就是 读写 模式。

步骤 2:一系列事务中的操作(主要是 DML,不含 DDL)。

步骤 3:提交事务或中止事务(即回滚事务)。

# 提交事务。当提交事务后,对数据库的修改是永久性的。
mysql> COMMIT;
# 回滚事务。即撤销正在进行的所有没有提交的修改
mysql> ROLLBACK;

# 将事务回滚到某个保存点。
mysql> ROLLBACK TO [SAVEPOINT]

其中关于 SAVEPOINT 相关操作有:

# 在事务中创建保存点,方便后续针对保存点进行回滚。一个事务中可以存在多个保存点。
SAVEPOINT 保存点名称;
# 删除某个保存点
RELEASE SAVEPOINT 保存点名称;

10.2.2、隐式事务

MySQL 中有一个系统变量 autocommit

mysql> SHOW VARIABLES LIKE 'autocommit';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| autocommit    |  ON   |
+---------------+-------+
1 row in set (0.01 sec)

当然,如果我们想关闭这种 自动提交 的功能,可以使用下边两种方法之一:

  • 显式的的使用 START TRANSACTION 或者 BEGIN 语句开启一个事务。这样在本次事务提交或者回滚前会暂时关闭掉自动提交的功能。

  • 把系统变量 autocommit 的值设置为 OFF,就像这样:

    SET autocommit = OFF;
    #或
    SET autocommit = 0;

10.2.3、隐式提交数据的情况

  • 数据定义语言(Data definition language,缩写为 DDL)。

    数据库对象,指的就是 数据库、表、视图、存储过程 等结构。当我们 CREATE、ALTER、DROP 等语句去修改数据库对象时,就会隐式的提交前边语句所属于的事物。即:

    BEGIN;
    
    SELECT ... # 事务中的一条语句
    UPDATE ... # 事务中的一条语句
    ... # 事务中的其他语句
    
    CREATE TABLE ... # 此语句会隐式的提交前边语句所属于的事务
  • 隐式使用或修改 mysql 数据库中的表。

    当我们使用 ALTER USERCREATE USERDROP USERGRANTRENAME USERREVOKESET PASSWORD 等语句时也会隐式的提交前边语句所属于的事务。

  • 事务控制或关于锁定的语句。

    1. 当我们在一个事务还没提交或者回滚时就又使用 START TRANSACTION 或者 BEGIN 语句开启了另一个事务时,会隐式的提交上一个事务。即:

      BEGIN;
      
      SELECT ... # 事务中的一条语句
      UPDATE ... # 事务中的一条语句
      ... # 事务中的其他语句
      
      BEGIN; # 此语句会隐式的提交前边语句所属于的事务
    2. 当前的 autocommit 系统变量的值为 OFF,我们手动把它调为 ON 时,也会隐式的提交前边语句所属的事务。

    3. 使用 LOCK TABLES 、 UNLOCK TABLES 等关于锁定的语句也会隐式的提交前边语句所属的事务。

  • 加载数据的语句。

    使用 LOAD DATA 语句来批量往数据库中导入数据时,也会 隐式的提交 前边语句所属的事务。

  • 关于 MySQL 复制的一些语句。

    使用 START SLAVE、STOP SLAVE、RESET SLAVE、CHANGE MASTER TO 等语句会隐式的提交前边语句所属的事务。

  • 其他的一些语句

    使用 ANALYZE TABLE、CACHE INDEX、CAECK TABLE、FLUSH、LOAD INDEX INTO CACHE、OPTIMIZE TABLE、REPAIR TABLE、RESET 等语句也会隐式的提交前边语句所属的事务。

10.2.4、提交与回滚

我们看下在 MySQL 的默认状态下,下面这个事务最后的处理结果是什么。

情况 1

CREATE TABLE user(name varchar(20), PRIMARY KEY (name)) ENGINE=InnoDB;

BEGIN;
INSERT INTO user SELECT '张三';
COMMIT;

BEGIN;
INSERT INTO user SELECT '李四';
INSERT INTO user SELECT '李四';
ROLLBACK;

SELECT * FROM user;

运行结果(1 行数据):

mysql> commit;
Query OK, 0 rows affected (0.00 秒)

mysql> BEGIN;
Query OK, 0 rows affected (0.00 秒)

mysql> INSERT INTO user SELECT '李四';
Query OK, 1 rows affected (0.00 秒)

mysql> INSERT INTO user SELECT '李四';
Duplicate entry '李四' for key 'user.PRIMARY'
mysql> ROLLBACK;
Query OK, 0 rows affected (0.01 秒)

mysql> select * from user;
+--------+
| name   |
+--------+
| 张三    |
+--------+
1 行于数据集 (0.01 秒)

情况 2

CREATE TABLE user (name varchar(20), PRIMARY KEY (name)) ENGINE=InnoDB;

BEGIN;
INSERT INTO user SELECT '张三';
COMMIT;

INSERT INTO user SELECT '李四';
INSERT INTO user SELECT '李四';
ROLLBACK;

运行结果(2 行数据):

mysql> SELECT * FROM user;
+--------+
| name   |
+--------+
| 张三    |
| 李四    |
+--------+
2 行于数据集 (0.01 秒)

情况 3

CREATE TABLE user(name varchar(255), PRIMARY KEY (name)) ENGINE=InnoDB;

SET @@completion_type = 1;
BEGIN;
INSERT INTO user SELECT '张三';
COMMIT;

INSERT INTO user SELECT '李四';
INSERT INTO user SELECT '李四';
ROLLBACK;

SELECT * FROM user;

运行结果(1 行数据):

mysql> SELECT * FROM user;
+--------+
| name   |
+--------+
| 张三    |
+--------+
1 行于数据集 (0.01 秒)

你能看到相同的 SQL 代码,只是在事务开始之前设置了 SET @@completion_type=1;,结果就和我们第一次处理的一样,只有一个 "张三"。这是为什么呢?

这里讲解一下 MySQL 中 completion_type 参数的作用,实际上这个参数有 3 种可能:

  1. completion=0,这是 默认情况。当我们执行 COMMIT 的时候会提交事务,在执行下一个事务时,还需要使用 START TRANSACTION 或者 BEGIN 来开启。
  2. completion=1,这种情况下,当我们提交事务后,相当于执行了 COMMIT AND CHAIN,也就是开启一个链式事务,即当我们提交事务之后会开启一个相同隔离级别的事务。
  3. completion=2,这种情况下 COMMIT=COMMIT AND RELEASE,也就是当我们提交后,会自动与服务器断开连接。

当我们设置 autocommit=0 时,不论是否采用 START TRANSACTION 或者 BEGIN 的方式来开启事务,都需要用 COMMIT 进行提交,让事务生效,使用 ROLLBACK 对事务进行回滚。

当我们设置 autocommit=1 时,每条 SQL 语句都会自动进行提交。 不过这时,如果你采用 START TRANSACTION 或者 BEGIN 的方式来显式地开启事务,那么这个事务只有在 COMMIT 时才会生效,在 ROLLBACK 时才会回滚。

10.2.5、MYISAM 不支持事务

CREATE TABLE test1(i INT) ENGINE=InnoDB;

CREATE TABLE test2(i INT) ENGINE=MYISAM;

针对于 InnoDB 表:

BEGIN;
INSERT INTO test1 VALUES(1);
ROLLBACK;

SELECT * FROM test1;

结果:没有数据。

针对于 MYISAM 表:

BEGIN;
INSERT INTO test1 VALUES(1);
ROLLBACK;

SELECT * FROM test2;

结果:有一条数据。

10.2.6、SAVEPOINT

创建表并添加数据:

CREATE TABLE account(
id INT PRIMARY KEY AUTO_INCREMENT,
NAME VARCHAR(15),
balance DECIMAL(10,2)
);

INSERT INTO account(NAME,balance)
VALUES
('张三',1000),
('李四',1000);
BEGIN;
UPDATE account SET balance = balance - 100 WHERE NAME = '张三';
UPDATE account SET balance = balance - 100 WHERE NAME = '张三';
SAVEPOINT s1; # 设置保存点
UPDATE account SET balance = balance + 1 WHERE NAME = '张三';
ROLLBACK TO s1; # 回滚到保存点

结果:张三 800.00。

ROLLBACK;

结果:张三 1000.00。

10.3、事务隔离级别

MySQL 是一个 客户端/服务器 架构的软件,对于同一个服务器来说,可以有若干个客户端与之连接,每个客户端与服务器连接上之后,就可以称为一个会话( Session )。

每个客户端都可以在自己的会话中向服务器发出请求语句,一个请求语句可能是某个事务的一部分,也就是对于服务器来说可能同时处理多个事务。

事务有 隔离性 的特性,理论上在某个事务 对某个数据进行访问 时,其他事务应该进行 排队,当该事务提交之后,其他事务才可以继续访问这个数据。

但是这样对 性能影响太大,我们既想保持事务的隔离性,又想让服务器在处理访问同一数据的多个事务时 性能尽量高些,那就看二者如何权衡取舍了。

10.3.1、数据准备

CREATE TABLE student (
    studentno INT,
    name VARCHAR(20),
    class varchar(20),
    PRIMARY KEY (studentno)
) Engine=InnoDB CHARSET=utf8;

然后向这个表里插入一条数据:

INSERT INTO student VALUES(1, '小谷', '1班');

现在表里的数据就是这样的:

mysql> select * from student;
+-----------+--------+-------+
| studentno | name   | class |
+-----------+--------+-------+
|      1    |   小谷  | 1班   |
+-----------+--------+-------+
1 row in set (0.00 sec)

10.3.2、数据并发问题

针对事务的隔离性和并发性,我们怎么做取舍呢?先看一下访问相同数据的事务在不保证串行执行(也就是执行完一个再执行另一个)的情况下可能会出现哪些问题:

1、脏写(Dirty Write)

对于两个事务 Session A、Session B,如果事务 Session A 修改了 另一个 未提交 事务 Session B 修改过 的数据,那就意味着发生了 脏写,示意图如下:

mysql_isolation_dirty_write

Session A 和 Session B 各开启了一个事务,Sesssion B 中的事务先将 studentno 列为 1 的记录的 name 列更新为 '李四',然后 Session A 中的事务接着又把这条 studentno 列为 1 的记录的 name 列更新为 '张三'。

如果之后 Session B 中的事务进行了回滚,那么 Session A 中的更新也将不复存在,这种现象称之为脏写。这时 Session A 中的事务就没有效果了,明明把数据更新了,最后也提交事务了,最后看到的数据什么变化也没有。

这里大家对事务的隔离性比较了解的话,会发现默认隔离级别下,上面 Session A 中的更新语句会处于等待状态,这里只是跟大家说明一下会出现这样的现象。

2、脏读(Dirty Read)

对于两个事务 Session A、Session B,Session A 读取 了已经被 Session B 更新 但还 没有被提交 的字段。之后若 Session B 回滚,Session A 读取 的内容就是 临时且无效 的。

mysql_isolation_dirty_read

Session A 和 Session B 各开启了一个事务,Session B 中的事务先将 studentno 列为 1 的记录的 name 列更新 为 '张三',然后 Session A 中的事务再去查询这条 studentno 为 1 的记录,如果读到列 name 的值为 '张三',而 Session B 中的事务稍后进行了回滚,那么 Session A 中的事务相当于读到了一个不存在的数据,这种现象就称之为 脏读

3、不可重复读(Non-Repeatable Read)

对于两个事务 Session A、Session B,Session A 读取 了一个字段,然后 Session B 更新 了该字段。之后 Session A 再次读取 同一个字段,值就不同 了。那就意味着发生了不可重复读。

mysql_isolation_norepeatable

我们在 Session B 中提交了几个 隐式事务(注意是隐式事务,意味着语句结束事务就提交了),这些事务都修改了 studentno 列为 1 的记录的列 name 的值,每次事务提交之后,如果 Session A 中的事务都可以查看到最新的值,这种现象也被称之为 不可重复读

4、幻读(Phantom)

对于两个事务 Session A、Session B,Session A 从一个表中 读取 了一个字段,然后 Session B 在该表中插入了一些新的行。之后,如果 Session A 再次读取 同一个表,就会多出几行。那就意味着发生了 幻读

mysql_isolation_phantom

Session A 中的事务先根据条件 studentno > 0 这个条件查询表 student,得到了 name 列值为 '张三' 的记录;

之后 Session B 中提交了一个 隐式事务,该事务向表 student 中插入了一条新记录;

之后 Session A 中的事务再根据相同的条件 studentno > 0 查询表 student,得到的结果集中包含 Session B 中的事务新插入的那条记录,这种现象也被称之为幻读。

我们把新插入的那些记录称之为 幻影记录

有的同学会有疑问,那如果 Session B 中删除了一些符合 studentno > 0 的记录而不是插入新记录,那 Session A 之后再根据 studentno > 0 的条件读取的 记录变少了,这种现象算不算 幻读 呢?这种现象 不属于幻读,幻读强调的是一个事务按照某个 相同条件多次读取 记录时,后读取时读到了之前 没有读到的记录

那对于先前已经读到的记录,之后又读取不到这种情况,算啥呢?这相当于对每一条记录都发生了 不可重复读 的现象。幻读只是重点强调了读取到了之前没有读取到的记录。

10.3.3、SQL 中的四种隔离级别

上面介绍了几种并发事务执行过程中可能遇到的一些问题,这些问题有轻重缓急之分,我们给这些问题按照严重性来排一下序:

脏写 > 脏读 > 不可重复读 > 幻读

我们愿意舍弃一部分隔离性来换取一部分性能在这里就体现在:设立一些隔离级别,隔离级别越低,并发问题发生的就越多。SQL标准 中设立了 4 个 隔离级别

  • READ UNCOMMITTED:读未提交,在该隔离级别,所有事务都可以看到其他未提交事务的执行结果。不能避免脏读、不可重复读、幻读。
  • READ COMMITTED:读已提交,它满足了隔离的简单定义,一个事务只能看见已经提交事务所做的改变。这是大多数数据库系统的默认隔离级别(但不是 MySQL 默认的)。可以避免脏读,但不可重复读、幻读问题仍然存在。
  • REPEATABLE READ:可重复读,事务 A 在读到一条数据之后,此时事务 B 对该数据进行了修改并提交,那么事务 A 再读该数据,读到的还是原来的内容。可以避免脏读、不可重复读,但幻读问题仍然存在。这是 MySQL 的默认隔离级别。
  • SERIALIZABLE:可串行化,确保事务可以从一个表中读取相同的行。在这个事务持续期间,禁止其他事务对该表执行插入、更新和删除操作。所有的并发问题都可以避免,但性能十分低下。能避免脏读、不可重复读和幻读。

SQL标准 中规定,针对不同的隔离级别,并发事务可以发生不同严重程度的问题,具体情况如下:

mysql_isolation_ranks

脏写 怎么没涉及到?因为脏写这个问题太严重了,不论是哪种隔离级别,都不允许脏写的情况发生。

不同的隔离级别有不同的现象,并有不同的锁和并发机制,隔离级别越高,数据库的并发性能就越差,4 种事务隔离级别与并发性能的关系如下:

mysql_isolation_ranks_2d

10.3.4、MySQL 支持的四种隔离级别

不同的数据库厂商对 SQL 标准中规定的四种隔离级别支持不一样。比如,Oracle 就只支持 READ COMMITED(默认隔离级别)SERIALIZABLE 隔离级别

MySQL 虽然支持 4 种隔离级别,但与 SQL 标准中所规定的各级隔离级别允许发生的问题却有些出入,MySQL 在 REPEATABLE READ 隔离级别下,是可以禁止幻读问题的发生的,禁止幻读的原因我们在后面章节讲解。

MySQL 的默认隔离级别为 REPEATABLE READ,我们可以手动修改一下事务的隔离级别。

# 查看隔离级别,MySQL 5.7.20的版本之前:
mysql> SHOW VARIABLES LIKE 'tx_isolation';
+---------------+-----------------+
| Variable_name | Value           |
+---------------+-----------------+
| tx_isolation  | REPEATABLE-READ |
+---------------+-----------------+
1 row in set (0.00 sec)
# MySQL 5.7.20版本之后,引入transaction_isolation来替换tx_isolation

# 查看隔离级别,MySQL 5.7.20的版本及之后:
mysql> SHOW VARIABLES LIKE 'transaction_isolation';
+-----------------------+-----------------+
| Variable_name         | Value           |
+-----------------------+-----------------+
| transaction_isolation | REPEATABLE-READ |
+-----------------------+-----------------+
1 row in set (0.02 sec)

# 或者不同MySQL版本中都可以使用的:
SELECT @@transaction_isolation;

10.3.5、如何设置事务的隔离级别

通过下面的语句修改事务的隔离级别。

SET [GLOBAL|SESSION] TRANSACTION ISOLATION LEVEL 隔离级别;
# 其中,隔离级别格式:
> READ UNCOMMITTED
> READ COMMITTED
> REPEATABLE READ
> SERIALIZABLE

或者:

SET [GLOBAL|SESSION] TRANSACTION_ISOLATION = '隔离级别'
# 其中,隔离级别格式:
> READ-UNCOMMITTED
> READ-COMMITTED
> REPEATABLE-READ
> SERIALIZABLE

关于设置时使用 GLOBAL 或 SESSION 的影响

使用 GLOBAL 关键字(在全局范围影响):

SET GLOBAL TRANSACTION ISOLATION LEVEL SERIALIZABLE;
# 或
SET GLOBAL TRANSACTION_ISOLATION = 'SERIALIZABLE';
  • 当前已经存在的会话无效。
  • 只对执行完该语句之后产生的会话起作用。

使用 SESSION 关键字(在会话范围影响):

SET SESSION TRANSACTION ISOLATION LEVEL SERIALIZABLE;
# 或
SET SESSION TRANSACTION_ISOLATION = 'SERIALIZABLE';
  • 对当前会话的所有后续的事务有效。
  • 如果在事务之间执行,则对后续的事务有效。
  • 该语句可以在已经开启的事务中间执行,但不会影响当前正在执行的事务。

如果在服务器启动时想改变事务的默认隔离级别,可以修改启动参数 transaction_isolation 的值。比如,在启动服务器时指定了 transaction_isolation=SERIALIZABLE,那么事务的默认隔离界别就从原来的 REPEATABLE-READ 变成了 SERIALIZABLE

数据库规定了多种事务隔离级别,不同隔离级别对应不同的干扰程度,隔离级别越高,数据一致性就越好,但并发性越弱。

10.3.6、不同隔离级别举例

初始化数据:

TRUNCATE TABLE account;
INSERT INTO account VALUES (1,'张三','100'), (2,'李四','0');
mysql> select * from account;
+----+--------+---------+
| id | NAME   | balance |
+----+--------+---------+
|  1 | 张三   | 1000.00 |
|  2 | 李四   | 1000.00 |
+----+--------+---------+
2 rows in set (0.00 sec)

10.3.6.1、读未提交之脏读

设置隔离级别为未提交读:

mysql_isolation_ex_1

脏读就是指当前事务就在访问数据,并且对数据进行了修改,而这种修改还没有提交到数据库中,这时,另外一个事务也访问了这个数据,然后使用了这个数据。

10.3.6.2、读已提交

mysql_isolation_ex_2

10.3.6.3、不可重复读

设置隔离级别为可重复读,事务的执行流程如下:

mysql_isolation_ex_3

当我们将当前会话的隔离级别设置为可重复读的时候,当前会话可以重复读,就是每次读取的结果集都相同,而不管其他事务有没有提交。但是在可重复读的隔离级别上会出现幻读的问题。

10.3.6.4、幻读

mysql_isolation_ex_4

这里要灵活 理解读取 的意思,第一次 select 是读取,第二次的 insert 其实也属于隐式的读取,只不过是在 mysql 的机制中读取的,插入数据也是要先读取一下有不有主键冲突才能决定是否执行插入。

幻读,并不是说两次读取获取的结果集不同,幻读侧重的方面是某一次的 select 操作得到的结果所表征的数据状态无法支撑后续的业务操作。更具体地说,select 某记录是否存在,不存在,准备插入此记录,但执行 insert 时发现此记录已存在,无法插入,此时就发生了幻读。

在 RR 隔离级别下,step1、step2 是会正常执行的,step3 则会报错主键冲突,对于事务 1 的业务来说是执行失败的,这里事务 1 就是发生了幻读,因为事务 1 在 step1 中读取的数据状态并不能支撑后续的业务操作。

事务 1 会觉得:“见鬼了,我刚才读到的结果应该可以支持我这样操作才对啊,为什么现在不可以”。事务 1 不敢相信地又执行了 step4,发现和 step1 读取的结果是一样的(RR 下的 MVCC 机制)。

此时,幻读无疑已经发生,事务 1 无论读取多少次,都查不到 id=3 的记录,但它的确无法插入这条他通过读取来认定不存在的记录(此数据已被事务 2 插入),对于事务 1 来说,它幻读了。

其实 RR 也是可以避免幻读的,通过对 select 操作手册加 行X锁(独占锁)(SELECT ... FOR UPDATE 这也正是 SERIALIZABLE 隔离级别下会隐式为你做的事情)。

同时,即便当前记录不存在,比如 id=3 是不存在的,当前事务也会获得一把记录锁(因为 InnoDB 的行锁锁定的是索引,故记录实体存在与否没关系,存在就加 行X锁,不存在就加 间隙锁),其他事务则无法插入此索引的记录,故杜绝了幻读。

SERIALIZABLE 隔离级别 下,step1 执行时是会隐式的添加 行(X)锁 / gap(X)锁 的,从而 step2 会被阻塞,step3 会正常执行,待事务 1 提交后,事务 2 才能继续执行(主键冲突执行失败),对于事务 1 来说业务是正确的,成功的阻塞扼杀了扰乱业务的事务 2,对于事务 1 来说它前期读取的结果是可以支撑其后续业务的。

所以 MySQL 的幻读并非什么读取两次返回结果集不同,而是事务在插入事先检测不存在的记录时,惊奇地发现这些数据已经存在了,之前的检测读获取到的数据如同鬼影一般。

10.4、事务的常见分类

从事务理论的角度来看,可以把事务分为以下几种类型:

  • 扁平事务(Flat Transactions)
  • 带有保存点的扁平事务(Flat Transactions with Savepoints)
  • 链事务(Chained Transactions)
  • 嵌套事务(Nested Transactions)
  • 分布式事务(Distributed Transactions)
标签云