1 并发一致性问题

常见并发并发一致性问题包括:丢失的修改、不可重复读、读脏数据、幻影读(幻影读在一些资料中往往与不可重复读归为一类)。

1.1 丢失修改

下面我们先来看一个例子,说明并发操作带来的数据的不一致性问题。

考虑飞机订票系统中的一个活动序列:

  1. 甲售票点(甲事务)读出某航班的机票余额a,设a=16.
  2. 乙售票点(乙事务)读出同一航班的机票余额a,也为16.
  3. 甲售票点卖出一张机票,修改余额a←a-1.所以a为15,把a写回数据库.
  4. 乙售票点也卖出一张机票,修改余额a←a-1.所以a为15,把a写回数据库.

结果明明卖出两张机票,数据库中机票余额只减少1。

归纳起来就是:两个事务t1和t2读入同一数据并修改,t2提交的结果破坏了t1提交的结果,导致t1的修改被丢失。前文(2.1.4数据删除与更新)中提到的问题及解决办法往往是针对此类并发问题的。但仍然有几类问题通过上面的方法解决不了,那就是:

1.2 不可重复读

不可重复读是指事务t1读取数据后,事务t2执行更新操作,使t1无法再现前一次读取结果。具体地讲,不可重复读包括三种情况:

  • 事务t1读取某一数据后,事务t2对其做了修改,当事务1再次读该数据时,得到与前一次不同的值。例如,t1读取b=100进行运算,t2读取同一数据b,对其进行修改后将b=200写回数据库。t1为了对读取值校对重读b,b已为200,与第一次读取值不一致。
  • 事务t1按一定条件从数据库中读取了某些数据记录后,事务t2删除了其中部分记录,当t1再次按相同条件读取数据时,发现某些记录神密地消失了。
  • 事务t1按一定条件从数据库中读取某些数据记录后,事务t2插入了一些记录,当t1再次按相同条件读取数据时,发现多了一些记录。(这也叫做幻影读)

1.3 读"脏"数据

读"脏"数据是指事务t1修改某一数据,并将其写回磁盘,事务t2读取同一数据后,t1由于某种原因被撤消,这时t1已修改过的数据恢复原值,t2读到的数据就与数据库中的数据不一致,则t2读到的数据就为"脏"数据,即不正确的数据。

产生上述三类数据不一致性的主要原因是并发操作破坏了事务的隔离性。并发控制就是要用正确的方式调度并发操作,使一个用户事务的执行不受其它事务的干扰,从而避免造成数据的不一致性。

2 并发一致性问题的解决办法

2.2.2.1 封锁(locking)

封锁是实现并发控制的一个非常重要的技术。所谓封锁就是事务t在对某个数据对象例如表、记录等操作之前,先向系统发出请求,对其加锁。加锁后事务t就对该数据对象有了一定的控制,在事务t释放它的锁之前,其它的事务不能更新此数据对象。

基本的封锁类型有两种:排它锁(exclusive locks 简记为x锁)和共享锁(share locks 简记为s锁)。

排它锁又称为写锁。若事务t对数据对象a加上x锁,则只允许t读取和修改a,其它任何事务都不能再对a加任何类型的锁,直到t释放a上的锁。这就保证了其它事务在t释放a上的锁之前不能再读取和修改a。

共享锁又称为读锁。若事务t对数据对象a加上s锁,则其它事务只能再对a加s锁,而不能加x锁,直到t释放a上的s锁。这就保证了其它事务可以读a,但在t释放a上的s锁之前不能对a做任何修改。

2.2.2.2 封锁协议

在运用x锁和s锁这两种基本封锁,对数据对象加锁时,还需要约定一些规则,例如应何时申请x锁或s锁、持锁时间、何时释放等。我们称这些规则为封锁协议(locking protocol)。对封锁方式规定不同的规则,就形成了各种不同的封锁协议。下面介绍三级封锁协议。三级封锁协议分别在不同程度上解决了丢失的修改、不可重复读和读"脏"数据等不一致性问题,为并发操作的正确调度提供一定的保证。下面只给出三级封锁协议的定义,不再做过多探讨。

  • 1级封锁协议

1级封锁协议是:事务t在修改数据r之前必须先对其加x锁,直到事务结束才释放。事务结束包括正常结束(commit)和非正常结束(rollback)。1级封锁协议可防止丢失修改,并保证事务t是可恢复的。在1级封锁协议中,如果仅仅是读数据不对其进行修改,是不需要加锁的,所以它不能保证可重复读和不读"脏"数据。

  • 2级封锁协议

2级封锁协议是:1级封锁协议加上事务t在读取数据r之前必须先对其加s锁,读完后即可释放s锁。2级封锁协议除防止了丢失修改,还可进一步防止读"脏"数据。

  • 3级封锁协议

3级封锁协议是:1级封锁协议加上事务t在读取数据r之前必须先对其加s锁,直到事务结束才释放。3级封锁协议除防止了丢失修改和不读'脏'数据外,还进一步防止了不可重复读。

2.3 事务隔离级别

尽管数据库理论对并发一致性问题提供了完善的解决机制,但让程序员自己去控制如何加锁以及加锁、解锁的时机显然是很困难的事情。索性绝大多数数据库以及开发工具都提供了事务隔离级别,让用户以一种更轻松的方式处理并发一致性问题。常见的事务隔离级别包括:readuncommitted、readcommitted、repeatableread和serializable四种。不同的隔离级别下对数据库的访问方式以及数据库的返回结果有可能是不同的。我们将通过几个实验深入了解事务隔离级别以及sql server在后台是如何将它们转换成锁的。

2.3.1 readuncommitted与readcommitted

readuncommitted是最低的隔离级别,这个级别的隔离允许读入别人尚未提交的脏数据,除此之外,在这种事务隔离级别下还存在不可重复读的问题。

readcommitted是许多数据库的缺省级别,这个隔离级别上,不会出现读取未提交的数据问题,但仍然无法避免不可重复读(包括幻影读)的问题。当你的系统对并发控制的要求非常严格时,这种默认的隔离级别可能无法提供数据有效的保护,但对于决大多数应用来讲,这种隔离级别就够用了。

我们使用下面的实验来进行测试:

首先配置sql server 2000数据库,附加dbapp数据库。然后在visual studio .net中建立一管理控制台应用程序,添加必要的命名空间引用:

using system;using system.data;using system.data.sqlclient;using system.configuration;

然后建立两个数据库链接,并分别采用不同的事务隔离级别:

   private static sqlconnection conn1;private static sqlconnection conn2;private static sqltransaction tx1;private static sqltransaction tx2;private static void setup(){conn1 = new sqlconnection(connectionstring);conn1.open();tx1 = conn1.begintransaction(isolationlevel.readuncommitted);conn2 = new sqlconnection(connectionstring);conn2.open();tx2 = conn2.begintransaction(isolationlevel.readcommitted);}

其中事务1允许读入未提交的数据,而事务2只允许读入已提交数据。

在主程序中,我们模拟两个人先后的不同操作,以产生并发一致性问题:

   public static void main(){setup();try{readuncommitteddatabytransaction1();uncommittedupdatebytransaction2();readuncommitteddatabytransaction1();tx2.rollback();console.writeline("/n-- transaction 2 rollbacked!/n");readuncommitteddatabytransaction1();tx1.rollback();}catch{……}}

第一步,使用readuncommitteddatabytransaction1方法利用事务1从数据库中读入id值为1的学生信息。此时的信息是数据库的初始信息。

第二步,调用uncommittedupdatebytransaction2方法,从第2个事务中发送一update命令更新数据库,但尚未提交。

第三步,再次调用readuncommitteddatabytransaction1,从事务1中读取数据库数据,你会发现由事务2发布的尚未提交的更新被事务1读取出来(readuncommitted)。

第四步,事务2放弃提交,回滚事务tx2.rollback();。

第五步,再次调用readuncommitteddatabytransaction1();,读取数据库中的数据,此次是已经回滚后的数据。

程序运行结果如下:

-- read age from database:age:20-- run an uncommitted command:update student set age=30 where id=1-- read age from database:age:30-- transaction 2 rollbacked!-- read age from database:age:20

关于readuncommitteddatabytransaction1()与uncommittedupdatebytransaction2()的方法定义如下:

   private static void uncommittedupdatebytransaction2(){string command = "update student set age=30 where id=1";console.writeline("/n-- run an uncommitted command:/n{0}/n", command);sqlcommand cmd = new sqlcommand(command, conn2);cmd.transaction = tx2;cmd.executenonquery();}private static void readuncommitteddatabytransaction1(){console.writeline("-- read age from database:");sqlcommand cmd = new sqlcommand("select age from student where id = 1", conn1);cmd.transaction = tx1;try{int age = (int)cmd.executescalar();console.writeline("age:{0}", age);}catch(sqlexception e){console.writeline(e.message);}}

从上面的实验可以看出,在readuncommitted隔离级别下,程序可能读入未提交的数据,但此隔离级别对数据库资源锁定最少。

本实验的完整代码可以从"samplecode/chapter 2/lab 2-6"下找到。

让我们再来做一个实验(这个实验要求动作要快的,否则可能看不到预期效果)。首先修改上面代码中的setup()方法代码,将

tx1 = conn1.begintransaction(isolationlevel.readuncommitted);

改为:

tx1 = conn1.begintransaction(isolationlevel.readcommitted);

再次运行代码,你会发现程序执行到第三步就不动了,如果你有足够的耐心等下去的话,你会看到"超时时间已到。在操作完成之前超时时间已过或服务器未响应。"的一条提示,这条提示究竟是什么意思呢?让我们探察一下究竟发生了什么:

第一步,在做这个实验之前,先将sql server 2000的企业管理器打开,然后再将sql server事件探察器打开并处于探察状态。

第二步,运行改动后的程序,程序执行到一半就暂停了。此时迅速切换到企业管理器界面,右击"管理"下面的"当前活动",选择"刷新"(整个过程应在大约15秒内完成即可,如图 2-8所示),我们便得到了数据库当前进程的一个快照。

 

图 2-8 使用企业管理器查看当前活动

我们发现此时进程出现了阻塞,被阻塞者是52号进程,而阻塞者是53号进程。也就是说53号进程的工作妨碍了52号进程继续工作。(不同实验时进程号可能各不相同)

第三步,为了进一步查明原因真相,我们切换到事件探察器窗口,看看这两个进程都是干什么的。如图 2-9所示,事件探察器显示了这两个进程的详细信息。从图中我们可以看出,52号进程对应我们的事务1,53号进程对应我们的事务2。事务2执行了update命令,但尚未提交,此时事务1去读尚未提交的数据便被阻塞住。从图中我们可以看出52号进程是被阻塞者。

此时如果事务2完成提交,52号进程便可以停止等待,得到需要的结果。然而我们的程序没有提交数据,因此52号进程就要无限等下去。所幸sql server 2000检测到事务2的运行时间过长(这就是上面的错误提示"超时时间已到。在操作完成之前超时时间已过或服务器未响应。"),所以将事务2回滚以释放占用的资源。资源被释放后,52号进程便得以执行。

 

图 2-9 事件探察器探察阻塞命令

第四步,了解了上面发生的事情后,我们现在可以深入讨论一下共享锁和排它锁的使用情况了。重新回到企业管理器界面,让我们查看一下两个进程各占用了什么资源。从图 2-10中我们可以看出,53号进程(事务2)在执行更新命令前对相应的键加上了排它锁(x锁),按照前文提到的1级封锁协议,该排它锁只有在事务2提交或回滚后才释放。现在52号进程(事务1)要去读同一行数据,按照2级封锁协议,它要首先对该行加共享锁,然而 该行数据已经被事务2加上了排它锁,因此事务1只能处于等待状态,等待排它锁被释放。因此我们就看到了前面的"阻塞"问题。

 

图 2-10 进程执行写操作前首先加了排它锁

 

 

图 2-11 进程读操作前要加共享锁,但被阻塞

 

当事务1的事务隔离级别是readuncommitted时,读数据是不加锁的,因此排它锁对readuncommitted不起作用,进程也不会被阻塞,不过确读到了"脏"数据。

2.3.2 repeatableread

repeatableread是指可重复读,它的隔离级别要比readcommitted级别高。它允许某事务执行重复读时数据保持不变,但是仍然无法解决幻影读的问题。为了更深入的了解repeatableread所能解决的问题,我们还是使用下面的实验来加以印证:

第一步,事务1与事务2同时设置为readcommitted,并同时开启事务。

 

private static void setup(){conn1 = new sqlconnection(connectionstring);conn1.open();tx1 = conn1.begintransaction(isolationlevel.readcommitted);conn2 = new sqlconnection(connectionstring);conn2.open();tx2 = conn2.begintransaction(isolationlevel.readcommitted);}

第二步,事务1读取数据库中数据。注意此时并没有通过提交或回滚的方式结束事务1,事务1仍然处于活动状态。

private static int readagebytransaction1(){return (int)executescalar("select age from student where (id = 1)");}private static object executescalar(string command){console.writeline("-- execute command: {0}", command);sqlcommand cmd = new sqlcommand(command, conn1);cmd.transaction = tx1;return cmd.executescalar();}

第三步,事务2修改年龄数据并提交修改。

private static void modifyagebytransaction2(){string command = "update student set age=30 where id=1";console.writeline("-- modify age by transaction2, command:{0}", command);sqlcommand cmd = new sqlcommand(command, conn2);cmd.transaction = tx2;try{cmd.executenonquery();tx2.commit();}catch(exception e){console.writeline(e.message);tx2.rollback();}}

第四步,事务1重复读取年龄数据,此时会发现读取出来的数据是修改过的数据,与上次读取的数据不一样了!顾名思义,不可重复读。主程序代码如下:

public static void main(){setup();try{int age1 = readagebytransaction1();modifyagebytransaction2();int age2 = readagebytransaction1();console.writeline("/nfirst read: age={0}/nsecond read: age={1}", age1, age2);}catch(exception e){console.writeline("got an error! " + e.message);}finally{cleanup();}}

程序的运行结果如下:

-- execute command: select age from student where (id = 1)-- modify age by transaction2, command:update student set age=30 where id=1-- execute command: select age from student where (id = 1)first read: age=20second read: age=30

之所以出现了重复读时读取的数据与第一次读取的不一样,是因为事务1被设置成了readcommitted隔离类型,该隔离级别无法防止不可重复读的问题。要想在一个事务中两次读取数据完全相同就必须使用repeatableread事务隔离级别。

让我们修改上面的setup()方法中的代码,将事务1的隔离级别设置为repeatableread:

tx1 = conn1.begintransaction(isolationlevel.repeatableread);

再次运行该程序,你会发现程序执行到第二步就暂停了,如果等待一段时间后你就会看到"超时时间已到。在操作完成之前超时时间已过或服务器未响应。"的错误提示,此时,重复读的数据确和第一次读完全一样。程序执行结果如下:

-- execute command: select age from student where (id = 1)-- modify age by transaction2, command:update student set age=30 where id=1超时时间已到。在操作完成之前超时时间已过或服务器未响应。-- execute command: select age from student where (id = 1)first read: age=20second read: age=20

为了探明原因,还是象上一个案例一样,再次执行该程序,当出现暂停时迅速切换到企业管理器中查看当前活动的快照,并检查阻塞进程中数据锁定情况,你会发现如图 2-12和图 2-13所示的内容:

 

图 2-12 repeatableread在读数据时加s锁,直到事务结束才释放

 

图 2-13 修改数据要求加x锁,但被阻塞

根据3级封锁协议,事务t在读取数据之前必须先对其加s锁,直到事务结束才释放。因此,事务1在第一次读取数据时便对数据加上了共享锁,第一次数据读取完成后事务并未结束,因此该共享锁并不会被释放,此时事务2试图修改该数据,按照2级封锁协议,在写之前要加排它锁,但数据上的共享锁尚未被释放,导致事务2不得不处于等待状态。当事务2等待时间超时后,sql server就强制将该事务回滚。尽管事务2执行失败,但保证了事务1实现了可重复读级别的事务隔离。

repeatableread事务隔离级别允许事务内的重复读操作,但是这并不能避免出现幻影读的问题,如果您的程序中存在幻影读的潜在问题的话,就必须采用最高的事务隔离级别:serializable。

2.3.3 serializable

serializable隔离级别是最高的事务隔离级别,在此隔离级别下,不会出现读脏数据、不可重复读和幻影读的问题。在详细说明为什么之前首先让我们看看什么是幻影读。

所谓幻影读是指:事务1按一定条件从数据库中读取某些数据记录后,事务2插入了一些符合事务1检索条件的新记录,当事务1再次按相同条件读取数据时,发现多了一些记录。让我们通过以下案例来重现幻影读的问题:

第一步,将事务1和事务2均设为repeatableread隔离级别,并同时开启事务。

private static void setup(){conn1 = new sqlconnection(connectionstring);conn1.open();tx1 = conn1.begintransaction(isolationlevel.repeatableread);conn2 = new sqlconnection(connectionstring);conn2.open();tx2 = conn2.begintransaction(isolationlevel.repeatableread);}

第二步,事务1读取学号为1的学生的平均成绩以及所学课程的门数。此时读到学生1学了3门课程,平均成绩为73.67。注意,此时事务1并未提交。

private static double readaveragemarksbytransaction1(){return (double)executescalar("select avg(mark) as avgmark from sc where (id = 1)");}private static int readtotalcoursesbytransaction1(){return (int)executescalar("select count(*) as num from sc where (id = 1)");}private static object executescalar(string command){console.writeline("-- execute command: {0}", command);sqlcommand cmd = new sqlcommand(command, conn1);cmd.transaction = tx1;return cmd.executescalar();}

第三步,事务2向数据库插入一条新记录,让学号为1的同学再学1门课程,成绩是80。然后提交修改到数据库。

private static void insertrecordbytransaction2(){string command = "insert into sc values(1, 5, 80)";console.writeline("-- insert to table sc by transaction 2");console.writeline("-- command:{0}/n", command);sqlcommand cmd = new sqlcommand(command, conn2);cmd.transaction = tx2;try{cmd.executenonquery();tx2.commit();}catch(exception e){console.writeline(e.message);tx2.rollback();}}

第四步,事务1再次读取学号为1的学生的平均成绩以及所学课程的门数。此时读到确是4门课程,平均成绩为75.25。与第一次读取的不一样!居然多出了一门课程,多出的这门课程就像幻影一样出现在我们的面前。测试用主程序如下:

public static void main(){setup();try{console.writeline(">>>> step 1");double avg = readaveragemarksbytransaction1();int total = readtotalcoursesbytransaction1();console.writeline("avg={0,5:f2}, total={1}/n", avg, total);console.writeline(">>>> step 2");insertrecordbytransaction2();console.writeline(">>>> step 3");avg = readaveragemarksbytransaction1();total = readtotalcoursesbytransaction1();console.writeline("avg={0,5:f2}, total={1}/n", avg, total);}catch(exception e){console.writeline("got an error! " + e.message);}finally{cleanup();}}

程序执行结果如下:

>>>> step 1-- execute command: select avg(mark) as avgmark from sc where (id = 1)-- execute command: select count(*) as num from sc where (id = 1)avg=73.67, total=3>>>> step 2-- insert to table sc by transaction 2-- command:insert into sc values(1, 5, 80)>>>> step 3-- execute command: select avg(mark) as avgmark from sc where (id = 1)-- execute command: select count(*) as num from sc where (id = 1)avg=75.25, total=4

大家可以思考一下,为什么repeatableread隔离模式并不能使得两次读取的平均值一样呢?(可以从锁的角度来解释这一现象)。

仍然象前面的做法一样,我们看看究竟发生了什么事情。在探察之前,先将setup方法中事务1的隔离级别设置为serializable,再次运行程序,当发现程序运行暂停时,查看数据库当前活动快照,你会发现如图 2-14和图 2-15所示的锁定问题:

 

图 2-14 serializable隔离模式对符合检索条件的数据添加了ranges-s锁

 

图 2-15 当试图插入符合rangein条件的记录时,只能处于等待状态

从图中我们可以看出,在serializalbe隔离模式下,数据库在检索数据时,对所有满足检索条件的记录均加上了ranges-s共享锁。事务2试图去插入一满足rangein条件的记录时,必须等待这些rangs-s锁释放,否则就只能处于等待状态。在等待超时后,事务2就会被sql server强制回滚。

修改后的程序运行结果如下:

>>>> step 1-- execute command: select avg(mark) as avgmark from sc where (id = 1)-- execute command: select count(*) as num from sc where (id = 1)avg=73.67, total=3>>>> step 2-- insert to table sc by transaction 2-- command:insert into sc values(1, 5, 80)超时时间已到。在操作完成之前超时时间已过或服务器未响应。>>>> step 3-- execute command: select avg(mark) as avgmark from sc where (id = 1)-- execute command: select count(*) as num from sc where (id = 1)avg=73.67, total=3

事务2的运行失败确保了事务1不会出现幻影读的问题。这里应当注意的是,1、2、3级封锁协议都不能保证有效解决幻影读的问题。

2.3 建议

通过上面的几个例子,我们更深入的了解了数据库在解决并发一致性问题时所采取的措施。锁机制属于最底层的保证机制,但很难直接使用。我们可以通过不同的事务隔离模式来间接利用锁定机制确保我们数据的完整一致性。在使用不同级别的隔离模式时,我们也应当注意以下一些问题:

  • 一般情况下readcommitted隔离级别就足够了。过高的隔离级别将会锁定过多的资源,影响数据的共享效率。
  • 你所选择的隔离级别依赖于你的系统和商务逻辑。
  • 尽量避免直接使用锁,除非在万不得已的情况下。
  • 我们可以通过控制where短语中的字段实现不同的更新策略,防止出现丢失的修改问题。但不必要的更新策略可能造成sql命令执行效率低下。所以要慎用时间戳和过多的保护字段作为更新依据。