baguai

uid：74

注册时间：2022-8-25 11:30 上次发表时间：2025-6-13 09:10

好友数 2 | 博客数 32 | 回帖数 8 | 主题数 0

Innodb行锁（2）：堵塞事务的唤醒方式

baguai 已有 2308 次阅读2023-12-1 11:03 |个人分类:MySQL学习|系统分类:用户实践

作者简介：高鹏，笔名八怪。《深入理解MySQL主从原理》图书作者，同时运营个人公众号“MySQL学习”，持续分享遇到的有趣case以及代码解析！

一、关于Lock_iter::for_each迭代器的迭代方式

加入到LOCK SYSTEM hash结构使用的space_id和page no，比如函数lock_rec_insert_to_granted，那么至少同一个page no的lock_t会挂入同一个hash 链表(cell)中. 而在迭代的时候，我们通常是需要迭代是相同page并且某个heap no上锁了，这里以Lock_iter::for_each迭代器为例，因为这个迭代器用得很多，那么需要如下，

UNIV_INLINEulint lock_rec_fold(const page_id_t page_id) {  return (ut_fold_ulint_pair(page_id.space(), page_id.page_no()));}

也就是根据上面的值，然后根据hash函数进行计算后找到LOCK SYSTEM hash结构的某个链表(cell)。但是，可能某些lock_t并没有对响应的bit位上锁，那么迭代的时候就需要判定bit位，比如在迭代的时候Lock_iter::for_each迭代中有函数，

&lt;code class="language-js_darkmode__2"&gt;bool RecID::matches(const lock_t *lock) const {  return (lock-&gt;rec_lock.page_id == get_page_id() &&          lock_rec_get_nth_bit(lock, m_heap_no));}

也就是先要确认这个lock_t 结构在当前需要上锁的行上已经上了锁了，然后才是判定兼容性，因为我们知道一个lock_t结构可能有很多的行锁，不一定就锁定了本次加锁需要的行。

二、堵塞事务等待唤醒

实际上这里的等待唤醒，唤醒权利可以有两个方面：

lock monitor线程唤醒超时的等待事务
提交或者回滚事务唤醒其堵塞的事务

实际上两个方面只是时机不同，我们这里主要讨论lock monitor线程的唤醒，因为提交或者回滚事务唤醒堵塞事务调用是一样的。

前面第一篇文章，我们已经解释了等待lock_t资源的事务已经返回一个DB_LOCK_WAIT给上层了，并且将线程属性设置为QUE_THR_LOCK_WAIT，如下开始调入等待函数，

&lt;code class="language-js_darkmode__5"&gt;row_mysql_handle_errors    case DB_LOCK_WAIT:      lock_wait_suspend_thread(thr);ha_innobase::index_read -&gt; row_search_mvcc   -&gt;row_mysql_handle_errors      -&gt;lock_wait_suspend_thread

那么在函数lock_wait_suspend_thread就开始堵塞了，将唤醒权给与其他线程，步骤大概如下，

找到LOCK_SYSTEM中对应的slot，用于lock monitor线程监测，每次加入一个等待的锁lock_wait_table_reservations加1，并且放入slot中记录，这是权重计算的一个重要指标
将wait_time属性写入到slot中，这就是innodb_lock_wait_timeout参数的设置，并且将等待开始时间写入到slot中，用于后面计算等待时长，因为每次不一定是超时，也可能是其他事务事务提交或者获取到lock_t资源后唤醒了等待者
增加属性srv_stats.n_lock_wait_count/ srv_stats.n_lock_wait_current_count，前者就是累积的Innodb_row_lock_waits等待行数的总和，后者就是当前等待的行数Innodb_row_lock_current_waits
通过slot->event进行等待开始，也就是从这里本事务丢失了CPU，开始等待
如果被唤醒了，也就是等待结束后，减少srv_stats.n_lock_wait_current_count，也就是Innodb_row_lock_current_waits当前等待的行数减去1，增加等待时间srv_stats.n_lock_wait_time，也就是Innodb_row_lock_time增加，为累积等待时长
将等待行锁的时间计入到慢查询的lock time中，通过函数thd_set_lock_wait_time

醒来后继续干活...

三、唤醒方式和权重判定

前面我们已经知道堵塞事务开始等待了，我们这里就以lock monitor线程唤醒超时的等待事务为列子，进行讲述。当然lock monitor线程还负责死锁检测在8.0中，这个我们后面在进行描述。先看它的第一个功能，唤醒等待的事务(线程)。本线程大概每1秒都会进行检测，完成的工作主要如下，

首先通过函数lock_wait_check_slots_for_timeouts进行检测，每次循环所有的slot，如下

&lt;code class="language-js_darkmode__13"&gt;for (auto slot = lock_sys-&gt;waiting_threads; slot last_slot;++slot)

对每一个等待的事务获取其超时参数，也会是slot->wait_timeout，因为前面我们知道这个来自参数innodb_lock_wait_timeout，而innodb_lock_wait_timeout是可以线程设置的，因此不能用全局的，只能用各个线程自己的。然后通过这个超时参数和当前等待时长进行判定如下,

&lt;code class="language-js_darkmode__15"&gt;if (wait_time &gt; (int64_t)slot-&gt;wait_timeout

如果有事务等待的lock_t锁资源已经超时，那么上LOCK SYSTEM独占锁，那么调用lock_cancel_waiting_and_release函数准备解锁，这里我们只考虑行锁。
lock_cancel_waiting_and_release函数会调用函数lock_rec_dequeue_from_page，注意这个参数lock_rec_dequeue_from_page非常重要，事务提交释放也是调用的这个函数，也是比较复杂。 lock_cancel_waiting_and_release 函数首先调用lock_rec_discard函数，这个函数比较简单主要完成的功能如下：

在trx->lock.trx_locks 中删除本次事务需要释放的lock_t锁结构
在LOCK SYSTEM中删除本次事务需要释放的lock_t锁结构

那么完成这一步本次需要释放的lock_t锁结构就在系统中不存在了，但是需要继续做的就是如果本事务超时的lock_t结构释放后会发生什么。比如A<-B<-C<-D，一旦B事务的锁自选超时了，那么可能出现三种情况：

情况1:A 事务持有行c锁资源，B事务持有a,b锁资源c锁资源被事务A堵塞了，而C和D事务分别堵塞在a,b锁资源被事务B堵塞了
情况2:A 事务持有行c锁资源，B事务持有a,b锁资源c锁资源被事务A堵塞了，而C和D事务分别堵塞在a锁资源被事务B堵塞了
情况3:A 事务持有行c锁资源，而B,C,D事务分别堵塞在c锁资源被事务A堵塞了

那么一旦B事务超时了，可能情况分别为：

情况1:C和D事务都应该正常的唤醒，并且继续
情况2:C事务唤醒，D事务继续被C事务堵塞
情况3:C,D事务都被A事务继续堵塞

因此需要继续检查，调用lock_rec_grant函数，进行情况判定，并且决定本次事务lock_t锁资源释放后以什么标准唤醒其堵塞的事务，堵塞的时候又处于何种状态，这就是最复杂的一步，我理解的时候也花了不少时间。

首先需要做的是循环本次释放lock_t锁资源在LOCK SYSTEM中查找，确认是否有其他事务在等待本lock_t锁资源，只要找到一个的话就需要详细的判定了，如果没知道就不需要了，就简单的释放本次lock_t锁资源就可以了，如下，

&lt;code class="language-js_darkmode__26"&gt;-&gt;for (auto lock = lock_rec_get_first_on_page_addr(lock_hash, page_id);lock != nullptr; lock = lock_rec_get_next_on_page(lock))   -&gt;(lock-&gt;is_waiting())        -&gt;found_waiter = true;break;

本次释放的lock_t锁资源的结果预测和根据权重唤醒事务

如果找到则需要相信判定如果堵塞的事务如果获取本次释放的lock_t锁资源，并且预测获取后将会处于何种状态，比如前面举例的就是3种不同的状态和结果，如下：

if (found_waiter)

接下来就根据本次释放的lock_t锁资源的 page no和其锁定的heap no（也就是具体锁定的行）进行判定，循环每个bit位来确认是本次需要释放的锁资源，如下：

ulint heap_no = 0; heap_no &lt; lock_rec_get_n_bits(in_lock); ++heap_no)if (lock_rec_get_nth_bit(in_lock, heap_no))

然后对每行锁定的资源调入函数lock_rec_grant_by_heap_no，本函数首先Lock_iter::for_each迭代与本次释放锁资源lock_t相关的行锁资源，也就是在LOCK SYSTEM 中查找，找到后使用lambda函数。本lambda函数首先如果不是堵塞的lock_t结构，则放入granted容器中，如下：

&lt;code class="language-js_darkmode__30"&gt;        if (!lock-&gt;is_waiting()) { //lock_t 是否没有处于waitting状态  LOCK_WAIT          /* Granted locks should be before waiting locks. */          ut_ad(!seen_waiting_lock);          granted.push_back(lock); //插入到granted中，          return (true); //返回后 回调 lambda函数不返回任何lock_t        }

如果是处于 LOCK_WAIT状态的lock_t资源则获取这个lock_t资源堵塞者，并且确认是不是本次超时释放的lock_t结构的事务，如果是说明这个LOCK_WAIT的lock_t资源可能会在本次超时释放后获取锁资源，如下：

&lt;code class="language-js_darkmode__31"&gt;        const auto blocking_trx =            trx-&gt;lock.blocking_trx.load(std::memory_order_relaxed); //输出本次迭代lock_t堵塞者的事务ID        /* No one should be WAITING without good reason! */        ut_ad(blocking_trx);        /* We will only consider granting the `lock`, if we are the reason it        was waiting. */        if (blocking_trx != in_trx) { //如果迭代事务的堵塞者不是本次释放lock_t的事务,说明不需要操作          return (true); //直接返回，因为不是本事务堵塞的        }

接着如果确实是本次释放lock_t资源堵塞的，那么就需要根据权重分别将它们插入不同的容器中如下：

对于优先级高的线程，比如SQL线程，插入到waiting容器中，也就是waiting容器的开头，这个拥有获取锁资源的高权限。
如果本事务的lock_t结构的权重较低，则放入low_priority_light容器中。
如果本事务的lock_t结构的权重较高，则放入low_priority_heavier容器中。

到底是高权重和还是低权重是其权重是否小于1，而权重的计算我们后面再说，这里只需要知道权重和其等待时长和其堵塞的事务多少有关。接着对于low_priority_heavier容器，虽然都是高权重事务，但是还是要分高下的，因此需要根据权重排序如下，

&lt;code class="language-js_darkmode__35"&gt;  std::stable_sort(low_priority_heavier.begin(), low_priority_heavier.end(),                   [](const LockDescriptorEx &a, const LockDescriptorEx &b) {                     return (a.first &gt; b.first);                    }); //进行排序，根据是schedule_weight权重进行比较

完成后又放入low_priority_heavier容器，然后将高权重排序好的lock_t锁资源放入到waiting容器中，然后再将低权重排序好的lock_t资源放入waiting容器中，如下，

  for (const auto &descriptor : low_priority_heavier) {    waiting.push_back(descriptor.second); //高权重加入  }  waiting.insert(waiting.end(), low_priority_light.begin(),                 low_priority_light.end()); //低权重加入

那么这个时候waitting容器实际上如下，

堵塞中的高优先级事务|堵塞中的按照权重排序的重权重事务|堵塞中的轻权重事务

这个顺序就是锁资源抢占的顺序。

遍历waitting容器，进行释放预测是释放其堵塞的事务

在做这个动作之前需要将granted容器的长度扩大，扩大至greanted容器长度+waitting容器长度，因为每次迭代，如果事务抢占本次释放锁资源成功，也会放进greanted容器，最多当然就是waitting容器中的事务的锁资源都获取成功了，最大长度就是其长度了，并且需要记录granted容器的原始长度，因为前一段是抢占锁资源之前的长度，后半部分是抢占中或者抢占后的状态，如下：

  /* New granted locks will be added from this index. */  const auto new_granted_index = granted.size();  granted.reserve(granted.size() + waiting.size());

接着就是遍历waitting容器了如下，

for (lock_t *wait_lock : waiting)

每次迭代都会带入调入lock_rec_has_to_wait_for_granted函数，本函数就是预测和决定释放哪些事务的根本，首先遍历granted的前半部分，也就是new_granted_index 之前的部分，反向遍历，如下：

for (size_t i = new_granted_index; i--;)const auto granted_lock = granted[i];

判定的标准是lock_has_to_wait(wait_lock, granted_lock) ，也就是当前已经获取已经获取当前释放行的锁lock_t结构的事务是否会堵塞接下来获取本行锁lock_t结构的事务。简单的说就是， A<-B<-C<-D，B超时释放行锁资源后，A事务的关于B事务释放行锁对于的lock_t结构是否会堵塞C事务。如果没有堵塞，那么还需要判定是否新的事务唤醒并且拿到关于本次释放行锁资源的行相关的锁资源是否会堵塞剩下的事务，简单的说就是A<-B<-C<-D，B超时释放行锁资源后，C不会被A堵塞，但是C会不会堵塞D，这个就需要正向迭代granted的后半部分，也就是new_granted_index 之后的部分，如下，

for (size_t i = new_granted_index; i &lt; granted.size(); ++i)  if (lock_has_to_wait(wait_lock, granted_lock))

如果两部分迭代都不存在堵塞，则返回nullptr，这说明本次lock_t释放后，新事务获取lock_t资源后不会堵塞，则开始唤醒这个事务如下，首先是将唤醒事务等待的lock_t锁结构清空，然后唤醒事务的lock_t锁结构去掉LOCK_WAIT状态

&lt;code class="language-js_darkmode__43"&gt;lock_reset_lock_and_trx_wait -&gt;lock_reset_lock_and_trx_wait(lock)     -&gt;lock-&gt;trx-&gt;lock.wait_lock = nullptr        既然已经开始给本事务进行lock_t授权了，那么本事务等待的锁应该设置为nullptr     -&gt;lock-&gt;type_mode &= ~LOCK_WAIT        本lock_t的状态去掉LOCK_WAIT状态

然后就是实际的唤醒本次lock_t结构释放后，获取到锁资源的事务了，

&lt;code class="language-js_darkmode__44"&gt;-&gt;lock_wait_release_thread_if_suspended   -&gt;os_event_set(thr-&gt;slot-&gt;event)

接着调用lock_rec_move_granted_to_front函数，在LOCK SYSTEM结构中更改，就是要把本次获取的锁资源放到对应链表(cell)的头部。当然还会将唤醒事务没有堵塞的lock_t结构放入到granted容器中，再次迭代，因为我们说过A<-B<-C<-D 这种堵塞的话，B超时了，C唤醒了，但是不能确认D是不是还会堵塞，需要再次遍历waitting容器，直到全部迭代完，才能确认全部的事务中哪些能够被的唤醒。如果根据前面的两次循环判定，唤醒的lock_t结构也会堵塞，那么就要更新持有本lock_t结构事务的状态了，实际上就是更新堵塞的源头事务了，比如A<-B<-C<-D，B超时了，C还是会被A堵塞的话，就跑这里，如下，

&lt;code class="language-js_darkmode__45"&gt; -&gt;lock_update_wait_for_edge(wait_lock, blocking_lock)     -&gt;waiting_lock-&gt;trx-&gt;lock.blocking_trx.store(blocking_lock-&gt;trx)

唤醒超时的事务

完成了上面最重要，最复杂的步骤后，就是唤醒超时的事务了，这个没啥说的了，也就是前面我们说的B事务，调用依旧是lock_wait_release_thread_if_suspended。

四、总结

本次分析中我们主要理解的，我们还是以A<-B<-C<-D 堵塞，且B事务超时来描述。

迭代锁结构的时候先是定位到space id和page no相关的链表，然后循环链表判定是否对应的bit位上锁了。
对于SQL线程这种优先级高的线程，唤醒优先级高
对于普通的事务，唤醒优先级是按照权重排列的，权重越高唤醒的权限越高
如果B事务超时后，需要对A C D事务堵塞进行判定，到底C会不会堵塞，D会不会堵塞，是根据B事务锁结构释放后的结果进行预测的。
先是唤醒C和D事务，如果他们可以被唤醒，然后才是唤醒被超时的B事务。
唤醒操作可能是lock monitor线程超时唤醒，也可能是事务提交后需要唤醒其他的事务，其本质上是一致的。

后面我们将分析死锁判定方式。

五、代码流程

&lt;code class="language-js_darkmode__53"&gt;锁堵塞和锁超时 在锁等待期间会通过函数que_thr_stop 如果锁状态为TRX_QUE_LOCK_WAIT，将线程状态设置为 QUE_THR_LOCK_WAIT，经过层层返回，通过函数que_run_threads进行挂起，也就是通过函数 lock_wait_suspend_thread(thr)进行挂起  lock_wait_suspend_thread   逻辑比较简单，主要是找到合适的slot，进行等待，其中几个wait相关的变量更改就在里面   比如wait和wait_current都在里面   -&gt;trx = thr_get_trx(thr)     获取当前的事务   -&gt;trx_lock_wait_timeout_get(trx)     获取超时参数   -&gt;lock_wait_mutex_enter()     lock_system_t wait加锁      -&gt;trx_mutex_enter(trx)     上 trx mutex，对于这把锁不仅保护事务的字段，同时保护trx_lock_t的相关属性   -&gt;lock_wait_table_reserve_slot     找到对应的slot，用于timeout线程监测,每次加入一个等待的锁     则lock_wait_table_reservations++，并且放入slot中，也就是说     lock_wait_table_reservations是一个全局的计数器     -&gt;slot = lock_sys-&gt;waiting_threads       获取slot链表     -&gt;for (uint32_t i = srv_max_n_threads; i--; ++slot)       循环这个slot数组，找到可用的slot，并且设置属性，为线性循环       比如等待开启的时间，session wait timeout的时间       slot-&gt;suspend_time = ut_time_monotonic();       slot-&gt;wait_timeout = wait_timeout;     -&gt;lock_sys-&gt;last_slot增加   -&gt;增加global status响应属性     srv_stats.n_lock_wait_count.inc();     srv_stats.n_lock_wait_current_count.inc();     start_time = ut_time_monotonic_us();   -&gt;lock_wait_mutex_exit()     lock_system_t wait解锁   -&gt;os_event_wait(slot-&gt;event);      进行等待   -&gt;thd_wait_end(trx-&gt;mysql_thd);      等待结束        -&gt;增加和减少global status响应属性     srv_stats.n_lock_wait_current_count.dec();      减少等待行数     srv_stats.n_lock_wait_time.add(diff_time);      增加等待时间   -&gt;thd_set_lock_wait_time(trx-&gt;mysql_thd, diff_time);      增加等待时间，慢查询就会使用这个值lock_wait_timeout_thread 线程1、工作1进行超时检测和锁唤醒  -&gt;每1秒进行循环    -&gt;lock_wait_check_slots_for_timeouts      -&gt; for (auto slot = lock_sys-&gt;waiting_threads; slot last_slot;++slot)         循环每个slot，这个slot就是前面等待的时候设置的         -&gt;lock_wait_check_and_cancel           -&gt;wait_time = ut_time_monotonic() - suspend_time;           -&gt;if (wait_time &gt; (int64_t)slot-&gt;wait_timeout              如果等待事假你大于了参数设置的时间              -&gt;上lock_system独占锁                locksys::Global_exclusive_latch_guard guard{}              -&gt;lock_cancel_waiting_and_release                这里只考虑行锁                -&gt;lock_rec_dequeue_from_page(lock) (这里也是事务提交需要调用的函数)                 -&gt;lock_rec_discard                   -&gt;in_lock-&gt;index-&gt;table-&gt;n_rec_locks.fetch_sub(1, std::memory_order_relaxed)                     减少加锁的行数                   -&gt;locksys::remove_from_trx_locks                     -&gt;UT_LIST_REMOVE(lock-&gt;trx-&gt;lock.trx_locks, lock);                       从trx_lock_t的trx_locks中去除                       lock-&gt;trx-&gt;lock.trx_locks_version++;                       锁版本+1                   -&gt;HASH_DELETE(lock_t, hash, lock_hash_get(in_lock-&gt;type_mode),lock_rec_fold(page_id), in_lock)                     从hash结构中去掉，注意输入的lock_t结构体的内存还存在，下面继续使用                 -&gt;lock_rec_grant                   -&gt;for (auto lock = lock_rec_get_first_on_page_addr(lock_hash, page_id);lock != nullptr; lock = lock_rec_get_next_on_page(lock))                   找到对应需要释放lock_t相应space和page no在hash cell的第一个lock_t结构，循环hash结构的链表，查找是否lock_t锁处于等待状态                   因为前面本lock_t已经在hash结构中去掉了，那么找到的肯定是其他事务的lock_t结构                   -&gt;(lock-&gt;is_waiting())                      处于LOCK_WAIT                     -&gt;found_waiter = true;break;                       只要找到一个处于等待状态和要删除的lock_t相同的space id和page no的就进行跳出，标记found_waiter为ture，这个来自其他session.                   -&gt; if (found_waiter)                     如果hash结构中有lock_t处于等待，则需要详细的检查，如果没有堵塞的则没有必要检查了，检查会循环每个bit位                     -&gt;(ulint heap_no = 0; heap_no &lt; lock_rec_get_n_bits(in_lock); ++heap_no)                       循环本次释放lock_t的 bit结构 也就是循环 每行记录                       -&gt;if (lock_rec_get_nth_bit(in_lock, heap_no))                         查看是否是本次释放lock_t的对应的heap no，确认锁定了多少行                         对每行锁定的资源调入函数lock_rec_grant_by_heap_no                        -&gt;lock_rec_grant_by_heap_no(in_lock, heap_no)                          如果本次释放的lock_t，是否有连带的事务需要释放比如                          A&lt;-B&lt;-C,比如B超时释放了，C到底是堵塞还是从等待中醒来。                          而其他情况比如A释放了，比如提交了也是调用这个函数，到底                          B和C是释放还是继续堵塞，而且先释放哪个(权重)都是这里决定的                          -&gt;Lock_iter::for_each                            迭代整个hash结构，通过page no和heap no(rec_id)进行查找对应的链表(cell)                            这里使用lambda函数                            -&gt;if (!lock-&gt;is_waiting())                                是否没有处于waitting状态  !LOCK_WAIT                              -&gt;granted.push_back(lock)                                插入到granted中                              -&gt;函数返回                            -&gt;trx = lock-&gt;trx                              获取迭代迭代lock_t的事务                            -&gt;blocking_trx = trx-&gt;lock.blocking_trx.load(std::memory_order_relaxed)                              输出本次迭代lock_t堵塞者的事务ID                            -&gt;if (blocking_trx != in_trx)                              如果迭代事务的堵塞者不是本次释放lock_t的事务，说明不需要操作                              直接返回                            -&gt;if (trx_is_high_priority(trx))                              如果事务具有高优先级,这样意味着需要在本次释放lock_t，后具有高有限的                              事务，优先获取锁资源，而不会管权重，比如SQL线程的事务                              -&gt; waiting.push_back(lock);                                直接插入到waiting容器的开头，那么就有优先释放的权利了                            -&gt;schedule_weight = trx-&gt;lock.schedule_weight.load(std::memory_order_relaxed)                              获取权重，这里是原子变量，但不使用内存屏障(不进行任何重排，没有barrier属性，这种方式通常用于计数器)                            -&gt;if (schedule_weight &lt;= 1)                              则说明等待是将不长，并且被其堵塞的事务不多                            -&gt;low_priority_light.push_back(lock);                              插入轻权重容器，实际上轻权重的容器的事务，释放优先级较低                            -&gt;low_priority_heavier.push_back(LockDescriptorEx{schedule_weight, lock});                              否则插入到重权重容器                            -&gt;函数返回                            -&gt;if (waiting.empty() && low_priority_light.empty() && low_priority_heavier.empty())                               如果没有需要释放的事务，则直接返回                            -&gt;std::stable_sort(low_priority_heavier.begin(), low_priority_heavier.end(),[](const LockDescriptorEx &a, const LockDescriptorEx &b) {return (a.first &gt; b.first); });                              这里对重权重容器，根据权重排序，显然权重越高的事务，在本次释放的lock_t后应该优先获取锁资源，                              因为其堵塞的事务多，堵塞的时间长。                            -&gt;for (const auto &descriptor : low_priority_heavier)                              排序完成后迭代low_priority_heavier容器                              -&gt;waiting.push_back(descriptor.second)                                插入到waiting链表中                            -&gt;for (const auto &descriptor : low_priority_heavier)                              -&gt;waiting.push_back(descriptor.second);                                 轻权重事务插入到waiting链表                                                          到这里waiting容器中，有如下，堵塞中的高优先级事务，堵塞中的按照权重排序的重权重事务，堵塞中的轻权重事务，那么获取释放                            的锁资源就是按照这个顺序来的。                            -&gt;const auto new_granted_index = granted.size();                              获取当前的已经获取的lock_t资源的容器的长度                            -&gt;granted.reserve(granted.size() + waiting.size());                              将granted容器的长度放大，因为后面释放本次锁资源，其他事务获取资源也会放进来，会循环判定。，                              因为下面会判定，如果一个本次lock_t释放后，获取锁资源的事务                              是否会造成新的堵塞，比如A&lt;-B&lt;-C&lt;-D,一旦B超时了，那么分好几种情况                              情况1:A 事务持有行c锁资源，B事务持有a,b锁资源c锁资源被事务A堵塞了，而C和D事务分别堵塞在a,b锁资源被事务B堵塞了                              情况2:A 事务持有行c锁资源，B事务持有a,b锁资源c锁资源被事务A堵塞了，而C和D事务分别堵塞在a锁资源被事务B堵塞了                              情况3:A 事务持有行c锁资源，而B,C,D事务分别堵塞在c锁资源被事务A堵塞了                                                            那么一旦B事务超时了，可能情况分为                              情况1:C和D事务都应该正常的唤醒，并且继续                              情况2:C事务唤醒，D事务继续被C事务堵塞                              情况3:C,D事务都被A事务继续堵塞                                                            那么接下来就需要判定进行预测各种情况，那么granted前一部分为当前获取的关于本page和heap no的lock_t,而后半部分就是waiting                              容器的内容，当前处于堵塞的。                            -&gt;for (lock_t *wait_lock : waiting)                              迭代waiting链表中的每个lock_t                              -&gt;lock_rec_has_to_wait_for_granted                                预测主要分为两部分，当前状态和新的事务获取lock_t资源后的状态，这里分别反向扫描granted容器和正向扫描waitting容器                                -&gt;for (size_t i = new_granted_index; i--;)                                  反向迭代当前grant容器，new_granted_index为granted的lock_t                                  -&gt;if (lock_has_to_wait(wait_lock, granted_lock))                                  比较当前的需要获取锁资源的lock_t，也就是wait容器里面的lock_t,是否和                                  现有的lock_t有锁冲突，比如这里的情况3，如果出现堵塞这里就能判定出来                                  而情况1和2是判定不出来的，因为A事务持有的lock_t和C、D事务是兼容的                                  -&gt;return (granted_lock);                                    如果堵塞返回这个当前事务的lock_t,也就是事务A的                                -&gt;for (size_t i = new_granted_index; i &lt; granted.size(); ++i)                                  正向迭代waiting容器，也就是granted容器的后半部分，进行释放后                                  堵塞的预测，也就是使用优先释放锁的顺序进行预测，这里就是预测                                  情况1和情况2，这里才能预测出来                                  -&gt;if (lock_has_to_wait(wait_lock, granted_lock))                                    如果堵塞则返回当前lock_t释放后优先授权的lock_t                                -&gt;return (nullptr);                                  如果不存在堵塞，则返回nullptr，比如情况1就不存在堵塞了                            -&gt;if (blocking_lock == nullptr)                                                               如果本次lock_t释放后，新事务获取lock_t资源后不会堵塞                                      -&gt;lock_grant(wait_lock)                                -&gt;lock_reset_wait_and_release_thread_if_suspended                                  加trx mutex，唤醒事务，本次授权的事务                                  -&gt;lock_reset_lock_and_trx_wait(lock)                                    -&gt;lock-&gt;trx-&gt;lock.wait_lock = nullptr                                      既然已经开始给本事务进行lock_t授权了，那么本事务等待的锁应该设置为nullptr                                    -&gt;lock-&gt;type_mode &= ~LOCK_WAIT                                      本lock_t的状态去掉LOCK_WAIT状态                                  -&gt;lock_wait_release_thread_if_suspended                                    -&gt;os_event_set(thr-&gt;slot-&gt;event)                                      实际就是按照slot进行唤醒，因为所有的堵塞事务都会在slot中注册                              -&gt;lock_rec_move_granted_to_front                                  修改LOCK SYSTEM的hash结构，主要是从现有链表(cell)中删除                                  然后插入到现有链表(cell)的头部                                   -&gt;granted.push_back                                加入到granted容器中继续预测，加入到尾部?貌似无所谓，反正都要预测                            -&gt; 否则,也就是blocking_lock存在则说明本次lock_t释放后，获取lock_t资源的事物会继续堵塞                              -&gt;lock_update_wait_for_edge(wait_lock, blocking_lock)                                -&gt;waiting_lock-&gt;trx-&gt;lock.blocking_trx.store(blocking_lock-&gt;trx)                                  更改堵塞新获取锁资源事务的堵塞源头事务                                        -&gt;lock_reset_wait_and_release_thread_if_suspended                  这个函数和前面一样。这里是唤醒的是本次超时的事务，不做描述

收藏 1 邀请举报