IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    无锁有序链表的实现

    Kevin Lynx发表于 2015-05-05 00:00:00
    love 0

    无锁有序链表可以保证元素的唯一性,使其可用于哈希表的桶,甚至直接作为一个效率不那么高的map。普通链表的无锁实现相对简单点,因为插入元素可以在表头插,而有序链表的插入则是任意位置。

    本文主要基于论文High Performance Dynamic Lock-Free Hash Tables实现。

    主要问题

    链表的主要操作包含insert和remove,先简单实现一个版本,就会看到问题所在,以下代码只用作示例:

    struct node_t {
            key_t key;
            value_t val;
            node_t *next;
        };
    
        int l_find(node_t **pred_ptr, node_t **item_ptr, node_t *head, key_t key) {
            node_t *pred = head;
            node_t *item = head->next;
            while (item) {
                int d = KEY_CMP(item->key, key);
                if (d >= 0) {
                    *pred_ptr = pred;
                    *item_ptr = item;
                    return d == 0 ? TRUE : FALSE;
                }
                pred = item;
                item = item->next;
            } 
            *pred_ptr = pred;
            *item_ptr = NULL;
            return FALSE;
        }
    
        int l_insert(node_t *head, key_t key, value_t val) {
            node_t *pred, *item, *new_item;
            while (TRUE) {
                if (l_find(&pred, &item, head, key)) {
                    return FALSE;
                }
                new_item = (node_t*) malloc(sizeof(node_t));
                new_item->key = key;
                new_item->val = val;
                new_item->next = item;
                // A. 如果pred本身被移除了
                if (CAS(&pred->next, item, new_item)) {
                    return TRUE;
                }
                free(new_item);
            }
        }
    
        int l_remove(node_t *head, key_t key) {
            node_t *pred, *item;
            while (TRUE) {
                if (!l_find(&pred, &item, head, key)) {
                    return TRUE;
                }
                // B. 如果pred被移除;如果item也被移除
                if (CAS(&pred->next, item, item->next)) {
                    haz_free(item);
                    return TRUE;
                }
            }
        }

    l_find函数返回查找到的前序元素和元素本身,代码A和B虽然拿到了pred和item,但在CAS的时候,其可能被其他线程移除。甚至,在l_find过程中,其每一个元素都可能被移除。问题在于,任何时候拿到一个元素时,都不确定其是否还有效。元素的有效性包括其是否还在链表中,其指向的内存是否还有效。

    解决方案

    通过为元素指针增加一个有效性标志位,配合CAS操作的互斥性,就可以解决元素有效性判定问题。

    因为node_t放在内存中是会对齐的,所以指向node_t的指针值低几位是不会用到的,从而可以在低几位里设置标志,这样在做CAS的时候,就实现了DCAS的效果,相当于将两个逻辑上的操作变成了一个原子操作。想象下引用计数对象的线程安全性,其内包装的指针是线程安全的,但对象本身不是。

    CAS的互斥性,在若干个线程CAS相同的对象时,只有一个线程会成功,失败的线程就可以以此判定目标对象发生了变更。改进后的代码(代码仅做示例用,不保证正确):

    typedef size_t markable_t;
        // 最低位置1,表示元素被删除
        #define HAS_MARK(p) ((markable_t)p & 0x01)
        #define MARK(p) ((markable_t)p | 0x01)
        #define STRIP_MARK(p) ((markable_t)p & ~0x01)
    
        int l_insert(node_t *head, key_t key, value_t val) {
            node_t *pred, *item, *new_item;
            while (TRUE) {
                if (l_find(&pred, &item, head, key)) { 
                    return FALSE;
                }
                new_item = (node_t*) malloc(sizeof(node_t));
                new_item->key = key;
                new_item->val = val;
                new_item->next = item;
                // A. 虽然find拿到了合法的pred,但是在以下代码之前pred可能被删除,此时pred->next被标记
                //    pred->next != item,该CAS会失败,失败后重试
                if (CAS(&pred->next, item, new_item)) {
                    return TRUE;
                }
                free(new_item);
            }
            return FALSE;
        }
    
        int l_remove(node_t *head, key_t key) {
            node_t *pred, *item;
            while (TRUE) {
                if (!l_find(&pred, &item, head, key)) {
                    return FALSE;
                }
                node_t *inext = item->next;
                // B. 删除item前先标记item->next,如果CAS失败,那么情况同insert一样,有其他线程在find之后
                //    删除了item,失败后重试
                if (!CAS(&item->next, inext, MARK(inext))) {
                    continue;
                }
                // C. 对同一个元素item删除时,只会有一个线程成功走到这里
                if (CAS(&pred->next, item, STRIP_MARK(item->next))) {
                    haz_defer_free(item);
                    return TRUE;
                }
            }
            return FALSE;
        }
    
        int l_find(node_t **pred_ptr, node_t **item_ptr, node_t *head, key_t key) {
            node_t *pred = head;
            node_t *item = head->next;
            hazard_t *hp1 = haz_get(0);
            hazard_t *hp2 = haz_get(1);
            while (item) {
                haz_set_ptr(hp1, pred);
                haz_set_ptr(hp2, item);
                /* 
                 如果已被标记,那么紧接着item可能被移除链表甚至释放,所以需要重头查找
                */
                if (HAS_MARK(item->next)) { 
                    return l_find(pred_ptr, item_ptr, head, key);
                }
                int d = KEY_CMP(item->key, key);
                if (d >= 0) {
                    *pred_ptr = pred;
                    *item_ptr = item;
                    return d == 0 ? TRUE : FALSE;
                }
                pred = item;
                item = item->next;
            } 
            *pred_ptr = pred;
            *item_ptr = NULL;
            return FALSE;
        }

    haz_get、haz_set_ptr之类的函数是一个hazard pointer实现,用于支持多线程下内存的GC。上面的代码中,要删除一个元素item时,会标记item->next,从而使得insert时中那个CAS不需要做任何调整。总结下这里的线程竞争情况:

    • insert中find到正常的pred及item,pred->next == item,然后在CAS前有线程删除了pred,此时pred->next == MARK(item),CAS失败,重试;删除分为2种情况:a) 从链表移除,得到标记,pred可继续访问;b) pred可能被释放内存,此时再使用pred会错误。为了处理情况b,所以引入了类似hazard pointer的机制,可以有效保障任意一个指针p只要还有线程在使用它,它的内存就不会被真正释放
    • insert中有多个线程在pred后插入元素,此时同样由insert中的CAS保证,这个不多说
    • remove中情况同insert,find拿到了有效的pred和next,但在CAS的时候pred被其他线程删除,此时情况同insert,CAS失败,重试
    • 任何时候改变链表结构时,无论是remove还是insert,都需要重试该操作
    • find中遍历时,可能会遇到被标记删除的item,此时item根据remove的实现很可能被删除,所以需要重头开始遍历

    ABA问题

    ABA问题还是存在的,insert中:

    if (CAS(&pred->next, item, new_item)) {
            return TRUE;
        }

    如果CAS之前,pred后的item被移除,又以相同的地址值加进来,但其value变了,此时CAS会成功,但链表可能就不是有序的了。pred->val < new_item->val > item->val

    为了解决这个问题,可以利用指针值地址对齐的其他位来存储一个计数,用于表示pred->next的改变次数。当insert拿到pred时,pred->next中存储的计数假设是0,CAS之前其他线程移除了pred->next又新增回了item,此时pred->next中的计数增加,从而导致insert中CAS失败。

    // 最低位留作删除标志
        #define MASK ((sizeof(node_t) - 1) & ~0x01)
    
        #define GET_TAG(p) ((markable_t)p & MASK)
        #define TAG(p, tag) ((markable_t)p | (tag))
        #define MARK(p) ((markable_t)p | 0x01)
        #define HAS_MARK(p) ((markable_t)p & 0x01)
        #define STRIP_MARK(p) ((node_t*)((markable_t)p & ~(MASK | 0x01)))

    remove的实现:

    /* 先标记再删除 */
        if (!CAS(&sitem->next, inext, MARK(inext))) {
            continue;
        }
        int tag = GET_TAG(pred->next) + 1;
        if (CAS(&pred->next, item, TAG(STRIP_MARK(sitem->next), tag))) {
            haz_defer_free(sitem);
            return TRUE;
        }

    insert中也可以更新pred->next的计数。

    总结

    无锁的实现,本质上都会依赖于CAS的互斥性。从头实现一个lock free的数据结构,可以深刻感受到lock free实现的tricky。最终代码可以从这里github获取。代码中为了简单,实现了一个不是很强大的hazard pointer,可以参考之前的博文。

    原文地址: http://codemacro.com/2015/05/05/lock_free_list/
    written by Kevin Lynx posted at http://codemacro.com



沪ICP备19023445号-2号
友情链接