ptmalloc源码分析 – 多线程争抢竞技场Arena的实现（04）

2023年6月30日上午1:12 • 人工智能 • 阅读 68

一、为何要引入Arena竞技场概念

二、主分配区和非主分配区的数据结构

三、获取分配区主函数arena_get

四、首次申请分配区的核心函数arena_get2

1、get_free_list 从空闲链表中获取一个分配区

2、_int_new_arena 初始化创建一个新的分配区

3、reused_arena 分配区满后重复利用一个分配区

一、为何要引入Arena竞技场概念

每个进程有一个主分配区，也可以允许有多个非主分配区。
主分配区可以使用brk和mmap来分配，而非主分配区只能使用mmap来映射内存块
非主分配区的数量一旦增加，则不会减少。
主分配区和非主分配区形成一个 环形链表进行管理。通过malloc_state->next来链接

我们可以看一下一个线程调用malloc的时候的流程以及分配区的状态：

当一个线程使用malloc分配内存的时候，首选会检查该线程环境中是否已经存在一个分配区，如果存在，则对该分配区进行加锁，并使用该分配区进行内存分配
如果分配失败，则遍历链表中获取的未加锁的分配区
如果整个链表都没有未加锁的分配区，则ptmalloc开辟一个新的分配区，假如malloc_state->next全局队列，并该线程在改内存分区上进行分配
当释放这块内存的时候，首先获取分配区的锁，然后释放内存，如果其他线程正在使用，则等待其他线程

通过主分配区和非主分配区，就可以解决多线程的冲突问题了。

二、主分配区和非主分配区的数据结构

/**
 * &#x5168;&#x5C40;malloc&#x72B6;&#x6001;&#x7BA1;&#x7406;
 */
struct malloc_state
{
.......

  /* &#x5206;&#x914D;&#x533A;&#x5168;&#x5C40;&#x94FE;&#x8868;&#xFF1A;&#x5206;&#x914D;&#x533A;&#x94FE;&#x8868;&#xFF0C;&#x4E3B;&#x5206;&#x914D;&#x533A;&#x653E;&#x5934;&#x90E8;&#xFF0C;&#x65B0;&#x52A0;&#x5165;&#x7684;&#x5206;&#x914D;&#x533A;&#x653E;main_arean.next &#x4F4D;&#x7F6E; Linked list */
  struct malloc_state *next;

  /* &#x5206;&#x914D;&#x533A;&#x7A7A;&#x95F2;&#x94FE;&#x8868; Linked list for free arenas.  Access to this field is serialized
     by free_list_lock in arena.c.  */
  struct malloc_state *next_free;

  /* freelist&#x7684;&#x72B6;&#x6001;&#xFF0C;0-&#x7A7A;&#x95F2; 1-&#x6B63;&#x5728;&#x4F7F;&#x7528;&#x4E2D;&#xFF0C;&#x5173;&#x8054;&#x7684;&#x7EBF;&#x7A0B;&#x6570; Number of threads attached to this arena.  0 if the arena is on
     the free list.  Access to this field is serialized by
     free_list_lock in arena.c.  */
  INTERNAL_SIZE_T attached_threads;

 .....

};

malloc_state是分配区的数据结构，起到一个状态机的作用，记录分配区的重要信息。

next：通过next来链接分配区，其中主分配区放链表头部，新加入的分配区放main_arena.next
next_free：分配区的空闲链表，通过该链表来管理忙闲状态，解决对线程分配冲突情况
attached_threads：空闲链表的状态记录，0-空闲，n-正在使用中，关联的线程个数（一个分配区可以给多个线程使用）

三、获取分配区主函数arena_get

获取分配区的主函数是arena_get（arena.c文件中），该函数主要从 thread_arena（当前线程的私有变量），获取一个分配区。如果获取到了，则加锁，进行后续的操作；如果没有获取到，线程第一次获取分配区，则调用arena_get2函数进行分配区的初始化。

这里有两个重要的变量，贯穿整个分配区：

main_arena：全局变量。进程（主线程）第一次创建的时候，会生成主分配区，然后保存在main_arena全局变量中
thread_arena：线程私有变量。每个线程都会设置这么一个变量，该变量保存对应的分配区。如果是主线程，则thread_arena设置成main_arena。

在第一次pcmalloc_init的时候，就将thread_arena设置成main_arena，意味着进程的主线程对应主分配区，然后再对主分配区进行初始化操作。

/*
 * ptmalloc_init &#x521D;&#x59CB;&#x5316;&#x8FC7;&#x7A0B;
 */
static void ptmalloc_init(void) {
    /**
     * 1. &#x5224;&#x65AD;&#x662F;&#x5426;&#x5DF2;&#x7ECF;&#x521D;&#x59CB;&#x5316;&#xFF0C;&#x5982;&#x679C;&#x521D;&#x59CB;&#x5316;&#x8FC7;&#x4E86;&#xFF0C;&#x5219;&#x4E0D;&#x518D;&#x6267;&#x884C;&#xFF1B;
     * 2. &#x5982;&#x679C;&#x7B49;&#x4E8E;0&#xFF0C;&#x5219;&#x6B63;&#x5728;&#x521D;&#x59CB;&#x5316;&#xFF0C;&#x5982;&#x679C;&#x7B49;&#x4E8E;1&#xFF0C;&#x5219;&#x521D;&#x59CB;&#x5316;&#x5B8C;&#x6210;
     */
    if (__malloc_initialized >= 0)
        return;

    __malloc_initialized = 0;

........

    /**
     * 1. main_arena&#x4E3A;&#x4E3B;&#x5206;&#x914D;&#x533A;&#x57DF;
     * 2. malloc_init_state &#x521D;&#x59CB;&#x5316;&#x4E3B;&#x5206;&#x914D;&#x533A;&#x6570;&#x636E;
     * 3. &#x5C06;&#x4E3B;&#x7EBF;&#x7A0B;&#x7684;thread_arena&#x503C;&#x8BBE;&#x7F6E;&#x4E3A;main_arena
     */
    thread_arena = &main_arena;

    malloc_init_state(&main_arena);

......
    /* &#x521D;&#x59CB;&#x5316;&#x5B8C;&#x6BD5;&#xFF0C;&#x5219;&#x8BBE;&#x7F6E;&#x4E3A;1 */
    __malloc_initialized = 1;
}

arena_get整个流程是这样的：

先从私有变量中thread_arena尝试获取分配区，不同线程都会设置自己的分配区
如果分配区存在，则加锁进行处理，直接返回当前分配区
如果分配区不存在，则调用arena_get2函数，从空闲链表或者新创建分配区
thread_arena = &main_arena; 进程的主线程对应的是主分配区
如果当前线程没有设置过分配区，则通过arena_get2进行分配区的申请

/**
 * 1. &#x5148;&#x4ECE;&#x79C1;&#x6709;&#x53D8;&#x91CF;&#x4E2D;thread_arena&#x5C1D;&#x8BD5;&#x83B7;&#x53D6;&#x5206;&#x914D;&#x533A;&#xFF0C;&#x4E0D;&#x540C;&#x7EBF;&#x7A0B;&#x90FD;&#x4F1A;&#x8BBE;&#x7F6E;&#x81EA;&#x5DF1;&#x7684;&#x5206;&#x914D;&#x533A;
 * 2. &#x5982;&#x679C;&#x5206;&#x914D;&#x533A;&#x5B58;&#x5728;&#xFF0C;&#x5219;&#x52A0;&#x9501;&#x8FDB;&#x884C;&#x5904;&#x7406;&#xFF0C;&#x76F4;&#x63A5;&#x8FD4;&#x56DE;&#x5F53;&#x524D;&#x5206;&#x914D;&#x533A;
 * 3. &#x5982;&#x679C;&#x5206;&#x914D;&#x533A;&#x4E0D;&#x5B58;&#x5728;&#xFF0C;&#x5219;&#x8C03;&#x7528;arena_get2&#x51FD;&#x6570;&#xFF0C;&#x4ECE;&#x7A7A;&#x95F2;&#x94FE;&#x8868;&#x6216;&#x8005;&#x65B0;&#x521B;&#x5EFA;&#x5206;&#x914D;&#x533A;
 * 4. thread_arena = &main_arena;  &#x8FDB;&#x7A0B;&#x7684;&#x4E3B;&#x7EBF;&#x7A0B;&#x5BF9;&#x5E94;&#x7684;&#x662F;&#x4E3B;&#x5206;&#x914D;&#x533A;
 * 5. &#x5982;&#x679C;&#x5F53;&#x524D;&#x7EBF;&#x7A0B;&#x6CA1;&#x6709;&#x8BBE;&#x7F6E;&#x8FC7;&#x5206;&#x914D;&#x533A;&#xFF0C;&#x5219;&#x901A;&#x8FC7;arena_get2&#x8FDB;&#x884C;&#x5206;&#x914D;&#x533A;&#x7684;&#x7533;&#x8BF7;
 */
#define arena_get(ptr, size) do { \
      ptr = thread_arena;                             \
      arena_lock (ptr, size);                             \
  } while (0)

#define arena_lock(ptr, size) do {                        \
      if (ptr)                                    \
        __libc_lock_lock (ptr->mutex);                        \
      else                                    \
        ptr = arena_get2 ((size), NULL);                      \
  } while (0)

四、首次申请分配区的核心函数arena_get2

如果线程是第一次申请分配区，这调用arena_get2函数，该函数也在arena.c文件中，该函数主要实现了三个功能：

get_free_list：从空闲链表中获取一个分配区，如果空闲链表中有该分配区，则直接使用，返回结果
_int_new_arena：去创建一个新的分配区，也就是一个malloc_state结构的对象，并且挂载到main_arena.next链表上面
reused_arena：如果分配区已经分配满了（分配区有个数上限），则需要循环等待其中一个分配区解锁

分配区个数：多少个分配区，根据系统来决定，一个进程最多能分配的arena个数在64位下是8 * core + 1，32位下是2 * core + 1个；arena 对于32位系统，数量最多为核心数量2倍，64位则最多为核心数量8倍，可以用来保证多线程的堆空间分配的高效性。

当arena满了之后就不再创建而是与其他arena共享一个arena，方法为依次给各个arena上锁（查看是否有其他线程正在使用该arena），如果上锁成功（没有其他线程正在使用），则使用该arena，之后一直使用这个arena，如果无法使用则阻塞等待。

/**
 * &#x83B7;&#x53D6;&#x4E00;&#x4E2A;&#x5206;&#x914D;&#x533A;&#xFF0C;&#x5982;&#x679C;&#x6709;&#x7A7A;&#x95F2;&#x7684;&#xFF0C;&#x5219;&#x8D70;&#x7A7A;&#x95F2;&#x94FE;&#x8868;&#xFF1B;&#x6CA1;&#x6709;&#x5219;&#x521B;&#x5EFA;&#x65B0;&#x7684;&#x5206;&#x914D;&#x533A;&#xFF1B;&#x5206;&#x914D;&#x533A;&#x6EE1;&#x4E86;&#xFF0C;&#x5219;&#x7B49;&#x5F85;&#x91CA;&#x653E;
 */
static mstate arena_get2(size_t size, mstate avoid_arena) {
    mstate a;

    static size_t narenas_limit;

    /* &#x4ECE;&#x7A7A;&#x95F2;&#x94FE;&#x8868;&#x4E0A;&#x83B7;&#x53D6;&#x4E00;&#x4E2A;mstate&#x7684;&#x5206;&#x914D;&#x533A; */
    a = get_free_list();

    /* &#x5982;&#x679C;&#x7A7A;&#x95F2;&#x94FE;&#x8868;&#x4E3A;NULL&#xFF0C;&#x5219;&#x521B;&#x5EFA;&#x4E00;&#x4E2A;&#x65B0;&#x7684;arean&#x5206;&#x914D;&#x533A; */
    if (a == NULL) {
        /* Nothing immediately available, so generate a new arena.  */
        /* &#x591A;&#x5C11;&#x4E2A;&#x5206;&#x914D;&#x533A;&#xFF0C;&#x6839;&#x636E;&#x7CFB;&#x7EDF;&#x6765;&#x51B3;&#x5B9A;&#xFF0C;&#x4E00;&#x4E2A;&#x8FDB;&#x7A0B;&#x6700;&#x591A;&#x80FD;&#x5206;&#x914D;&#x7684;arena&#x4E2A;&#x6570;&#x5728;64&#x4F4D;&#x4E0B;&#x662F;8 * core&#xFF0C;32&#x4F4D;&#x4E0B;&#x662F;2 * core&#x4E2A;
         * arena &#x5BF9;&#x4E8E;32&#x4F4D;&#x7CFB;&#x7EDF;&#xFF0C;&#x6570;&#x91CF;&#x6700;&#x591A;&#x4E3A;&#x6838;&#x5FC3;&#x6570;&#x91CF;2&#x500D;&#xFF0C;64&#x4F4D;&#x5219;&#x6700;&#x591A;&#x4E3A;&#x6838;&#x5FC3;&#x6570;&#x91CF;8&#x500D;&#xFF0C;&#x53EF;&#x4EE5;&#x7528;&#x6765;&#x4FDD;&#x8BC1;&#x591A;&#x7EBF;&#x7A0B;&#x7684;&#x5806;&#x7A7A;&#x95F4;&#x5206;&#x914D;&#x7684;&#x9AD8;&#x6548;&#x6027;&#x3002;
         * &#x4E3B;&#x8981;&#x5B58;&#x50A8;&#x4E86;&#x8F83;&#x9AD8;&#x5C42;&#x6B21;&#x7684;&#x4E00;&#x4E9B;&#x4FE1;&#x606F;&#x3002;&#x6709;&#x4E00;&#x4E2A;main_arena&#xFF0C;&#x662F;&#x7531;&#x4E3B;&#x7EBF;&#x7A0B;&#x521B;&#x5EFA;&#x7684;&#xFF0C;thread_arena&#x5219;&#x4E3A;&#x5404;&#x7EBF;&#x7A0B;&#x521B;&#x5EFA;&#x7684;&#xFF0C;
         * &#x5F53;arena&#x6EE1;&#x4E86;&#x4E4B;&#x540E;&#x5C31;&#x4E0D;&#x518D;&#x521B;&#x5EFA;&#x800C;&#x662F;&#x4E0E;&#x5176;&#x4ED6;arena&#x5171;&#x4EAB;&#x4E00;&#x4E2A;arena&#xFF0C;&#x65B9;&#x6CD5;&#x4E3A;&#x4F9D;&#x6B21;&#x7ED9;&#x5404;&#x4E2A;arena&#x4E0A;&#x9501;&#xFF08;&#x67E5;&#x770B;&#x662F;&#x5426;&#x6709;&#x5176;&#x4ED6;&#x7EBF;&#x7A0B;&#x6B63;&#x5728;&#x4F7F;&#x7528;&#x8BE5;arena&#xFF09;&#xFF0C;
         * &#x5982;&#x679C;&#x4E0A;&#x9501;&#x6210;&#x529F;&#xFF08;&#x6CA1;&#x6709;&#x5176;&#x4ED6;&#x7EBF;&#x7A0B;&#x6B63;&#x5728;&#x4F7F;&#x7528;&#xFF09;&#xFF0C;&#x5219;&#x4F7F;&#x7528;&#x8BE5;arena&#xFF0C;&#x4E4B;&#x540E;&#x4E00;&#x76F4;&#x4F7F;&#x7528;&#x8FD9;&#x4E2A;arena&#xFF0C;&#x5982;&#x679C;&#x65E0;&#x6CD5;&#x4F7F;&#x7528;&#x5219;&#x963B;&#x585E;&#x7B49;&#x5F85;&#x3002;
         *  */
        if (narenas_limit == 0) {
            if (mp_.arena_max != 0)
                narenas_limit = mp_.arena_max;
            else if (narenas > mp_.arena_test) {
                int n = __get_nprocs();

                if (n >= 1)
                    narenas_limit = NARENAS_FROM_NCORES(n);
                else
                    /* We have no information about the system.  Assume two
                     cores.  */
                    narenas_limit = NARENAS_FROM_NCORES(2); //&#x9ED8;&#x8BA4;&#x662F;&#x6838;&#x6570;&#x7684;&#x4E24;&#x500D;
            }
        }
        repeat: ;
        size_t n = narenas; //narenas=1
        /* NB: the following depends on the fact that (size_t)0 - 1 is a
         very large number and that the underflow is OK.  If arena_max
         is set the value of arena_test is irrelevant.  If arena_test
         is set but narenas is not yet larger or equal to arena_test
         narenas_limit is 0.  There is no possibility for narenas to
         be too big for the test to always fail since there is not
         enough address space to create that many arenas.  */
        /* */
        if (__glibc_unlikely(n <= narenas_limit - 1)) { if (catomic_compare_and_exchange_bool_acq(&narenas, n + 1, n)) goto repeat; a="_int_new_arena(size);" 创建一个新的分配区 (__glibc_unlikely(a="=" null)) catomic_decrement(&narenas); } else 复用默认分区 return a; }< code></=>

通过全局变量free_list保存空闲链表。如果空闲链表为空，则直接返回空的值，如果不为空，则调整free_list的变量值为free_list->next。将attached_threads的值设置成1，说明已经有线程绑定该分配区进行使用了。最后需要将thread_arena的线程私有变量，设置成分配区。

remove_from_free_list函数：主要是移除free_list，直接操作next_free的指针即可

/**
 * &#x4ECE;FreeList&#x4E0A;&#x83B7;&#x53D6;&#x4E00;&#x4E2A;&#x5206;&#x914D;&#x533A;
 */
/* Remove an arena from free_list.  */
static mstate get_free_list(void) {
    mstate replaced_arena = thread_arena; //&#x83B7;&#x53D6;&#x5F53;&#x524D;&#x7EBF;&#x7A0B;&#x5206;&#x914D;&#x533A;
    /* free_list &#x5168;&#x5C40;&#x53D8;&#x91CF; */
    mstate result = free_list; //&#x5F53;&#x524D;&#x7A7A;&#x95F2;&#x7684;&#x5206;&#x914D;&#x533A;
    if (result != NULL) {
        __libc_lock_lock(free_list_lock); //&#x52A0;&#x9501;
        result = free_list; //&#x518D;&#x6B21;&#x83B7;&#x53D6;free_list
        if (result != NULL) {
            free_list = result->next_free; //&#x79FB;&#x52A8;free_list

            /* The arena will be attached to this thread.  */
            assert(result->attached_threads == 0);
            result->attached_threads = 1; //&#x4FEE;&#x6539;&#x5206;&#x914D;&#x533A;&#x7684;&#x7EBF;&#x7A0B;&#x7ED1;&#x5B9A;&#x4E2A;&#x6570;

            detach_arena(replaced_arena);
        }
        __libc_lock_unlock(free_list_lock); //&#x89E3;&#x9664;&#x9501;

        /* &#x5206;&#x914D;&#x533A;&#x52A0;&#x9501;&#xFF0C;&#x5E76;&#x5C06;thread_arena&#x8BBE;&#x7F6E;&#x4E3A;result */
        if (result != NULL) {
            LIBC_PROBE(memory_arena_reuse_free_list, 1, result);
            __libc_lock_lock(result->mutex);
            thread_arena = result; //&#x5C06;&#x7EBF;&#x7A0B;&#x7684;&#x5206;&#x914D;&#x533A;&#x8BBE;&#x7F6E;&#x4E3A;result
        }
    }

    return result;
}

/* Remove the arena from the free list (if it is present).

 free_list_lock must have been acquired by the caller.

 &#x79FB;&#x52A8;&#x94FE;&#x8868;&#x5730;&#x5740;&#xFF0C;&#x79FB;&#x9664;free_list&#x4E0A;&#x7684;&#x5206;&#x914D;&#x533A;&#x7ED3;&#x6784;*/
static void remove_from_free_list(mstate arena) {
    mstate *previous = &free_list;
    for (mstate p = free_list; p != NULL; p = p->next_free) {
        assert(p->attached_threads == 0);
        if (p == arena) {
            /* Remove the requested arena from the list.  */
            *previous = p->next_free;
            break;
        } else
            previous = &p->next_free;
    }
}

_int_new_arena函数主要是创建一个新的分配区，该分配区主要是非主分配区类型。主分配区在ptmalloc_init中初始化，并且设置了全局变量main_arena的值。

首先调用new_heap，该结构主要用来记录堆信息。new_heap只在非主分配区会使用，非主分配区一般都是通过MMAP向系统申请内存。非主分配区申请后，是不能被销毁的
然后通过malloc_init_state函数，对分配区的状态机结构进行初始化。并设置attached_threads字段，关联的进程个数。将thread_arena的值设置为状态机结构
最后，将新的分配区加入到全局链表上main_arena.next，新申请的分配区都会放入主分配区的下一个位置设置为1（表示有一个线程关联这个分配区）

/**
 * &#x521D;&#x59CB;&#x5316;&#x4E00;&#x4E2A;&#x65B0;&#x7684;&#x5206;&#x914D;&#x533A;arena
 * &#x8BE5;&#x51FD;&#x6570;&#x4E3B;&#x8981;&#x521B;&#x5EFA;&#xFF1A;&#x975E;&#x4E3B;&#x5206;&#x914D;&#x533A;
 * &#x4E3B;&#x5206;&#x914D;&#x533A;&#x5728;ptmalloc_init&#x4E2D;&#x521D;&#x59CB;&#x5316;&#xFF0C;&#x5E76;&#x4E14;&#x8BBE;&#x7F6E;&#x4E86;&#x5168;&#x5C40;&#x53D8;&#x91CF;main_arena&#x7684;&#x503C;
 */
static mstate _int_new_arena(size_t size) {
    mstate a;
    heap_info *h;
    char *ptr;
    unsigned long misalign;

    /* &#x5206;&#x914D;&#x4E00;&#x4E2A;heap_info&#xFF0C;&#x7528;&#x4E8E;&#x8BB0;&#x5F55;&#x5806;&#x7684;&#x4FE1;&#x606F;&#xFF0C;&#x975E;&#x4E3B;&#x5206;&#x914D;&#x533A;&#x4E00;&#x822C;&#x90FD;&#x662F;&#x901A;&#x8FC7;MMAP&#x5411;&#x7CFB;&#x7EDF;&#x7533;&#x8BF7;&#x5185;&#x5B58;&#xFF1B;&#x975E;&#x4E3B;&#x5206;&#x914D;&#x533A;&#x7533;&#x8BF7;&#x540E;&#xFF0C;&#x662F;&#x4E0D;&#x80FD;&#x88AB;&#x9500;&#x6BC1;&#x7684; */
    h = new_heap(size + (sizeof(*h) + sizeof(*a) + MALLOC_ALIGNMENT),
            mp_.top_pad);&#xE5;
    if (!h) {
        /* Maybe size is too large to fit in a single heap.  So, just try
         to create a minimally-sized arena and let _int_malloc() attempt
         to deal with the large request via mmap_chunk().  */
        h = new_heap(sizeof(*h) + sizeof(*a) + MALLOC_ALIGNMENT, mp_.top_pad);
        if (!h)
            return 0;
    }
    a = h->ar_ptr = (mstate)(h + 1); //heap_info->ar_ptr&#x7684;&#x503C;&#x8BBE;&#x7F6E;&#x6210;mstate&#x7684;&#x5206;&#x914D;&#x533A;&#x72B6;&#x6001;&#x673A;&#x7684;&#x6570;&#x636E;&#x7ED3;&#x6784;

    malloc_init_state(a); //&#x521D;&#x59CB;&#x5316;mstate
    a->attached_threads = 1; //&#x8BBE;&#x7F6E;&#x8FDB;&#x7A0B;&#x5173;&#x8054;&#x4E2A;&#x6570;
    /*a->next = NULL;*/
    a->system_mem = a->max_system_mem = h->size;

    /* Set up the top chunk, with proper alignment. */
    ptr = (char *) (a + 1);
    misalign = (unsigned long) chunk2mem(ptr) & MALLOC_ALIGN_MASK;
    if (misalign > 0)
        ptr += MALLOC_ALIGNMENT - misalign;
    top (a) = (mchunkptr) ptr;
    set_head(top(a), (((char *) h + h->size) - ptr) | PREV_INUSE);

    LIBC_PROBE(memory_arena_new, 2, a, size);
    mstate replaced_arena = thread_arena;
    thread_arena = a; //&#x5C06;&#x5F53;&#x524D;&#x7EBF;&#x7A0B;&#x8BBE;&#x7F6E;mstate
    __libc_lock_init(a->mutex); //&#x521D;&#x59CB;&#x5316;&#x5206;&#x914D;&#x533A;&#x9501;

    __libc_lock_lock(list_lock); //&#x52A0;&#x4E0A;&#x5206;&#x914D;&#x533A;&#x9501;

    /* &#x5C06;&#x65B0;&#x7684;&#x5206;&#x914D;&#x533A;&#x52A0;&#x5165;&#x5230;&#x5168;&#x5C40;&#x94FE;&#x8868;&#x4E0A;&#xFF0C;&#x65B0;&#x7533;&#x8BF7;&#x7684;&#x5206;&#x914D;&#x533A;&#x90FD;&#x4F1A;&#x653E;&#x5165;&#x4E3B;&#x5206;&#x914D;&#x533A;&#x7684;&#x4E0B;&#x4E00;&#x4E2A;&#x4F4D;&#x7F6E;*/
    /* Add the new arena to the global list.  */
    a->next = main_arena.next;
    /* FIXME: The barrier is an attempt to synchronize with read access
     in reused_arena, which does not acquire list_lock while
     traversing the list.  */
    atomic_write_barrier();
    main_arena.next = a;
    __libc_lock_unlock(list_lock);

    /* &#x8C03;&#x6574;attached_threads&#x72B6;&#x6001;*/
    __libc_lock_lock(free_list_lock);
    detach_arena(replaced_arena);
    __libc_lock_unlock(free_list_lock);

     __malloc_fork_lock_parent.  */

    __libc_lock_lock(a->mutex); //&#x89E3;&#x9664;&#x5206;&#x914D;&#x533A;&#x9501;

    return a;
}

/* Remove the arena from the free list (if it is present).

 free_list_lock must have been acquired by the caller.

 &#x79FB;&#x52A8;&#x94FE;&#x8868;&#x5730;&#x5740;&#xFF0C;&#x79FB;&#x9664;free_list&#x4E0A;&#x7684;&#x5206;&#x914D;&#x533A;&#x7ED3;&#x6784;*/
static void remove_from_free_list(mstate arena) {
    mstate *previous = &free_list;
    for (mstate p = free_list; p != NULL; p = p->next_free) {
        assert(p->attached_threads == 0);
        if (p == arena) {
            /* Remove the requested arena from the list.  */
            *previous = p->next_free;
            break;
        } else
            previous = &p->next_free;
    }
}

如果分配区全部处于忙碌中，则通过遍历方式，尝试没有加锁的分配区进行分配操作。如果得到一个没有加锁的分配区，则attached_threads关联的线程数，并将thread_arena设置到当前的分配区上。这样就实现了多线程环境下，分配区的重复利用。

/* Lock and return an arena that can be reused for memory allocation.

 Avoid AVOID_ARENA as we have already failed to allocate memory in
 it and it is currently locked.

 &#x5982;&#x679C;&#x5206;&#x914D;&#x533A;&#x5168;&#x90E8;&#x5904;&#x4E8E;&#x5FD9;&#x788C;&#x4E2D;&#xFF0C;&#x5219;&#x901A;&#x8FC7;&#x904D;&#x5386;&#x65B9;&#x5F0F;&#xFF0C;&#x5C1D;&#x8BD5;&#x6CA1;&#x6709;&#x52A0;&#x9501;&#x7684;&#x5206;&#x914D;&#x533A;&#x8FDB;&#x884C;&#x5206;&#x914D;&#x64CD;&#x4F5C;
 */
static mstate reused_arena(mstate avoid_arena) {
    mstate result;
    /* FIXME: Access to next_to_use suffers from data races.  */
    static mstate next_to_use;
    if (next_to_use == NULL)
        next_to_use = &main_arena;

    /* Iterate over all arenas (including those linked from
     free_list). &#x5FAA;&#x73AF;&#x904D;&#x5386;&#x6574;&#x4E2A;&#x5206;&#x914D;&#x533A;&#x94FE;&#x8868; */
    result = next_to_use;
    do {
        if (!__libc_lock_trylock(result->mutex)) //&#x5BFB;&#x627E;&#x4E00;&#x4E2A;&#x4E0D;&#x80FD;&#x9501;&#x5B9A;&#x7684;&#x5206;&#x914D;&#x533A;
            goto out;

        /* FIXME: This is a data race, see _int_new_arena.  */
        result = result->next;
    } while (result != next_to_use);

    /* Avoid AVOID_ARENA as we have already failed to allocate memory
     in that arena and it is currently locked.   */
    if (result == avoid_arena)
        result = result->next;

    /* No arena available without contention.  Wait for the next in line.  */
    LIBC_PROBE(memory_arena_reuse_wait, 3, &result->mutex, result, avoid_arena);
    __libc_lock_lock(result->mutex);

    /* &#x8DF3;&#x8F6C;&#x64CD;&#x4F5C; */
    out:
    /* Attach the arena to the current thread.  */
    {
        /* Update the arena thread attachment counters.   */
        mstate replaced_arena = thread_arena;
        __libc_lock_lock(free_list_lock); //&#x52A0;&#x9501;
        detach_arena(replaced_arena);

        /* We may have picked up an arena on the free list.  We need to
         preserve the invariant that no arena on the free list has a
         positive attached_threads counter (otherwise,
         arena_thread_freeres cannot use the counter to determine if the
         arena needs to be put on the free list).  We unconditionally
         remove the selected arena from the free list.  The caller of
         reused_arena checked the free list and observed it to be empty,
         so the list is very short.  */
        remove_from_free_list(result); //&#x4ECE;free list&#x79FB;&#x52A8;&#x9664;&#xFF0C;&#x591A;&#x4E2A;&#x7EBF;&#x7A0B;&#x5171;&#x7528;

        ++result->attached_threads; //&#x7EBF;&#x7A0B;&#x5F15;&#x7528;&#x6570;&#x91CF;+1

        __libc_lock_unlock(free_list_lock); //&#x89E3;&#x9501;
    }

    LIBC_PROBE(memory_arena_reuse, 2, result, avoid_arena);
    thread_arena = result;  //&#x8BBE;&#x7F6E;&#x7EBF;&#x7A0B;
    next_to_use = result->next; //&#x8C8C;&#x4F3C;&#x6CA1;&#x610F;&#x4E49;&#x7684;&#x4E00;&#x884C;&#x4EE3;&#x7801;

    return result;
}

非主分配区都是通过new_heap的方式，进行内存的申请和分配，下一章，我们重点讲解一下 heap_info堆信息的结构以及与分配区的关系

Original: https://blog.csdn.net/initphp/article/details/127750294
Author: 老码农zhuli
Title: ptmalloc源码分析 – 多线程争抢竞技场Arena的实现（04）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/660331/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

学习C++图像处理最快最好的途径

学习C++图像处理前首先的明确图像处理是什么，它是如何定义的？它能给我们带来哪些便利？之后根据需求选择合适的编程语言，C++ or python？图像处理(image proce…

人工智能 2023年6月18日
0071
神经网络——nn.CrossEntropyLoss的使用及反向传播

之前说过Loss Functions有两个作用：1.可以计算我们实际输出和目标之间的差距；2.为我们更新输出提供一定的依据（反向传播），这篇文章我们就通过搭建一个神经网络，使用nn…

人工智能 2023年7月14日
0045
【画学numpy】Drawing and Studying Numpy

画学numpy 用画画的方式轻松入门numpy ⭐️github：drawing_and_studying_numpy包含了可以运行的notebook文件以及本文绘制的所有插图。也…

人工智能 2023年7月17日
0055
【项目实战】Python基于决策树多分类模型实现水色图像的水质评价

说明：这是一个机器学习实战项目（附带数据+代码+文档+视频讲解），如需数据+代码+文档+视频讲解可以直接到文章最后获取。 1.项目背景随着工业技术的日益提升，人类的生活变得越…

人工智能 2023年7月2日
0093
K210模型训练（物体分类）

目录一、打开Maix IDE 的官网找到需要训练模型的平台Maix Hub 模型训练的分类：二、如何使用Maix Hub模型训练平台数据集的采集三、训练模型后的文件分类一…

人工智能 2023年7月1日
0099
卷积神经网络学习—Resnet50（论文精读+pytorch代码复现）

前言一、Resnet论文精读 * 引入残差残差块 ResNet50模型基本构成 BN层 Resnet50总体结构二、Resnet50代码复现 * 完整代码前言如果说在CN…

人工智能 2023年7月12日
0055
计算机网络概述

既然我们无法逃避接触互联网，那么为何不去了解它并且使用它。 ——因特网”之父” 温顿.瑟夫因特网概述 1、网络、互联网与因特网的区别与关系多节点之间通过…

人工智能 2023年6月26日
0053
猫狗图像识别（卷积神经网络算法，TensorFlow安装）

目录一、tensorflow库安装（1）TensorFlow的历史版本与对应Python版本（2）Python版本查询（3）找到上面的版本框进行对应的TensorFlow下…

人工智能 2023年6月24日
0054
xilinx ZCU104安装tensorflow

xilinx ZCU104安装tensorflow ZCU104芯片是Cortex-A53，该芯片是ARMv8架构，目前满足该平台的tensorflow版本较少，我当时在githu…

人工智能 2023年5月24日
0067
机器学习的数学基础（5）：最小均方误差的回归问题

一. 回归经过前面的铺垫，我们终于要接触到实际的与机器学习有关的数学问题了。对于一个基本的监督学习模型来说，其本质是找到一个函数来拟合所给定的数据集。而找到这个拟合函数f的过程，…

人工智能 2023年6月17日
0071
空洞卷积详解（输入输出大小分析）

空洞卷积空洞卷积的提出主要是为了解决图像分割问题中存在的信息丢失问题，之前的图像分割算法往往会使用深度卷积神经网络，卷积层之间往往会夹杂着池化层来增大感受野，最后再通过一系列的上…

人工智能 2023年6月17日
0054
Jetson Xavier NX Yolov5的搭建及配合Intel Realsense D435i的使用

该实验需分为三步来完成1.在Jetson Xavier NX上搭建Yolov5。2.安装Intel Realsense D435i的SDK。3.配合YOLOV5实现实时目标检测。 …

人工智能 2023年7月18日
0062
008-单片机最小系统解析、函数的调用

关于单片机最小系统解析的讲解及函数的定义、调用单片机最小系统电源电路 5V和3.3V是一个概念值，非准确值。数字电路常用电源有24V,12V,5V,3.3V,2.5V,1.8…

人工智能 2023年6月6日
0084
转置卷积（Transposed Convolution）的介绍以及理论讲解

转置卷积（Transposed Convolution）论文：A guide to convolution arithmetic for deep learning 转置卷积（T…

人工智能 2023年5月26日
0097
【第十届“泰迪杯”数据挖掘挑战赛】C题：疫情背景下的周边游需求图谱分析问题二方案及Python实现

目录相关链接代码下载 1 问题二题目 2 思路方案 4 Python实现 * 4.1 提取旅游产品 – 4.1.1 数据准备 4.1.2 单独提取公众号和游记攻略的…

人工智能 2023年6月1日
00137
BertTokenizer 使用方法

python 导入与初始化 BertTokenizer from transformers import BertTokenizer tokenizer = BertTokeniz…

人工智能 2023年6月16日
00107

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

ptmalloc源码分析 – 多线程争抢竞技场Arena的实现（04）

一、为何要引入Arena竞技场概念

二、主分配区和非主分配区的数据结构

三、获取分配区主函数arena_get

四、首次申请分配区的核心函数arena_get2

大家都在看