Go: Memory Management and Allocation

引子

goroutine堆栈上的内存块不用gc。

package-level变量在堆上分配且运行期间永远不会gc。

示例1:

package main

type smallStruct struct {
   a, b int64
   c, d float64
}

func main() {
   smallAllocation()
}

//go:noinline
func smallAllocation() *smallStruct {
   return &smallStruct{}
}

//go:noinline 是用来防止编译器进行inline优化,移除这个函数导致没有内存分配(不太懂原文意思,理论肯定有分配)。然后堆上分配变量分析命令

go tool compile "-m" main.go

输出

main.go:14:9: &smallStruct literal escapes to heap

还可以用

go tool compile -S main.go

显式汇编代码

0x001d 00029 (main.go:14)   LEAQ   type."".smallStruct(SB), AX
0x0024 00036 (main.go:14)  PCDATA $0, $0
0x0024 00036 (main.go:14)  MOVQ   AX, (SP)
0x0028 00040 (main.go:14)  CALL   runtime.newobject(SB)

runtime.newobject是内置的在heap上的内存分配函数,mallocgc的代理。根据分配内存大小有:小内存分配和大内存分配。

小内存分配

32kb以下,go会尝试从叫mcache的本地缓存中获取内存。这个cache管理了一个块大小为32kb的内存块跨度列表(span list)。叫作mspan, 它包含可分配的内存。

allocation with mcache

每个线程M分配给一个处理器P并一次最多处理一个goroutine。在分配内存时,当前的goroutine将使用其当前P的本地缓存来查找跨度列表span list中可用的第一个空闲对象。使用此本地缓存不需要锁,并使分配效率更高。

跨度列表span list分为〜70个大小类别,从8字节到32k字节,可以存储不同的对象大小:

span size classes

每个跨度有两个:一个给不包含指针的对象使用,另一个是包含指针的(不过上图没有展示出来 ?)。这种区分使得垃圾回收更容易,因为不包含指针的不必去扫描有没有相关引用(it will not have to scan the spans that do not contain any pointer.)。

回到上面例子中,smallStruct的大小是32 bytes,符合32 bytes的跨度。

现在考虑如果没有空闲位置的情况。go维护每个尺寸级别的跨度的集中列表,叫mcentral,每个跨度有空闲对象列表和非空闲对象列表(是个双向列表)。

central lists of spans

分配使用后挪到非空列表,回收后挪到空列表。

我们程序当mcache没有空位后从mcentral那获取一个span。

span replacement from mcentral

如果空列表中没有新的跨度,Go需要一种方法来将新的跨度移到中心列表。现在将从堆中分配新的范围,并将其链接到中央列表:

span allocation from the heap

堆在需要时从OS中提取内存。如果需要更多内存,堆将分配一大块大量内存,称为arena,64位系统大小为64Mb,其它大多数是4Mb。arena用span来映射内存页(The arena also maps the memory page with the spans)。

heap is composed by arenas

大内存分配

Go不会使用本地缓存来管理大量分配。这些大于32kb的分配将四舍五入为页面大小,并将页面直接分配给堆。

large allocation directly from the heap

全图

components of the memory allocation

灵感

内存分配器最初基于TCMalloc,TCMalloc是为Google创建的并发环境优化的内存分配器。

The documentation of TCMalloc is worth reading; you will also find the concepts explained previously.