func Alignof(x ArbitraryType) uintptr
func Offsetof(x ArbitraryType) uintptr
func Sizeof(x ArbitraryType) uintptr
type ArbitraryType int
type Pointer *ArbitraryType
在unsafe包中,只提供了3个函数,两个类型。就这么少的量,却有着超级强悍的功能。
// ArbitraryType is here for the purposes of documentation only and is not actually
// part of the unsafe package. It represents the type of an arbitrary Goexpression.
// ArbitryType仅用于文档目的,实际上并非不安全包的一部分。它表示任意Go表达式的类型。
type ArbitraryType int
ArbitraryType 是以int为基础定义的一个新类型,但是Go 语言unsafe包中,对ArbitraryType赋予了特殊的意义,通常,把interface{}看作是任意类型,那么ArbitraryType这个类型,在Go 语言系统中,比interface{}还要随意。
Pointer 是ArbitraryType指针类型为基础的新类型,在Go 语言系统中,可以把Pointer类型,理解成任何指针的亲爹。
Go 语言的指针类型长度与int类型长度,在内存中占用的字节数是一样的。ArbitraryType类型的变量也可以是指针。
// Alignof返回变量对齐字节数量
func Alignof(x ArbitraryType) uintptr
// Offsetof返回变量指定属性的偏移量,所以如果变量是一个struct类型,不能直接将这个struct类型的变量当作参数,只能将这个struct类型变量的属性当作参数。
func Offsetof(x ArbitraryType) uintptr
// Sizeof 返回变量在内存中占用的字节数,切记,如果是slice,则不会返回这个slice在内存中的实际占用长度。
func Sizeof(x ArbitraryType) uintptr
unsafe中,通过ArbitraryType 、Pointer 这两个类型,可以将其他类型都转换过来,然后通过这三个函数,分别能取长度,偏移量,对齐字节数,就可以在虚拟内存中来回调度。
1。 unsafe.Pointer只是单纯的通用指针类型,用于转换不同类型指针,它不可以参与指针运算;
而uintptr是用于指针运算的,GC 不把 uintptr 当指针,也就是说 uintptr 无法持有对象, uintptr 类型的目标会被回收;
unsafe.Pointer 可以和 普通指针 进行相互转换;
unsafe.Pointer 可以和 uintptr 进行相互转换。
准备结构体,成员不导出(私有)
初始化结构体
func main() {
s:=pkg.UnsafeStruct{}
// {0 0}
fmt.Println(s)
}
众所周知,结构体的地址就是第一个成员的地址
func main() {
s:=pkg.UnsafeStruct{}
// 取成员1
field1Pointer:=unsafe.Pointer(&s)
fmt.Println(field1Pointer)
// 转为int32类型指针
field1Ptr:=(*int32)(field1Pointer)
fmt.Println(*field1Ptr)
}
赋值,可以看到私有字段已经被改变
func main() {
s:=pkg.UnsafeStruct{}
// 取成员1
field1Pointer:=unsafe.Pointer(&s)
fmt.Println(field1Pointer)
// 转为int32类型指针
field1Ptr:=(*int32)(field1Pointer)
fmt.Println(*field1Ptr)
// 赋值
*field1Ptr = 10
fmt.Println(s)
}
利用偏移量改变字段2的值
func main() {
s:=pkg.UnsafeStruct{}
// 取成员1
field1Pointer:=unsafe.Pointer(&s)
fmt.Println(field1Pointer)
// 转为int32类型指针
field1Ptr:=(*int32)(field1Pointer)
fmt.Println(*field1Ptr)
// 赋值
*field1Ptr = 1314
fmt.Println(s)
// 获取成员2的Pointer
filed2Pointer:= unsafe.Pointer(uintptr(field1Pointer)+ unsafe.Sizeof(int64(0)))
fmt.Println(filed2Pointer)
// 转为int64类型指针
field2Ptr:=(*int64)(filed2Pointer)
fmt.Println(*field2Ptr)
// 赋值
*field2Ptr = 520
fmt.Println(s)
}
成员声明为int32和int64是为了避免对齐的影响,否则就要加上对齐值
在 Go 语言中,可以使用 unsafe.Sizeof 计算出一个数据类型实例需要占用的字节数。
package main
import (
"fmt"
"unsafe"
)
type Args struct {
num1 int
num2 int
}
type Flag struct {
num1 int16
num2 int32
}
func main() {
fmt.Println(unsafe.Sizeof(Args{}))
fmt.Println(unsafe.Sizeof(Flag{}))
}
因此,一个结构体实例所占据的空间等于各字段占据空间之和,再加上内存对齐的空间大小。
CPU 只从对齐的地址开始加载数据
CPU 读取块的大小是固定的,通常为 B 的 2 的整数幂次
CPU 访问内存时,并不是逐个字节访问,而是以字长(word size)为单位访问。比如 32 位的 CPU ,字长为 4 字节,那么 CPU 访问内存的单位也是 4 字节。
这么设计的目的,是减少 CPU 访问内存的次数,加大 CPU 访问内存的吞吐量。比如同样读取 8 个字节的数据,一次读取 4 个字节那么只需要读取 2 次。
CPU 始终以字长访问内存,如果不进行内存对齐,很可能增加 CPU 访问内存的次数。
6. 变量 a、b 各占据 3 字节的空间,内存对齐后,a、b 占据 4 字节空间,CPU 读取 b 变量的值只需要进行一次内存访问。
7. 如果不进行内存对齐,CPU 读取 b 变量的值需要进行 2 次内存访问。第一次访问得到 b 变量的第 1 个字节,第二次访问得到 b 变量的后两个字节。
结论:内存对齐对实现变量的原子性操作也是有好处的,每次内存访问是原子的,如果变量的大小不超过字长,那么内存对齐后,对该变量的访问就是原子的,这个特性在并发场景下至关重要。
unsafe 标准库提供了 Alignof 方法,可以返回一个类型的对齐值,也可以叫做对齐系数或者对齐倍数。
unsafe.Alignof(Args{}) // 8
unsafe.Alignof(Flag{}) // 4
type demo1 struct {
a int8
b int16
c int32
}
type demo2 struct {
a int8
c int32
b int16
}
func main() {
fmt.Println(unsafe.Sizeof(demo1{})) // 8
fmt.Println(unsafe.Sizeof(demo2{})) // 12
}
因此 demo1 的内存占用为 8 字节。
demo2 的对齐倍数由 c 的对齐倍数决定,也是 4,因此,demo2 的内存占用为 12 字节。
空 struct{} 大小为 0,作为其他 struct 的字段时,一般不需要内存对齐。
但是有一种情况除外:即当 struct{} 作为结构体最后一个字段时,需要内存对齐。