SideTables的定义:
static StripedMap<SideTable>& SideTables() {
return SideTablesMap.get();
}
这里的方法名是sideTables,返回值是StripedMap<SideTable>&
//这里面其实StripedMap里一共就一个PaddedT类型的数组,大小为StripeCount【64】
//可以大致理解为,该方法会返回一个StripedMap类型的数据结构,里面存储的类型是SideTable
SideTablesMap:
static objc::ExplicitInit<StripedMap<SideTable>> SideTablesMap;
//StripedMap 是一个模板类,根据传递的实际参数决定其中 array 成员存储的元素类型。
// 能通过对象的地址,运算出 Hash 值,通过该 hash 值找到对应的 value 。
为了管理引用计数和weak
指针,苹果创建了一个全局的哈希表SideTables
,在这里面装的都是SideTable
结构体,它使用对象的内存地址当它的key
,来管理引用计数和weak
指针。
哈希表
基于数组的一种数据结构,通过一定的算法,把key进行运算得出一个数字,用这个数字做数组下标,将value存入这个下标对应的内存之中。
哈希桶
哈希算法算出的数字有可能会重复,对于哈希值重复的数据,如何存入哈希表呢?常用方法有闭散列和开散列等方式,其中采用开散列方式的哈希表称为哈希桶。开散列就是在哈希值对应的位置上,使用链表或数组,将哈希值冲突的数据存入这个链表或者数组中,提高查找效率。通俗点说:哈希桶就是将这个数组的单个空间扩展成一个拉链一样的结构,将指向同一个空间的值存到同一条拉链上。
例如:在上面介绍的SideTable,SideTable就是一条拉链,一个对象根据其地址在SideTables上找到相应的SideTable,存入其中。拉链可以用数组/链表组织数据,Apple使用的是数组。
SideTable的定义:
struct SideTable {
spinlock_t slock;
RefcountMap refcnts;
weak_table_t weak_table;
...
}
下面我们先学习一下这三个结构体成员。
锁是操作系统中的一个概念,但在iOS中为了保证多线程安全,也引入了锁,确保同一时刻只有同一个线程来对同一个数据源进行访问。
以引用计数举例,由于我们的程序是多线程的,可能在不同的线程都会对某个对象的应用计数操作,导致混乱,这里使用锁,当某次访问开始时,锁就被持有,其余访问就不能进行,当访问结束,锁被空出来,才能轮到其他访问去竞争这把锁。
因为对象引用计数相关操作应该是原子性的。不然如果多个线程同时去写一个对象的引用计数,那就会造成数据错乱,失去了内存管理的意义。同时又因为内存中对象的数量是很大的,需要非常频繁的操作SideTables,所以不能对整个Hash表加锁。苹果采用了分离锁技术:
用SideTable来举例,如果是给SideTable中的每个对象的引用计数都加锁,那么就是分拆锁,但是这种加锁方式消耗很大。给每个SideTable加锁,只让某个SideTable不能多次访问,这就是分离锁。
苹果使用了自旋锁,分离锁,对于每个SideTable,中间都有自旋锁;同时给单个的SideTable上锁,保证了安全性的同时有兼具效率。
查看一下RefcountMap定义:
typedef objc::DenseMap<DisguisedPtr<objc_object>,size_t,RefcountMapValuePurgeable> RefcountMap;
以DisguisedPtr
为key的hash表来存储OC对象的引用计数。
RefcountMap的工作逻辑:
那么引用计数是怎么加一的呢?下面用这个例子说明一下:
储存对象弱引用指针的hash表。weak功能实现的核心数据结构。
查看一下weak_table_t的定义:
struct weak_table_t {
//连续地址空间的头指针, 数组
//管理所有指向某对象的weak指针,也是一个hash
weak_entry_t *weak_entries;
数组中已占用位置的个数
size_t num_entries;
//数组下标最大值(即数组大小 - 1)
uintptr_t mask;
//最大哈希偏移值
uintptr_t max_hash_displacement;
};
weak_table_t
中并没有直接通过数组存放weak指针,而是通过weak_entry_t
结构体来存放weak指针。
struct weak_entry_t {
DisguisedPtr<objc_object> referent; //被指对象的地址。前面循环遍历查找的时候就是判断目标地址是否和他相等。
union {
struct {
weak_referrer_t *referrers; //可变数组,里面保存着所有指向这个对象的弱引用的地址。当这个对象被释放的时候,referrers里的所有指针都会被设置成nil。
//指向 referent 对象的 weak 指针数组
uintptr_t out_of_line_ness : 2; //这里标记是否超过内联边界, 下面会提到
uintptr_t num_refs : PTR_MINUS_2; //数组中已占用的大小
uintptr_t mask; //数组下标最大值(数组大小 - 1)
uintptr_t max_hash_displacement; //最大哈希偏移值
};
struct {
// out_of_line_ness field is low bits of inline_referrers[1]
weak_referrer_t inline_referrers[WEAK_INLINE_COUNT]; //只有4个元素的数组,默认情况下用它来存储弱引用的指针。当大于4个的时候使用referrers来存储指针。
//当指向这个对象的weak指针不超过4个,则直接使用数组inline_referrers,省去hash
};
};
union共用体 苹果是使用同一段内存去存放不同的信息
中间有两个数组
weak_referrer_t *referrers
和weak_referrer_t inline_referrers[WEAK_INLINE_COUNT];
在weak指针个数小于4的时候会存入第二个数组,省去了hash,提高了存储效率,大于4的时候才会存入referrers当中
从中我们也可以看出来弱引用表的结构是一个hash结构的表,Key是所指对象的地址,Value是weak指针的地址(这个地址的值是所指对象的地址)数组。
简单申请一个__weak修饰符修饰的变量 我们查看一下汇编
NSObject* obj = [[NSObject alloc] init];
__weak NSObject* objWeak = obj;
调用到了objc_initWeak
和objc_destroyWeak
。查看一下源码:
id
objc_initWeak(id *location, id newObj)
{
if (!newObj) {
*location = nil;
return nil;
}
return storeWeak<DontHaveOld, DoHaveNew, DoCrashIfDeallocating>
(location, (objc_object*)newObj);
}
查看对象实例是否有效 无效对象直接导致指针的释放
如果有效那么就会调用storeWeak()
函数
// HaveOld: true - 变量有值
// false - 需要被及时清理,当前值可能为 nil
// HaveNew: true - 需要被分配的新值,当前值可能为 nil
// false - 不需要分配新值
// CrashIfDeallocating: true - 说明 newObj 已经释放或者 newObj 不支持弱引用,该过程需要暂停
// false - 用 nil 替代存储
template <HaveOld haveOld, HaveNew haveNew,
enum CrashIfDeallocating crashIfDeallocating>
static id
storeWeak(id *location, objc_object *newObj)
{
// 该过程用来更新弱引用指针的指向
ASSERT(haveOld || haveNew);
if (!haveNew) ASSERT(newObj == nil);
// 初始化 previouslyInitializedClass 指针
Class previouslyInitializedClass = nil;
id oldObj;
// 声明两个 SideTable 新旧散列创建
SideTable *oldTable;
SideTable *newTable;
// 获得新值和旧值的锁存位置(用地址作为唯一标示)
// 通过地址来建立索引标志,防止桶重复
// 下面指向的操作会改变旧值
retry:
if (haveOld) { // 更改指针,获得以 oldObj 为索引所存储的值地址
oldObj = *location;
oldTable = &SideTables()[oldObj];
} else {
oldTable = nil;
}
if (haveNew) { // 更改新值指针,获得以 newObj 为索引所存储的值地址
newTable = &SideTables()[newObj];
} else {
newTable = nil;
}
// 加锁操作,防止多线程中竞争冲突
SideTable::lockTwo<haveOld, haveNew>(oldTable, newTable);
// 避免线程冲突重处理
// location 应该与 oldObj 保持一致,如果不同,说明当前的 location 已经处理过 oldObj 可是又被其他线程所修改
if (haveOld && *location != oldObj) {
SideTable::unlockTwo<haveOld, haveNew>(oldTable, newTable);
goto retry;
}
// 防止弱引用间死锁
// 并且通过 +initialize 初始化构造器保证所有弱引用的isa不是空
if (haveNew && newObj) {
// 获得新对象的 isa 指针
Class cls = newObj->getIsa();
// 判断 isa 非空且已经初始化
if (cls != previouslyInitializedClass &&
!((objc_class *)cls)->isInitialized())
{
// 解锁
SideTable::unlockTwo<haveOld, haveNew>(oldTable, newTable);
// 对其 isa 指针进行初始化
class_initialize(cls, (id)newObj);
// 如果该类已经完成执行 +initialize 方法是最理想情况
// 如果该类 +initialize 在线程中
// 例如 +initialize 正在调用 storeWeak 方法
// 需要手动对其增加保护策略,并设置 previouslyInitializedClass 指针进行标记
previouslyInitializedClass = cls;
goto retry;
}
}
// ② 清除旧值
if (haveOld) {
weak_unregister_no_lock(&oldTable->weak_table, oldObj, location);
}
// ③ 分配新值
if (haveNew) {
newObj = (objc_object *)
weak_register_no_lock(&newTable->weak_table, (id)newObj, location,
crashIfDeallocating ? CrashIfDeallocating : ReturnNilIfDeallocating);
// 如果弱引用被释放 weak_register_no_lock 方法返回 nil
// 在引用计数表中设置若引用标记位
if (!newObj->isTaggedPointerOrNil()) {
// 弱引用位初始化操作
// 引用计数那张散列表的weak引用对象的引用计数中标识为weak引用
newObj->setWeaklyReferenced_nolock();
}
// 之前不要设置 location 对象,这里需要更改指针指向
*location = (id)newObj;
}
else {
// 没有新值,则无需更改
}
SideTable::unlockTwo<haveOld, haveNew>(oldTable, newTable);
//必须在没有锁的情况下调用,因为它可以调用任意代码
//ps:即使_setWeaklyReferenced没有实现,resolveInstanceMethod:也可能被调用并且回调到弱引用机制中
callSetWeaklyReferenced((id)newObj);
return (id)newObj;
}
haveOld
:weak
指针之前是否指向了一个弱引用。haveNew
:weak指针是否需要指向一个新的引用。crash
。weak_unregister_no_lock(&oldTable->weak_table, oldObj, location)
处理旧值。weak_register_no_lock(&newTable->weak_table, (id)newObj, location,crashIfDeallocating)
进行赋值操作。void
weak_unregister_no_lock(weak_table_t *weak_table, id referent_id,
id *referrer_id)
{
objc_object *referent = (objc_object *)referent_id;
objc_object **referrer = (objc_object **)referrer_id;
weak_entry_t *entry;
if (!referent) return;
if ((entry = weak_entry_for_referent(weak_table, referent))) {
remove_referrer(entry, referrer);
bool empty = true;
if (entry->out_of_line() && entry->num_refs != 0) {
empty = false;
}
else {
for (size_t i = 0; i < WEAK_INLINE_COUNT; i++) {
if (entry->inline_referrers[i]) {
empty = false;
break;
}
}
}
if (empty) {
weak_entry_remove(weak_table, entry);
}
}
// Do not set *referrer = nil. objc_storeWeak() requires that the
// value not change.
}
weak_entry_for_referent
去查询 referent 对象对应的 entry,然后通过remove_referrer(entry, referrer)
从对应的entry中删除该weak记录。weak_table
删除。该方法通过对象的地址,获取到该weak_table
中的entry【保存着指向某对象的所有weak指针】。
static weak_entry_t *
weak_entry_for_referent(weak_table_t *weak_table, objc_object *referent)
{
ASSERT(referent);
weak_entry_t *weak_entries = weak_table->weak_entries;
if (!weak_entries) return nil;
size_t begin = hash_pointer(referent) & weak_table->mask;
size_t index = begin;
size_t hash_displacement = 0;
while (weak_table->weak_entries[index].referent != referent) {
index = (index+1) & weak_table->mask;
if (index == begin) bad_weak_table(weak_table->weak_entries);
hash_displacement++;
if (hash_displacement > weak_table->max_hash_displacement) {
return nil;
}
}
return &weak_table->weak_entries[index];
}
&weak_table->mask
这个操作是?这个mask实际值是表的size-1,而size是2的n次方进行扩张的,所以mask的形式就1111 1111 1111这种,索引和mask位与之后的值必定就落在了[0, size]范围内。也就是说,先是通过hash_pointer
对地址进行hash
映射,得到下标,接下来通过位遮蔽,保证这个映射是在范围内的,不会超出范围。index = (index+1) & weak_table->mask
;是在遇到哈希冲突的时候,就一直往下找下一个位置。id
weak_register_no_lock(weak_table_t *weak_table, id referent_id,
id *referrer_id, WeakRegisterDeallocatingOptions deallocatingOptions)
{
// referent_id是新的被弱引用对象
objc_object *referent = (objc_object *)referent_id;
// referrer_id是__weak指针的地址
objc_object **referrer = (objc_object **)referrer_id;
// 如果referent为nil 或 referent 采用了TaggedPointer计数方式,直接返回,不做任何操作
if (referent->isTaggedPointerOrNil()) return referent_id;
// 确保被引用的对象可用(没有在析构,同时应该支持weak引用)
if (deallocatingOptions == ReturnNilIfDeallocating ||
deallocatingOptions == CrashIfDeallocating) {
bool deallocating;
if (!referent->ISA()->hasCustomRR()) {
deallocating = referent->rootIsDeallocating();
}
else {
// Use lookUpImpOrForward so we can avoid the assert in
// class_getInstanceMethod, since we intentionally make this
// callout with the lock held.
auto allowsWeakReference = (BOOL(*)(objc_object *, SEL))
lookUpImpOrForwardTryCache((id)referent, @selector(allowsWeakReference),
referent->getIsa());
if ((IMP)allowsWeakReference == _objc_msgForward) {
return nil;
}
deallocating =
! (*allowsWeakReference)(referent, @selector(allowsWeakReference));
}
// 正在析构的对象,不能够被弱引用
if (deallocating) {
if (deallocatingOptions == CrashIfDeallocating) {
_objc_fatal("Cannot form weak reference to instance (%p) of "
"class %s. It is possible that this object was "
"over-released, or is in the process of deallocation.",
(void*)referent, object_getClassName((id)referent));
} else {
return nil;
}
}
}
// now remember it and where it is being stored
weak_entry_t *entry;
// 在 weak_table中找到referent对应的weak_entry,并将referrer加入到weak_entry中
if ((entry = weak_entry_for_referent(weak_table, referent))) {
append_referrer(entry, referrer);
}
else {
// 如果找不到,就新建一个并插入
weak_entry_t new_entry(referent, referrer);
weak_grow_maybe(weak_table);
weak_entry_insert(weak_table, &new_entry);
}
// Do not set *referrer. objc_storeWeak() requires that the
// value not change.
return referent_id;
}
从以上源码可以分析出这个方法主要完成了以下工作:
TaggedPointer
计数方式,直接返回,不做任何操作。weak_entry_for_referent
方法根据弱引用对象的地址从弱引用表中找到对应的weak_entry,如果能够找到则调用append_referrer
方法向其中插入weak指针地址。否则新建一个weak_entry
。static void append_referrer(weak_entry_t *entry, objc_object **new_referrer)
{
if (!entry->out_of_line()) {
// 如果weak_entry 尚未使用动态数组
for (size_t i = 0; i < WEAK_INLINE_COUNT; i++) {
// 找到一个空位直接插入,结束返回
if (entry->inline_referrers[i] == nil) {
entry->inline_referrers[i] = new_referrer;
return;
}
}
// 如果inline_referrers的位置已经存满了,则要转型为referrers,做动态数组。
weak_referrer_t *new_referrers = (weak_referrer_t *)
calloc(WEAK_INLINE_COUNT, sizeof(weak_referrer_t));
// This constructed table is invalid, but grow_refs_and_insert
// will fix it and rehash it.
for (size_t i = 0; i < WEAK_INLINE_COUNT; i++) {
new_referrers[i] = entry->inline_referrers[i];
}
entry->referrers = new_referrers;
entry->num_refs = WEAK_INLINE_COUNT;
entry->out_of_line_ness = REFERRERS_OUT_OF_LINE;
entry->mask = WEAK_INLINE_COUNT-1;
entry->max_hash_displacement = 0;
}
// 对于动态数组的附加处理:
ASSERT(entry->out_of_line());
// 如果动态数组中元素个数大于或等于数组位置总空间的3/4,则扩展数组空间为当前长度的一倍
if (entry->num_refs >= TABLE_SIZE(entry) * 3/4) {
// 扩容并插入
return grow_refs_and_insert(entry, new_referrer);
}
// 开始插入到weak_entry中
// 确保begin的位置只能大于或等于 数组的长度
size_t begin = w_hash_pointer(new_referrer) & (entry->mask);
// 初始的hash index
size_t index = begin;
// 用于记录hash冲突的次数,也就是hash再位移的次数
size_t hash_displacement = 0;
// 这里 weak_entry_t 的hash算法和 weak_table_t 的hash算法是一样的,
while (entry->referrers[index] != nil) {
hash_displacement++;
// 移到下一个位置,再试一次能否插入。
// 这里entry->mask取值,一定是:0x111, 0x1111, 0x11111, ...
// 因为数组每次都是*2增长,即8, 16, 32,对应动态数组空间长度-1的mask,也就是前面的取值
index = (index+1) & entry->mask;
// 意味着走完都没有合适位置,抛出异常
if (index == begin) bad_weak_table(entry);
}
if (hash_displacement > entry->max_hash_displacement) {
// 记录最大的hash冲突次数
// max_hash_displacement是允许冲突的次数,如果超过都没位置就是出问题了
entry->max_hash_displacement = hash_displacement;
}
// 将ref存入hash数组
weak_referrer_t &ref = entry->referrers[index];
// 更新元素个数num_refs
ref = new_referrer;
entry->num_refs++;
}
当weak属性所指向对象(newObj)被销毁后,obj_destroyWeak函数将0(nil)作为参数,调用objc_storeWeak函数。上面分析store_weak得出,在newObj为nil时,则无需为其分配新值,但是会清除以location的地址的索引从weak_table上
删除。
_objc_rootDealloc
方法对对象进行释放,rootDealloc
方法,在这个方法里,判断是否为TaggedPointer对象
,如果是,则直接释放;如果是优化的isa,且该对象没有weak指针,且没有开sideTable存储强引用,直接free;否则,调用object_dispose()。objc_destructInstance()
。obj->clearDeallocating()
。sidetable_clearDeallocating()
;一个是clearDeallocating_slow()
;weak_clear_no_lock
。void
weak_clear_no_lock(weak_table_t *weak_table, id referent_id)
{
objc_object *referent = (objc_object *)referent_id;
weak_entry_t *entry = weak_entry_for_referent(weak_table, referent);
if (entry == nil) {
/// XXX shouldn't happen, but does with mismatched CF/objc
//printf("XXX no entry for clear deallocating %p\n", referent);
return;
}
// zero out references
weak_referrer_t *referrers;
size_t count;
if (entry->out_of_line()) {
referrers = entry->referrers;
count = TABLE_SIZE(entry);
}
else {
referrers = entry->inline_referrers;
count = WEAK_INLINE_COUNT;
}
for (size_t i = 0; i < count; ++i) {
objc_object **referrer = referrers[i];
if (referrer) {
if (*referrer == referent) {
*referrer = nil;
}
else if (*referrer) {
_objc_inform("__weak variable at %p holds %p instead of %p. "
"This is probably incorrect use of "
"objc_storeWeak() and objc_loadWeak(). "
"Break on objc_weak_error to debug.\n",
referrer, (void*)*referrer, (void*)referent);
objc_weak_error();
}
}
}
weak_entry_remove(weak_table, entry);
}
这个方法的流程:
weak_entry_for_referent
方法查找到对应的entry,如果没有查找到则返回nil。runtime维护了一个weak表。用于存储指向某个对象的所有weak指针。weak表其实是一个weak_table_t结构的hash表,key是所指对象的地址,value是weak指针的地址数组。
weak实现的原理包括以下三步:
objc_initWeak
函数,初始化一个新的weak指针指向对象的地址objc_initWeak
函数会调用objc_storeWeak()
函数,objc_storeWeak()
的作用是用于更新指针指向,创建弱引用表。clearDeallocating
函数。clearDeallocating
函数首先根据对象地址获取所有weak指针数组,然后遍历这个数组,把其中的数据设为nil,最后把这个entry从weak表中删除,最后清理对象的记录。copy和strong修饰的属性在底层编译的不一致,主要还是llvm中对其进行了不同的处理的结果。copy的赋值是通过objc_setProperty,而strong的赋值时通过self + 内存平移(即将指针通过平移至变量所在的位置,然后赋值),然后还原成 strong类型。
二者底层都是通过调用objc_storeStrong
来实现:
查看一下objc_storeStrong
的源码:
void
objc_storeStrong(id *location, id obj)
{
id prev = *location;
if (obj == prev) {
return;
}
objc_retain(obj);
*location = obj;
objc_release(prev);
}
本质上主要也是retain新值,release旧值。