Block原理分析详解

Posted by 黄成都 on 2017-04-11
Words 3.1k and Reading Time 13 Minutes
Viewed Times

1 基本说明

Block一直是OC的一个重点、难点、黑科技。Block在日常项目中经常使用,他的实现方式和一般的oc代码不一样。同时也很容易出现使用不慎的情况。我们知道OC的本质是C语言+runtimeruntime中的具体实现完全就是汇编加上C语言。而且我们发现大部分都是通过结构体实现的。我们可以通过clang -rewrite-objc main.m这种命令把包含Block的main.m函数反编译(注意:这里所说的反编译并不是真正的反编译,只是把OC源码转换为对等的C++源码)为为C++的具体实现。下面我就会通过这个命令来分析一下Block转换以后的源码。下面所有列子中转换前的代码都在main.m中,替换后的代码都在mainX.cpp中.

2 void (*block)(void)类型解析

我们先看一下转换以前的代码。顶一个一个block。只定义一个变量i并且赋值为1。对应的文件为mainX.cpp

1
2
3
4
5
6
7
int main() {
void (^blk)(void) = ^(){
int i = 1;
};
blk();
return 0;
}

下面是转换以后的代码。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
struct __block_impl {
void *isa;
int Flags;
int Reserved;
void *FuncPtr;
};

static void __main_block_func_0(struct __main_block_impl_0 *__cself) {

int i = 1;
}

struct __main_block_impl_0 {
struct __block_impl impl;
struct __main_block_desc_0* Desc;
__main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
impl.isa = &_NSConcreteStackBlock;
impl.Flags = flags;
impl.FuncPtr = fp;
Desc = desc;
}
};

static struct __main_block_desc_0 {
size_t reserved;
size_t Block_size;
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};

int main() {

void (*blk)(void) = ( (void (*)()) & __main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA) );

((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk);

return 0;
}

上面是我截取的关键部分源码,其他还有很多辅助性的代码,这里我们就不用管了。看这段代码我们发现一个简单的block的转换成C++以后增加了很多代码:

  • main函数入口,我们可以发现这个函数里面主要初始化了一个__main_block_impl_0的结构体。并且调用结构体的FuncPtr方法。
  • __main_block_impl_0结构体。这个结构体有一个__block_impl__main_block_desc_0结构体。以及一个初始化函数。
  • __block_impl结构体。这个结构体有四个变量。其中我们可以发现有两个很关键的isaFuncPtr
  • __main_block_desc_0结构体。这个结构体包含了两个size_t类型的属性,主要用于记录Block的内存大小。
  • __main_block_func_0静态方法,我们发现这个方法就是BLock的具体实现。

2.1具体流程分析

首先main函数代码。

1
2
3
4
5
int main() {
void (*blk)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA));
((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk);
return 0;
}

我们把它具体简化以后如下:

1
2
3
struct __main_block_impl_0 tmp = __main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA);
struct __main_block_impl_0 *blk = &tmp;
(*blk->impl.FuncPtr)(blk);
  • 1首先初始化一个__main_block_impl_0结构体变量。并且传入的参数是__main_block_func_0指向结构体的具体实现。__main_block_desc_0_DATA__main_block_desc_0结构体的一个变量,主要目的是指定结构体的大小。
  • 2 把tmp的地址赋值给blk指针。
  • 3 通过blk找到他的impl属性,然后再通过impl这个__block_impl变量获取FuncPtr函数的地址。然后传入blk的指针作为参数。从而实现OC中的blk();这句话。

接下来我们看一下__main_block_impl_0这个结构体。

1
2
3
4
5
6
7
8
9
10
struct __main_block_impl_0 {
struct __block_impl impl;
struct __main_block_desc_0* Desc;
__main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
impl.isa = &_NSConcreteStackBlock;
impl.Flags = flags;
impl.FuncPtr = fp;
Desc = desc;
}
};

这个结构体主要有一个初始化函数,通过传入结构体具体实现的函数指针fp,记录大小描述信息的参数desc,已经一个标记为flags。通过他来初始化__block_impl__main_block_desc_0

__block_impl这个结构体我们从他的结构发现和OC的类结构体有点像。他的isa属性其实就是OC的isa属性有异曲同工的作用,用于指向结构体的具体类型。FuncPtr函数指针就是指向Block具体实现的函数。

3 int (*block)(int)类型解析

废话少说,上代码。通过代码我们发现和上面那种没有什么区别。主要是__main_block_func_0函数的实现多了返回值和多了一个参数。具体看代码注释。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
int main() {
int (^blk)(int i) = ^(int i){
int result = i + 1;
return result;
};
blk(3);
return 0;
}
//==============上面是反编译以前的代码==================
struct __block_impl {
void *isa;//isa表明结构体类型。
int Flags;
int Reserved;
void *FuncPtr;//指向函数指针
};
//这个结构体及时Block反编译以后生成的主要结构。
struct __main_block_impl_0 {
struct __block_impl impl;
struct __main_block_desc_0* Desc;
//初始化函数
__main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
impl.isa = &_NSConcreteStackBlock;//表示这个Block是存储于栈上。
impl.Flags = flags;
impl.FuncPtr = fp;//函数指针赋值
Desc = desc;
}
};
//这个函数就是Block的具体实现,并且添加了一个默认实现。
static int __main_block_func_0(struct __main_block_impl_0 *__cself, int i) {
int result = i + 1;
return result;
}
//Block的描述信息
static struct __main_block_desc_0 {
size_t reserved;
size_t Block_size;
};
//__main_block_desc_0的一个实例,其中Block_size初始化为__main_block_impl_0结构体的大小。
struct __main_block_desc_0 __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};

int main() {
//int (*blk)(int i) = ((int (*)(int))&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA));
//上面一行转换为下面两行等价
struct __main_block_impl_0 tmp = __main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA);
struct __main_block_impl_0 *blk = &tmp;

//int blkRerurn = ((int (*)(__block_impl *, int))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk, 3);
//下面一行是上面一行的简化版
(*blk->impl.FuncPtr)(blk,3);
return 0;
}

4 带__block变量的void (*block)(void)类型解析

我们发现加入一个带__block标志位的变量以后,代码复杂了很多。具体如下:

  • 多了__Block_byref_i_0结构体。这个结构体就是__block变量i直接生成的。
  • 多了两个函数__main_block_copy_0__main_block_dispose_0。这两个函数主要用于处理block复制的时候,对应的__block变量i的处理。
  • __main_block_impl_0结构体多了一个__Block_byref_i_0类型的属性i。这个i就是对应于block里面的变量。
  • __main_block_desc_0结构体多了两个函数。copydispose。在初始化结构体的时候,传入上面新增的两个函数作为参数。
  • 每个block变量都回生成一个对应的结构体,并且作为`main_block_impl_0`结构体的属性。

通过对结构体__main_block_impl_0的初始化函数和__main_block_func_0方法的分析。我们可以得到如下结论:

  • block变量i在转换为c语言后直接转换为一个`Block_byref_i_0`类型的结构体。
  • __main_block_impl_0结构体中的i指针用于存储__block结构体变量,也就是block里面的那个i对象。
  • block外面的那个i其实是block里面的i变量通过i->__forwarding->i来获取的。当我们在block里面改变i的值的时候,其实是间接的通过i->__forwarding->i来改变。其中第一个i是block里面的变量。第二个i是block外边的变量。这样就解释了为什么block里面改变i的值block外面的i改变的原因。
  • 非block类型的变量在block里面是直接引用,不会生成专门的结构体。

同时我们也注意到__main_block_copy_0__main_block_dispose_0这两个函数,我们虽然不能找到他的具体实现,不过可以根据上下文做一下具体的猜测:

1
2
3
4
5
6
7
8
//当我们复制block的时候。分别传入两个block的block变量的指针,然后做处理。
static void __main_block_copy_0(struct __main_block_impl_0*dst, struct __main_block_impl_0*src) {
_Block_object_assign((void*)&dst->one, (void*)src->one, 8);
}
//当我们销毁一个block后,估计会调用这个函数的block变量的指针,做销毁操作
static void __main_block_dispose_0(struct __main_block_impl_0*src) {
_Block_object_dispose((void*)src->one, 8);
}

完整代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
#include "stdio.h"
#define NORMAL
typedef void (^Block)();
int main() {
@autoreleasepool {
__block int i = 1;
Block block1 = ^(){
i = 2;
printf("%d",i);
};
block1();
}
return 0;
}
//==============上面是反编译以前的代码==================
typedef void (*Block)();

struct __block_impl {
void *isa;
int Flags;
int Reserved;
void *FuncPtr;
};
//这个结构体是专门为了__block变量i生成的。
struct __Block_byref_i_0 {
void *__isa;
__Block_byref_i_0 *__forwarding;
int __flags;
int __size;
int i;
};
//多了一个__Block_byref_i_0变量
struct __main_block_impl_0 {
struct __block_impl impl;
struct __main_block_desc_0* Desc;
__Block_byref_i_0 *i; // 多了一个i属性。block变量
__main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, __Block_byref_i_0 *_i, int flags=0) : i(_i->__forwarding) {
impl.isa = &_NSConcreteStackBlock;
impl.Flags = flags;
impl.FuncPtr = fp;
Desc = desc;
}
};
//Block的具体实现。从这里我们发现为啥改变i的值的猫腻。
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
__Block_byref_i_0 *i = __cself->i; // bound by ref

(i->__forwarding->i) = 2;
printf("%d",(i->__forwarding->i));
}
//用于管理i变量的声明周期。复制一个block的时候,复制他对应的i变量。
static void __main_block_copy_0(struct __main_block_impl_0*dst, struct __main_block_impl_0*src) {

_Block_object_assign((void*)&dst->i, (void*)src->i, 8/*BLOCK_FIELD_IS_BYREF*/);
}
//用于管理i变量的声明周期
static void __main_block_dispose_0(struct __main_block_impl_0*src) {
_Block_object_dispose((void*)src->i, 8/*BLOCK_FIELD_IS_BYREF*/);
}
//多了两个指针函数、
static struct __main_block_desc_0 {
size_t reserved;
size_t Block_size;
void (*copy)(struct __main_block_impl_0*, struct __main_block_impl_0*);
void (*dispose)(struct __main_block_impl_0*);
};
//实例变量
struct __main_block_desc_0 __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0), __main_block_copy_0, __main_block_dispose_0};
//入口
int main() {
//自动释放池,这里暂不管他
{__AtAutoreleasePool __autoreleasepool;

#ifdef NORMAL
__attribute__((__blocks__(byref))) __Block_byref_i_0 i;
i = {(void*)0,(__Block_byref_i_0 *)&i, 0, sizeof(__Block_byref_i_0), 1};

Block block1 = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, (__Block_byref_i_0 *)&i, 570425344));

((void (*)(__block_impl *))((__block_impl *)block1)->FuncPtr)((__block_impl *)block1);
#else
//定义一个__Block_byref_i_0结构体变量。并且初始化
__Block_byref_i_0 i;
i = {(void*)0,(__Block_byref_i_0 *)&i, 0, sizeof(__Block_byref_i_0), 1};
//定义一个__main_block_impl_0结构体变量,同时传入i的指针
__main_block_impl_0 tmp = __main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, (__Block_byref_i_0 *)&i, 570425344);
//把结构体变量的指针赋值给block1对象
Block block1 = &tmp;
//调用解耦固体。就是OC里面的`block1()`
((*block1->impl)->FuncPrt)(block1);
#endif
}
return 0;
}

5 带全局变量、静态全局变量、局部全局变量类型的Block解析

从转换以前和转换以后的代码比较。发现block变量和上面一样,这里就不做具体分析了。但是对于几个非block变量则有不同情况:

  • 全局变量global_val和静态全局变量static_global_val转换以前和转换以后调用方式没有任何区别。
  • 局部静态变量static_val会作为结构体__main_block_impl_0的一个属性。并且这个属性是局部静态变量的一个指针。
  • 当改变局部静态变量的值的时候,我们通过__main_block_impl_0结构体的static_val属性拿到静态局部变量的指针,然后直接赋值。
  • Block直接截取的值静态局部变量的指针。然后对指针操作。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
int global_val = 1;
static int static_global_val = 2;
int main() {
@autoreleasepool {
__block int one = 1;
static int static_val = 2;
Block block1 = ^(){
one = 2;
global_val = global_val + 1;
static_global_val = static_global_val + 1;
static_val = static_val + 1;
printf("%d--%d--%d--%d",one,global_val,static_global_val,static_val);
};
block1();
}
return 0;
}
//==============上面是反编译以前的代码==================

typedef void (*Block)();
//全局变量和静态全局变量的用法没有任何转变。
int global_val = 1;
static int static_global_val = 2;
struct __block_impl {
void *isa;
int Flags;
int Reserved;
void *FuncPtr;
};

struct __Block_byref_one_0 {
void *__isa;
__Block_byref_one_0 *__forwarding;
int __flags;
int __size;
int one;
};

struct __main_block_impl_0 {
struct __block_impl impl;
struct __main_block_desc_0* Desc;
int *static_val;//局部静态变量的指针作为结构体的一个属性
__Block_byref_one_0 *one; // by ref
__main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int *_static_val, __Block_byref_one_0 *_one, int flags=0) : static_val(_static_val), one(_one->__forwarding) {
impl.isa = &_NSConcreteStackBlock;
impl.Flags = flags;
impl.FuncPtr = fp;
Desc = desc;
}
};

static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
__Block_byref_one_0 *one = __cself->one; // bound by ref
int *static_val = __cself->static_val; // bound by copy
(one->__forwarding->one) = 2;
global_val = global_val + 1;
static_global_val = static_global_val + 1;
(*static_val) = (*static_val) + 1;
printf("%d--%d--%d--%d",(one->__forwarding->one),global_val,static_global_val,(*static_val));
}

static void __main_block_copy_0(struct __main_block_impl_0*dst, struct __main_block_impl_0*src) {
_Block_object_assign((void*)&dst->one, (void*)src->one, 8/*BLOCK_FIELD_IS_BYREF*/);
}

static void __main_block_dispose_0(struct __main_block_impl_0*src) {
_Block_object_dispose((void*)src->one, 8/*BLOCK_FIELD_IS_BYREF*/);
}

static struct __main_block_desc_0 {
size_t reserved;
size_t Block_size;
void (*copy)(struct __main_block_impl_0*, struct __main_block_impl_0*);
void (*dispose)(struct __main_block_impl_0*);
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0), __main_block_copy_0, __main_block_dispose_0};

int main() {
/* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool;
__attribute__((__blocks__(byref))) __Block_byref_one_0 one = {(void*)0,(__Block_byref_one_0 *)&one, 0, sizeof(__Block_byref_one_0), 1};
static int static_val = 2;

//Block block1 = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, &static_val, (__Block_byref_one_0 *)&one, 570425344));
//上面这行转换为下面这行
__main_block_impl_0 tmp = __main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, &static_val, (__Block_byref_one_0 *)&one, 570425344);
Block block1 = (void (*)())&tmp;

((void (*)(__block_impl *))((__block_impl *)block1)->FuncPtr)((__block_impl *)block1);
}
return 0;
}

6 总结

通过测试、我发现同一种类型的Block实例变量,会分别生成对应的__main_block_impl_X,__main_block_func_X,__main_block_desc_X,__main_block_copy_X,__main_block_dispose_X。但是会共用相同的__block_impl。如果多个Block(不管是不是同一种类型)使用同一个block变量,则会共享相同的`Block_byref_YYY_X`结构体。

把一个Block变量赋值给另一个Block变量。则相当于被复制的Block变量有两个引用,并不会生成一套对应的结构体。

判断Block是不是同一种类型,只与返回变量、参数类型相关。与通过宏定义的名字无关。

具体源码位置源码地址


...

...

00:00
00:00