late bound
】为了减少对正文内容理解的歧义,我们先统一若干术语的名词解释:
泛型项:
要么,泛型函数generic function
;
要么,泛型类型generic type
(比如,泛型结构体)。
泛型参数:
要么,泛型·类型·参数generic type parameter
;
要么,泛型·生命周期·参数generic lifetime parameter
。
泛型参数限定条件:
见下图吧,实在不容易文字描述
要么,trait bounds
;
要么,lifetime bounds
。
高阶·生命周期·限定条件higher-ranked lifetime bounds
:
语法:for<'a>
功能:描述【高阶函数】内【闭包】类型【形参 / 返回值】里【形参 / 返回值】的生命周期。文字描述得绕儿,直接看下图吧,一图抵千词。
FST
:Fixed Size Type
首先,无论是【早·绑定】还是【晚·绑定】,【泛型参数-绑定】都是发生在编译阶段,而不是运行期间。
只不过【泛型参数·早·绑定】是发生在【单态化monomorphize
】过程中的【泛型项】定义位置。
而【泛型参数·晚·绑定】是发生在【单态化monomorphize
】之后的【泛型项】调用位置(比如,函数调用)。
所以,【泛型参数】的【早/晚·绑定】是一个纯编译时概念,还是馁馁的【编译时-抽象】和零运行时(抽象)成本。
其次,区分【泛型参数】是【早·绑定】还是【晚·绑定】的标准就是
若在【rustc
单态化monomorphize
】期间,就能推断出【泛型参数】具体“值”,那么该【泛型参数】就是【早·绑定】。
若在【rustc
单态化monomorphize
】之后,还需评估【泛型项】的调用方式,才能确定【泛型参数】具体“值”,那么该【泛型参数】就是【晚·绑定】。
接着,被【早·绑定】的【泛型参数】
既可·由编译器自动推断 [例程1]
也可·徒手编写TurboFish
调用语句显示地指定 [例程1]
再次,被【晚·绑定】的【泛型参数】
仅能·由编译器自动推断 [例程3]
不可·由TurboFish
调用语句显示地指定 [例程2]
TurboFish
语法原因是【TurboFish
调用语句·展开】与【泛型参数 - 晚·绑定】有两项不同:
第一,执行时间点不同
TurboFish
调用语句是在【单态化monomorphize
】过程中被展开的。
【泛型参数 - 晚·绑定】则是发生在【单态化monomorphize
】之后。此时,TurboFish
调用语句的源码已经不存在了(— 之前已经被展开了)。
第二,执行位置不同
【已知项】:函数的引用类型【实参】的生命周期
【未知项】:函数的引用类型【返回值】的生命周期
有点抽象,那举个例子:展开【泛型项】调用位置上的let array = iterator.collect::<Vec<u8>>();
语句会导致,在【单态化monomorphize
】之后,在Iterator::collect()
成员方法的定义位置多出来一个fn collect(self) -> Vec<u8>
的新成员方法定义。由此可见,最终的修改项还是落在了【泛型项】定义位置的codegen
代码上。
由此得出一个结论:TurboFish
语法调用语句·等同于·【泛型参数 - 早·绑定】
编译器对TurboFish
调用语句的【展开】处理会回过头来对【泛型项】定义位置的代码产生影响。即,【单态化】会生成更多的代码 — 这类由编译器生成的代码被称为codegen
。
而由【泛型参数·晚·绑定】确定【泛型参数】【实参】并不会导致在【泛型项】定义位置有新的codegen
被生成。这是一个纯“调用位置”的,由【已知项】推断【未知项】的行为。其中,
先直接记结论吧。以后,再慢慢体会底层逻辑。
【泛型·类型·参数】都是【早·绑定】的。例如,在给【函数指针】赋值前,必须先明确【泛型·类型·参数】的具体“值”。
fn m<T>() {}let m1 = m::<u8>; // 赋值函数指针,得先确定泛型类型参数`T`的实参值`u8`。m1(); // 经由【函数指针】调用函数就没有机会再显示地指定【泛型参数】值了。
【泛型函数】的【泛型·生命周期·参数】都是【晚·绑定】,
【泛型函数】是一个【成员方法】且引用了由其所属【泛型类型】(比如,结构体)声明的另一个【泛型·生命周期·参数】(有点绕儿,看 [例程3])。于是,该【泛型函数】使用的这个【生命周期·参数】就是【早·绑定】的。
lifetime bound
出现。即,【泛型·生命周期·参数】正被另一个【泛型·生命周期·参数】所限定(比如,<'a, 'b> where 'a: 'b
)。有点绕儿,看 [例程4]。于是,该【泛型函数】的这两个【泛型·生命周期·参数】(限定的·与·被限定的)皆都是【早·绑定】。
要么,忽略【泛型·生命周期·参数】的存在。别说你没写过这样的代码,可能仅只是没有认真思考为什么可以这样。
- fn m<'a>(name: &'a str) -> &'a str {name}let m1 = m; // 'a 的生命周期参数被直接无视了。let r = m1("test"); // 函数被调用了才知道其实参的`lifetime`是`static`
- // 和其返回值的`lifetime`也是`static`
要么,使用【高阶·生命周期·限定条件higher-ranked lifetime bounds
】显示地标注待定的【泛型·生命周期·参数】
- fn m<'a>(name: &'a str) -> &'a str {name}// `for<'a>`语法表示`'a`生命周期参数的实参待定。let m1: for<'a> fn(&'a str) -> &'a str = m; // 函数指针写法let r = m1("test"); // 函数被调用了才知道其实参的`lifetime`是`static`
- // 和其返回值的`lifetime`也是`static`// 对于不嫌麻烦的你,没准【闭包`trait`写法】也是一个选择。let m2: Box<dyn for<'a> Fn(&'a str) -> &'a str> = Box::new(m);let r = m2("test");
因为函数不被调用,就不知其【实参】的真实生命周期。而【泛型函数】【生命周期·参数】的关键作用就是以【实参】生命周期为“已知量",推断【返回值】生命周期的"未知量"。特别是,当一个函数同时有多个·引用类型·形参输入和·引用类型·返回值输出时,【泛型·生命周期·参数】就必须被声明和使用,否则编译错误。
在【函数指针】赋值中,
两个【早·绑定】的例外
【泛型类型】的【泛型·生命周期·参数】都是【早·绑定】,
【泛型类型】的【泛型参数】声明包含了【高阶·生命周期·限定条件higher-ranked lifetime bound
】 [例程5]。
因为明确了类型,也就明确了如何实例化该类型。而【泛型类型】【生命周期·参数】的关键作用就是以该类型【实例】的生命周期为“已知量”,推断它的·引用类型·字段值生命周期的“未知量”。
一个【晚·绑定】的例外
没有【限定条件】的【泛型参数】,编译器会自动给其安排缺省bound
:
就【泛型·类型·参数】而言,编译器会自动给该【泛型参数】添加Sized
缺省trait bound
。即,<T: Sized>
。所以,【泛型·类型·参数】一定都是FST
的。
就【泛型lifetime
参数】而言,编译器会认为该【泛型参数】生存期 >= 【泛型项】生存期。
【生命周期】参数也是【泛型参数】。
lifetime bound
限定条件的四句实用口诀左长,右短 — 被限定项总比限定项更能“活” <'a, 'b> where 'a: 'b
则有'a >= 'b
留长,返短 — 函数【引用类型·返回值】的生命周期总是对齐”最短命“【入参】的生命周期 [例程6] fn test<'a, 'b>(a: &'a str, b: &'b str) -> &'b str where 'a: 'b
内长,外短 — 引用的引用。越是外层的引用,其生命周期就越短<'a, 'b> where 'a: 'b
则有&'b &'a i32
。而,&'a &'b i32
会导致编译错误。
'static
最”命长“ — 它馁馁地命长于任何被显示声明的生命周期参数'a
。
至此,我已经倾其所有领会内容。希望对读者理解【泛型参数 - 绑定】有所帮助。我希望看官老爷们评论、转发、点赞 — 图名不图利。咱们共同进步。