Merge pull request #196 from JesseAtSZ/patch-19

Update generic.md
pull/203/head
Sunface 3 years ago committed by GitHub
commit efe38525ec
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23

@ -1,6 +1,6 @@
# 泛型Generics # 泛型Generics
Go语言在2022年就要正式引入泛型被视为在1.0版本后,语言特性发展迈出的一大步,那么为什么泛型这么重要?到底什么是泛型?以及Rust的泛型有几种? Go语言在2022年就要正式引入泛型被视为在1.0版本后语言特性发展迈出的一大步为什么泛型这么重要到底什么是泛型Rust的泛型有几种
本章将一一为你讲解。 本章将一一为你讲解。
我们在编程中,经常有这样的需求:用同一功能的函数处理不同类型的数据,例如两个数的加法,无论是整数还是浮点数,甚至是自定义类型,都能进行支持。在不支持泛型的编程语言中,通常需要为每一种类型编写一个函数: 我们在编程中,经常有这样的需求:用同一功能的函数处理不同类型的数据,例如两个数的加法,无论是整数还是浮点数,甚至是自定义类型,都能进行支持。在不支持泛型的编程语言中,通常需要为每一种类型编写一个函数:
@ -22,13 +22,13 @@ fn main() {
} }
``` ```
上述代码可以正常运行,但是很啰嗦,如果你要支持全部的类型,那么更是极其繁琐。程序员或多或少都有强迫症,一个好程序员的公认特征就是 - 懒,这么勤快的写一大堆代码,显然不是咱们的优良传统,是不? 上述代码可以正常运行,但是很啰嗦,如果你要支持更多的类型,那么会更繁琐。程序员或多或少都有强迫症,一个好程序员的公认特征就是 - 懒,这么勤快的写一大堆代码,显然不是咱们的优良传统,是不?
在开始讲解Rust的泛型之前先来看看何为多态。 在开始讲解Rust的泛型之前先来看看什么是多态。
在编程的时候,我们经常利用多态。通俗的讲,多态就是好比坦克的炮管,既可以发射普通弹药,也可以发射制导炮弹(导弹),也可以发射贫铀穿甲弹,甚至发射子母弹,大家都不想为每一种炮弹都在坦克上分别安装一个专用炮管,即使生产商愿意,炮手也不愿意,累死人啊。所以在编程开发中,我们也需要这样“通用的炮管”,这个“通用的炮管”就是多态。 在编程的时候,我们经常利用多态。通俗的讲,多态就是好比坦克的炮管,既可以发射普通弹药,也可以发射制导炮弹(导弹),也可以发射贫铀穿甲弹,甚至发射子母弹,没有必要为每一种炮弹都在坦克上分别安装一个专用炮管,即使生产商愿意,炮手也不愿意,累死人啊。所以在编程开发中,我们也需要这样“通用的炮管”,这个“通用的炮管”就是多态。
实际上,泛型就是一种多态。泛型主要目的是为程序员提供了编程的便利,减少代码的臃肿,同时极大丰富了语言本身的表达能力, 为程序员提供了一个合适的炮管。想想,一个函数,代替几十个,甚至数百个函数,是一件多么让人兴奋的事情: 实际上,泛型就是一种多态。泛型主要目的是为程序员提供编程的便利,减少代码的臃肿,同时可以极大地丰富语言本身的表达能力,为程序员提供了一个合适的炮管。想想,一个函数,可以代替几十个,甚至数百个函数,是一件多么让人兴奋的事情
```rust ```rust
fn add<T>(a:T, b:T) -> T { fn add<T>(a:T, b:T) -> T {
a + b a + b
@ -43,15 +43,15 @@ fn main() {
将之前的代码改成上面这样就是Rust泛型的初印象这段代码虽然很简洁但是并不能编译通过我们会在后面进行详细讲解现在只要对泛型有个大概的印象即可。 将之前的代码改成上面这样就是Rust泛型的初印象这段代码虽然很简洁但是并不能编译通过我们会在后面进行详细讲解现在只要对泛型有个大概的印象即可。
## 泛型详解 ## 泛型详解
上面代码的`T`就是**泛型参数**在Rust中泛型参数的名称实际上你可以任意起,但是出于惯例,我们都用`T`(`T`是`type`的首字母)来作为首选,同时越短越好,除非需要表达含义,否则一个字母是最完美的. 上面代码的 `T` 就是**泛型参数**实际上在Rust中泛型参数的名称你可以任意起但是出于惯例我们都用 `T` ( `T``type` 的首字母)来作为首选,这个名称越短越好,除非需要表达含义,否则一个字母是最完美的。
使用泛型参数,有一个先前条件:必需在使用前进行声明: 使用泛型参数,有一个先决条件,必需在使用前对其进行声明:
```rust ```rust
fn largest<T>(list: &[T]) -> T { fn largest<T>(list: &[T]) -> T {
``` ```
该泛型函数是从列表中找出最大的值其中列表中的元素类型为T。首先`largest<T>`对泛型参数`T`进行了声明,然后才在函数参数中进行使用该泛型参数`list: &[T]`(还记得`&[T]`类型吧?这是[数组切片](../compound-type/array#数组切片))。 该泛型函数的作用是从列表中找出最大的值其中列表中的元素类型为T。首先 `largest<T>` 对泛型参数 `T` 进行了声明,然后才在函数参数中进行使用该泛型参数 `list: &[T]` (还记得 `&[T]` 类型吧?这是[数组切片](../compound-type/array#数组切片))。
总之,我们可以这样理解这个定义:函数`largest`有泛型类型`T`, 它有个参数 `list`,其类型是元素为 `T` 的数组切片, 最后,该函数返回值的类型也是`T` 总之,我们可以这样理解这个函数定义:函数 `largest` 有泛型类型 `T`,它有个参数 `list`,其类型是元素为 `T` 的数组切片,最后,该函数返回值的类型也是 `T`
具体的泛型函数实现如下: 具体的泛型函数实现如下:
```rust ```rust
@ -96,9 +96,9 @@ help: consider restricting type parameter `T` // 考虑对T进行类型上的限
| ++++++++++++++++++++++ | ++++++++++++++++++++++
``` ```
因为T可以是任何类型不是所有的类型都能进行比较,因此上面的错误中,编译器建议我们给`T`添加一个类型限制:使用`std::cmp::PartialOrd`特征对T进行限制特征在下一节会详细介绍现在你只要理解该特征的目的就是让**类型实现可比较的功能**。 因为T可以是任何类型但不是所有的类型都能进行比较因此上面的错误中编译器建议我们给 `T` 添加一个类型限制:使用 `std::cmp::PartialOrd` 特征Trait对T进行限制特征在下一节会详细介绍现在你只要理解该特征的目的就是让**类型实现可比较的功能**。
还记得我们一开始的`add`泛型函数吗?如果你运行它,会得到以下的报错: 还记得我们一开始的 `add` 泛型函数吗?如果你运行它,会得到以下的报错:
```console ```console
error[E0369]: cannot add `T` to `T` // 无法将`T`类型跟`T`类型进行相加 error[E0369]: cannot add `T` to `T` // 无法将`T`类型跟`T`类型进行相加
--> src/main.rs:2:7 --> src/main.rs:2:7
@ -114,7 +114,7 @@ help: consider restricting type parameter `T`
| +++++++++++++++++++++++++++ | +++++++++++++++++++++++++++
``` ```
同样的,不是所有`T`类型都能进行相加操作,因此我们需要用`std::ops::Add<Output = T>`对T进行限制: 同样的,不是所有`T`类型都能进行相加操作,因此我们需要用`std::ops::Add<Output = T>`对T进行限制
```rust ```rust
fn add<T: std::ops::Add<Output = T>>(a:T, b:T) -> T { fn add<T: std::ops::Add<Output = T>>(a:T, b:T) -> T {
a + b a + b
@ -137,10 +137,10 @@ fn main() {
``` ```
这里有两点需要特别的注意: 这里有两点需要特别的注意:
- **提前声明**, 跟泛型函数定义类似,首先我们在使用泛型参数之前必需要进行声明`Point<T>`,接着就可以在结构体的字段类型中使用`T`来替代具体的类型 - **提前声明**跟泛型函数定义类似,首先我们在使用泛型参数之前必需要进行声明`Point<T>`,接着就可以在结构体的字段类型中使用`T`来替代具体的类型
- **x和y是相同的类型** - **x和y是相同的类型**
第二点非常重要,它会导致下面代码的报错: 第二点非常重要,如果使用不同的类型,那么它会导致下面代码的报错:
```rust ```rust
struct Point<T> { struct Point<T> {
x: T, x: T,
@ -162,9 +162,9 @@ error[E0308]: mismatched types //类型不匹配
``` ```
当把`1`赋值给`x`时,变量`p`的`T`类型就被确定为整数类型,因此`y`也必须是整数类型,但是我们却给它赋予了浮点数,因此导致报错。 当把 `1` 赋值给 `x` 时,变量 `p` `T` 类型就被确定为整数类型,因此 `y` 也必须是整数类型,但是我们却给它赋予了浮点数,因此导致报错。
如果想让`x`和`y`即能类型相同,又能类型不同,需要使用不同的泛型参数: 如果想让 `x` `y` 即能类型相同,又能类型不同,需要使用不同的泛型参数:
```rust ```rust
struct Point<T,U> { struct Point<T,U> {
x: T, x: T,
@ -175,11 +175,11 @@ fn main() {
} }
``` ```
切记,所有的泛型参数都要提前声明: `Point<T,U>` ! 但是如果你的结构体变成这鬼样:`struct Woo<T,U,V,W,X>`,那么你需要考虑拆分这个结构体,减少泛型参数的个数和代码复杂度。 切记,所有的泛型参数都要提前声明`Point<T,U>` ! 但是如果你的结构体变成这鬼样:`struct Woo<T,U,V,W,X>`,那么你需要考虑拆分这个结构体,减少泛型参数的个数和代码复杂度。
## 枚举中使用泛型 ## 枚举中使用泛型
提到枚举类型,`Option`永远是第一个应该被想起来的,在之前的章节中,它也多次出现: 提到枚举类型,`Option` 永远是第一个应该被想起来的,在之前的章节中,它也多次出现:
```rust ```rust
enum Option<T> { enum Option<T> {
Some(T), Some(T),
@ -187,9 +187,9 @@ enum Option<T> {
} }
``` ```
`Option<T>` 是一个拥有泛型 `T`, 它第一个成员是`Some(T)`,存放了一个类型为`T`的值。得益于泛型的引入,我们可以在任何一个需要返回值的函数中,去使用`Option<T>`枚举类型来做为返回值,用于返回一个任意类型的值`Some(T)`,或者没有值`None`. `Option<T>` 是一个拥有泛型 `T`,它第一个成员是 `Some(T)`存放了一个类型为`T`的值。得益于泛型的引入,我们可以在任何一个需要返回值的函数中,去使用 `Option<T>` 枚举类型来做为返回值,用于返回一个任意类型的值 `Some(T)`,或者没有值 `None`
对于枚举而言,卧龙凤雏永远是绕不过去的存在:如果是`Option`是卧龙,那么`Result`就一定是凤雏,得两者可得天下: 对于枚举而言,卧龙凤雏永远是绕不过去的存在:如果是 `Option` 是卧龙,那么 `Result` 就一定是凤雏,得两者可得天下:
```rust ```rust
enum Result<T, E> { enum Result<T, E> {
Ok(T), Ok(T),
@ -197,12 +197,12 @@ enum Result<T, E> {
} }
``` ```
该枚举和`Option`一样,主要用于函数返回值,与`Option`用于值的存在与否不同,`Result`关注的主要是正确性。 这个枚举和 `Option` 一样,主要用于函数返回值,与 `Option` 用于值的存在与否不同,`Result `关注的主要是值的正确性。
如果函数正常运行,则最后返回一个`Ok(T)``T`是函数具体的返回值类型,如果函数异常运行,则返回一个`Err(E)``E`是错误类型。例如打开一个文件:当成功打开文件,返回`Ok(std::fs::File)`,因此`T` 对应的是 `std::fs::File` 类型;而当打开文件时出现问题时,返回`Err(std::io::Error)`, `E`对应的是`std::io::Error`类型。 如果函数正常运行,则最后返回一个 `Ok(T)``T` 是函数具体的返回值类型,如果函数异常运行,则返回一个 `Err(E)``E` 是错误类型。例如打开一个文件:如果成功打开文件,则返回`Ok(std::fs::File)`,因此 `T` 对应的是 `std::fs::File` 类型;而当打开文件时出现问题时,返回 `Err(std::io::Error)``E` 对应的就是`std::io::Error` 类型。
## 方法中使用泛型 ## 方法中使用泛型
上一章中,我们讲到何为方法以及如何在结构体和枚举上定义方法。方法上也可以使用泛型: 上一章中,我们讲到什么是方法以及如何在结构体和枚举上定义方法。方法上也可以使用泛型:
```rust ```rust
struct Point<T> { struct Point<T> {
x: T, x: T,
@ -222,7 +222,7 @@ fn main() {
} }
``` ```
使用泛型参数前,依然需要提前声明: `impl<T>`,只有提前声明了,我们才能在`Point<T>`中使用它, 这样`Rust`就知道`Point`的尖括号中的类型是泛型而不是具体类。需要注意的是,这里的`Point<T>`不再是泛型声明,而是一个完整的结构体类型,因为我们定义的结构体就是`Point<T>`而不再是`Point` 使用泛型参数前,依然需要提前声明`impl<T>`,只有提前声明了,我们才能在`Point<T>`中使用它这样Rust就知道 `Point` 的尖括号中的类型是泛型而不是具体类。需要注意的是,这里的 `Point<T>` 不再是泛型声明,而是一个完整的结构体类型,因为我们定义的结构体就是 `Point<T>` 而不再是 `Point`
除了结构体中的泛型参数,我们还能在该结构体的方法中定义额外的泛型参数,就跟泛型函数一样: 除了结构体中的泛型参数,我们还能在该结构体的方法中定义额外的泛型参数,就跟泛型函数一样:
@ -251,10 +251,10 @@ fn main() {
} }
``` ```
这个例子中,`T,U`是定义在结构体`Point`上的泛型参数,`V,W`是单独定义在方法`mixup`上的泛型参数,它们并不冲突,说白了,你可以理解为,一个是结构体泛型,一个是函数泛型。 这个例子中,`T,U` 是定义在结构体 `Point` 上的泛型参数,`V,W` 是单独定义在方法 `mixup` 上的泛型参数,它们并不冲突,说白了,你可以理解为,一个是结构体泛型,一个是函数泛型。
#### 为具体的泛型类型实现方法 #### 为具体的泛型类型实现方法
对于`Point<T>`类型,你不仅能定义基于`T`的方法,还能针对特定的具体类型,进行方法定义: 对于 `Point<T>` 类型,你不仅能定义基于 `T` 的方法,还能针对特定的具体类型,进行方法定义:
```rust ```rust
impl Point<f32> { impl Point<f32> {
fn distance_from_origin(&self) -> f32 { fn distance_from_origin(&self) -> f32 {
@ -271,7 +271,7 @@ impl Point<f32> {
## const泛型Rust 1.51版本引入的重要特性) ## const泛型Rust 1.51版本引入的重要特性)
在之前的泛型中,可以抽象为一句话:针对类型实现的泛型,所有的泛型都是为了抽象不同的类型,那有没有针对值的泛型?可能很多同学感觉很难理解,值怎么使用泛型?不急,我们先从数组讲起。 在之前的泛型中,可以抽象为一句话:针对类型实现的泛型,所有的泛型都是为了抽象不同的类型,那有没有针对值的泛型?可能很多同学感觉很难理解,值怎么使用泛型?不急,我们先从数组讲起。
在[数组](../compound-type/array.md)那节,有提到过很重要的一点:`[i32; 2]`和`[i32; 3]`是不同的数组类型,例如以下代码: 在[数组](../compound-type/array.md)那节,有提到过很重要的一点:`[i32; 2]``[i32; 3]` 是不同的数组类型,比如下面的代码:
```rust ```rust
fn display_array(arr: [i32; 3]) { fn display_array(arr: [i32; 3]) {
println!("{:?}", arr); println!("{:?}", arr);
@ -295,9 +295,9 @@ error[E0308]: mismatched types // 类型不匹配
// 期望一个长度为3的数组却发现一个长度为2的 // 期望一个长度为3的数组却发现一个长度为2的
``` ```
结合代码和报错,可以很清楚的看出,`[i32; 3]`和`[i32; 2]`确实是两个完全不同的类型,因此无法用同一个函数调用。 结合代码和报错,可以很清楚的看出,`[i32; 3]``[i32; 2]` 确实是两个完全不同的类型,因此无法用同一个函数调用。
首先,让我们修改代码,让`display_array`能打印所有长度的`i32`数组: 首先,让我们修改代码,让 `display_array` 能打印任意长度的 `i32` 数组:
```rust ```rust
fn display_array(arr: &[i32]) { fn display_array(arr: &[i32]) {
println!("{:?}", arr); println!("{:?}", arr);
@ -310,9 +310,9 @@ fn main() {
display_array(&arr); display_array(&arr);
} }
``` ```
很简单,只要使用数组切片,然后传入`arr`的不可变引用即可。 很简单,只要使用数组切片,然后传入 `arr` 的不可变引用即可。
接着,将`i32`改成所有类型的数组: 接着,将 `i32` 改成所有类型的数组:
```rust ```rust
fn display_array<T: std::fmt::Debug>(arr: &[T]) { fn display_array<T: std::fmt::Debug>(arr: &[T]) {
@ -327,11 +327,11 @@ fn main() {
} }
``` ```
也不难唯一要注意的是需要对T加一个限制`std::fmt::Debug`,该限制表明`T`可以用在`println!("{:?}", arr)`中,因为`{:?}`形式的格式化输出需要`arr`实现该特征。 也不难唯一要注意的是需要对T加一个限制 `std::fmt::Debug`,该限制表明 `T` 可以用在 `println!("{:?}", arr)`中,因为 `{:?}` 形式的格式化输出需要 `arr` 实现该特征。
通过引用,我们可以很轻松的解决处理任何类型数组的问题,但是如果在某些场景下不适宜用引用或者干脆不能用呢?那真的没什么好办法了,你们知道为什么以前Rust的一些数组库在使用的时候都限定长度不超过32吗因为它们会为每个长度都单独实现一个函数简直。。。毫无人性。 通过引用,我们可以很轻松的解决处理任何类型数组的问题,但是如果在某些场景下引用不适宜用或者干脆不能用呢你们知道为什么以前Rust的一些数组库在使用的时候都限定长度不超过32吗因为它们会为每个长度都单独实现一个函数简直。。。毫无人性。难道没有什么办法可以解决这个问题吗?
好在现在咱们有了const泛型也就是针对值的泛型正好可以用于处理数组长度的问题: 好在现在咱们有了const泛型也就是针对值的泛型正好可以用于处理数组长度的问题
```rust ```rust
fn display_array<T: std::fmt::Debug, const N: usize>(arr: [T; N]) { fn display_array<T: std::fmt::Debug, const N: usize>(arr: [T; N]) {
println!("{:?}", arr); println!("{:?}", arr);
@ -345,15 +345,16 @@ fn main() {
} }
``` ```
如上所示,我们定义了一个类型为`[T; N]`的数组,其中`T`是一个基于类型的泛型参数,这个和之前讲的泛型没有区别,而重点在于`N`这个泛型参数,它是一个基于值的泛型参数!因为它用来替代的是数组的长度。 如上所示,我们定义了一个类型为 `[T; N]` 的数组,其中 `T` 是一个基于类型的泛型参数,这个和之前讲的泛型没有区别,而重点在于 `N` 这个泛型参数,它是一个基于值的泛型参数!因为它用来替代的是数组的长度。
`N`就是const泛型定义的语法是`const N: usize`表示const泛型N它基于的值类型是`usize`。 `N` 就是const泛型定义的语法是 `const N: usize`表示const泛型N它基于的值类型是 `usize`
在泛型参数之前Rust完全不适合复杂矩阵的运算自从有了const泛型一切即将改变。 在泛型参数之前Rust完全不适合复杂矩阵的运算自从有了const泛型一切即将改变。
#### const泛型表达式 #### const泛型表达式
假设我们某段代码需要在内存很小的平台上工作因此需要限制函数参数占用的内存大小此时就可以使用const泛型表达式来实现 假设我们某段代码需要在内存很小的平台上工作因此需要限制函数参数占用的内存大小此时就可以使用const泛型表达式来实现
```rust ```rust
// 目前只能在nightly版本下使用
#![allow(incomplete_features)] #![allow(incomplete_features)]
#![feature(generic_const_exprs)] #![feature(generic_const_exprs)]
@ -393,13 +394,13 @@ impl IsTrue for Assert<true> {
在Rust中泛型是零成本的抽象意味着你在使用泛型时完全不用担心性能上的问题。 在Rust中泛型是零成本的抽象意味着你在使用泛型时完全不用担心性能上的问题。
但是任何选择都是权衡得失的既然我们获得了性能上的巨大优势那么又失去了什么呢Rust采用的是在编译期为泛型对应的多个类型,生成各自的代码,因此损失了编译速度和增大了最终生成文件的大小。 但是任何选择都是权衡得失的既然我们获得了性能上的巨大优势那么又失去了什么呢Rust是在编译期为泛型对应的多个类型生成各自的代码因此损失了编译速度和增大了最终生成文件的大小。
具体来说: 具体来说:
Rust 通过在编译时进行泛型代码的 **单态化***monomorphization*)来保证效率。单态化是一个通过填充编译时使用的具体类型,将通用代码转换为特定代码的过程。 Rust 通过在编译时进行泛型代码的 **单态化***monomorphization*)来保证效率。单态化是一个通过填充编译时使用的具体类型,将通用代码转换为特定代码的过程。
编译器所做的工作正好与我们创建泛型函数的步骤相反, 编译器寻找所有泛型代码被调用的位置并针对具体类型生成代码。 编译器所做的工作正好与我们创建泛型函数的步骤相反编译器寻找所有泛型代码被调用的位置并针对具体类型生成代码。
让我们看看一个使用标准库中 `Option` 枚举的例子: 让我们看看一个使用标准库中 `Option` 枚举的例子:
@ -408,7 +409,7 @@ let integer = Some(5);
let float = Some(5.0); let float = Some(5.0);
``` ```
当 Rust 编译这些代码的时候,它会进行单态化。编译器会读取传递给 `Option<T>` 的值并发现有两种 `Option<T>`:一个对应 `i32` 另一个对应 `f64`。为此,它会将泛型定义 `Option<T>` 展开为 `Option_i32``Option_f64`,接着将泛型定义替换为这两个具体的定义。 当 Rust 编译这些代码的时候,它会进行单态化。编译器会读取传递给 `Option<T>` 的值并发现有两种 `Option<T>`:一种对应 `i32` 另一种对应 `f64`。为此,它会将泛型定义 `Option<T>` 展开为 `Option_i32``Option_f64`,接着将泛型定义替换为这两个具体的定义。
编译器生成的单态化版本的代码看起来像这样: 编译器生成的单态化版本的代码看起来像这样:

Loading…
Cancel
Save