# 深入了解特征 特征之于Rust更甚于接口之于其他语言,因此特征在Rust中很重要也相对较为复杂,我们决定把特征分为两篇进行介绍,[第一篇](./trait.md)在之前已经讲过,现在就是第二篇:关于特征的进阶篇,会讲述一些你不常用到但是该了解的特性。 ## 关联类型 在方法一章中,我们将到了[关联函数](../method.md#关联函数),但是实际上关联类型和关联函数并没有任何交集,虽然它们的名字有一半的交集。 关联类型是在特征定义的语句块中,申明一个自定义类型,这样就可以在特征的方法签名中使用该类型: ```rust pub trait Iterator { type Item; fn next(&mut self) -> Option; } ``` 以上是标准库中的迭代器特征`Iterator`,它有一个`Item`关联类型,用于替代遍历的值的类型。 同时,`next`方法也返回了一个`Item`类型,不过使用`Option`枚举进行了包裹,假如迭代器中的值是`i32`类型,那么调用`next`方法就将获取一个`Option`的值。 还记得`Self`吧?在之前的章节[提到过](./trait-object#Self与self), `Self`用来指代当前的特征实例 ,那么`Self::Item`就用来指代特征实例中具体的`Item`类型: ```rust impl Iterator for Counter { type Item = u32; fn next(&mut self) -> Option { // --snip-- ``` 在上述代码中,我们为`Counter`类型实现了`Iterator`特征,那么`Self`就是当前的`Iterator`特征对象,`Item`就是`u32`类型。 聪明的读者之所以聪明,因为你们喜欢联想和举一反三,同时你们也喜欢提问:为何不用泛型,例如如下代码 ```rust pub trait Iterator { fn next(&mut self) -> Option; } ``` 答案其实很简单,为了代码的可读性. 当你使用了泛型后,你需要在所有地方都这样写`Iterator`,而使用了关联类型,你只需要这样写`Iterator`,当类型定义复杂时,这种写法可以极大的增加可读性: ```rust pub trait CacheableItem: Clone + Default + fmt::Debug + Decodable + Encodable { type Address: AsRef<[u8]> + Clone + fmt::Debug + Eq + Hash; fn is_null(&self) -> bool; } ``` 例如上面的代码,`Address`自然远比`AsRef<[u8]> + Clone + fmt::Debug + Eq + Hash`的要简单的多,而且含义清晰。 再例如,如果使用泛型,你将得到以下的代码: ```rust trait Container { fn contains(&self,a: A,b: B) -> bool; } fn difference(container: &C) -> i32 where C : Container {...} ``` 而使用关联类型,将得到可读性好的多的代码: ```rust trait Container{ type A; type B; fn contains(&self, a: &Self::A, b: &Self::B) -> bool; } fn difference(container: &C) {} ``` ## 默认泛型类型参数 当使用泛型类型参数时,可以为其指定一个默认的具体类型,例如标准库中的`std::ops::Add`特征: ```rust trait Add { type Output; fn add(self, rhs: RHS) -> Self::Output; } ``` 它有一个泛型参数`RHS`,但是与我们以往的用法不同,这里它给`RHS`一个默认值,也就是当用户不指定`RHS`时,默认使用两个同样类型的值进行相加,然后返回一个关联类型`Output`。 可能上面那段不太好理解,下面我们用代码来举例: ```rust use std::ops::Add; #[derive(Debug, PartialEq)] struct Point { x: i32, y: i32, } impl Add for Point { type Output = Point; fn add(self, other: Point) -> Point { Point { x: self.x + other.x, y: self.y + other.y, } } } fn main() { assert_eq!(Point { x: 1, y: 0 } + Point { x: 2, y: 3 }, Point { x: 3, y: 3 }); } ``` 上面的代码主要干了一件事,就是为`Point`结构体提供`+`的能力,这就是**运算符重载**,不过Rust并不支持创建自定义运算符,你也无法为所有运算符进行重载,目前来说,只有定义在`std::ops`中的运算符才能进行重载。 跟`+`对应的特征是`std::ops::Add`,我们在之前也看过它的定义`trait Add`,但是上面的例子中并没有为`Point`实现`Add`特征,而是实现了`Add`特征,这意味着我们使用了`RHS`的默认类型,也就是`Self`。换句话说,我们这里定义的是两个相同的`Point`类型相加,因此无需指定`RHS`。 与上面的例子相反,下面的例子,我们来创建两个不同类型的相加: ```rust use std::ops::Add; struct Millimeters(u32); struct Meters(u32); impl Add for Millimeters { type Output = Millimeters; fn add(self, other: Meters) -> Millimeters { Millimeters(self.0 + (other.0 * 1000)) } } ``` 这里,是进行`Millimeters + Meters`的操作,因此此时不能再使用默认的RHS,否则就会变成`Millimeters + Millimeters`的形式。使用`Add`可以将`RHS`指定为`Meters`,那么`fn add(self, rhs: RHS) `自然而言的变成了`Millimeters`和`Meters`的相加. 默认类型参数主要用于两个方面: 1. 减少实现的样板代码 2. 扩展类型但是无需大幅修改现有的代码 之前的例子就是第一点,虽然效果也就那样。在`+`左右两边都是同样类型时,只需要`impl Add`即可,否则你需要`impl Add`,嗯,会多写几个字:) 对于第二点,也很好理解,如果你在一个复杂类型的基础上,新引入一个泛型参数,可能需要修改很多地方,但是如果新引入的泛型参数有了默认类型,情况就会好很多。 归根到底,默认泛型参数,是有用的,但是大多数情况下,咱们确实用不到,当需要用到时,大家再回头来查阅本章即可, **手上有剑,心中不慌**. ## 调用同名的方法 不同特征拥有同名的方法是很正常的事情,你没有任何办法阻止这一点,甚至除了特征上的同名方法外,在你的类型上,也有同名方法: ```rust trait Pilot { fn fly(&self); } trait Wizard { fn fly(&self); } struct Human; impl Pilot for Human { fn fly(&self) { println!("This is your captain speaking."); } } impl Wizard for Human { fn fly(&self) { println!("Up!"); } } impl Human { fn fly(&self) { println!("*waving arms furiously*"); } } ``` 这里,不仅仅两个特征`Pilot`和`Wizard`有`fly`方法,就连实现那两个特征的`Human`元结构体,也拥有一个同名方法`fly`(这世界怎么了,非常这么卷吗?程序员何苦难为程序员,哎). 既然代码已经不可更改,那下面我们来讲讲该如何调用这些`fly`方法。 #### 优先调用类型上的方法 当调用`Human`实例的`fly`时,编译器默认调用该类型中定义的方法: ```rust fn main() { let person = Human; person.fly(); } ``` 这段代码会打印`*waving arms furiously*`,说明直接调用了类型上定义的方法。 #### 调用特征上的方法 为了能够调用两个特征的方法,需要使用显式调用的语法: ```rust fn main() { let person = Human; Pilot::fly(&person); // 调用Pilot特征上的方法 Wizard::fly(&person); // 调用Wizard特征上的方法 person.fly(); // 调用Human类型自身的方法 } ``` 运行后依次输出: ```console This is your captain speaking. Up! *waving arms furiously* ``` 因为`fly`方法的参数是`self`,当显示的调用时,编译器就可以根据调用的类型(`self`的类型)决定具体调用哪个方法。 这个时候问题又来了,如果方法没有`self`参数呢?稍等,估计有读者会问:还有方法没有`self`参数?看到这个疑问,作者的眼泪不禁流了下来, 大明湖畔的[关联函数](../method.md#关联函数),你还记得嘛? 但是成年人的世界,就算再伤心,事还得做,咱们继续: ```rust trait Animal { fn baby_name() -> String; } struct Dog; impl Dog { fn baby_name() -> String { String::from("Spot") } } impl Animal for Dog { fn baby_name() -> String { String::from("puppy") } } fn main() { println!("A baby dog is called a {}", Dog::baby_name()); } ``` 就像人类妈妈会给自己的宝宝起爱称一样,狗狗妈妈也会。狗狗妈称呼自己的宝宝为**Spot**,其它动物称呼狗宝宝为**puppy**, 这个时候假如有其它动物,不知道该称如何呼狗宝宝,它需要查询一下。 但是`Dog::baby_name()`的调用方式显然不行,这是狗妈妈对宝宝的爱称,但是如果你试图这样查询: ```rust fn main() { println!("A baby dog is called a {}", Animal::baby_name()); } ``` 铛铛,无情报错了: ```rust error[E0283]: type annotations needed // 需要类型注释 --> src/main.rs:20:43 | 20 | println!("A baby dog is called a {}", Animal::baby_name()); | ^^^^^^^^^^^^^^^^^ cannot infer type // 无法推断类型 | = note: cannot satisfy `_: Animal` ``` 因为单纯从`Animal::baby_name()`上,编译器无法得到任何有效的信息:你想获取哪个动物宝宝的名称?狗宝宝?猪宝宝?还是熊宝宝? 此时,就需要使用**完全限定语法**. ##### 完全限定语法 完全限定语法是调用函数最为明确的方式: ```rust fn main() { println!("A baby dog is called a {}", ::baby_name()); } ``` 在尖括号中,通过`as`关键字,我们向Rust编译器提供了类型注解,也就是`Animal`就是`Dog`,而不是其他动物,因此最终会调用`impl Animal for Dog `中的方法,获取到其它动物对狗宝宝的称呼:**puppy**. 言归正题,完全限定语法定义为: ```rust ::function(receiver_if_method, next_arg, ...); ``` 对于关联函数,其没有一个方法接收器(`receiver`),故只会有其他参数的列表。**可以选择在任何函数或方法调用处使用完全限定语法**, 同时,你还能省略任何Rust能够从程序中的其他信息中推导出的的部分。只有当存在多个同名实现而 Rust 需要帮助以便知道我们希望调用哪个实现时,才需要使用这个较为冗长的语法。 ## 特征定义中的特征约束 有时,我们会需要让某个特征A能使用另一个特征B的功能(另一种形式的特征约束),这种情况下,不仅仅要为类型实现特征A,还要为类型实现特征B才行,这就是`supertrait`(实在不知道该如何翻译,有大佬指导下嘛?) 例如有一个特征`OutlinePrint`,它有一个方法,能够对当前的实现类型进行格式化输出: ```rust use std::fmt::Display; trait OutlinePrint: Display { fn outline_print(&self) { let output = self.to_string(); let len = output.len(); println!("{}", "*".repeat(len + 4)); println!("*{}*", " ".repeat(len + 2)); println!("* {} *", output); println!("*{}*", " ".repeat(len + 2)); println!("{}", "*".repeat(len + 4)); } } ``` 等等,这里有一个眼熟的语法:`OutlinePrint: Display`,感觉很像之前讲过的**特征约束**,只不过用在了特征定义中而不是函数的参数中, 是的,在某种意义上来说,这和特征约束非常类似,都用来说明一个特征需要实现另一个特征,这里就是:如果你想要实现`OutlinePrint`特征,首先你需要实现`Display`特征。 想象一下,假如没有这个特征约束,那么`self.to_string`还能够调用吗(`to_string`方法会为实现`Display`特征的类型自动实现)?编译器肯定是不愿意的, 会报错说当前作用域中找不到用于`&Self`类型的方法`to_string`: ```rust struct Point { x: i32, y: i32, } impl OutlinePrint for Point {} ``` 因为`Point`没有实现`Display`特征,会得到下面的报错: ```console error[E0277]: the trait bound `Point: std::fmt::Display` is not satisfied --> src/main.rs:20:6 | 20 | impl OutlinePrint for Point {} | ^^^^^^^^^^^^ `Point` cannot be formatted with the default formatter; try using `:?` instead if you are using a format string | = help: the trait `std::fmt::Display` is not implemented for `Point` ``` 既然我们有求于编译器,那只能选择满足它咯: ```rust use std::fmt; impl fmt::Display for Point { fn fmt(&self, f: &mut fmt::Formatter) -> fmt::Result { write!(f, "({}, {})", self.x, self.y) } } ``` 上面代码为`Point`实现了`Display`特征,那么`to_string`方法也将自动实现:最终获得字符串是通过这里的`fmt`方法获得的。 ## 在外部类型上实现外部特征(newtype) 在[特征](./trait#特征定义与实现的位置(孤儿规则))章节中, 有提到孤儿规则,简单来说,就是特征或者类型必需至少有一个是本地的,才能在此类型上定义特征。 这里提供一个办法来绕过孤儿规则, 那就是使用**newtype模式**,简而言之: 就是为一个[元组结构体](../compound-type/struct.md#元组结构体)创建新类型。该元组结构体封装有一个字段,该字段就是希望实现特征的具体类型。 该封装类型是本地的,因此我们可以为此类型实现外部的特征。 `newtype`不仅仅能实现以上的功能,而且它在运行时没有任何性能损耗,因为在编译期,该类型会被自动忽略。 下面来看一个例子,我们有一个动态数组类型:`Vec`,它定义在标准库中,还有一个特征`Display`,它也定义在标准库中,如果没有`newtype`,我们是无法为`Vec`实现`Display`的: ```console error[E0117]: only traits defined in the current crate can be implemented for arbitrary types --> src/main.rs:5:1 | 5 | impl std::fmt::Display for Vec { | ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^------ | | | | | Vec is not defined in the current crate | impl doesn't use only types from inside the current crate | = note: define and implement a trait or new type instead ``` 编译器给了我们提示:`define and implement a trait or new type instead`,重新定义一个特征,或者使用`new type`,前者当然不可行,那么来试试后者: ```rust use std::fmt; struct Wrapper(Vec); impl fmt::Display for Wrapper { fn fmt(&self, f: &mut fmt::Formatter) -> fmt::Result { write!(f, "[{}]", self.0.join(", ")) } } fn main() { let w = Wrapper(vec![String::from("hello"), String::from("world")]); println!("w = {}", w); } ``` 其中,`struct Wrapper(Vec)`就是一个元组结构体,它定义了一个新类型`Wrapper`,代码很简单,相信大家也很容易看懂。 既然`new type`有这么多好处,它有没有不好的地方呢?答案是肯定的。注意到我们怎么访问里面的数组吗?`self.0.join(", ")`, 是的,很啰嗦,因为需要先从`Wrapper`中取出数组: `self.0`,然后才能执行`join`方法. 类似的,任何数组上的方法,你都无法直接调用,需要先用`self.0`取出数组,然后再进行调用。 当然,解决办法还是有的,要不怎么说Rust是极其强大灵活的编程语言!Rust提供了一个特征叫[`Deref`](../../traits/deref.md),实现该特征后,可以自动做一层类似类型转换的操作,可以将`Wrapper`变成`Vec`来使用。这样就会像直接使用数组那样去使用`Wrapper`,而无需为每一个操作都添加上`self.0`。 同时,如果不想`Wrapper`暴漏底层数组的所有方法,我们还可以为`Wrapper`去重载这些方法,实现隐藏的目的。