# 深入了解特征

特征之于Rust更甚于接口之于其他语言，因此特征在Rust中很重要也相对较为复杂，我们决定把特征分为两篇进行介绍，[第一篇](./trait.md)在之前已经讲过，现在就是第二篇：关于特征的进阶篇，会讲述一些你不常用到但是该了解的特性。

## 关联类型
在方法一章中，我们将到了[关联函数](../method.md#关联函数)，但是实际上关联类型和关联函数并没有任何交集，虽然它们的名字有一半的交集。

关联类型是在特征定义的语句块中，申明一个自定义类型，这样就可以在特征的方法签名中使用该类型：
```rust
pub trait Iterator {
    type Item;

    fn next(&mut self) -> Option<Self::Item>;
}
```

以上是标准库中的迭代器特征`Iterator`，它有一个`Item`关联类型，用于替代遍历的值的类型。

同时,`next`方法也返回了一个`Item`类型，不过使用`Option`枚举进行了包裹，假如迭代器中的值是`i32`类型，那么调用`next`方法就将获取一个`Option<i32>`的值。

还记得`Self`吧？在之前的章节[提到过](./trait-object#Self与self), `Self`用来指代当前的特征实例 ,那么`Self::Item`就用来指代特征实例中具体的`Item`类型:
```rust
impl Iterator for Counter {
    type Item = u32;

    fn next(&mut self) -> Option<Self::Item> {
        // --snip--
```

在上述代码中，我们为`Counter`类型实现了`Iterator`特征，那么`Self`就是当前的`Iterator`特征对象，`Item`就是`u32`类型。

聪明的读者之所以聪明，因为你们喜欢联想和举一反三，同时你们也喜欢提问：为何不用泛型，例如如下代码
```rust
pub trait Iterator<Item> {
    fn next(&mut self) -> Option<Item>;
}
```

答案其实很简单，为了代码的可读性. 当你使用了泛型后，你需要在所有地方都这样写`Iterator<Item>`，而使用了关联类型，你只需要这样写`Iterator`，当类型定义复杂时，这种写法可以极大的增加可读性:
```rust
pub trait CacheableItem: Clone + Default + fmt::Debug + Decodable + Encodable {
  type Address: AsRef<[u8]> + Clone + fmt::Debug + Eq + Hash;
  fn is_null(&self) -> bool;
}
```

例如上面的代码，`Address`自然远比`AsRef<[u8]> + Clone + fmt::Debug + Eq + Hash`的要简单的多，而且含义清晰。

再例如，如果使用泛型，你将得到以下的代码：
```rust
trait Container<A,B> {
    fn contains(&self,a: A,b: B) -> bool;
}

fn difference<A,B,C>(container: &C) -> i32
  where
    C : Container<A,B> {...}
```

而使用关联类型，将得到可读性好的多的代码:
```rust
trait Container{
    type A;
    type B;
    fn contains(&self, a: &Self::A, b: &Self::B) -> bool;
}

fn difference<C: Container>(container: &C) {}
```

## 默认泛型类型参数

当使用泛型类型参数时，可以为其指定一个默认的具体类型，例如标准库中的`std::ops::Add`特征：
```rust
trait Add<RHS=Self> {
    type Output;

    fn add(self, rhs: RHS) -> Self::Output;
}
```
它有一个泛型参数`RHS`，但是与我们以往的用法不同，这里它给`RHS`一个默认值，也就是当用户不指定`RHS`时，默认使用两个同样类型的值进行相加，然后返回一个关联类型`Output`。

可能上面那段不太好理解，下面我们用代码来举例：
```rust
use std::ops::Add;

#[derive(Debug, PartialEq)]
struct Point {
    x: i32,
    y: i32,
}

impl Add for Point {
    type Output = Point;

    fn add(self, other: Point) -> Point {
        Point {
            x: self.x + other.x,
            y: self.y + other.y,
        }
    }
}

fn main() {
    assert_eq!(Point { x: 1, y: 0 } + Point { x: 2, y: 3 },
               Point { x: 3, y: 3 });
}
```
上面的代码主要干了一件事，就是为`Point`结构体提供`+`的能力，这就是**运算符重载**，不过Rust并不支持创建自定义运算符，你也无法为所有运算符进行重载，目前来说，只有定义在`std::ops`中的运算符才能进行重载。

跟`+`对应的特征是`std::ops::Add`，我们在之前也看过它的定义`trait Add<RHS=Self>`，但是上面的例子中并没有为`Point`实现`Add<RHS>`特征，而是实现了`Add`特征，这意味着我们使用了`RHS`的默认类型，也就是`Self`。换句话说，我们这里定义的是两个相同的`Point`类型相加，因此无需指定`RHS`。

与上面的例子相反，下面的例子，我们来创建两个不同类型的相加：
```rust
use std::ops::Add;

struct Millimeters(u32);
struct Meters(u32);

impl Add<Meters> for Millimeters {
    type Output = Millimeters;

    fn add(self, other: Meters) -> Millimeters {
        Millimeters(self.0 + (other.0 * 1000))
    }
}
```

这里，是进行`Millimeters + Meters`的操作，因此此时不能再使用默认的RHS，否则就会变成`Millimeters + Millimeters`的形式。使用`Add<Meters>`可以将`RHS`指定为`Meters`，那么`fn add(self, rhs: RHS) `自然而言的变成了`Millimeters`和`Meters`的相加.

默认类型参数主要用于两个方面：
1. 减少实现的样板代码
2. 扩展类型但是无需大幅修改现有的代码

之前的例子就是第一点，虽然效果也就那样。在`+`左右两边都是同样类型时，只需要`impl Add`即可，否则你需要`impl Add<SOME_TYPE>`，嗯，会多写几个字:)

对于第二点，也很好理解，如果你在一个复杂类型的基础上，新引入一个泛型参数，可能需要修改很多地方，但是如果新引入的泛型参数有了默认类型，情况就会好很多。

归根到底，默认泛型参数，是有用的，但是大多数情况下，咱们确实用不到，当需要用到时，大家再回头来查阅本章即可, **手上有剑,心中不慌**.

## 调用同名的方法
不同特征拥有同名的方法是很正常的事情，你没有任何办法阻止这一点，甚至除了特征上的同名方法外，在你的类型上，也有同名方法:
```rust
trait Pilot {
    fn fly(&self);
}

trait Wizard {
    fn fly(&self);
}

struct Human;

impl Pilot for Human {
    fn fly(&self) {
        println!("This is your captain speaking.");
    }
}

impl Wizard for Human {
    fn fly(&self) {
        println!("Up!");
    }
}

impl Human {
    fn fly(&self) {
        println!("*waving arms furiously*");
    }
}
```

这里，不仅仅两个特征`Pilot`和`Wizard`有`fly`方法，就连实现那两个特征的`Human`元结构体，也拥有一个同名方法`fly`(这世界怎么了，非常这么卷吗？程序员何苦难为程序员,哎).

既然代码已经不可更改，那下面我们来讲讲该如何调用这些`fly`方法。

#### 优先调用类型上的方法
当调用`Human`实例的`fly`时，编译器默认调用该类型中定义的方法:
```rust
fn main() {
    let person = Human;
    person.fly();
}
```
这段代码会打印`*waving arms furiously*`，说明直接调用了类型上定义的方法。

#### 调用特征上的方法
为了能够调用两个特征的方法，需要使用显式调用的语法：
```rust
fn main() {
    let person = Human;
    Pilot::fly(&person); // 调用Pilot特征上的方法
    Wizard::fly(&person); // 调用Wizard特征上的方法
    person.fly(); // 调用Human类型自身的方法
}
```

运行后依次输出:
```console
This is your captain speaking.
Up!
*waving arms furiously*
```

因为`fly`方法的参数是`self`，当显示的调用时，编译器就可以根据调用的类型(`self`的类型)决定具体调用哪个方法。

这个时候问题又来了，如果方法没有`self`参数呢？稍等，估计有读者会问：还有方法没有`self`参数？看到这个疑问，作者的眼泪不禁流了下来, 大明湖畔的[关联函数](../method.md#关联函数)，你还记得嘛？

但是成年人的世界，就算再伤心，事还得做，咱们继续：
```rust
trait Animal {
    fn baby_name() -> String;
}

struct Dog;

impl Dog {
    fn baby_name() -> String {
        String::from("Spot")
    }
}

impl Animal for Dog {
    fn baby_name() -> String {
        String::from("puppy")
    }
}

fn main() {
    println!("A baby dog is called a {}", Dog::baby_name());
}
```

就像人类妈妈会给自己的宝宝起爱称一样，狗狗妈妈也会。狗狗妈称呼自己的宝宝为**Spot**，其它动物称呼狗宝宝为**puppy**, 这个时候假如有其它动物，不知道该称如何呼狗宝宝，它需要查询一下。

但是`Dog::baby_name()`的调用方式显然不行，这是狗妈妈对宝宝的爱称，但是如果你试图这样查询：
```rust
fn main() {
    println!("A baby dog is called a {}", Animal::baby_name());
}
```

铛铛，无情报错了:
```rust
error[E0283]: type annotations needed // 需要类型注释
  --> src/main.rs:20:43
   |
20 |     println!("A baby dog is called a {}", Animal::baby_name());
   |                                           ^^^^^^^^^^^^^^^^^ cannot infer type // 无法推断类型
   |
   = note: cannot satisfy `_: Animal`
```

因为单纯从`Animal::baby_name()`上，编译器无法得到任何有效的信息：你想获取哪个动物宝宝的名称？狗宝宝？猪宝宝？还是熊宝宝？

此时，就需要使用**完全限定语法**.

##### 完全限定语法
完全限定语法是调用函数最为明确的方式:
```rust
fn main() {
    println!("A baby dog is called a {}", <Dog as Animal>::baby_name());
}
```
在尖括号中，通过`as`关键字，我们向Rust编译器提供了类型注解，也就是`Animal`就是`Dog`，而不是其他动物，因此最终会调用`impl Animal for Dog `中的方法，获取到其它动物对狗宝宝的称呼：**puppy**.

言归正题，完全限定语法定义为:
```rust
<Type as Trait>::function(receiver_if_method, next_arg, ...);
```

对于关联函数，其没有一个方法接收器(`receiver`)，故只会有其他参数的列表。**可以选择在任何函数或方法调用处使用完全限定语法**, 同时，你还能省略任何Rust能够从程序中的其他信息中推导出的的部分。只有当存在多个同名实现而 Rust 需要帮助以便知道我们希望调用哪个实现时，才需要使用这个较为冗长的语法。 


## 特征定义中的特征约束
有时，我们会需要让某个特征A能使用另一个特征B的功能(另一种形式的特征约束)，这种情况下，不仅仅要为类型实现特征A，还要为类型实现特征B才行，这就是`supertrait`(实在不知道该如何翻译，有大佬指导下嘛？)

例如有一个特征`OutlinePrint`，它有一个方法，能够对当前的实现类型进行格式化输出：
```rust
use std::fmt::Display;

trait OutlinePrint: Display {
    fn outline_print(&self) {
        let output = self.to_string();
        let len = output.len();
        println!("{}", "*".repeat(len + 4));
        println!("*{}*", " ".repeat(len + 2));
        println!("* {} *", output);
        println!("*{}*", " ".repeat(len + 2));
        println!("{}", "*".repeat(len + 4));
    }
}
```

等等，这里有一个眼熟的语法:`OutlinePrint: Display`，感觉很像之前讲过的**特征约束**，只不过用在了特征定义中而不是函数的参数中, 是的，在某种意义上来说，这和特征约束非常类似，都用来说明一个特征需要实现另一个特征，这里就是：如果你想要实现`OutlinePrint`特征，首先你需要实现`Display`特征。

想象一下，假如没有这个特征约束，那么`self.to_string`还能够调用吗(`to_string`方法会为实现`Display`特征的类型自动实现)？编译器肯定是不愿意的, 会报错说当前作用域中找不到用于`&Self`类型的方法`to_string`:
```rust
struct Point {
    x: i32,
    y: i32,
}

impl OutlinePrint for Point {}
```
因为`Point`没有实现`Display`特征，会得到下面的报错：
```console
error[E0277]: the trait bound `Point: std::fmt::Display` is not satisfied
  --> src/main.rs:20:6
   |
20 | impl OutlinePrint for Point {}
   |      ^^^^^^^^^^^^ `Point` cannot be formatted with the default formatter;
try using `:?` instead if you are using a format string
   |
   = help: the trait `std::fmt::Display` is not implemented for `Point`
```

既然我们有求于编译器，那只能选择满足它咯：
```rust
use std::fmt;

impl fmt::Display for Point {
    fn fmt(&self, f: &mut fmt::Formatter) -> fmt::Result {
        write!(f, "({}, {})", self.x, self.y)
    }
}
```

上面代码为`Point`实现了`Display`特征，那么`to_string`方法也将自动实现：最终获得字符串是通过这里的`fmt`方法获得的。

## 在外部类型上实现外部特征(newtype)

 在[特征](./trait#特征定义与实现的位置(孤儿规则))章节中, 有提到孤儿规则，简单来说，就是特征或者类型必需至少有一个是本地的，才能在此类型上定义特征。

 这里提供一个办法来绕过孤儿规则, 那就是使用**newtype模式**，简而言之: 就是为一个[元组结构体](../compound-type/struct.md#元组结构体)创建新类型。该元组结构体封装有一个字段，该字段就是希望实现特征的具体类型。

 该封装类型是本地的，因此我们可以为此类型实现外部的特征。
 
 `newtype`不仅仅能实现以上的功能，而且它在运行时没有任何性能损耗，因为在编译期，该类型会被自动忽略。

 下面来看一个例子，我们有一个动态数组类型：`Vec<T>`，它定义在标准库中，还有一个特征`Display`，它也定义在标准库中，如果没有`newtype`，我们是无法为`Vec<T>`实现`Display`的: 


```console
error[E0117]: only traits defined in the current crate can be implemented for arbitrary types  
--> src/main.rs:5:1
|
5 | impl<T> std::fmt::Display for Vec<T> {
| ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^------
| |                             |
| |                             Vec is not defined in the current crate
| impl doesn't use only types from inside the current crate
|
= note: define and implement a trait or new type instead
```

编译器给了我们提示：`define and implement a trait or new type instead`，重新定义一个特征，或者使用`new type`，前者当然不可行，那么来试试后者：

```rust
use std::fmt;

struct Wrapper(Vec<String>);

impl fmt::Display for Wrapper {
    fn fmt(&self, f: &mut fmt::Formatter) -> fmt::Result {
        write!(f, "[{}]", self.0.join(", "))
    }
}

fn main() {
    let w = Wrapper(vec![String::from("hello"), String::from("world")]);
    println!("w = {}", w);
}
```

其中，`struct Wrapper(Vec<String>)`就是一个元组结构体，它定义了一个新类型`Wrapper`，代码很简单，相信大家也很容易看懂。

既然`new type`有这么多好处，它有没有不好的地方呢？答案是肯定的。注意到我们怎么访问里面的数组吗？`self.0.join(", ")`, 是的，很啰嗦，因为需要先从`Wrapper`中取出数组: `self.0`，然后才能执行`join`方法.

类似的，任何数组上的方法，你都无法直接调用，需要先用`self.0`取出数组，然后再进行调用。

当然，解决办法还是有的，要不怎么说Rust是极其强大灵活的编程语言！Rust提供了一个特征叫[`Deref`](../../traits/deref.md)，实现该特征后，可以自动做一层类似类型转换的操作，可以将`Wrapper`变成`Vec<String>`来使用。这样就会像直接使用数组那样去使用`Wrapper`，而无需为每一个操作都添加上`self.0`。

同时，如果不想`Wrapper`暴漏底层数组的所有方法，我们还可以为`Wrapper`去重载这些方法，实现隐藏的目的。