update ch06-01-defining-an-enum.md

pull/256/head
xiaohulu 6 years ago
parent fb9a0fbb45
commit c49fa6a980

@ -17,7 +17,7 @@ enum IpAddrKind {
} }
``` ```
现在 `IpAddrKind` 就是一个可以在代码中使用的自定义类型了。 现在 `IpAddrKind` 就是一个可以在代码中使用的自定义数据类型了。
### 枚举值 ### 枚举值
@ -58,7 +58,7 @@ route(IpAddrKind::V4);
route(IpAddrKind::V6); route(IpAddrKind::V6);
``` ```
使用枚举甚至还有更多优势。进一步考虑一下我们的 IP 地址类型,目前没有一个存实际 IP 地址 **数据** 的方法;只知道它是什么 **类型** 的。考虑到已经在第五章学习过结构体了,你可能会像示例 6-1 那样处理这个问题: 使用枚举甚至还有更多优势。进一步考虑一下我们的 IP 地址类型,目前没有一个存实际 IP 地址 **数据** 的方法;只知道它是什么 **类型** 的。考虑到已经在第五章学习过结构体了,你可能会像示例 6-1 那样处理这个问题:
```rust ```rust
enum IpAddrKind { enum IpAddrKind {
@ -82,9 +82,9 @@ let loopback = IpAddr {
}; };
``` ```
<span class="caption">示例 6-1将 IP 地址的数据和 `IpAddrKind` 成员存在一个 `struct`</span> <span class="caption">示例 6-1将 IP 地址的数据和 `IpAddrKind` 成员存在一个 `struct`</span>
这里我们定义了一个有两个字段的结构体 `IpAddr``kind` 字段是 `IpAddrKind`(之前定义的枚举)类型的而 `address` 字段是 `String` 类型的。这里有两个结构体的实例。第一个,`home`,它的 `kind` 的值是 `IpAddrKind::V4` 与之相关联的地址数据是 `127.0.0.1`。第二个实例,`loopback``kind` 的值是 `IpAddrKind` 的另一个成员,`V6`,关联的地址是 `::1`。我们使用了一个结构体来将 `kind``address` 打包在一起,现在枚举成员就与值相关联了。 这里我们定义了一个有两个字段的结构体 `IpAddr``IpAddrKind`(之前定义的枚举)类型的 `kind` 字段和 `String` 类型 `address` 字段。我们有这个结构体的两个实例。第一个,`home`,它的 `kind` 的值是 `IpAddrKind::V4` 与之相关联的地址数据是 `127.0.0.1`。第二个实例,`loopback``kind` 的值是 `IpAddrKind` 的另一个成员,`V6`,关联的地址是 `::1`。我们使用了一个结构体来将 `kind``address` 打包在一起,现在枚举成员就与值相关联了。
我们可以使用一种更简洁的方式来表达相同的概念,仅仅使用枚举并将数据直接放进每一个枚举成员而不是将枚举作为结构体的一部分。`IpAddr` 枚举的新定义表明了 `V4``V6` 成员都关联了 `String` 值: 我们可以使用一种更简洁的方式来表达相同的概念,仅仅使用枚举并将数据直接放进每一个枚举成员而不是将枚举作为结构体的一部分。`IpAddr` 枚举的新定义表明了 `V4``V6` 成员都关联了 `String` 值:
@ -101,7 +101,7 @@ let loopback = IpAddr::V6(String::from("::1"));
我们直接将数据附加到枚举的每个成员上,这样就不需要一个额外的结构体了。 我们直接将数据附加到枚举的每个成员上,这样就不需要一个额外的结构体了。
用枚举替代结构体还有另一个优势每个成员可以处理不同类型和数量的数据。IPv4 版本的 IP 地址总是含有四个值在 0 和 255 之间的数字部分。如果我们想要将 `V4` 地址存为四个 `u8` 值而 `V6` 地址仍然表现为一个 `String`,这就不能使用结构体了。枚举则可以轻易处理的这个情况: 用枚举替代结构体还有另一个优势每个成员可以处理不同类型和数量的数据。IPv4 版本的 IP 地址总是含有四个值在 0 和 255 之间的数字部分。如果我们想要将 `V4` 地址存为四个 `u8` 值而 `V6` 地址仍然表现为一个 `String`,这就不能使用结构体了。枚举则可以轻易处理的这个情况:
```rust ```rust
enum IpAddr { enum IpAddr {
@ -114,7 +114,7 @@ let home = IpAddr::V4(127, 0, 0, 1);
let loopback = IpAddr::V6(String::from("::1")); let loopback = IpAddr::V6(String::from("::1"));
``` ```
这些代码展示了使用枚举来存两种不同 IP 地址的几种可能的选择。然而,事实证明存和编码 IP 地址实在是太常见了[以致标准库提供了一个开箱即用的定义!][IpAddr]<!-- ignore -->让我们看看标准库是如何定义 `IpAddr` 的:它正有着跟我们定义和使用的一样的枚举和成员,不过它将成员中的地址数据嵌入到了两个不同形式的结构体中,它们对不同的成员的定义是不同的: 这些代码展示了使用枚举来存两种不同 IP 地址的几种可能的选择。然而,事实证明存和编码 IP 地址实在是太常见了[以致标准库提供了一个开箱即用的定义!][IpAddr]<!-- ignore -->让我们看看标准库是如何定义 `IpAddr` 的:它正有着跟我们定义和使用的一样的枚举和成员,不过它将成员中的地址数据嵌入到了两个不同形式的结构体中,它们对不同的成员的定义是不同的:
[IpAddr]: https://doc.rust-lang.org/std/net/enum.IpAddr.html [IpAddr]: https://doc.rust-lang.org/std/net/enum.IpAddr.html
@ -148,28 +148,28 @@ enum Message {
} }
``` ```
<span class="caption">示例 6-2一个 `Message` 枚举,其每个成员都存了不同数量和类型的值</span> <span class="caption">示例 6-2一个 `Message` 枚举,其每个成员都存了不同数量和类型的值</span>
这个枚举有四个含有不同类型的成员: 这个枚举有四个含有不同类型的成员:
* `Quit` 没有关联任何数据。 * `Quit` 没有关联任何数据。
* `Move` 包含一个匿名结构体 * `Move` 包含一个匿名结构体
* `Write` 包含单独一个 `String` * `Write` 包含单独一个 `String`
* `ChangeColor` 包含三个 `i32` * `ChangeColor` 包含三个 `i32`
定义一个如示例 6-2 中所示那样的有关联值的枚举的方式和定义多个不同类型的结构体的方式很相像——除了枚举不使用 `struct` 关键字以及其所有成员都被组合在一起位于 `Message`之外。如下这些结构体可以包含与之前枚举成员中相同的数据: 定义一个如示例 6-2 中所示那样的有关联值的枚举的方式和定义多个不同类型的结构体的方式很相像——除了枚举不使用 `struct` 关键字以及其所有成员都被组合在一起位于 `Message` 类型下。如下这些结构体可以包含与之前枚举成员中相同的数据:
```rust ```rust
struct QuitMessage; // unit struct struct QuitMessage; // 类单元结构体
struct MoveMessage { struct MoveMessage {
x: i32, x: i32,
y: i32, y: i32,
} }
struct WriteMessage(String); // tuple struct struct WriteMessage(String); // 元组结构体
struct ChangeColorMessage(i32, i32, i32); // tuple struct struct ChangeColorMessage(i32, i32, i32); // 元组结构体
``` ```
不过,如果我们使用多个不同类型的结构体,由于它们都有不同的类型,我们将不能像使用示例 6-2 中定义 `Message` 枚举那样,轻易的定义一个能够处理这些不同类型的结构体的函数。因为使用枚举的情况下,“它们”是一个类型 不过,如果我们使用不同的结构体,由于它们都有不同的类型,我们将不能像使用示例 6-2 中定义 `Message` 枚举那样,轻易的定义一个能够处理这些不同类型的结构体的函数。因为使用枚举的情况下,“它们”是一个类型。
结构体和枚举还有另一个相似点:就像可以使用 `impl` 来为结构体定义方法那样,也可以在枚举上定义方法。这是一个定义于我们 `Message` 枚举上的叫做 `call` 的方法: 结构体和枚举还有另一个相似点:就像可以使用 `impl` 来为结构体定义方法那样,也可以在枚举上定义方法。这是一个定义于我们 `Message` 枚举上的叫做 `call` 的方法:
@ -183,7 +183,7 @@ struct ChangeColorMessage(i32, i32, i32); // tuple struct
# #
impl Message { impl Message {
fn call(&self) { fn call(&self) {
// method body would be defined here // 在这里定义方法体
} }
} }
@ -191,15 +191,15 @@ let m = Message::Write(String::from("hello"));
m.call(); m.call();
``` ```
方法体使用了 `self` 来获取调用方法的值。这个例子中,创建了一个拥有类型 `Message::Write("hello")` 的变量 `m`,而且这就是当 `m.call()` 运行时 `call` 方法中的 `self` 的值。 方法体使用了 `self` 来获取调用方法的值。这个例子中,创建了一个值为 `Message::Write(String::from("hello"))` 的变量 `m`,而且这就是当 `m.call()` 运行时 `call` 方法中的 `self` 的值。
让我们看看标准库中的另一个非常常见且实用的枚举:`Option`。 让我们看看标准库中的另一个非常常见且实用的枚举:`Option`。
### `Option` 枚举和其相对于空值的优势 ### `Option` 枚举和其相对于空值的优势
在之前的部分,我们看到了 `IpAddr` 枚举如何利用 Rust 的类型系统编码更多信息而不单单是程序中的数据。接下来我们分析一个 `Option` 的案例,`Option` 是标准库定义的另一个枚举。`Option` 类型应用广泛因为它编码了一个非常普遍的场景,即一个值要么是某个值要么什么都不是。从类型系统的角度来表达这个概念就意味着编译器需要检查是否处理了所有应该处理的情况,这样就可以避免在其他编程语言中非常常见的 bug。 在之前的部分,我们看到了 `IpAddr` 枚举如何利用 Rust 的类型系统在程序中编码更多信息而不单单是数据。接下来我们分析一个 `Option` 的案例,`Option` 是标准库定义的另一个枚举。`Option` 类型应用广泛因为它编码了一个非常普遍的场景,即一个值要么有值要么没值。从类型系统的角度来表达这个概念就意味着编译器需要检查是否处理了所有应该处理的情况,这样就可以避免在其他编程语言中非常常见的 bug。
编程语言的设计经常从其包含功能的角度考虑问题,但是从其所排除在外的功能的角度思考也很重要。Rust 并没有很多其他语言中有的空值功能。**空值***Null* )是一个值,它代表没有值。在有空值的语言中,变量总是这两种状态之一:空值和非空值。 编程语言的设计经常要考虑包含哪些功能,但考虑排除哪些功能也很重要。Rust 并没有很多其他语言中有的空值功能。**空值***Null* )是一个值,它代表没有值。在有空值的语言中,变量总是这两种状态之一:空值和非空值。
Tony Hoarenull 的发明者,在他 2009 年的演讲 “Null References: The Billion Dollar Mistake” 中曾经说到: Tony Hoarenull 的发明者,在他 2009 年的演讲 “Null References: The Billion Dollar Mistake” 中曾经说到:
@ -214,11 +214,11 @@ Tony Hoarenull 的发明者,在他 2009 年的演讲 “Null References: Th
> >
> 我称之为我十亿美元的错误。当时,我在为一个面向对象语言设计第一个综合性的面向引用的类型系统。我的目标是通过编译器的自动检查来保证所有引用的使用都应该是绝对安全的。不过我未能抵抗住引入一个空引用的诱惑,仅仅是因为它是这么的容易实现。这引发了无数错误、漏洞和系统崩溃,在之后的四十多年中造成了数十亿美元的苦痛和伤害。 > 我称之为我十亿美元的错误。当时,我在为一个面向对象语言设计第一个综合性的面向引用的类型系统。我的目标是通过编译器的自动检查来保证所有引用的使用都应该是绝对安全的。不过我未能抵抗住引入一个空引用的诱惑,仅仅是因为它是这么的容易实现。这引发了无数错误、漏洞和系统崩溃,在之后的四十多年中造成了数十亿美元的苦痛和伤害。
空值的问题在于当你尝试像一个非空值那样使用一个空值,会出现某种形式的错误。因为空和非空的属性无处不在,非常容易出现这类错误。 空值的问题在于当你尝试像一个非空值那样使用一个空值,会出现某种形式的错误。因为空和非空的属性无处不在,非常容易出现这类错误。
然而,空值尝试表达的概念仍然是有意义的:空值是一个因为某种原因目前无效或缺失的值。 然而,空值尝试表达的概念仍然是有意义的:空值是一个因为某种原因目前无效或缺失的值。
问题不在于具体的概念而在于特定的实现。为此Rust 并没有空值,不过它确实拥有一个可以编码存在或不存在概念的枚举。这个枚举是 `Option<T>`,而且它[定义于标准库中][option]<!-- ignore -->,如下: 问题不在于概念而在于具体的实现。为此Rust 并没有空值,不过它确实拥有一个可以编码存在或不存在概念的枚举。这个枚举是 `Option<T>`,而且它[定义于标准库中][option]<!-- ignore -->,如下:
[option]: https://doc.rust-lang.org/std/option/enum.Option.html [option]: https://doc.rust-lang.org/std/option/enum.Option.html
@ -229,7 +229,7 @@ enum Option<T> {
} }
``` ```
`Option<T>` 是如此有用以至于它甚至被包含在了 prelude 之中,这意味着我们不需要显式引入作用域。另外,它的成员也是如此,可以不需要 `Option::` 前缀来直接使用 `Some``None`。即便如此 `Option<T>` 也仍是常规的枚举,`Some(T)` 和 `None` 仍是 `Option<T>` 的成员。 `Option<T>` 枚举是如此有用以至于它甚至被包含在了 prelude 之中,你不需要将其显式引入作用域。另外,它的成员也是如此,可以不需要 `Option::` 前缀来直接使用 `Some``None`。即便如此 `Option<T>` 也仍是常规的枚举,`Some(T)` 和 `None` 仍是 `Option<T>` 的成员。
`<T>` 语法是一个我们还未讲到的 Rust 功能。它是一个泛型类型参数,第十章会更详细的讲解泛型。目前,所有你需要知道的就是 `<T>` 意味着 `Option` 枚举的 `Some` 成员可以包含任意类型的数据。这里是一些包含数字类型和字符串类型 `Option` 值的例子: `<T>` 语法是一个我们还未讲到的 Rust 功能。它是一个泛型类型参数,第十章会更详细的讲解泛型。目前,所有你需要知道的就是 `<T>` 意味着 `Option` 枚举的 `Some` 成员可以包含任意类型的数据。这里是一些包含数字类型和字符串类型 `Option` 值的例子:
@ -240,12 +240,11 @@ let some_string = Some("a string");
let absent_number: Option<i32> = None; let absent_number: Option<i32> = None;
``` ```
如果使用 `None` 而不是 `Some`,需要告诉 Rust `Option<T>` 是什么类型的,因为编译器只通过 `None` 值无法推断出 `Some` 变量保留的值的类型。 如果使用 `None` 而不是 `Some`,需要告诉 Rust `Option<T>` 是什么类型的,因为编译器只通过 `None` 值无法推断出 `Some` 成员保存的值的类型。
当有一个 `Some` 值时,我们就知道存在一个值,而这个值保存在 `Some` 中。当有个`None` 值时,在某种意义上它跟空值是相同的意义:并没有一个有效的值。那么,`Option<T>` 为什么就比空值要好呢? 当有一个 `Some` 值时,我们就知道存在一个值,而这个值保存在 `Some` 中。当有个 `None` 值时,在某种意义上,它跟空值具有相同的意义:并没有一个有效的值。那么,`Option<T>` 为什么就比空值要好呢?
简而言之,因为 `Option<T>``T`(这里 `T` 可以是任何类型)是不同的类型,编译器不允许像一个肯定有效的值那样使用 `Option<T>`。例如,这段代码不能编译,因为它尝试将 `Option<i8>``i8` 相加:
简而言之,因为 `Option<T>``T`(这里 `T` 可以是任何类型)是不同的类型,编译器不允许像一个被定义的有效的类型那样使用 `Option<T>`。例如,这些代码不能编译,因为它尝试将 `Option<i8>``i8` 相加:
```rust,ignore ```rust,ignore
let x: i8 = 5; let x: i8 = 5;
@ -266,14 +265,14 @@ not satisfied
| |
``` ```
哇哦!事实上,错误信息意味着 Rust 不知道该如何将 `Option<i8>``i8` 相加。当在 Rust 中拥有一个像 `i8` 这样类型的值时,编译器确保它总是有一个有效的值。我们可以自信使用而无需判空。只有当使用 `Option<i8>`(或者任何用到的类型)的时候需要担心可能没有一个值,而编译器会确保我们在使用值之前处理为空的情况。 哇哦!事实上,错误信息意味着 Rust 不知道该如何将 `Option<i8>``i8` 相加,因为它们的类型不同。当在 Rust 中拥有一个像 `i8` 这样类型的值时,编译器确保它总是有一个有效的值。我们可以自信使用而无需做空值检查。只有当使用 `Option<i8>`(或者任何用到的类型)的时候需要担心可能没有值,而编译器会确保我们在使用值之前处理为空的情况。
换句话说,在对 `Option<T>` 进行 `T` 的运算之前必须将其转换为 `T`。通常这能帮助我们捕获空值最常见的问题之一:假设某值不为空但实际上为空的情况。 换句话说,在对 `Option<T>` 进行 `T` 的运算之前必须将其转换为 `T`。通常这能帮助我们捕获空值最常见的问题之一:假设某值不为空但实际上为空的情况。
不再需要担心会错把一个值当作非空值来使用让我们对代码更加有信心,为了拥有一个可能为空的值,我们必须要显式的将其放入对应类型的 `Option<T>` 中。接着,当使用这个值时,必须明确的处理值为空的情况。任何地方一个值不是 `Option<T>` 类型的话,我们就 **可以** 安全的认为它的值不为空。这是 Rust 的一个有意为之的设计选择,来限制空值的泛滥以增加 Rust 代码的安全性。 不再担心会错误的假设一个非空值,会让你对代码更加有信心。为了拥有一个可能为空的值,你必须要显式的将其放入对应类型的 `Option<T>` 中。接着,当使用这个值时,必须明确的处理值为空的情况。只要一个值不是 `Option<T>` 类型,你就 **可以** 安全的认定它的值不为空。这是 Rust 的一个经过深思熟虑的设计决策,来限制空值的泛滥以增加 Rust 代码的安全性。
那么当有一个 `Option<T>` 的值时,如何从 `Some` 成员中取出 `T` 的值来使用它呢?`Option<T>` 枚举拥有大量用于各种情况的方法:你可以查看[相关代码][docs]<!-- ignore -->。熟悉 `Option<T>` 的方法将对你的 Rust 之旅提供巨大的帮助 那么当有一个 `Option<T>` 的值时,如何从 `Some` 成员中取出 `T` 的值来使用它呢?`Option<T>` 枚举拥有大量用于各种情况的方法:你可以查看[它的文档][docs]<!-- ignore -->。熟悉 `Option<T>` 的方法将对你的 Rust 之旅非常有用
[docs]: https://doc.rust-lang.org/std/option/enum.Option.html [docs]: https://doc.rust-lang.org/std/option/enum.Option.html
总的来说,为了使用 `Option<T>` 值,需要编写处理每个成员的代码。我们想要一些代码只当拥有 `Some(T)` 值时运行,这些代码允许使用其中的 `T`。也希望一些代码在 `None` 时运行,这些代码并没有一个可用的 `T` 值。`match` 表达式就是这么一个处理枚举的控制流结构:它会根据枚举的成员运行不同的代码,这些代码可以使用匹配到的值中的数据。 总的来说,为了使用 `Option<T>` 值,需要编写处理每个成员的代码。想要一些代码只当拥有 `Some(T)` 值时运行,允许这些代码使用其中的 `T`。也希望一些代码在值为 `None` 时运行,这些代码并没有一个可用的 `T` 值。`match` 表达式就是这么一个处理枚举的控制流结构:它会根据枚举的成员运行不同的代码,这些代码可以使用匹配到的值中的数据。

Loading…
Cancel
Save