@ -7340,7 +7340,228 @@ How dreary to be somebody!
< br >
< br >
commit 4f2dc564851dc04b271a2260c834643dfd86c724< / p >
commit 4f2dc564851dc04b271a2260c834643dfd86c724< / p >
< / blockquote >
< / blockquote >
< a class = "header" href = "#迭代器" name = "迭代器" > < h1 > 迭代器< / h1 > < / a >
< p > Rust 的设计灵感来源于很多前人的成果。影响 Rust 的其中之一就是函数式编程,在这里函数也是值并可以被用作参数或其他函数的返回值、赋值给变量等等。我们将回避解释函数式编程的具体是什么以及其优缺点,而是突出展示 Rust 中那些类似被认为是函数式的编程语言中的功能。< / p >
< p > 更具体的,我们将要涉及:< / p >
< ul >
< li > < strong > 闭包< / strong > ( < em > Closures< / em > ),一个可以储存在变量里的类似函数的结构< / li >
< li > < strong > 迭代器< / strong > ( < em > Iterators< / em > ),一种处理元素序列的方式。。< / li >
< li > 如何使用这些功能来改进上一章的项目< / li >
< li > 这些功能的性能。**剧透高能:**他们的速度超乎想象!< / li >
< / ul >
< p > 这并不是一个 Rust 受函数式风格影响的完整功能列表:还有模式匹配、枚举和很多其他功能。不过掌握闭包和迭代器则是编写符合语言风格的快速的 Rust 代码的重要一环。< / p >
< a class = "header" href = "#闭包" name = "闭包" > < h2 > 闭包< / h2 > < / a >
< blockquote >
< p > < a href = "https://github.com/rust-lang/book/blob/master/second-edition/src/ch13-01-closures.md" > ch13-01-closures.md< / a >
< br >
commit 3f2a1bd8dbb19cc48b210fc4fb35c305c8d81b56< / p >
< / blockquote >
< p > Rust 提供了定义< strong > 闭包< / strong > 的能力,它类似于函数。让我们先不从技术上的定义开始,而是看看闭包语句结构,然后再返回他们的定义。列表 13-1 展示了一个被赋值给变量< code > add_one< / code > 的小的闭包定义,之后可以用这个变量来调用闭包:< / p >
< p > < span class = "filename" > Filename: src/main.rs< / span > < / p >
< pre > < code class = "language-rust" > fn main() {
let add_one = |x| x + 1;
let five = add_one(4);
assert_eq!(5, five);
}
< / code > < / pre >
< p > < span class = "caption" > Listing 13-1: A closure that takes one parameter and adds
one to it, assigned to the variable < code > add_one< / code > < / span > < / p >
< p > 闭包的定义位于第一行,展示了闭包获取了一个叫做< code > x< / code > 的参数。闭包的参数位于竖线之间(< code > |< / code > )。< / p >
< p > 这是一个很小的闭包,它只包含一个表达式。列表 13-2 展示了一个稍微复杂一点的闭包:< / p >
< p > < span class = "filename" > Filename: src/main.rs< / span > < / p >
< pre > < code class = "language-rust" > fn main() {
let calculate = |a, b| {
let mut result = a * 2;
result += b;
result
};
assert_eq!(7, calculate(2, 3)); // 2 * 2 + 3 == 7
assert_eq!(13, calculate(4, 5)); // 4 * 2 + 5 == 13
}
< / code > < / pre >
< p > < span class = "caption" > Listing 13-2: A closure with two parameters and multiple
expressions in its body< / span > < / p >
< p > 可以通过大括号来定义多于一个表达式的闭包体。< / p >
< p > 你会注意到一些闭包不同于< code > fn< / code > 关键字定义的函数的地方。第一个不同是并不需要声明闭包的参数和返回值的类型。也可以选择加上类型注解;列表 13-3 展示了列表 13-1 中闭包带有参数和返回值类型注解的版本:< / p >
< p > < span class = "filename" > Filename: src/main.rs< / span > < / p >
< pre > < code class = "language-rust" > fn main() {
let add_one = |x: i32| -> i32 { x + 1 };
assert_eq!(2, add_one(1));
}
< / code > < / pre >
< p > < span class = "caption" > Listing 13-3: A closure definition with optional
parameter and return value type annotations< / span > < / p >
< p > 在带有类型注解的情况下闭包的语法于函数就更接近了。让我们来更直接的比较一下不同闭包的语法与函数的语法。这里增加了一些空格来对齐相关的部分:< / p >
< pre > < code class = "language-rust,ignore" > fn add_one_v1 (x: i32) -> i32 { x + 1 } // a function
let add_one_v2 = |x: i32| -> i32 { x + 1 }; // the full syntax for a closure
let add_one_v3 = |x| { x + 1 }; // a closure eliding types
let add_one_v4 = |x| x + 1 ; // without braces
< / code > < / pre >
< p > 定义闭包时并要求类型注解而在定义函数是要求的原因在于函数是显式暴露给用户的接口的一部分,所以为了严格的定义接口确保所有人都同意函数使用和返回的值类型是很重要的。但是闭包并不像函数那样用于暴露接口:他们存在于绑定中并直接被调用。强制标注类型就等于为了很小的优点而显著的降低了工程性(本末倒置)。< / p >
< p > 不过闭包的定义确实会推断每一个参数和返回值的类型。例如,如果用< code > i8< / code > 调用列表 13-1 中没有类型注解的闭包,如果接着用< code > i32< / code > 调用同一闭包则会得到一个错误:< / p >
< p > < span class = "filename" > Filename: src/main.rs< / span > < / p >
< pre > < code class = "language-rust,ignore" > let add_one = |x| x + 1;
let five = add_one(4i8);
assert_eq!(5i8, five);
let three = add_one(2i32);
< / code > < / pre >
< p > 编译器给出如下错误:< / p >
< pre > < code > error[E0308]: mismatched types
-->
|
7 | let three = add_one(2i32);
| ^^^^ expected i8, found i32
< / code > < / pre >
< p > 因为闭包是直接被调用的所以能可靠的推断出其类型,再强制要求标注类型就显得有些冗余了。< / p >
< p > 闭包与函数语法不同还有另一个原因是,它与函数有着不同的行为:闭包拥有其< strong > 环境(上下文)< / strong > 。< / p >
< a class = "header" href = "#闭包可以引用其环境" name = "闭包可以引用其环境" > < h3 > 闭包可以引用其环境< / h3 > < / a >
< p > 我们知道函数只能使用其作用域内的变量,或者要么是< code > const< / code > 的要么是被声明为参数的。闭包则可以做的更多:闭包允许使用包含他们的作用域的变量。列表 13-4 是一个在< code > equal_to_x< / code > 变量中并使用其周围环境中变量< code > x< / code > 的闭包的例子:< / p >
< p > < span class = "filename" > Filename: src/main.rs< / span > < / p >
< pre > < code class = "language-rust" > fn main() {
let x = 4;
let equal_to_x = |z| z == x;
let y = 4;
assert!(equal_to_x(y));
}
< / code > < / pre >
< p > < span class = "caption" > Listing 13-4: Example of a closure that refers to a
variable in its enclosing scope< / span > < / p >
< p > 这里。即便< code > x< / code > 并不是< code > equal_to_x< / code > 的一个参数,< code > equal_to_x< / code > 闭包也被允许使用它,因为变量< code > x< / code > 定义于同样定义< code > equal_to_x< / code > 的作用域中。并不允许在函数中进行与列表 13-4 相同的操作;尝试这么做看看会发生什么:< / p >
< p > < span class = "filename" > Filename: src/main.rs< / span > < / p >
< pre > < code class = "language-rust,ignore" > fn main() {
let x = 4;
fn equal_to_x(z: i32) -> bool { z == x }
let y = 4;
assert!(equal_to_x(y));
}
< / code > < / pre >
< p > 我们会得到一个错误:< / p >
< pre > < code > error[E0434]: can't capture dynamic environment in a fn item; use the || { ... }
closure form instead
-->
|
4 | fn equal_to_x(z: i32) -> bool { z == x }
| ^
< / code > < / pre >
< p > 编译器甚至提醒我们这只能用于闭包!< / p >
< p > 获取他们环境中值的闭包主要用于开始新线程的场景。我们也可以定义以闭包作为参数的函数,通过使用< code > Fn< / code > trait。这里是一个函数< code > call_with_one< / code > 的例子,它的签名有一个闭包参数:< / p >
< pre > < code class = "language-rust" > fn call_with_one< F> (some_closure: F) -> i32
where F: Fn(i32) -> i32 {
some_closure(1)
}
let answer = call_with_one(|x| x + 2);
assert_eq!(3, answer);
< / code > < / pre >
< p > 我们将< code > |x| x + 2< / code > 传递给了< code > call_with_one< / code > ,而< code > call_with_one< / code > 用< code > 1< / code > 作为参数调用了这个闭包。< code > some_closure< / code > 调用的返回值接着被< code > call_with_one< / code > 返回。< / p >
< p > < code > call_with_one< / code > 的签名使用了第十章 trait 部分讨论到的< code > where< / code > 语法。< code > some_closure< / code > 参数有一个泛型类型< code > F< / code > ,它在< code > where< / code > 从句中被定义为拥有< code > Fn(i32) -> i32< / code > trait bound。< code > Fn< / code > trait 代表了一个闭包,而且可以给< code > Fn< / code > trait 增加类型来代表一个特定类型的闭包。在这种情况下,闭包拥有一个< code > i32< / code > 的参数并返回一个< code > i32< / code > ,所以泛型的 trait bound 被指定为< code > Fn(i32) -> i32< / code > 。< / p >
< p > 在函数签名中指定闭包要求使用泛型和 trait bound。每一个闭包都有一个独特的类型, 所以不能写出闭包的类型而必须使用泛型。< / p >
< p > < code > Fn< / code > 并不是唯一可以指定闭包的 trait bound, 事实上有三个: < code > Fn< / code > 、< code > FnMut< / code > 和< code > FnOnce< / code > 。这是在 Rust 中经常见到的三种模式的延续:借用、可变借用和获取所有权。用< code > Fn< / code > 来指定可能只会借用其环境中值的闭包。用< code > FnMut< / code > 来指定会修改环境中值的闭包,而如果闭包会获取环境值的所有权则使用< code > FnOnce< / code > 。大部分情况可以从< code > Fn< / code > 开始,而编译器会根据调用闭包时会发生什么来告诉你是否需要< code > FnMut< / code > 或< code > FnOnce< / code > 。< / p >
< p > 为了展示拥有闭包作为参数的函数的应用场景,让我们继续下一主题:迭代器。< / p >
< a class = "header" href = "#迭代器" name = "迭代器" > < h2 > 迭代器< / h2 > < / a >
< blockquote >
< p > < a href = "https://github.com/rust-lang/book/blob/master/second-edition/src/ch13-02-iterators.md" > ch13-02-iterators.md< / a >
< br >
commit 3f2a1bd8dbb19cc48b210fc4fb35c305c8d81b56< / p >
< / blockquote >
< p > 迭代器是 Rust 中的一个模式,它允许你对一个项的序列进行某些处理。例如。列表 13-5 中对 vecctor 中的每一个数加一:< / p >
< pre > < code class = "language-rust" > let v1 = vec![1, 2, 3];
let v2: Vec< i32> = v1.iter().map(|x| x + 1).collect();
assert_eq!(v2, [2, 3, 4]);
< / code > < / pre >
< p > < span class = "caption" > Listing 13-5: Using an iterator, < code > map< / code > , and < code > collect< / code > to
add one to each number in a vector< / span > < / p >
<!-- Will add wingdings in libreoffice /Carol -->
< p > vector 的< code > iter< / code > 方法允许从 vector 创建一个< strong > 迭代器< / strong > ( < em > iterator< / em > )。接着迭代器上的< code > map< / code > 方法调用允许我们处理每一个元素:在这里,我们向< code > map< / code > 传递了一个对每一个元素< code > x< / code > 加一的闭包。< code > map< / code > 是最基本的与比较交互的方法之一,因为依次处理每一个元素是非常有用的!最后< code > collect< / code > 方法消费了迭代器并将其元素存放到一个新的数据结构中。在这个例子中,因为我们指定< code > v2< / code > 的类型是< code > Vec< i32> < / code > , < code > collect< / code > 将会创建一个< code > i32< / code > 的 vector。< / p >
< p > 像< code > map< / code > 这样的迭代器方法有时被称为< strong > 迭代器适配器< / strong > ( < em > iterator adaptors< / em > ),因为他们获取一个迭代器并产生一个新的迭代器。也就是说,< code > map< / code > 在之前迭代器的基础上通过调用传递给它的闭包来创建了一个新的值序列的迭代器。< / p >
< p > 概括一下,这行代码进行了如下工作:< / p >
< ol >
< li > 从 vector 中创建了一个迭代器。< / li >
< li > 使用< code > map< / code > 适配器和一个闭包参数对每一个元素加一。< / li >
< li > 使用< code > collect< / code > 适配器来消费迭代去并生成了一个新的 vector。< / li >
< / ol >
< p > 这就是如何产生结果< code > [2, 3, 4]< / code > 的。如你所见,闭包是使用迭代器的很重要的一部分:他们提供了一个自定义类似< code > map< / code > 这样的迭代器适配器的行为的方法。< / p >
< a class = "header" href = "#迭代器是惰性的" name = "迭代器是惰性的" > < h3 > 迭代器是惰性的< / h3 > < / a >
< p > 在上一部分,你可能已经注意到了一个微妙的用词区别:我们说< code > map< / code > < strong > 适配< / strong > ( < em > adapts< / em > )了一个迭代器,而< code > collect< / code > < strong > 消费< / strong > ( < em > consumes< / em > )了一个迭代器。这是有意为之的。单独的迭代器并不会做任何工作;他们是惰性的。也就是说,像列表 13-5 的代码但是不调用< code > collect< / code > 的话:< / p >
< pre > < code class = "language-rust" > let v1: Vec< i32> = vec![1, 2, 3];
v1.iter().map(|x| x + 1); // without collect
< / code > < / pre >
< p > 这可以编译,不过会给出一个警告:< / p >
< pre > < code > warning: unused result which must be used: iterator adaptors are lazy and do
nothing unless consumed, #[warn(unused_must_use)] on by default
--> src/main.rs:4:1
|
4 | v1.iter().map(|x| x + 1); // without collect
| ^^^^^^^^^^^^^^^^^^^^^^^^^
< / code > < / pre >
< p > 这个警告是因为迭代器适配器实际上并不自己进行处理。他们需要一些其他方法来触发迭代器链的计算。我们称之为< strong > 消费迭代器< / strong > ( < em > consuming adaptors< / em > ),而< code > collect< / code > 就是其中之一。< / p >
< p > 那么如何知道迭代器方法是否消费了迭代器呢?还有哪些适配器是可用的呢?为此,让我们看看< code > Iterator< / code > trait。< / p >
< a class = "header" href = "#iterator-trait" name = "iterator-trait" > < h3 > < code > Iterator< / code > trait< / h3 > < / a >
< p > 迭代器都实现了一个标准库中叫做< code > Iterator< / code > 的 trait。其定义看起来像这样: < / p >
< pre > < code class = "language-rust" > trait Iterator {
type Item;
fn next(& mut self) -> Option< Self::Item> ;
}
< / code > < / pre >
< p > 这里有一些还未讲到的新语法:< code > type Item< / code > 和< code > Self::Item< / code > 定义了这个 trait 的< strong > 关联类型< / strong > ( < em > associated type< / em > ) , 第XX章会讲到关联类型。现在所有你需要知道就是这些代码表示< code > Iterator< / code > trait 要求你也定义一个< code > Item< / code > 类型,而这个< code > Item< / code > 类型用作< code > next< / code > 方法的返回值。换句话说,< code > Item< / code > 类型将是迭代器返回的元素的类型。< / p >
< p > 让我们使用< code > Iterator< / code > trait 来创建一个从一数到五的迭代器< code > Counter< / code > 。首先,需要创建一个结构体来存放迭代器的当前状态,它有一个< code > u32< / code > 的字段< code > count< / code > 。我们也定义了一个< code > new< / code > 方法,当然这并不是必须的。因为我们希望< code > Counter< / code > 能从一数到五,所以它总是从零开始:< / p >
< pre > < code class = "language-rust" > struct Counter {
count: u32,
}
impl Counter {
fn new() -> Counter {
Counter { count: 0 }
}
}
< / code > < / pre >
< p > 接下来,我们将通过定义< code > next< / code > 方法来为< code > Counter< / code > 类型实现< code > Iterator< / code > trait。我们希望迭代器的工作方式是对当前状态加一( 这就是为什么将< code > count< / code > 初始化为零,这样迭代器首先就会返回一)。如果< code > count< / code > 仍然小于六,将返回当前状态,不过如果< code > count< / code > 大于等于六,迭代器将返回< code > None< / code > ,如列表 13-6 所示:< / p >
< pre > < code class = "language-rust" > # struct Counter {
# count: u32,
# }
#
impl Iterator for Counter {
// Our iterator will produce u32s
type Item = u32;
fn next(& mut self) -> Option< Self::Item> {
// increment our count. This is why we started at zero.
self.count += 1;
// check to see if we've finished counting or not.
if self.count < 6 {
Some(self.count)
} else {
None
}
}
}
< / code > < / pre >
< p > < span class = "caption" > Listing 13-6: Implementing the < code > Iterator< / code > trait on our
< code > Counter< / code > struct< / span > < / p >
<!-- I will add wingdings in libreoffice /Carol -->
< p > < code > type Item = u32< / code > 这一行表明迭代器中< code > Item< / code > 的关联类型将是< code > u32< / code > 。同样无需担心关联类型, 因为第XX章会涉及他们。< / p >
< p > < code > next< / code > 方法是迭代器的主要接口,它返回一个< code > Option< / code > 。如果它是< code > Some(value)< / code > ,相当于可以迭代器中获取另一个值。如果它是< code > None< / code > ,迭代器就结束了。在< code > next< / code > 方法中可以进行任何迭代器需要的计算。在这个例子中,我们对当前状态加一,接着检查其是否仍然小于六。如果是,返回< code > Some(self.count)< / code > 来产生下一个值。如果大于等于六,迭代结束并返回< code > None< / code > 。< / p >
< p > 迭代器 trait 指定当其返回< code > None< / code > ,就代表迭代结束。该 trait 并不强制任何在< code > next< / code > 方法返回< code > None< / code > 后再次调用时必须有的行为。在这个情况下,在第一次返回< code > None< / code > 后每一次调用< code > next< / code > 仍然返回< code > None< / code > ,不过其内部< code > count< / code > 字段会依次增长到< code > u32< / code > 的最大值,接着< code > count< / code > 会溢出(在调试模式会< code > panic!< / code > 而在发布模式则会折叠从最小值开始)。< / p >
< / div >
< / div >