|
|
|
|
## 共享状态并发
|
|
|
|
|
|
|
|
|
|
> [ch16-03-shared-state.md](https://github.com/rust-lang/book/blob/master/second-edition/src/ch16-03-shared-state.md)
|
|
|
|
|
> <br>
|
|
|
|
|
> commit 9df612e93e038b05fc959db393c15a5402033f47
|
|
|
|
|
|
|
|
|
|
虽然消息传递是一个很好的处理并发的方式,但并不是唯一的一个。再次考虑一下它的口号:
|
|
|
|
|
|
|
|
|
|
> Do not communicate by sharing memory; instead, share memory by
|
|
|
|
|
> communicating.
|
|
|
|
|
>
|
|
|
|
|
> 不要共享内存来通讯;而是要通讯来共享内存。
|
|
|
|
|
|
|
|
|
|
那么“共享内存来通讯”是怎样的呢?共享内存并发有点像多所有权:多个线程可以同时访问相同的内存位置。第十五章介绍了智能指针如何使得多所有权成为可能,然而这会增加额外的复杂性,因为需要以某种方式管理这些不同的所有者。
|
|
|
|
|
|
|
|
|
|
不过 Rust 的类型系统和所有权可以很好的帮助我们,正确的管理它们。以共享内存中更常见的并发原语:互斥器(mutexes)为例,让我们看看具体的情况。
|
|
|
|
|
|
|
|
|
|
### 互斥器一次只允许一个线程访问数据
|
|
|
|
|
|
|
|
|
|
**互斥器**(*mutex*)是一种用于共享内存的并发原语。它是“mutual exclusion”的缩写,也就是说,任意时间,它只允许一个线程访问某些数据。互斥器以难以使用著称,因为你不得不记住:
|
|
|
|
|
|
|
|
|
|
1. 在使用数据之前尝试获取锁。
|
|
|
|
|
2. 处理完被互斥器所保护的数据之后,必须解锁数据,这样其他线程才能够获取锁。
|
|
|
|
|
|
|
|
|
|
现实中也有互斥器的例子,想象一下在一个会议中,只有一个麦克风。如果一个成员要发言,他必须请求使用麦克风。一旦得到了麦克风,他可以畅所欲言,然后将麦克风交给下一个希望讲话的成员。如果成员在没有麦克风的时候就开始叫喊,或者在其他成员发言结束之前就拿走麦克风,是很不合适的。如果这个共享的麦克风因为此类原因而出现问题,会议将无法正常进行。
|
|
|
|
|
|
|
|
|
|
正确的管理互斥器异常复杂,这也是许多人之所以热衷于通道的原因。然而,在 Rust 中,得益于类型系统和所有权,我们不会在锁和解锁上出错。
|
|
|
|
|
|
|
|
|
|
### `Mutex<T>`的 API
|
|
|
|
|
|
|
|
|
|
让我们看看示例 16-12 中使用互斥器的例子,现在不涉及多线程:
|
|
|
|
|
|
|
|
|
|
<span class="filename">文件名: src/main.rs</span>
|
|
|
|
|
|
|
|
|
|
```rust
|
|
|
|
|
use std::sync::Mutex;
|
|
|
|
|
|
|
|
|
|
fn main() {
|
|
|
|
|
let m = Mutex::new(5);
|
|
|
|
|
|
|
|
|
|
{
|
|
|
|
|
let mut num = m.lock().unwrap();
|
|
|
|
|
*num = 6;
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
println!("m = {:?}", m);
|
|
|
|
|
}
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
<span class="caption">示例 16-12: 为简单,在一个单线程中探索 `Mutex<T>` 的 API</span>
|
|
|
|
|
|
|
|
|
|
像很多类型一样,我们使用关联函数 `new` 来创建一个 `Mutex<T>`。使用`lock`方法获取锁,以访问互斥器中的数据。这个调用会阻塞,直到我们拥有锁为止。如果另一个线程拥有锁,并且那个线程 panic 了,则这个调用会失败。类似于示例 16-6 那样,我们暂时使用 `unwrap()` 进行错误处理,或者使用第九章中提及的更好的工具。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
一旦获取了锁,就可以将返回值(在这里是`num`)作为一个数据的可变引用使用了。观察 Rust 类型系统如何保证使用值之前必须获取锁:`Mutex<i32>`并不是一个`i32`,所以**必须**获取锁才能使用这个`i32`值。我们是不会忘记这么做的,因为类型系统不允许。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
你也许会怀疑,`Mutex<T>`是一个智能指针?是的!更准确的说,`lock`调用返回一个叫做`MutexGuard`的智能指针。类似我们在第十五章见过的智能指针,它实现了`Deref`来指向其内部数据。另外`MutexGuard`有一个用来释放锁的`Drop`实现。这样就不会忘记释放锁了。这在`MutexGuard`离开作用域时会自动发生,例如它发生于示例 16-12 中内部作用域的结尾。接着可以打印出互斥器的值并发现能够将其内部的`i32`改为 6。
|
|
|
|
|
|
|
|
|
|
#### 在线程间共享`Mutex<T>`
|
|
|
|
|
|
|
|
|
|
现在让我们尝试使用`Mutex<T>`在多个线程间共享值。我们将启动十个线程,并在各个线程中对同一个计数器值加一,这样计数器将从 0 变为 10。注意,接下来的几个例子会出现编译错误,而我们将通过这些错误来学习如何使用
|
|
|
|
|
`Mutex<T>`,以及 Rust 又是如何辅助我们以确保正确。示例 16-13 是最开始的例子:
|
|
|
|
|
|
|
|
|
|
<span class="filename">文件名: src/main.rs</span>
|
|
|
|
|
|
|
|
|
|
```rust,ignore
|
|
|
|
|
use std::sync::Mutex;
|
|
|
|
|
use std::thread;
|
|
|
|
|
|
|
|
|
|
fn main() {
|
|
|
|
|
let counter = Mutex::new(0);
|
|
|
|
|
let mut handles = vec![];
|
|
|
|
|
|
|
|
|
|
for _ in 0..10 {
|
|
|
|
|
let handle = thread::spawn(|| {
|
|
|
|
|
let mut num = counter.lock().unwrap();
|
|
|
|
|
|
|
|
|
|
*num += 1;
|
|
|
|
|
});
|
|
|
|
|
handles.push(handle);
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
for handle in handles {
|
|
|
|
|
handle.join().unwrap();
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
println!("Result: {}", *counter.lock().unwrap());
|
|
|
|
|
}
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
<span class="caption">示例 16-13: 程序启动了 10 个线程,每个线程都通过 `Mutex<T>` 来增加计数器的值</span>
|
|
|
|
|
|
|
|
|
|
这里创建了一个 `counter` 变量来存放内含 `i32` 的 `Mutex<T>`,类似示例 16-12 那样。接下来使用 range 创建了 10 个线程。使用了 `thread::spawn` 并对所有线程使用了相同的闭包:他们每一个都将调用 `lock` 方法来获取 `Mutex<T>` 上的锁,接着将互斥器中的值加一。当一个线程结束执行,`num` 会离开闭包作用域并释放锁,这样另一个线程就可以获取它了。
|
|
|
|
|
|
|
|
|
|
在主线程中,我们像示例 16-2 那样收集了所有的 join 句柄,调用它们的 `join` 方法来确保所有线程都会结束。之后,主线程会获取锁并打印出程序的结果。
|
|
|
|
|
|
|
|
|
|
之前提示过这个例子不能编译,让我们看看为什么!
|
|
|
|
|
|
|
|
|
|
```
|
|
|
|
|
error[E0373]: closure may outlive the current function, but it borrows
|
|
|
|
|
`counter`, which is owned by the current function
|
|
|
|
|
-->
|
|
|
|
|
|
|
|
|
|
|
9 | let handle = thread::spawn(|| {
|
|
|
|
|
| ^^ may outlive borrowed value `counter`
|
|
|
|
|
10 | let mut num = counter.lock().unwrap();
|
|
|
|
|
| ------- `counter` is borrowed here
|
|
|
|
|
|
|
|
|
|
|
help: to force the closure to take ownership of `counter` (and any other
|
|
|
|
|
referenced variables), use the `move` keyword, as shown:
|
|
|
|
|
| let handle = thread::spawn(move || {
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
这类似于示例 16-5 中解决了的问题。考虑到启动了多个线程,Rust 无法知道这些线程会运行多久,而在每一个线程尝试借用 `counter` 时它是否仍然有效。帮助信息提醒了我们如何解决它:可以使用 `move` 来给予每个线程其所有权。尝试在闭包上做一点改动:
|
|
|
|
|
|
|
|
|
|
```rust,ignore
|
|
|
|
|
thread::spawn(move || {
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
再次编译。这回出现了一个不同的错误!
|
|
|
|
|
|
|
|
|
|
```
|
|
|
|
|
error[E0382]: capture of moved value: `counter`
|
|
|
|
|
-->
|
|
|
|
|
|
|
|
|
|
|
9 | let handle = thread::spawn(move || {
|
|
|
|
|
| ------- value moved (into closure) here
|
|
|
|
|
10 | let mut num = counter.lock().unwrap();
|
|
|
|
|
| ^^^^^^^ value captured here after move
|
|
|
|
|
|
|
|
|
|
|
= note: move occurs because `counter` has type `std::sync::Mutex<i32>`,
|
|
|
|
|
which does not implement the `Copy` trait
|
|
|
|
|
|
|
|
|
|
error[E0382]: use of moved value: `counter`
|
|
|
|
|
-->
|
|
|
|
|
|
|
|
|
|
|
9 | let handle = thread::spawn(move || {
|
|
|
|
|
| ------- value moved (into closure) here
|
|
|
|
|
...
|
|
|
|
|
21 | println!("Result: {}", *counter.lock().unwrap());
|
|
|
|
|
| ^^^^^^^ value used here after move
|
|
|
|
|
|
|
|
|
|
|
= note: move occurs because `counter` has type `std::sync::Mutex<i32>`,
|
|
|
|
|
which does not implement the `Copy` trait
|
|
|
|
|
|
|
|
|
|
error: aborting due to 2 previous errors
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
`move` 并没有像示例 16-5 中那样解决问题。为什么呢?错误信息有点难懂,因为它表明 `counter` 被移动进了闭包,接着它在调用 `lock` 时被捕获。这似乎是我们希望的,然而不被允许。
|
|
|
|
|
|
|
|
|
|
让我们推理一下。这次不再使用 `for` 循环创建 10 个线程,只创建两个线程,看看会发生什么。将示例 16-13 中第一个`for`循环替换为如下代码:
|
|
|
|
|
|
|
|
|
|
```rust,ignore
|
|
|
|
|
let handle = thread::spawn(move || {
|
|
|
|
|
let mut num = counter.lock().unwrap();
|
|
|
|
|
|
|
|
|
|
*num += 1;
|
|
|
|
|
});
|
|
|
|
|
handles.push(handle);
|
|
|
|
|
|
|
|
|
|
let handle2 = thread::spawn(move || {
|
|
|
|
|
let mut num2 = counter.lock().unwrap();
|
|
|
|
|
|
|
|
|
|
*num2 += 1;
|
|
|
|
|
});
|
|
|
|
|
handles.push(handle2);
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
这里创建了两个线程,并将第二个线程所用的变量改名为 `handle2` 和 `num2`。我们简化了例子,看是否能理解错误信息。此次编译给出如下信息:
|
|
|
|
|
|
|
|
|
|
```text
|
|
|
|
|
error[E0382]: capture of moved value: `counter`
|
|
|
|
|
-->
|
|
|
|
|
|
|
|
|
|
|
8 | let handle = thread::spawn(move || {
|
|
|
|
|
| ------- value moved (into closure) here
|
|
|
|
|
...
|
|
|
|
|
16 | let mut num = counter.lock().unwrap();
|
|
|
|
|
| ^^^^^^^ value captured here after move
|
|
|
|
|
|
|
|
|
|
|
= note: move occurs because `counter` has type `std::sync::Mutex<i32>`,
|
|
|
|
|
which does not implement the `Copy` trait
|
|
|
|
|
|
|
|
|
|
error[E0382]: use of moved value: `counter`
|
|
|
|
|
-->
|
|
|
|
|
|
|
|
|
|
|
8 | let handle = thread::spawn(move || {
|
|
|
|
|
| ------- value moved (into closure) here
|
|
|
|
|
...
|
|
|
|
|
26 | println!("Result: {}", *counter.lock().unwrap());
|
|
|
|
|
| ^^^^^^^ value used here after move
|
|
|
|
|
|
|
|
|
|
|
= note: move occurs because `counter` has type `std::sync::Mutex<i32>`,
|
|
|
|
|
which does not implement the `Copy` trait
|
|
|
|
|
|
|
|
|
|
error: aborting due to 2 previous errors
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
啊哈!第一个错误信息中说,`counter` 被移动进了 `handle` 所代表线程的闭包中。因此我们无法在第二个线程中对其调用 `lock`,并将结果储存在 `num2` 中时捕获`counter`!所以 Rust 告诉我们不能将 `counter` 的所有权移动到多个线程中。这在之前很难看出,因为我们在循环中创建了多个线程,而 Rust 无法在每次迭代中指明不同的线程(没有临时变量 `num2`)。
|
|
|
|
|
|
|
|
|
|
#### 多线程和多所有权
|
|
|
|
|
|
|
|
|
|
在第十五章中,我们通过使用智能指针 `Rc<T>` 来创建引用计数的值,以便拥有多所有权。同时第十五章提到了 `Rc<T>` 只能在单线程环境中使用,不过还是在这里试用 `Rc<T>` 看看会发生什么。示例 16-14 将 `Mutex<T>` 装进了 `Rc<T>` 中,并在移入线程之前克隆了 `Rc<T>`。再用循环来创建线程,保留闭包中的 `move` 关键字:
|
|
|
|
|
|
|
|
|
|
<span class="filename">文件名: src/main.rs</span>
|
|
|
|
|
|
|
|
|
|
```rust
|
|
|
|
|
use std::rc::Rc;
|
|
|
|
|
use std::sync::Mutex;
|
|
|
|
|
use std::thread;
|
|
|
|
|
|
|
|
|
|
fn main() {
|
|
|
|
|
let counter = Rc::new(Mutex::new(0));
|
|
|
|
|
let mut handles = vec![];
|
|
|
|
|
|
|
|
|
|
for _ in 0..10 {
|
|
|
|
|
let counter = counter.clone();
|
|
|
|
|
let handle = thread::spawn(move || {
|
|
|
|
|
let mut num = counter.lock().unwrap();
|
|
|
|
|
|
|
|
|
|
*num += 1;
|
|
|
|
|
});
|
|
|
|
|
handles.push(handle);
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
for handle in handles {
|
|
|
|
|
handle.join().unwrap();
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
println!("Result: {}", *counter.lock().unwrap());
|
|
|
|
|
}
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
<span class="caption">示例 16-14: 尝试使用 `Rc<T>` 来允许多个线程拥有 `Mutex<T>`</span>
|
|
|
|
|
|
|
|
|
|
再一次编译并...出现了不同的错误!编译器真是教会了我们很多!
|
|
|
|
|
|
|
|
|
|
```
|
|
|
|
|
error[E0277]: the trait bound `std::rc::Rc<std::sync::Mutex<i32>>:
|
|
|
|
|
std::marker::Send` is not satisfied
|
|
|
|
|
-->
|
|
|
|
|
|
|
|
|
|
|
11 | let handle = thread::spawn(move || {
|
|
|
|
|
| ^^^^^^^^^^^^^ the trait `std::marker::Send` is not
|
|
|
|
|
implemented for `std::rc::Rc<std::sync::Mutex<i32>>`
|
|
|
|
|
|
|
|
|
|
|
= note: `std::rc::Rc<std::sync::Mutex<i32>>` cannot be sent between threads
|
|
|
|
|
safely
|
|
|
|
|
= note: required because it appears within the type
|
|
|
|
|
`[closure@src/main.rs:11:36: 15:10
|
|
|
|
|
counter:std::rc::Rc<std::sync::Mutex<i32>>]`
|
|
|
|
|
= note: required by `std::thread::spawn`
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
哇哦,太长不看!说重点:第一个提示表明 `Rc<Mutex<i32>>` 不能安全的在线程间传递。理由也在错误信息中,“不满足 `Send` trait bound”(`the trait bound Send is not satisfied`)。下一部分将会讨论 `Send`,它是确保许多用在多线程中的类型,能够适合并发环境的 trait 之一。
|
|
|
|
|
|
|
|
|
|
不幸的是,`Rc<T>` 并不能安全的在线程间共享。当 `Rc<T>` 管理引用计数时,它必须在每一个 `clone` 调用时增加计数,并在每一个克隆被丢弃时减少计数。`Rc<T>` 并没有使用任何并发原语,来确保改变计数的操作不会被其他线程打断。在计数出错时可能会导致诡异的 bug,比如可能会造成内存泄漏,或在使用结束之前就丢弃一个值。如果有一个类型与 `Rc<T>` 相似,又以一种线程安全的方式改变引用计数,会怎么样呢?
|
|
|
|
|
|
|
|
|
|
#### 原子引用计数 `Arc<T>`
|
|
|
|
|
|
|
|
|
|
答案是肯定的,确实有一个类似`Rc<T>`并可以安全的用于并发环境的类型:`Arc<T>`。字母“a”代表**原子性**(*atomic*),所以这是一个**原子引用计数**(*atomically reference counted*)类型。原子性是另一类这里还未涉及到的并发原语;请查看标准库中`std::sync::atomic`的文档来获取更多细节。其中的要点就是:原子性类型工作起来类似原始类型,不过可以安全的在线程间共享。
|
|
|
|
|
|
|
|
|
|
为什么不是所有的原始类型都是原子性的?为什么不是所有标准库中的类型都默认使用`Arc<T>`实现?线程安全带来性能惩罚,我们希望只在必要时才为此买单。如果只是在单线程中对值进行操作,原子性提供的保证并无必要,代码可以因此运行的更快。
|
|
|
|
|
|
|
|
|
|
回到之前的例子:`Arc<T>`和`Rc<T>`除了`Arc<T>`内部的原子性之外没有区别。其 API 也相同,所以可以修改`use`行和`new`调用。示例 16-15 中的代码最终可以编译和运行:
|
|
|
|
|
|
|
|
|
|
<span class="filename">文件名: src/main.rs</span>
|
|
|
|
|
|
|
|
|
|
```rust
|
|
|
|
|
use std::sync::{Mutex, Arc};
|
|
|
|
|
use std::thread;
|
|
|
|
|
|
|
|
|
|
fn main() {
|
|
|
|
|
let counter = Arc::new(Mutex::new(0));
|
|
|
|
|
let mut handles = vec![];
|
|
|
|
|
|
|
|
|
|
for _ in 0..10 {
|
|
|
|
|
let counter = counter.clone();
|
|
|
|
|
let handle = thread::spawn(move || {
|
|
|
|
|
let mut num = counter.lock().unwrap();
|
|
|
|
|
|
|
|
|
|
*num += 1;
|
|
|
|
|
});
|
|
|
|
|
handles.push(handle);
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
for handle in handles {
|
|
|
|
|
handle.join().unwrap();
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
println!("Result: {}", *counter.lock().unwrap());
|
|
|
|
|
}
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
<span class="caption">示例 16-15: 使用 `Arc<T>` 包装一个 `Mutex<T>` 能够实现在多线程之间共享所有权</span>
|
|
|
|
|
|
|
|
|
|
这会打印出:
|
|
|
|
|
|
|
|
|
|
```
|
|
|
|
|
Result: 10
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
成功了!我们从 0 数到了 10,这可能并不是很显眼,不过一路上我们学习了很多关于`Mutex<T>`和线程安全的内容!这个例子中构建的结构可以用于比增加计数更为复杂的操作。能够被分解为独立部分的计算可以像这样被分散到多个线程中,并可以使用`Mutex<T>`来允许每个线程在他们自己的部分更新最终的结果。
|
|
|
|
|
|
|
|
|
|
你可能注意到了,因为`counter`是不可变的,不过可以获取其内部值的可变引用,这意味着`Mutex<T>`提供了内部可变性,就像`Cell`系列类型那样。正如第十五章中使用`RefCell<T>`可以改变`Rc<T>`中的内容那样,同样的可以使用`Mutex<T>`来改变`Arc<T>`中的内容。
|
|
|
|
|
|
|
|
|
|
回忆一下`Rc<T>`并没有避免所有可能的问题:我们也讨论了当两个`Rc<T>`相互引用时的引用循环的可能性,这可能造成内存泄露。`Mutex<T>`有一个类似的 Rust 同样也不能避免的问题:死锁。**死锁**(*deadlock*)是一个场景中操作需要锁定两个资源,而两个线程分别拥有一个锁并永远相互等待的问题。如果你对这个主题感兴趣,尝试编写一个带有死锁的 Rust 程序,接着研究任何其他语言中使用互斥器的死锁规避策略并尝试在 Rust 中实现他们。标准库中`Mutex<T>`和`MutexGuard`的 API 文档会提供有用的信息。
|
|
|
|
|
|
|
|
|
|
Rust 的类型系统和所有权规则,确保了线程在更新共享值时拥有独占的访问权限,所以线程不会以不可预测的方式覆盖彼此的操作。虽然为了使一切正确运行而在编译器上花了一些时间,但是我们节省了未来的时间,尤其是线程以特定顺序执行才会出现的诡异错误难以重现。
|
|
|
|
|
|
|
|
|
|
接下来,为了丰富本章的内容,让我们讨论一下`Send`和`Sync` trait 以及如何对自定义类型使用他们。
|