新增对()类型的补充解释

pull/275/head
sunface 3 years ago
parent ce8283faaa
commit 8f36ae2869

@ -85,7 +85,7 @@
- [async/await异步编程 doing](async/intro.md) - [async/await异步编程 doing](async/intro.md)
- [async编程入门](async/getting-started.md) - [async编程入门](async/getting-started.md)
- [底层探秘: Future执行与任务调度](async/future-excuting.md) - [底层探秘: Future执行与任务调度](async/future-excuting.md)
- [定海神针Pin和Unpin todo](async/pin-unpin.md) - [定海神针Pin和Unpin](async/pin-unpin.md)
- [async/await 和 Stream todo](async/async-await.md) - [async/await 和 Stream todo](async/async-await.md)
- [一些棘手问题的解决 todo](async/hassles.md) - [一些棘手问题的解决 todo](async/hassles.md)
- [HTTP Client/Server todo](async/http.md) - [HTTP Client/Server todo](async/http.md)

@ -202,7 +202,7 @@ hello, world!, 0x16f3#aec70
上面的`unsafe`虽然简单好用,但是它不太安全,是否还有其他选择?还真的有,那就是`Pin`。 上面的`unsafe`虽然简单好用,但是它不太安全,是否还有其他选择?还真的有,那就是`Pin`。
## 无法被移动的Pin ## 无法被移动的Pin
Pin在后续章节会深入讲解目前你只需要知道它可以固定住一个值防止该值的所有权被转移 Pin在后续章节会深入讲解目前你只需要知道它可以固定住一个值防止该值在内存中被移动
通过开头我们知道自引用最麻烦的就是创建引用的同时值的所有权会被转移而通过Pin就可以很好的防止这一点: 通过开头我们知道自引用最麻烦的就是创建引用的同时值的所有权会被转移而通过Pin就可以很好的防止这一点:
```rust ```rust
@ -343,6 +343,9 @@ fn main() {
> rental虽然不怎么维护但是可能依然是这三个里面最强大的而且网上的用例也比较多容易找到参考代码 > rental虽然不怎么维护但是可能依然是这三个里面最强大的而且网上的用例也比较多容易找到参考代码
## Rc+RefCell或Arc+Mutex
类似于循环引用的解决方式,自引用也可以用这种组合来解决,但是会导致代码的类型标识到处都是,大大的影响了可读性。
## 终极大法 ## 终极大法
如果两个放在一起会报错,那就分开它们。对,终极大法就这么简单,当然思路上的简单不代表实现上的简单,最终结果就是导致代码复杂度的上升。 如果两个放在一起会报错,那就分开它们。对,终极大法就这么简单,当然思路上的简单不代表实现上的简单,最终结果就是导致代码复杂度的上升。

@ -1,3 +1,204 @@
# Pin、Unpin(todo) # 定海神针Pin和Unpin
在Rust异步编程中有一个定海神针般的存在它就是`Pin`作用说简单也简单说复杂也非常复杂当初刚出来时就连一些Rust大佬都一头雾水何况瑟瑟发抖的我。好在今非昔比目前网上的资料已经很全因此我借花献佛给大家好好讲讲这个`Pin`。
https://doc.rust-lang.org/std/pin/index.html#example-intrusive-doubly-linked-list 在Rust中所有的类型可以分为两类:
- **类型的值可以在内存中安全地被移动**,例如数值、字符串、布尔值、结构体、枚举,总之你能想到的几乎所有类型都可以落入到此范畴内
- **自引用类型**,大魔王来了,大家快跑,在之前章节我们已经见识过它的厉害,下面来看看自引用类型的一种简单解决方法:
```rust
struct SelfRef {
value: String,
pointer_to_value: *mut String,
}
```
在上面的结构体中,`pointer_to_value`是一个原生指针,指向第一个字段`value`持有的字符串`String`。很简单对吧?现在考虑一个情况,若`String`被移动了怎么办?
此时一个致命的问题就出现了:新的字符串的内存地址变了,而`pointer_to_value`依然指向之前的地址一个重大bug就出现了
原生指针是`unsafe`的因此遇到这种问题也在情理之中谁让我们不用Rust提供的安全引用类型呢。但是既然已经用了抱怨也没用那么有没有办法解决这个问题
答案就是使用`Pin`,它可以防止一个类型在内存中被移动。再来回忆下之前在`Futuer`章节中,我们提到过在`poll`方法的签名中有一个`self: Pin<&mut Self>`,那么为何要在这里使用`Pin`呢?
## 为何需要Pin
其实`Pin`还有一个小伙伴`UnPin`,与前者相反,后者表示类型可以在内存中安全地移动。在深入之前,我们先来回忆下`async/.await`是如何工作的:
```rust
let fut_one = /* ... */; // Future 1
let fut_two = /* ... */; // Future 2
async move {
fut_one.await;
fut_two.await;
}
```
在底层,`async`会创建一个实现了`Future`的匿名类型,并提供了一个`poll`方法:
```rust
// `async { ... }`语句块创建的`Future`类型
struct AsyncFuture {
fut_one: FutOne,
fut_two: FutTwo,
state: State,
}
// `async`语句块可能处于的状态
enum State {
AwaitingFutOne,
AwaitingFutTwo,
Done,
}
impl Future for AsyncFuture {
type Output = ();
fn poll(mut self: Pin<&mut Self>, cx: &mut Context<'_>) -> Poll<()> {
loop {
match self.state {
State::AwaitingFutOne => match self.fut_one.poll(..) {
Poll::Ready(()) => self.state = State::AwaitingFutTwo,
Poll::Pending => return Poll::Pending,
}
State::AwaitingFutTwo => match self.fut_two.poll(..) {
Poll::Ready(()) => self.state = State::Done,
Poll::Pending => return Poll::Pending,
}
State::Done => return Poll::Ready(()),
}
}
}
}
```
当`poll`第一次被调用时,它会去查询`fut_one`的状态,若`fut_one`无法完成,则`poll`方法会返回。未来对`poll`的调用将从上一次调用结束的地方开始。该过程会一直持续,直到`Future`完成为止。
然而,如果我们的`async`语句块中使用了引用类型,会发生什么?例如下面例子:
```rust
async {
let mut x = [0; 128];
let read_into_buf_fut = read_into_buf(&mut x);
read_into_buf_fut.await;
println!("{:?}", x);
}
```
这段代码会编译成下面的形式:
```rust
struct ReadIntoBuf<'a> {
buf: &'a mut [u8], // 指向下面的`x`字段
}
struct AsyncFuture {
x: [u8; 128],
read_into_buf_fut: ReadIntoBuf<'what_lifetime?>,
}
```
这里,`ReadIntoBuf`拥有一个引用字段,指向了结构体的另一个字段`x`,一旦`AsyncFuture`被移动,那`x`的地址也将随之变化,此时对`x`的引用就变成了不合法的,也就是`read_into_buf_fut.buf`会变为不合法的。
若能将`Future`在内存中固定到一个位置,就可以避免这种问题的发生,也就可以安全的创建上面这种引用类型。
## 深入理解Pin
对于上面的问题我们可以简单的归结为如何在Rust中处理自引用类型(果然,只要是难点,都和自引用脱离不了关系),下面用一个稍微简单点的例子来理解下`Pin`:
```rust
#[derive(Debug)]
struct Test {
a: String,
b: *const String,
}
impl Test {
fn new(txt: &str) -> Self {
Test {
a: String::from(txt),
b: std::ptr::null(),
}
}
fn init(&mut self) {
let self_ref: *const String = &self.a;
self.b = self_ref;
}
fn a(&self) -> &str {
&self.a
}
fn b(&self) -> &String {
assert!(!self.b.is_null(), "Test::b called without Test::init being called first");
unsafe { &*(self.b) }
}
}
```
`Test`提供了方法用于获取字段`a`和`b`的值的引用。`b`是`a`的一个引用但是我们并没有使用引用类型而是用了原生指针原因是Rust的借用规则不允许我们这样用不符合生命周期的要求。此时的`Test`就是一个自引用结构体。
如果不移动任何值,那么上面的例子将没有任何问题,例如:
```rust
fn main() {
let mut test1 = Test::new("test1");
test1.init();
let mut test2 = Test::new("test2");
test2.init();
println!("a: {}, b: {}", test1.a(), test1.b());
println!("a: {}, b: {}", test2.a(), test2.b());
}
```
输出非常正常:
```console
a: test1, b: test1
a: test2, b: test2
```
明知上有虎,偏向虎山行,这才是我辈年轻人的风华。既然移动数据会导致指针不合法,那我们就移动下数据试试,将`test`和`test2`进行下交换:
```rust
fn main() {
let mut test1 = Test::new("test1");
test1.init();
let mut test2 = Test::new("test2");
test2.init();
println!("a: {}, b: {}", test1.a(), test1.b());
std::mem::swap(&mut test1, &mut test2);
println!("a: {}, b: {}", test2.a(), test2.b());
}
```
按理来说,这样修改后,输出应该如下:
```rust
a: test1, b: test1
a: test1, b: test1
```
但是实际运行后,却产生了下面的输出:
```rust
a: test1, b: test1
a: test1, b: test2
```
原因是`test2.b`指针依然指向了旧的地址,而该地址现在在`test1`里。因此会打印出意料之外的值。
如果大家还是将信将疑,那再看看下面的代码:
```rust
fn main() {
let mut test1 = Test::new("test1");
test1.init();
let mut test2 = Test::new("test2");
test2.init();
println!("a: {}, b: {}", test1.a(), test1.b());
std::mem::swap(&mut test1, &mut test2);
test1.a = "I've totally changed now!".to_string();
println!("a: {}, b: {}", test2.a(), test2.b());
}
```
下面的图片也可以帮助更好的理解这个过程:
<img alt="" src="/img/async-02.jpg" class="center" />
## Pin在实践中的运用

@ -16,7 +16,7 @@ fn main() {
} }
``` ```
如果大家从部分陈旧的语言可能会大喊一声这XX叫字符是的在Rust语言中这些都是字符Rust的字符不仅仅是`ASCII`,所有的`Unicode`值都可以作为Rust字符包括单个的中文、日文、韩文、emoji表情符号等等都是合法的字符类型。`Unicode` 值的范围从 `U+0000~U+D7FF``U+E000~U+10FFFF`。不过“字符”并不是 `Unicode` 中的一个概念,所以人在直觉上对“字符”的理解和 Rust 的字符概念并不一致。 如果大家是从有年代感的编程语言过可能会大喊一声这XX叫字符是的在Rust语言中这些都是字符Rust的字符不仅仅是`ASCII`,所有的`Unicode`值都可以作为Rust字符包括单个的中文、日文、韩文、emoji表情符号等等都是合法的字符类型。`Unicode` 值的范围从 `U+0000~U+D7FF``U+E000~U+10FFFF`。不过“字符”并不是 `Unicode` 中的一个概念,所以人在直觉上对“字符”的理解和 Rust 的字符概念并不一致。
由于`Unicode`都是4个字节编码因此字符类型也是占用4个字节 由于`Unicode`都是4个字节编码因此字符类型也是占用4个字节
```rust ```rust
@ -65,3 +65,4 @@ fn main() {
例如常见的`println!()`的返回值也是元类型`()`。 例如常见的`println!()`的返回值也是元类型`()`。
再比如,你可以用`()`作为`map`的值,表示我们不关注具体的值,只关注`key`。 这种用法和Go语言的`struct{}`类似,可以作为一个值用来占位,但是完全不占用任何内存。

Binary file not shown.

After

Width:  |  Height:  |  Size: 165 KiB

Loading…
Cancel
Save