Update: unified format

pull/485/head
Allan Downey 3 years ago
parent e67790e976
commit 2c47b2db70

@ -95,7 +95,7 @@ fatal runtime error: stack overflow
以上的代码可能并不会造成什么大的问题,但是在一个更加复杂的程序中,类似的问题可能会造成你的程序不断地分配内存、泄漏内存,最终程序会不幸**OOM**,当然这其中的 CPU 损耗也不可小觑。 以上的代码可能并不会造成什么大的问题,但是在一个更加复杂的程序中,类似的问题可能会造成你的程序不断地分配内存、泄漏内存,最终程序会不幸**OOM**,当然这其中的 CPU 损耗也不可小觑。
总之,创建引用并不简单,但是也并不是完全遇不到,当你使用`RefCell<Rc<T>>`或者类似的类型嵌套组合(具备内部可变性和引用计数)时,就要打起万分精神,前面可能是深渊! 总之,创建引用并不简单,但是也并不是完全遇不到,当你使用 `RefCell<Rc<T>>` 或者类似的类型嵌套组合(具备内部可变性和引用计数)时,就要打起万分精神,前面可能是深渊!
那么问题来了? 如果我们确实需要实现上面的功能,该怎么办?答案是使用 `Weak` 那么问题来了? 如果我们确实需要实现上面的功能,该怎么办?答案是使用 `Weak`
@ -114,8 +114,8 @@ fatal runtime error: stack overflow
| 不计数 | 引用计数 | | 不计数 | 引用计数 |
| 不拥有所有权 | 拥有值的所有权 | | 不拥有所有权 | 拥有值的所有权 |
| 不阻止值被释放(drop) | 所有权计数归零,才能 drop | | 不阻止值被释放(drop) | 所有权计数归零,才能 drop |
| 引用的值存在返回Some,不存在返回None | 引用的值必定存在 | | 引用的值存在返回 `Some`,不存在返回 `None ` | 引用的值必定存在 |
| 通过`upgrade`取到`Option<Rc<T>>`,然后再取值 | 通过`Deref`自动解引用,取值无需任何操作 | | 通过 `upgrade` 取到 `Option<Rc<T>>`,然后再取值 | 通过 `Deref` 自动解引用,取值无需任何操作 |
通过这个对比,可以非常清晰的看出 `Weak` 为何这么弱,而这种弱恰恰非常适合我们实现以下的场景: 通过这个对比,可以非常清晰的看出 `Weak` 为何这么弱,而这种弱恰恰非常适合我们实现以下的场景:
@ -125,13 +125,13 @@ fatal runtime error: stack overflow
使用方式简单总结下:**对于父子引用关系,可以让父节点通过 `Rc` 来引用子节点,然后让子节点通过 `Weak` 来引用父节点**。 使用方式简单总结下:**对于父子引用关系,可以让父节点通过 `Rc` 来引用子节点,然后让子节点通过 `Weak` 来引用父节点**。
#### Weak 总结 #### Weak 总结
因为Weak本身并不是很好理解因此我们再来帮大家梳理总结下然后再通过一个例子来彻底掌握。 因为 `Weak` 本身并不是很好理解,因此我们再来帮大家梳理总结下,然后再通过一个例子,来彻底掌握。
`Weak` 通过 `use std::rc::Weak` 来引入,它具有以下特点: `Weak` 通过 `use std::rc::Weak` 来引入,它具有以下特点:
- 可访问,但没有所有权,不增加引用计数,因此不会影响被引用值的释放回收 - 可访问,但没有所有权,不增加引用计数,因此不会影响被引用值的释放回收
- 可由 `Rc<T>` 调用 `downgrade` 方法转换成 `Weak<T>` - 可由 `Rc<T>` 调用 `downgrade` 方法转换成 `Weak<T>`
- `Weak<T>`可使用`upgrade`方法转换成`Option<Rc<T>>`,如果资源已经被释放,则`Option`的值是`None` - `Weak<T>` 可使用 `upgrade` 方法转换成 `Option<Rc<T>>`,如果资源已经被释放,则 `Option` 的值是 `None`
- 常用于解决循环引用的问题 - 常用于解决循环引用的问题
一个简单的例子: 一个简单的例子:
@ -163,7 +163,7 @@ fn main() {
理论知识已经足够,现在用两个例子来模拟下真实场景下可能会遇到的循环引用。 理论知识已经足够,现在用两个例子来模拟下真实场景下可能会遇到的循环引用。
#### 工具间的故事 #### 工具间的故事
工具间里,每个工具都有其主人,且多个工具可以拥有一个主人;同时一个主人也可以拥有多个工具,在这种场景下,就很容易形成循环引用,好在我们有`Weak`: 工具间里,每个工具都有其主人,且多个工具可以拥有一个主人;同时一个主人也可以拥有多个工具,在这种场景下,就很容易形成循环引用,好在我们有 `Weak`
```rust ```rust
use std::rc::Rc; use std::rc::Rc;
use std::rc::Weak; use std::rc::Weak;
@ -211,7 +211,7 @@ fn main() {
println!("Gadget {} owned by {}", gadget.id, gadget.owner.name); println!("Gadget {} owned by {}", gadget.id, gadget.owner.name);
} }
// 在main函数的最后 gadget_owner, gadget1和daget2都被销毁。 // 在 main 函数的最后gadget_ownergadget1 和 daget2 都被销毁。
// 具体是,因为这几个结构体之间没有了强引用(`Rc<T>`),所以,当他们销毁的时候。 // 具体是,因为这几个结构体之间没有了强引用(`Rc<T>`),所以,当他们销毁的时候。
// 首先 gadget1 和 gadget2 被销毁。 // 首先 gadget1 和 gadget2 被销毁。
// 然后因为 gadget_owner 的引用数量为 0所以这个对象可以被销毁了。 // 然后因为 gadget_owner 的引用数量为 0所以这个对象可以被销毁了。
@ -276,10 +276,10 @@ fn main() {
``` ```
这个例子就留给读者自己解读和分析,我们就不画蛇添足了 这个例子就留给读者自己解读和分析,我们就不画蛇添足了:
## unsafe 解决循环引用 ## unsafe 解决循环引用
除了使用Rust标准库提供的这些类型你还可以使用`unsafe`里的原生指针来解决这些棘手的问题,但是由于我们还没有讲解`unsafe`,因此这里就不进行展开,只附上[源码链接](https://codes.rs/unsafe/self-ref.html), 挺长的需要耐心o_O 除了使用 Rust 标准库提供的这些类型,你还可以使用 `unsafe` 里的原生指针来解决这些棘手的问题,但是由于我们还没有讲解 `unsafe`,因此这里就不进行展开,只附上[源码链接](https://codes.rs/unsafe/self-ref.html), 挺长的需要耐心o_o
虽然 `unsafe` 不安全,但是在各种库的代码中依然很常见用它来实现自引用结构,主要优点如下: 虽然 `unsafe` 不安全,但是在各种库的代码中依然很常见用它来实现自引用结构,主要优点如下:
@ -290,4 +290,4 @@ fn main() {
## 总结 ## 总结
本文深入讲解了何为循环引用以及如何使用 `Weak` 来解决,同时还结合 `Rc`、`RefCell`、`Weak` 等实现了两个有实战价值的例子,让大家对智能指针的使用更加融会贯通。 本文深入讲解了何为循环引用以及如何使用 `Weak` 来解决,同时还结合 `Rc`、`RefCell`、`Weak` 等实现了两个有实战价值的例子,让大家对智能指针的使用更加融会贯通。
至此,智能指针一章即将结束(严格来说还有一个Mutex放在多线程一章讲解)而Rust语言本身的学习之旅也即将结束后面我们将深入多线程、项目工程、应用实践、性能分析等特色专题来一睹Rust在这些领域的风采。 至此,智能指针一章即将结束(严格来说还有一个 `Mutex` 放在多线程一章讲解),而 Rust 语言本身的学习之旅也即将结束,后面我们将深入多线程、项目工程、应用实践、性能分析等特色专题,来一睹 Rust 在这些领域的风采。

@ -12,7 +12,7 @@ struct RefWithinMe<'a> {
pointer_to_value: &'a str, pointer_to_value: &'a str,
} }
``` ```
以上就是一个很简单的自引用结构体,看上去好像没什么,那来试着运行下: 以上就是一个很简单的自引用结构体看上去好像没什么,那来试着运行下:
```rust ```rust
fn main(){ fn main(){
let s = "aaa".to_string(); let s = "aaa".to_string();
@ -23,7 +23,7 @@ fn main(){
} }
``` ```
运行后报错: 运行后报错
```console ```console
let v = SelfRef { let v = SelfRef {
12 | value: s, 12 | value: s,
@ -35,7 +35,7 @@ fn main(){
因为我们试图同时使用值和值的引用,最终所有权转移和借用一起发生了。所以,这个问题貌似并没有那么好解决,不信你可以回想下自己具有的知识,是否可以解决? 因为我们试图同时使用值和值的引用,最终所有权转移和借用一起发生了。所以,这个问题貌似并没有那么好解决,不信你可以回想下自己具有的知识,是否可以解决?
## 使用 Option ## 使用 Option
最简单的方式就是使用`Opiton`分两步来实现: 最简单的方式就是使用 `Opiton` 分两步来实现:
```rust ```rust
#[derive(Debug)] #[derive(Debug)]
struct WhatAboutThis<'a> { struct WhatAboutThis<'a> {
@ -54,7 +54,7 @@ fn main() {
} }
``` ```
在某种程度上来说,`Option`这个方法可以工作,但是这个方法的限制较多,例如从一个函数创建并返回它是不可能的: 在某种程度上来说,`Option` 这个方法可以工作,但是这个方法的限制较多,例如从一个函数创建并返回它是不可能的
```rust ```rust
fn creator<'a>() -> WhatAboutThis<'a> { fn creator<'a>() -> WhatAboutThis<'a> {
let mut tricky = WhatAboutThis { let mut tricky = WhatAboutThis {
@ -67,7 +67,7 @@ fn creator<'a>() -> WhatAboutThis<'a> {
} }
``` ```
报错如下: 报错如下
```console ```console
error[E0515]: cannot return value referencing local data `tricky.name` error[E0515]: cannot return value referencing local data `tricky.name`
--> src/main.rs:24:5 --> src/main.rs:24:5
@ -108,7 +108,7 @@ fn main() {
``` ```
## unsafe 实现 ## unsafe 实现
既然借用规则妨碍了我们,那就一脚踢开: 既然借用规则妨碍了我们,那就一脚踢开
```rust ```rust
#[derive(Debug)] #[derive(Debug)]
struct SelfRef { struct SelfRef {
@ -134,7 +134,8 @@ impl SelfRef {
} }
fn pointer_to_value(&self) -> &String { fn pointer_to_value(&self) -> &String {
assert!(!self.pointer_to_value.is_null(), "Test::b called without Test::init being called first"); assert!(!self.pointer_to_value.is_null(),
"Test::b called without Test::init being called first");
unsafe { &*(self.pointer_to_value) } unsafe { &*(self.pointer_to_value) }
} }
} }
@ -147,9 +148,9 @@ fn main() {
} }
``` ```
在这里,我们在`pointer_to_value`中直接存储原生指针而不是Rust的引用因此不再受到Rust借用规则和生命周期的限制而且实现起来非常清晰、简洁。但是缺点就是通过指针获取值时需要使用`unsafe`代码, 在这里,我们在 `pointer_to_value` 中直接存储原生指针,而不是 Rust 的引用,因此不再受到 Rust 借用规则和生命周期的限制,而且实现起来非常清晰、简洁。但是缺点就是,通过指针获取值时需要使用 `unsafe` 代码。
当然,上面的代码你还能通过原生指针来修改`String`,但是需要将`*const`修改为`*mut`: 当然,上面的代码你还能通过原生指针来修改 `String`,但是需要将 `*const` 修改为 `*mut`
```rust ```rust
#[derive(Debug)] #[derive(Debug)]
struct SelfRef { struct SelfRef {
@ -193,7 +194,7 @@ fn main() {
println!("{}, {:p}", t.value(), t.pointer_to_value()); println!("{}, {:p}", t.value(), t.pointer_to_value());
} }
``` ```
运行后输出: 运行后输出
```console ```console
hello, 0x16f3aec70 hello, 0x16f3aec70
hello, world!, 0x16f3aec70 hello, world!, 0x16f3aec70
@ -202,15 +203,15 @@ hello, world!, 0x16f3aec70
上面的 `unsafe` 虽然简单好用,但是它不太安全,是否还有其他选择?还真的有,那就是 `Pin` 上面的 `unsafe` 虽然简单好用,但是它不太安全,是否还有其他选择?还真的有,那就是 `Pin`
## 无法被移动的 Pin ## 无法被移动的 Pin
Pin在后续章节会深入讲解目前你只需要知道它可以固定住一个值防止该值在内存中被移动。 `Pin` 在后续章节会深入讲解,目前你只需要知道它可以固定住一个值,防止该值在内存中被移动。
通过开头我们知道,自引用最麻烦的就是创建引用的同时,值的所有权会被转移,而通过Pin就可以很好的防止这一点: 通过开头我们知道,自引用最麻烦的就是创建引用的同时,值的所有权会被转移,而通过 `Pin` 就可以很好的防止这一点:
```rust ```rust
use std::marker::PhantomPinned; use std::marker::PhantomPinned;
use std::pin::Pin; use std::pin::Pin;
use std::ptr::NonNull; use std::ptr::NonNull;
// 下面是一个自引用数据结构体,因为slice字段是一个指针, 指向了data字段 // 下面是一个自引用数据结构体,因为 slice 字段是一个指针,指向了 data 字段
// 我们无法使用普通引用来实现,因为违背了 Rust 的编译规则 // 我们无法使用普通引用来实现,因为违背了 Rust 的编译规则
// 因此,这里我们使用了一个原生指针,通过 NonNull 来确保它不会为 null // 因此,这里我们使用了一个原生指针,通过 NonNull 来确保它不会为 null
struct Unmovable { struct Unmovable {
@ -220,7 +221,7 @@ struct Unmovable {
} }
impl Unmovable { impl Unmovable {
// 为了确保函数返回时数据的所有权不会被转移, 我们将它放在堆上, 唯一的访问方式就是通过指针 // 为了确保函数返回时数据的所有权不会被转移,我们将它放在堆上,唯一的访问方式就是通过指针
fn new(data: String) -> Pin<Box<Self>> { fn new(data: String) -> Pin<Box<Self>> {
let res = Unmovable { let res = Unmovable {
data, data,
@ -290,7 +291,7 @@ fn main(){
在使用时,通过 `borrow_value` 来借用 `value` 的值,通过 `borrow_pointer_to_value` 来借用 `pointer_to_value` 这个指针。 在使用时,通过 `borrow_value` 来借用 `value` 的值,通过 `borrow_pointer_to_value` 来借用 `pointer_to_value` 这个指针。
看上去很美好对吧?但是你可以尝试着去修改`String`字符串的值试试,`ouroboros`限制还是较多的,但是对于基本类型依然是支持的不错,以下例子来源于官方: 看上去很美好对吧?但是你可以尝试着去修改 `String` 字符串的值试试,`ouroboros` 限制还是较多的,但是对于基本类型依然是支持的不错,以下例子来源于官方
```rust ```rust
use ouroboros::self_referencing; use ouroboros::self_referencing;
@ -335,7 +336,7 @@ fn main() {
只能说,它确实帮助我们解决了问题,但是一个是破坏了原有的结构,另外就是并不是所有数据类型都支持:它需要目标值的内存地址不会改变,因此 `Vec` 动态数组就不适合因为当内存空间不够时Rust 会重新分配一块空间来存放该数组,这会导致内存地址的改变。 只能说,它确实帮助我们解决了问题,但是一个是破坏了原有的结构,另外就是并不是所有数据类型都支持:它需要目标值的内存地址不会改变,因此 `Vec` 动态数组就不适合因为当内存空间不够时Rust 会重新分配一块空间来存放该数组,这会导致内存地址的改变。
类似的库还有: 类似的库还有
- [rental](https://github.com/jpernst/rental) 这个库其实是最有名的,但是好像不再维护了,用倒是没问题 - [rental](https://github.com/jpernst/rental) 这个库其实是最有名的,但是好像不再维护了,用倒是没问题
- [owning-ref](https://github.com/Kimundi/owning-ref-rs),将所有者和它的引用绑定到一个封装类型 - [owning-ref](https://github.com/Kimundi/owning-ref-rs),将所有者和它的引用绑定到一个封装类型
@ -352,7 +353,7 @@ fn main() {
## 学习一本书:如何实现链表 ## 学习一本书:如何实现链表
最后,推荐一本专门将如何实现链表的书(真是富有Rust特色链表都能复杂到出书了O, O)[Learn Rust by writing Entirely Too Many Linked Lists](https://rust-unofficial.github.io/too-many-lists/) 最后,推荐一本专门将如何实现链表的书(真是富有 Rust 特色链表都能复杂到出书了o_o[Learn Rust by writing Entirely Too Many Linked Lists](https://rust-unofficial.github.io/too-many-lists/)
## 总结 ## 总结

Loading…
Cancel
Save