diff --git a/README.md b/README.md index 6c9994ae..73e6f54b 100644 --- a/README.md +++ b/README.md @@ -1,52 +1,138 @@ -# Rust语言圣经 (The Course) +

Rust语言圣经

-- 在线阅读 - - 官方: [https://course.rs](https://course.rs) - - 知乎: [支持章节内目录跳转,很好用!](https://www.zhihu.com/column/c_1452781034895446017) - -- Rust语言社区: QQ群 1009730433 - -> 学习 Rust 光看书不够,精心设计的习题和项目实践可以让你事半功倍。[Rust By Practice](https://github.com/sunface/rust-by-practice) 是本书的配套习题和实践,覆盖了 easy to hard 各个难度,满足大家对 Rust 的所有期待。 -> -> [Rust 语言周刊](https://github.com/sunface/rust-weekly),每周一发布,精选过去一周的技术文章、业界新闻、开源项目和 Rust 语言动态。 -> -> Rust 优秀项目很多,如何在茫茫码海中与它们相遇?相比 Awesome Rust, [Fancy Rust](https://github.com/sunface/fancy-rust) 能带给你全新的体验和选择。 +
+ +
+ +
+ +[![studyrut](https://img.shields.io/badge/study-rust-orange)](https://github.com/studyrs) [![Stars Count](https://img.shields.io/github/stars/sunface/rust-course?style=flat)](https://github.com/sunface/rust-course/stargazers) +[![](https://img.shields.io/github/issues-pr-closed-raw/sunface/rust-course.svg?style=flat)](https://github.com/sunface/rust-course/issues) +[![Binder](https://mybinder.org/badge_logo.svg)](https://mybinder.org/v2/gh/ines/spacy-course/master) + + + + + +
+ + ## 教程简介 +- 在线阅读: https://course.rs + **`Rust语言圣经`**涵盖从**入门到精通**所需的 Rust 知识,目录及内容都经过深思熟虑的设计,同时语言生动幽默,行文流畅自如,摆脱技术书籍常有的机器味和晦涩感。 -在 Rust 基础教学的同时,我们还提供了(部分): - - **深入度**,在基础教学的同时,提供了深入剖析。浅尝辄止并不能让我们站上紫禁之巅 -- **性能优化**,选择 Rust,就意味着要追求性能,因此你需要体系化地了解性能优化 -- **专题**,将 Rust 高级内容通过专题的形式一一呈现,内容内聚性极强 -- **难点和错误索引**,作为一本工具书,优秀的索引能力非常重要,遗忘不可怕,找不到才可怕 -- **场景化模版**,程序员上网查询如何操作文件是常事,没有人能记住所有代码,场景化模版可解君忧 -总之在写作过程中我们始终铭记初心:为中国用户打造一门**全面的、深入的、持续更新的** Rust 教程。 新手用来入门,老手用来提高,高手用来提升生产力。 +- **专题内容**,将 Rust 高级内容通过专题的形式一一呈现,内容内聚性极强,例如性能优化、手把手实现链表、Cargo和Tokio使用指南、async异步编程、标准库解析、WASM等等 -## ❤️ 开源 -本书是完全开源的,但是并不意味着质量上的妥协,这里的每一个章节都花费了大量的心血和时间才能完成,为此牺牲了陪伴家人、日常娱乐的时间,虽然我们并不后悔,但是如果能得到读者您的鼓励,我们将感激不尽。 +- **内容索引**,作为一本工具书,优秀的索引能力非常重要,遗忘不可怕,找不到才可怕 -既然是开源,那最大的鼓励不是 money,而是 star:) **如果大家觉得这本书作者真的用心了,就帮我们点一个 🌟 吧,这将是我们继续前行最大的动力** +- **规避陷阱和对抗编译器**,只有真的上手写过一长段时间 Rust 项目,才知道该如何规避常见的陷阱以及解决一些难搞的编译器错误,而本书将帮助你大大缩短这个过程,提前规避这些问题 -> 在开源版权上,我们选择了 [No License](https://www.google.com.hk/url?sa=t&rct=j&q=&esrc=s&source=web&cd=&ved=2ahUKEwigkv-KtMT0AhXFdXAKHdI4BCcQFnoECAQQAw&url=https%3A%2F%2Fchoosealicense.com%2Fno-permission%2F&usg=AOvVaw3M2Q4IbdhnpJ2K71TF7SPB),这意味着读者可以随意的 fork 和阅读,但是**不能私下修改后再包装分发**,如果有这方面的需求,请联系我们,望理解。 +- **[Cookbook](https://rusty.rs)**,涵盖多个应用场景的实战代码片段,程序员上网查询文件操作、正则解析、数据库操作是常事,没有人能记住所有代码,而 Cookbook 可解君忧,Ctrl + C/V 走天下 +- **[配套练习题](https://github.com/sunface/rust-by-practice)**,像学习一门大学课程一样学习 Rust 是一种什么感觉?*Rust语言圣经 + Rust语言实战* 双剑合璧,给你最极致的学习体验 +总之在写作过程中我们始终铭记初心:为中国用户打造一门**全面的、深入的、持续更新的** Rust 教程。 新手用来入门,老手用来提高,高手用来提升生产力。 -## 贡献者 - -非常感谢本教程的所有贡献者们,正是有了你们,才有了现在的高质量 Rust 教程! -- [@AllanDowney](https://github.com/AllanDowney) -- [@JesseAtSZ](https://github.com/JesseAtSZ) -- [@1132719438](https://github.com/1132719438) -- [@Mintnoii](https://github.com/Mintnoii) -- [@Rustln](https://github.com/rustln) +## 🏅 贡献者 + +非常感谢本教程的[所有贡献者](https://github.com/sunface/rust-course/graphs/contributors),正是有了你们,才有了现在的高质量 Rust 教程! + +
+ +**🏆 贡献榜前三**(根据难易度、贡献次数、活跃度综合评定): + + + + + + +
+ + +
+ Sunface 🥇 +
+
+ + +
+ AllanDowney 🥈 +
+
+ + +
+ JesseAtSZ 🥉 +
+
+ +
+ +🏅 核心贡献者: + + + + + + + +
+ + +
+ 1132719438 +
+
+ + +
+ zongzi531 +
+
+ + +
+ Mintnoii +
+
+ + +
+ Rustln +
+
+ + +## 创作感悟 + +截至目前,Rust语言圣经已写了 170 余章,110 余万字,历经 800 多个小时,每一个章节都是手动写就,没有任何机翻和质量上的妥协( 相信深入阅读过的读者都能体会到这一点 )。 + +曾经有读者问过 "这么好的书为何要开源,而不是出版?",原因很简单:**只有完全开源才能完美地呈现出我想要的教学效果**。 + +总之,Rust 要在国内真正发展起来,必须得有一些追逐梦想的人在做着不计付出的事情,而我希望自己能贡献一份微薄之力。 + +但是要说完全无欲无求,那也是不可能的,看到项目多了一颗 🌟,那感觉...棒极了,因为它代表了读者的认可和称赞。 + +你们用指尖绘制的星空,那里繁星点点,每一颗都在鼓励着怀揣着开源梦想的程序员披荆斩棘、不断前行,不夸张的说,没有你们,开源世界就没有星光,自然也就不会有今天的开源盛世。 + +因此,**我恳请大家,如果觉得书还可以,就在你的指尖星空绘制一颗新的 🌟,指引我们继续砥砺前行**。这个人世间,因善意而美好。 + +最后,能通过开源在茫茫人海中与大家相识,这感觉真好 :D + + +## 开源协议 + +在开源版权上,我们选择了 [No License](https://www.google.com.hk/url?sa=t&rct=j&q=&esrc=s&source=web&cd=&ved=2ahUKEwigkv-KtMT0AhXFdXAKHdI4BCcQFnoECAQQAw&url=https%3A%2F%2Fchoosealicense.com%2Fno-permission%2F&usg=AOvVaw3M2Q4IbdhnpJ2K71TF7SPB),这意味着读者可以随意的 fork 和阅读,但是**不能私下修改后再包装分发**,如果有这方面的需求,请联系我们,望理解。 -尤其感谢这些主要贡献者,谢谢你们花费大量时间贡献了多处`fix`和高质量的内容优化。非常感动,再次感谢~~ ## 借鉴的书籍 @@ -59,5 +145,14 @@ 因为它们绝大部分是支持 APACHE + MIT 双协议的,因此我们选择了遵循其中的 MIT 协议,并在这里统一对借鉴的书籍进行说明。 -## Rust语言社区 -QQ群 1009730433, 欢迎大家加入,一起 happy,一起进步。 + +## 社区 & 读者交流 + +- 知乎: [孙飞 Sunface](https://www.zhihu.com/people/iSunface) + +- **StudyRust** 社区 + - QQ群 `1009730433`,用于日常技术交流 + - 微信公众号: 搜索 `studyrust` 或扫描下面的二维码关注公众号 `Rust语言中文网` + + + diff --git a/assets/Rust中英翻译对照表.md b/assets/Rust中英翻译对照表.md deleted file mode 100644 index 111273f2..00000000 --- a/assets/Rust中英翻译对照表.md +++ /dev/null @@ -1,422 +0,0 @@ -> 词汇表是从https://github.com/rust-lang-cn/english-chinese-glossary-of-rust fork而来,原因是在部分词汇的翻译上,存在不同的意见,欢迎大家开issue讨论或者提交pr - -# Rust 语言术语中英文对照表 - -English 英文 | Chinese 中文 | Note 备注 -------------------------------- |----------------------------- |---------- -**A** | | -Abstract Syntax Tree | 抽象语法树 | -ABI | 应用程序二进制接口 | Application Binary Interface 缩写 -accumulator | 累加器 | -accumulator variable | 累加器变量 | -ahead-of-time compiled | 预编译 | -ahead-of-time compiled language | 预编译语言 | -algebraic data types(ADT) | 代数数据类型 | -alias | 别名 | -aliasing | 别名使用 | 参见 [Wikipedia](https://en.wikipedia.org/wiki/Pointer_aliasing) -angle brackets | 尖括号,“<”和“>” | -annotate | 标注,注明(动词) | -annotation | 标注,注明(名词) | -ARC | 原子引用计数器 | Atomic Referecne Counter -anonymity | 匿名 | -argument | 参数,实参,实际参数 | 不严格区分的话, argument(参数)和
parameter(参量)可以互换地使用 -argument type | 参数类型 | -assignment | 赋值 | -associated functions | 关联函数 | -associated items | 关联项 | -associated types | 关联类型 | -asterisk | 星号(\*) | -atomic | 原子的 | -attribute | 属性 | -automated building | 自动构建 | -automated test | 自动测试,自动化测试 | -**B** | | -baroque macro | 巴洛克宏 | -benchmark | 基准 | -binary | 二进制的 | -binary executable | 二进制的可执行文件 | -bind | 绑定 | -block | 语句块,代码块 | -boolean | 布尔型,布尔值 | -borrow check | 借用检查 | -borrower | 借用者,借入者 | -borrowed | 借用的 | -borrowing | 借用 | -bound | 约束,限定,限制 | 此词和 constraint 意思相近,
constraint 在 C# 语言中翻译成“约束” -box | 箱子,盒子,装箱类型 | 一般不译,作动词时翻译成“装箱”,
具有所有权的智能指针 -boxed | 装箱,装包 | -boxing | 装箱,装包 | -brace | 大括号,“{”或“}” | -breaking changes | 破坏性变更 | -buffer | 缓冲区 | -build | 构建 | -builder pattern | 创建者模式 | -**C** | | -call | 调用 | -caller | 调用者 | -capacity | 容量 | -capture | 捕获 | -cargo | (Rust 包管理器,不译) | 该词作名词时意思是“货物”,
作动词时意思是“装载货物” -cargo-fy | Cargo 化,使用 Cargo 创建项目 | -case analysis | 事例分析 | -cast | 类型转换,转型 | -casting | 类型转换 | -chaining method call | 链式方法调用 | -channel | 信道,通道 | -closure | 闭包 | -coercion | 强制类型转换,强制转换 | coercion 原意是“强制,胁迫” -collection | 集合 | 参见 [Wikipedia](https://zh.wikipedia.org/wiki/%E9%9B%86%E5%90%88_(%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%A7%91%E5%AD%A6)) | -combinator | 组合算子,组合器 | -comma | 逗号,“,” | -command | 命令 | -command line | 命令行 | -comment | 注释 | -compile | 编译(动词) | -compile time | 编译期,编译期间,编译时 | -compilation | 编译(名词) | -compilation unit | 编译单元 | -compiler | 编译器 | -compiler intrinsics | 编译器固有功能 | -compound | 复合(类型,数据) | -concurrency | 并发 | -conditional compilation | 条件编译 | -configuration | 配置 | -constant | 常量 | -constant raw pointer | 原生常量指针 | -constructor | 构造器 | -consumer | 消费者 | -container | 容器 | -container type | 容器类型 | -convert | 转换,转化,转 | -copy | 复制,拷贝 | -crate | 包 | crate 是 Rust 的基本编译单元 -crate root | 包根 | 别拍我,我知道很奇葩 -curly braces | 大括号,包含“{”和“}” | -custom type | 自定义类型 | -**D** | | -dangling pointer | 悬垂指针 | use after free 在释放后使用 -data race | 数据竞争 | -dead code | 死代码,无效代码,不可达代码 | -deallocate | 释放,重新分配 | -declare | 声明 | -deep copy | 深拷贝,深复制 | -dependency | 依赖 | -deref coercions | 解引用强制转换 | -dereference | 解引用 | Rust 文章中有时简写为 Deref -derive | 派生 | -designator | 指示符 | -destruction | 销毁,毁灭 | -destructor | 析构器,析构函数 | -destructure | 解构 | -destructuring | 解构,解构赋值 | -desugar | 脱糖 | -diverge function | 发散函数 | -device drive | 设备驱动 | -directory | 目录 | -dispatch | 分发 | -diverging functions | 发散函数 | -documentation | 文档 | -dot operator | 点运算符 | -DST | 动态大小类型 | dynamic sized type,一般不译,
使用英文缩写形式 -dynamic language | 动态类型语言 | -dynamic trait type | 动态特质类型 | -**E** | | -enum variant | 枚举成员 | -enumeration | 枚举 | -encapsulation | 封装 | -equality test | 相等测试 | -elision | 省略 | -exhaustiveness checking | 穷尽性检查,无遗漏检查 | -executor | 执行器 | -expression | 表达式 | -expression-oriented language | 面向表达式的语言 | -explicit | 显式 | -explicit discriminator | 显式的辨别值 | -explicit type conversion | 显式类型转换 | -extension | 扩展名 | -extern | 外,外部 | 作关键字时不译 -**F** | | -fat pointer | 宽指针 | -Feature | 暂时不译 | 在Rust中主要用于Cargo feature该词 -feature gate | 功能开关 | -field | 字段 | -field-level mutability | 字段级别可变性 | -file | 文件 | -fmt | 格式化,是 format 的缩写 | -formatter | 格式化程序,格式化工具,格式器| -floating-point number | 浮点数 | -flow control | 流程控制 | -Foreign Function Interface(FFI)| 外部语言函数接口 | -fragment specifier | 片段分类符 | -free variables | 自由变量 | -freeze | 冻结 | -function | 函数 | -function declaration | 函数声明 | -functional | 函数式 | -**G** | | -garbage collector | 垃圾回收 | -generalize | 泛化,泛型化 | -generator | 生成器 | -generic | 泛型 | -generic type | 泛型类型 | -getter | 读访问器 | -growable | 可增长的 | -guard | 守卫 | -**H** | | -handle error | 句柄错误 | -hash | 哈希,哈希值,散列 | -hash map | 散列映射,哈希表 | -heap | 堆 | -hierarchy | 层次,分层,层次结构 | -higher rank lifetime | 高阶生命周期 | -higher rank trait bound | 高阶特质约束 | -higher rank type | 高阶类型 | -hygiene | 卫生 | -hygienic macro system | 卫生宏系统 | -**I** | | -ICE | 编译内部错误 | internal compiler error 的缩写 -immutable | 不可变的 | -implement | 实现 | -implementor | 实现者 | -implicit | 隐式 | -implicit discriminator | 隐式的辨别值 | -implicit type conversion | 隐式类型转换 | -import | 导入 | -in assignment | 在赋值(语句) | -index | 索引 | 英语复数形式:indices -infer | 推导(动词) | -inference | 推导(名词) | -inherited mutability | 承袭可变性 | -inheritance | 继承 | -integrated development
environment(IDE) | 集成开发环境 | 中文著作中通常直接写成 IDE -integration-style test | 集成测试 | -interior mutability | 内部可变性 | -installer | 安装程序,安装器 | -instance | 实例 | -instance method | 实例方法 | -integer | 整型,整数 | -interact | 相互作用,相互影响 | -interior mutability | 内部可变性 | -intrinsic | 固有的 | -invoke | 调用 | -item | 项,条目,项目 | -iterate | 重复 | -iteration | 迭代 | -iterator | 迭代器 | -iterator adaptors | 迭代器适配器 | -iterator invalidation | 迭代器失效 | -**L** | | -local variables | 局部变量 | -LHS | 左操作数 | left-hand side 的非正式缩写,
与 RHS 相对 -lender | 借出者 | -library | 库 | -lifetime | 生命周期 | -lifetime elision | 生命周期消除 | -link | 链接 | -linked-list | 链表 | -lint | 代码静态分析 | Lint, or a linter, is a static code analysis tool used to flag programming errors, bugs, stylistic errors and suspicious constructs | -list | 列表 | -listener | 监听器 | -literal | 数据,常量数据,字面值,字面量,
字面常量,字面上的 | 英文意思:字面意义的(内容) -LLVM | (不译) | Low Level Virtual Machine 的缩写,
是构建编译器的系统 -loop | 循环 | 作关键字时不译 -low-level code | 底层代码 | -low-level language | 底层语言 | -l-value | 左值 | -**M** | | -main function | main 函数,主函数 | -macro | 宏 | -map | 映射 | 一般不译 -match guard | 匹配守卫 | -memory | 内存 | -memory leak | 内存泄露 | -memory safe | 内存安全 | -meta | 原则,元 | -metadata | 元数据 | -metaprogramming | 元编程 | -metavariable | 元变量 | -method call syntax | 方法调用语法 | -method chaining | 方法链 | -method definition | 方法定义 | -modifier | 修饰符 | -module | 模块 | -monomorphization | 单态 | mono: one, morph: form -move | 移动,转移 | 按照 Rust 所规定的内容,
英语单词 transfer 的意思
比 move 更贴合实际描述
参考:[Rust by Example](http://rustwiki.org/rust-by-example/scope/move.html) -move semantics | 移动语义 | -mutability | 可变性 | -mutable | 可变 | -mutable reference | 可变引用 | -multiple bounds | 多重约束 | -mutiple patterns | 多重模式 | -**N** | | -naming | 命名 | -nest | 嵌套 | -Nightly Rust | Rust 开发版 | nightly本意是“每夜,每天晚上”,
指代码每天都更新 -NLL | 非词法生命周期 | non lexical lifetime 的缩写,
一般不译 -non-copy type | 非复制类型 | -non-generic | 非泛型 | -no-op | 空操作,空运算 | (此词出现在类型转换章节中) -non-commutative | 非交换的 | -non-scalar cast | 非标量转换 | -notation | 符号,记号 | -number type | 数据类型 -numeric | 数值,数字 | -**O** | | -optimization | 优化 | -out-of-bounds accessing | 越界访问 | -orphan rule | 孤儿规则 | -overflow | 溢出,越界 | -own | 占有,拥有 | -owned | 所拥有的 | -owner | 所有者,拥有者 | -ownership | 所有权 | -**P** | | -package | 不翻译 | -panic | 异常、致命错误、不译 | 在 Rust 中用于不可恢复的错误处理,跟其它语言的exception类似 -parallelism | 并行 | -parameter | 参数 | -parametric polymorphism | 参数多态 | -parent scope | 父级作用域 | -parentheses | 小括号,包括“(”和“)” | -parse | 分析,解析 | -parser | (语法)分析器,解析器 | -pattern | 模式 | -pattern match | 模式匹配 | -phantom type | 虚类型,虚位类型 | phantom 相关的专有名词:
phantom bug 幻影指令
phantom power 幻象电源
参见:[Haskell](https://wiki.haskell.org/Phantom_type)、[Haskell/Phantom_type](https://en.wikibooks.org/wiki/Haskell/Phantom_types)、
[Rust/Phantom](http://rustwiki.org/rust-by-example/generics/phantom.html)、[stdlib/PhantomData](https://doc.rust-lang.org/std/marker/struct.PhantomData.html) -platform | 平台 | -polymorphism | 多态 | -powershell |(不译) | Windows 系统的一种命令行外壳程序
和脚本环境 -possibility of absence | 不存在的可能性 | -precede | 预先?,在...发生(或出现) | -prelude |(不译) | 预先导入模块,英文本意:序曲,前奏 -primitive types | 原生类型,基本类型,简单类型 | -print | 打印 | -process | 进程 | -procedural macros | 过程宏,程序宏 | -project | 项目,工程 | -prototype | 原型 | -**R** | | -race condition | 竞态条件 | -RAII | 资源获取即初始化(一般不译) | resource acquisition is initialization 的缩写 -range | 区间,范围 | -range expression | 区间表达式 | -raw identifier | 原生标识符 | -raw pointer | 原生指针,裸指针 | -RC | 引用计数 | reference counted -reader | 读取器 | -reader/writer | 读写器 | -recursive macro | 递归宏 | -reference | 引用 | -reference cycle | 引用循环 | -release | 发布 | -resource | 资源 | -resource leak | 资源泄露 | -RHS | 右操作数 | right-hand side 的非正式缩写,
与 LHS 相对 -root directory | 根目录 | -runtime | 运行时 | -runtime behavior | 运行时行为 | -runtime overhead | 运行时开销 | -Rust | (不译) | 一种编程语言 -Rustacean | (不译) | 编写 Rust 的程序员或爱好者的通称 -rustc | (不译) | Rust 语言编译器 -r-value | 右值 | -**S** | | -scalar | 标量,数量 | -schedule | 调度 | -scope | 作用域 | -screen | 屏幕 | -script | 脚本 | -semicolon | 分号,“;” | -self | 自身,作关键字时不译 | -setter | 写访问器 | -shadow | 遮蔽,隐蔽,隐藏,覆盖 | -shallow copy | 浅拷贝,浅复制 | -signature | 标记 | -slice | 切片 | -snake case | 蛇形命名 | 参见:[Snake case](https://en.wikipedia.org/wiki/Snake_case) -source file | 源文件 | -source code | 源代码 | -specialization | 泛型特化 | -square | 平方,二次方,二次幂 | -square brackets | 中括号,“[”和“]” | -src | (不译) | source 的缩写,指源代码 -stack | 栈 | -stack unwind | 栈解开、栈展开 | -statement | 语句 | -statically allocated | 静态分配 | -statically allocated string | 静态分配的字符串 | -statically dispatch | 静态分发 | -static method | 静态方法 | -string | 字符串 | -string literal | 字符串常量 | -string slices | 字符串切片 | -stringify | 字符串化 | -subscript notation | 下标 | -sugar | 糖 | -super | 父级,作关键字时不译 | -syntax context | 语法上下文 | -systems programming language | 系统级编程语言 | -**T** | | -tagged union | 标记联合 | -target triple | 多层次指标,三层/重 指标/目标 | triple 本义是“三”,但此处虚指“多”,
此词翻译需要更多讨论 -terminal | 终端 | -testing | 测试 | -testsuit | 测试套件 | -the least significant bit (LSB) | 最低数字位 | -the most significant bit (MSB) | 最高数字位 | -thread | 线程 | -TOML | (不译) | Tom's Obvious, Minimal Language
的缩写,一种配置语言 -token tree | 令牌树? | 待进一步斟酌 -trait | 特征 | 其字面上有“特性,特征”之意 -trait bound | 特征约束 | bound 有“约束,限制,限定”之意 -trait object | 特征对象 | -transmute | (不译) | 其字面上有“变化,变形,变异”之意,
不作翻译 -trivial | 平凡的 | -troubleshooting | 疑难解答,故障诊断,
故障排除,故障分析 | -tuple | 元组 | -turbofish | 双冒号`::` | 难以翻译,所以直接用形译法 -two's complement | 补码,二补数 | -two-word object | 双字对象 | -type annotation | 类型标注 | -type erasure | 类型擦除 | -type inference | 类型推导 | -type inference engine | 类型推导引擎 | -type parameter | 类型参量 | -type placeholder | 类型占位符 | -type signature | 类型标记 | -**U** | | -undefined behavior | 未定义行为 | -uninstall | 卸载 | -unit-like struct | 类单元结构体 | - unit struct | 单元结构体 | -"unit-style" tests | 单元测试 | -unit test | 单元测试 | -unit type | 单元类型 | -universal function call syntax
(UFCS) | 通用函数调用语法 | -unsized types | 不定长类型 | -unwind | 展开 | -unwrap | 解包 | 暂译! -**V** | | -variable binding | 变量绑定 | -variable shadowing | 变量遮蔽,变量隐蔽,
变量隐藏,变量覆盖 | -variable capture | 变量捕获 | -variant | 变量 | -vector | (动态数组,一般不译) | vector 本义是“向量” -visibility | 可见性 | -vtable | 虚表 | -**W** | | -where clause | where 子句,where 从句,where 分句 | 在数据库的官方手册中多翻译成“子句”,英语语法中翻译成“从句” -workspace | 工作空间 | -wrap | 包装 | 暂译! -wrapped | 装包 | -wrapper | 装包 | -writer | 写入器 | -**Y** | | -yield | 产生(收益、效益等),产出,提供| -**Z** | | -zero-cost abstractions | 零开销抽象 | -zero-width space(ZWSP) | 零宽空格 | - - - - diff --git a/assets/banner.jpg b/assets/banner.jpg new file mode 100644 index 00000000..8f695097 Binary files /dev/null and b/assets/banner.jpg differ diff --git a/assets/bigPicture.js b/assets/bigPicture.js new file mode 100644 index 00000000..c5063bd6 --- /dev/null +++ b/assets/bigPicture.js @@ -0,0 +1 @@ +var BigPicture=function(){var t,n,e,o,i,r,a,c,p,s,l,d,u,f,m,b,g,h,x,v,y,w,_,T,k,M,S,L,E,A,H,z,I,C=[],D={},O="appendChild",N="createElement",V="removeChild";function W(){var n=t.getBoundingClientRect();return"transform:translate3D("+(n.left-(e.clientWidth-n.width)/2)+"px, "+(n.top-(e.clientHeight-n.height)/2)+"px, 0) scale3D("+t.clientWidth/o.clientWidth+", "+t.clientHeight/o.clientHeight+", 0)"}function q(t){var n=A.length-1;if(!u){if(t>0&&E===n||t<0&&!E){if(!I.loop)return j(i,""),void setTimeout(j,9,i,"animation:"+(t>0?"bpl":"bpf")+" .3s;transition:transform .35s");E=t>0?-1:n+1}if([(E=Math.max(0,Math.min(E+t,n)))-1,E,E+1].forEach(function(t){if(t=Math.max(0,Math.min(t,n)),!D[t]){var e=A[t].src,o=document[N]("IMG");o.addEventListener("load",F.bind(null,e)),o.src=e,D[t]=o}}),D[E].complete)return B(t);u=1,j(m,"opacity:.4;"),e[O](m),D[E].onload=function(){y&&B(t)},D[E].onerror=function(){A[E]={error:"Error loading image"},y&&B(t)}}}function B(n){u&&(e[V](m),u=0);var r=A[E];if(r.error)alert(r.error);else{var a=e.querySelector("img:last-of-type");j(i=o=D[E],"animation:"+(n>0?"bpfl":"bpfr")+" .35s;transition:transform .35s"),j(a,"animation:"+(n>0?"bpfol":"bpfor")+" .35s both"),e[O](i),r.el&&(t=r.el)}H.innerHTML=E+1+"/"+A.length,X(A[E].caption),M&&M([i,A[E]])}function P(){var t,n,e=.95*window.innerHeight,o=.95*window.innerWidth,i=I.dimensions||[1920,1080],r=i[0],a=i[1],p=a/r;p>e/o?n=(t=Math.min(a,e))/p:t=(n=Math.min(r,o))*p,c.style.cssText+="width:"+n+"px;height:"+t+"px;"}function G(t){~[1,4].indexOf(o.readyState)?(U(),setTimeout(function(){o.play()},99)):o.error?U(t):f=setTimeout(G,35,t)}function R(n){I.noLoader||(n&&j(m,"top:"+t.offsetTop+"px;left:"+t.offsetLeft+"px;height:"+t.clientHeight+"px;width:"+t.clientWidth+"px"),t.parentElement[n?O:V](m),u=n)}function X(t){t&&(g.innerHTML=t),j(b,"opacity:"+(t?"1;pointer-events:auto":"0"))}function F(t){!~C.indexOf(t)&&C.push(t)}function U(t){if(u&&R(),T&&T(),"string"==typeof t)return $(),I.onError?I.onError():alert("Error: The requested "+t+" could not be loaded.");_&&F(s),o.style.cssText+=W(),j(e,"opacity:1;pointer-events:auto"),k=setTimeout(k,410),v=1,y=!!A,setTimeout(function(){o.style.cssText+="transition:transform .35s;transform:none",h&&setTimeout(X,250,h)},60)}function Y(t){var n=t?t.target:e,i=[b,x,r,a,g,L,S,m];n.blur(),w||~i.indexOf(n)||(o.style.cssText+=W(),j(e,"pointer-events:auto"),setTimeout($,350),clearTimeout(k),v=0,w=1)}function $(){if((o===c?p:o).removeAttribute("src"),document.body[V](e),e[V](o),j(e,""),j(o,""),X(0),y){for(var t=e.querySelectorAll("img"),n=0;n',n}function d(t,n){var e=document[N]("button");return e.className="bp-lr",e.innerHTML='',j(e,n),e.onclick=function(n){n.stopPropagation(),q(t)},e}var f=document[N]("STYLE");f.innerHTML="#bp_caption,#bp_container{bottom:0;left:0;right:0;position:fixed;opacity:0}#bp_container>*,#bp_loader{position:absolute;right:0;z-index:10}#bp_container,#bp_caption,#bp_container svg{pointer-events:none}#bp_container{top:0;z-index:9999;background:rgba(0,0,0,.7);opacity:0;transition:opacity .35s}#bp_loader{top:0;left:0;bottom:0;display:flex;align-items:center;cursor:wait;background:0;z-index:9}#bp_loader svg{width:50%;max-width:300px;max-height:50%;margin:auto;animation:bpturn 1s infinite linear}#bp_aud,#bp_container img,#bp_sv,#bp_vid{user-select:none;max-height:96%;max-width:96%;top:0;bottom:0;left:0;margin:auto;box-shadow:0 0 3em rgba(0,0,0,.4);z-index:-1}#bp_sv{background:#111}#bp_sv svg{width:66px}#bp_caption{font-size:.9em;padding:1.3em;background:rgba(15,15,15,.94);color:#fff;text-align:center;transition:opacity .3s}#bp_aud{width:650px;top:calc(50% - 20px);bottom:auto;box-shadow:none}#bp_count{left:0;right:auto;padding:14px;color:rgba(255,255,255,.7);font-size:22px;cursor:default}#bp_container button{position:absolute;border:0;outline:0;background:0;cursor:pointer;transition:all .1s}#bp_container>.bp-x{padding:0;height:41px;width:41px;border-radius:100%;top:8px;right:14px;opacity:.8;line-height:1}#bp_container>.bp-x:focus,#bp_container>.bp-x:hover{background:rgba(255,255,255,.2)}.bp-x svg,.bp-xc svg{height:21px;width:20px;fill:#fff;vertical-align:top;}.bp-xc svg{width:16px}#bp_container .bp-xc{left:2%;bottom:100%;padding:9px 20px 7px;background:#d04444;border-radius:2px 2px 0 0;opacity:.85}#bp_container .bp-xc:focus,#bp_container .bp-xc:hover{opacity:1}.bp-lr{top:50%;top:calc(50% - 130px);padding:99px 0;width:6%;background:0;border:0;opacity:.4;transition:opacity .1s}.bp-lr:focus,.bp-lr:hover{opacity:.8}@keyframes bpf{50%{transform:translatex(15px)}100%{transform:none}}@keyframes bpl{50%{transform:translatex(-15px)}100%{transform:none}}@keyframes bpfl{0%{opacity:0;transform:translatex(70px)}100%{opacity:1;transform:none}}@keyframes bpfr{0%{opacity:0;transform:translatex(-70px)}100%{opacity:1;transform:none}}@keyframes bpfol{0%{opacity:1;transform:none}100%{opacity:0;transform:translatex(-70px)}}@keyframes bpfor{0%{opacity:1;transform:none}100%{opacity:0;transform:translatex(70px)}}@keyframes bpturn{0%{transform:none}100%{transform:rotate(360deg)}}@media (max-width:600px){.bp-lr{font-size:15vw}}",document.head[O](f),(e=document[N]("DIV")).id="bp_container",e.onclick=Y,l=s("bp-x"),e[O](l),"ontouchstart"in window&&(z=1,e.ontouchstart=function(n){var e=n.changedTouches;t=e[0].pageX},e.ontouchmove=function(t){t.preventDefault()},e.ontouchend=function(n){var e=n.changedTouches;if(y){var o=e[0].pageX-t;o<-30&&q(1),o>30&&q(-1)}}),i=document[N]("IMG"),(r=document[N]("VIDEO")).id="bp_vid",r.setAttribute("playsinline",1),r.controls=1,r.loop=1,(a=document[N]("audio")).id="bp_aud",a.controls=1,a.loop=1,(H=document[N]("span")).id="bp_count",(b=document[N]("DIV")).id="bp_caption",(x=s("bp-xc")).onclick=X.bind(null,0),b[O](x),g=document[N]("SPAN"),b[O](g),e[O](b),S=d(1,"transform:scalex(-1)"),L=d(-1,"left:0;right:auto"),(m=document[N]("DIV")).id="bp_loader",m.innerHTML='',(c=document[N]("DIV")).id="bp_sv",(p=document[N]("IFRAME")).setAttribute("allowfullscreen",1),p.allow="autoplay; fullscreen",p.onload=function(){return c[V](m)},j(p,"border:0;position:absolute;height:100%;width:100%;left:0;top:0"),c[O](p),i.onload=U,i.onerror=U.bind(null,"image"),window.addEventListener("resize",function(){y||u&&R(1),o===c&&P()}),document.addEventListener("keyup",function(t){var n=t.keyCode;27===n&&v&&Y(),y&&(39===n&&q(1),37===n&&q(-1),38===n&&q(10),40===n&&q(-10))}),document.addEventListener("keydown",function(t){y&&~[37,38,39,40].indexOf(t.keyCode)&&t.preventDefault()}),document.addEventListener("focus",function(t){v&&!e.contains(t.target)&&(t.stopPropagation(),l.focus())},1),n=1}(),u&&(clearTimeout(f),$()),I=w,d=w.ytSrc||w.vimeoSrc,T=w.animationStart,k=w.animationEnd,M=w.onChangeImage,_=0,h=(t=w.el).getAttribute("data-caption"),w.gallery?function(n,r){var a=I.galleryAttribute||"data-bp";if(Array.isArray(n))A=n,h=n[E=r||0].caption;else{var c=(A=[].slice.call("string"==typeof n?document.querySelectorAll(n+" ["+a+"]"):n)).indexOf(t);E=0===r||r?r:-1!==c?c:0,A=A.map(function(t){return{el:t,src:t.getAttribute(a),caption:t.getAttribute("data-caption")}})}_=1,!~C.indexOf(s=A[E].src)&&R(1),A.length>1?(e[O](H),H.innerHTML=E+1+"/"+A.length,z||(e[O](S),e[O](L))):A=0,(o=i).src=s}(w.gallery,w.position):d||w.iframeSrc?(o=c,I.ytSrc?W="https://www.youtube.com/embed/"+d+"?html5=1&rel=0&playsinline=1&autoplay=1":I.vimeoSrc?W="https://player.vimeo.com/video/"+d+"?autoplay=1":I.iframeSrc&&(W=I.iframeSrc),j(m,""),c[O](m),p.src=W,P(),setTimeout(U,9)):w.imgSrc?(_=1,!~C.indexOf(s=w.imgSrc)&&R(1),(o=i).src=s):w.audio?(R(1),(o=a).src=w.audio,G("audio file")):w.vidSrc?(R(1),w.dimensions&&j(r,"width:"+w.dimensions[0]+"px"),D=w.vidSrc,Array.isArray(D)?(o=r.cloneNode(),D.forEach(function(t){var n=document[N]("SOURCE");n.src=t,n.type="video/"+t.match(/.(\w+)$/)[1],o[O](n)})):(o=r).src=D,G("video")):(o=i).src="IMG"===t.tagName?t.src:window.getComputedStyle(t).backgroundImage.replace(/^url|[(|)|'|"]/g,""),e[O](o),document.body[O](e),{close:Y,next:function(){return q(1)},prev:function(){return q(-1)}};var W}}(); \ No newline at end of file diff --git a/assets/custom.js b/assets/custom.js new file mode 100644 index 00000000..59d19a51 --- /dev/null +++ b/assets/custom.js @@ -0,0 +1,158 @@ +var initAll = function () { + var path = window.location.pathname; + if (path.endsWith("/print.html")) { + return; + } + + var images = document.querySelectorAll("main img") + Array.prototype.forEach.call(images, function (img) { + img.addEventListener("click", function () { + BigPicture({ + el: img, + }); + }); + }); + + // Un-active everything when you click it + Array.prototype.forEach.call(document.getElementsByClassName("pagetoc")[0].children, function (el) { + el.addEventHandler("click", function () { + Array.prototype.forEach.call(document.getElementsByClassName("pagetoc")[0].children, function (el) { + el.classList.remove("active"); + }); + el.classList.add("active"); + }); + }); + + var updateFunction = function () { + var id = null; + var elements = document.getElementsByClassName("header"); + Array.prototype.forEach.call(elements, function (el) { + if (window.pageYOffset >= el.offsetTop) { + id = el; + } + }); + + Array.prototype.forEach.call(document.getElementsByClassName("pagetoc")[0].children, function (el) { + el.classList.remove("active"); + }); + + Array.prototype.forEach.call(document.getElementsByClassName("pagetoc")[0].children, function (el) { + if (id == null) { + return; + } + if (id.href.localeCompare(el.href) == 0) { + el.classList.add("active"); + } + }); + }; + + var pagetoc = document.getElementsByClassName("pagetoc")[0]; + var elements = document.getElementsByClassName("header"); + Array.prototype.forEach.call(elements, function (el) { + var link = document.createElement("a"); + + // Indent shows hierarchy + var indent = ""; + switch (el.parentElement.tagName) { + case "H1": + return; + case "H3": + indent = "20px"; + break; + case "H4": + indent = "40px"; + break; + default: + break; + } + + link.appendChild(document.createTextNode(el.text)); + link.style.paddingLeft = indent; + link.href = el.href; + pagetoc.appendChild(link); + }); + updateFunction.call(); + + // Handle active elements on scroll + window.addEventListener("scroll", updateFunction); + + document.getElementById("theme-list").addEventListener("click", function (e) { + var iframe = document.querySelector('.giscus-frame'); + if (!iframe) return; + var theme; + if (e.target.className === "theme") { + theme = e.target.id; + } else { + return; + } + + // 若当前 mdbook 主题不是 Light 或 Rust ,则将 giscuz 主题设置为 transparent_dark + var giscusTheme = "light" + if (theme != "light" && theme != "rust") { + giscusTheme = "transparent_dark"; + } + + var msg = { + setConfig: { + theme: giscusTheme + } + }; + iframe.contentWindow.postMessage({ giscus: msg }, 'https://giscus.app'); + }); + + pagePath = pagePath.replace("index.md", ""); + pagePath = pagePath.replace(".md", ""); + if (pagePath.length > 0) { + if (pagePath.charAt(pagePath.length-1) == "/"){ + pagePath = pagePath.substring(0, pagePath.length-1) + } + }else { + pagePath = "index" + } + + // add vistors count + var ele = document.createElement("div"); + ele.setAttribute("align","center"); + var count = document.createElement("img") + count.setAttribute("src", "https://visitor-badge.glitch.me/badge?page_id=" + path); + ele.appendChild(count); + var divider =document.createElement("hr") + + document.getElementById("giscus-container").appendChild(ele); + document.getElementById("giscus-container").appendChild(divider); + + // 选取浏览器默认使用的语言 + // const lang = navigator.language || navigator.userLanguage + + // 若当前 mdbook 主题为 Light 或 Rust ,则将 giscuz 主题设置为 light + var theme = "transparent_dark"; + const themeClass = document.getElementsByTagName("html")[0].className; + if (themeClass.indexOf("light") != -1 || themeClass.indexOf("rust") != -1) { + theme = "light" + } + + var script = document.createElement("script") + script.type = "text/javascript"; + script.src = "https://giscus.app/client.js"; + script.async = true; + script.crossOrigin = "anonymous"; + script.setAttribute("data-repo", "sunface/rust-course"); + script.setAttribute("data-repo-id", "MDEwOlJlcG9zaXRvcnkxNDM4MjIwNjk="); + script.setAttribute("data-category", "章节评论区"); + script.setAttribute("data-category-id", "DIC_kwDOCJKM9c4COQcP"); + script.setAttribute("data-mapping", "specific"); + script.setAttribute("data-term", pagePath); + script.setAttribute("data-reactions-enabled", "1"); + script.setAttribute("data-emit-metadata", "0"); + script.setAttribute("data-input-position", "top"); + script.setAttribute("data-theme", theme); + // script.setAttribute("data-lang", lang); + // 预先加载评论会更好,这样用户读到那边时,评论就加载好了 + // script.setAttribute("data-loading", "lazy"); + document.getElementById("giscus-container").appendChild(script); + + + +}; + +window.addEventListener('load', initAll); \ No newline at end of file diff --git a/assets/ferris.css b/assets/ferris.css deleted file mode 100644 index b856d477..00000000 --- a/assets/ferris.css +++ /dev/null @@ -1,33 +0,0 @@ -body.light .does_not_compile, -body.light .panics, -body.light .not_desired_behavior, -body.rust .does_not_compile, -body.rust .panics, -body.rust .not_desired_behavior { - background: #fff1f1; -} - -body.coal .does_not_compile, -body.coal .panics, -body.coal .not_desired_behavior, -body.navy .does_not_compile, -body.navy .panics, -body.navy .not_desired_behavior, -body.ayu .does_not_compile, -body.ayu .panics, -body.ayu .not_desired_behavior { - background: #501f21; -} - -.ferris { - position: absolute; - z-index: 99; - right: 5px; - top: 30px; - width: 10%; - height: auto; -} - -.ferris-explain { - width: 100px; -} \ No newline at end of file diff --git a/assets/ferris.js b/assets/ferris.js deleted file mode 100644 index 06a40cd7..00000000 --- a/assets/ferris.js +++ /dev/null @@ -1,51 +0,0 @@ -var ferrisTypes = [ - { - attr: 'does_not_compile', - title: 'This code does not compile!' - }, - { - attr: 'panics', - title: 'This code panics!' - }, - { - attr: 'unsafe', - title: 'This code block contains unsafe code.' - }, - { - attr: 'not_desired_behavior', - title: 'This code does not produce the desired behavior.' - } -] - -document.addEventListener('DOMContentLoaded', () => { - for (var ferrisType of ferrisTypes) { - attachFerrises(ferrisType) - } -}) - -function attachFerrises (type) { - var elements = document.getElementsByClassName(type.attr) - - for (var codeBlock of elements) { - var lines = codeBlock.textContent.split(/\r|\r\n|\n/).length - 1; - - if (lines >= 4) { - attachFerris(codeBlock, type) - } - } -} - -function attachFerris (element, type) { - var a = document.createElement('a') - a.setAttribute('href', 'ch00-00-introduction.html#ferris') - a.setAttribute('target', '_blank') - - var img = document.createElement('img') - img.setAttribute('src', '/img/ferris/' + type.attr + '.svg') - img.setAttribute('title', type.title) - img.className = 'ferris' - - a.appendChild(img) - - element.parentElement.insertBefore(a, element) -} \ No newline at end of file diff --git a/assets/sitemap.xml b/assets/sitemap.xml index 6bb6863c..bb88977c 100644 --- a/assets/sitemap.xml +++ b/assets/sitemap.xml @@ -426,62 +426,62 @@ weekly - + 2021-12-30 weekly - + 2021-12-30 weekly - + 2021-12-30 weekly - + 2021-12-30 weekly - + 2021-12-30 weekly - + 2021-12-30 weekly - + 2021-12-30 weekly - + 2021-12-30 weekly - + 2021-12-30 weekly - + 2021-12-30 weekly - + 2021-12-30 weekly - + 2021-12-30 weekly diff --git a/assets/studyrust公众号.png b/assets/studyrust公众号.png new file mode 100644 index 00000000..2fddd2d5 Binary files /dev/null and b/assets/studyrust公众号.png differ diff --git a/assets/theme/2018-edition.css b/assets/theme/2018-edition.css deleted file mode 100644 index b1dcf936..00000000 --- a/assets/theme/2018-edition.css +++ /dev/null @@ -1,9 +0,0 @@ -span.caption { - font-size: .8em; - font-weight: 600; -} - -span.caption code { - font-size: 0.875em; - font-weight: 400; -} diff --git a/assets/zhihu.jpg b/assets/zhihu.jpg new file mode 100644 index 00000000..a4075a25 Binary files /dev/null and b/assets/zhihu.jpg differ diff --git a/book.toml b/book.toml index 246e69a4..00c73b29 100644 --- a/book.toml +++ b/book.toml @@ -1,19 +1,19 @@ [book] authors = ["sunface"] language = "zh-CN" -title = "Rust语言圣经(Rust教程 Rust Course)" +title = "Rust语言圣经(Rust Course)" src = "src" [output.html] -additional-css = ["assets/ferris.css", "assets/theme/2018-edition.css"] -additional-js = ["assets/ferris.js"] +additional-css = ["theme/style3.css"] +additional-js = ["assets/custom.js", "assets/bigPicture.js"] git-repository-url = "https://github.com/sunface/rust-course" edit-url-template = "https://github.com/sunface/rust-course/edit/main/{path}" [output.html.playground] editable = true copy-js = true -line-numbers = true +# line-numbers = true [output.html.fold] enable = true diff --git a/src/SUMMARY.md b/src/SUMMARY.md index 800199b7..263b916f 100644 --- a/src/SUMMARY.md +++ b/src/SUMMARY.md @@ -1,22 +1,27 @@ # Rust 语言圣经 +[Rust语言圣经](about-book.md) [进入 Rust 编程世界](into-rust.md) -[AWS 为何这么喜欢 Rust?](usecases/aws-rust.md) -[避免从入门到放弃](sth-you-should-not-do.md) -[关于本书](about-book.md) - [快速查询入口](index-list.md) -## Getting started +--- +[StudyRust 社区](studyrust.md) +[一本生锈的书](rusty-book.md) +[Rust 语言周刊](rust-weekly.md) +[Rustt 翻译计划](rustt.md) +# 快速开始 +--- - [寻找牛刀,以便小试](first-try/intro.md) - [安装 Rust 环境](first-try/installation.md) - [墙推 VSCode!](first-try/editor.md) - [认识 Cargo](first-try/cargo.md) - [不仅仅是 Hello world](first-try/hello-world.md) - -## Rust 学习三部曲 - + - [下载依赖太慢了?](first-try/slowly-downloading.md) + - [避免从入门到放弃](first-try/sth-you-should-not-do.md) + +# Rust语言特性 +--- - [Rust 基础入门](basic/intro.md) - [变量绑定与解构](basic/variable.md) - [基本类型](basic/base-type/index.md) @@ -58,6 +63,7 @@ - [使用 use 引入模块及受限可见性](basic/crate-module/use.md) - [注释和文档](basic/comment.md) - [格式化输出](basic/formatted-output.md) + - [Rust 高级进阶](advance/intro.md) - [生命周期](advance/lifetime/intro.md) - [认识生命周期](advance/lifetime/basic.md) @@ -96,38 +102,47 @@ - [Macro 宏编程](advance/macro.md) + + - [易混淆概念解析](advance/confonding/intro.md) + - [切片和切片引用](advance/confonding/slice.md) + - [Eq 和 PartialEq](advance/confonding/eq.md) + - [String、&str 和 str todo](advance/confonding/string.md) + - [裸指针、引用和智能指针 todo](advance/confonding/pointer.md) + - [作用域、生命周期和 NLL todo](advance/confonding/lifetime.md) + - [move、Copy 和 Clone todo](advance/confonding/move-copy.md) -## 专题内容,每个专题都配套一个小型项目进行实践 - +- [Rust 异步编程](async-rust/intro.md) + - [async/await 异步编程](async-rust/async/intro.md) + - [async 编程入门](async-rust/async/getting-started.md) + - [底层探秘: Future 执行与任务调度](async-rust/async/future-excuting.md) + - [定海神针 Pin 和 Unpin](async-rust/async/pin-unpin.md) + - [async/await 和 Stream 流处理](async-rust/async/async-await.md) + - [同时运行多个 Future](async-rust/async/multi-futures-simultaneous.md) + - [一些疑难问题的解决办法](async-rust/async/pain-points-and-workarounds.md) + - [实践应用:Async Web 服务器](async-rust/async/web-server.md) + - [Tokio 使用指南](async-rust/tokio/intro.md) + - [tokio 概览](async-rust/tokio/overview.md) + - [使用初印象](async-rust/tokio/getting-startted.md) + - [创建异步任务](async-rust/tokio/spawning.md) + - [共享状态](async-rust/tokio/shared-state.md) + - [消息传递](async-rust/tokio/channels.md) + - [I/O](async-rust/tokio/io.md) + - [解析数据帧](async-rust/tokio/frame.md) + - [深入 async](async-rust/tokio/async.md) + - [select](async-rust/tokio/select.md) + - [类似迭代器的 Stream](async-rust/tokio/stream.md)) + - [优雅的关闭](async-rust/tokio/graceful-shutdown.md) + - [异步跟同步共存](async-rust/tokio/bridging-with-sync.md) + +# 常用工具链 +--- - [自动化测试](test/intro.md) - [编写测试及控制执行](test/write-tests.md) - [单元测试和集成测试](test/unit-integration-test.md) - [断言 assertion](test/assertion.md) - - [用 Github Actions 进行持续集成](test/ci.md) + - [用 GitHub Actions 进行持续集成](test/ci.md) - [基准测试 benchmark](test/benchmark.md) -- [async/await 异步编程](async/intro.md) - - [async 编程入门](async/getting-started.md) - - [底层探秘: Future 执行与任务调度](async/future-excuting.md) - - [定海神针 Pin 和 Unpin](async/pin-unpin.md) - - [async/await 和 Stream 流处理](async/async-await.md) - - [同时运行多个 Future](async/multi-futures-simultaneous.md) - - [一些疑难问题的解决办法](async/pain-points-and-workarounds.md) - - [实践应用:Async Web 服务器](async/web-server.md) -- [Tokio 使用指南](tokio/intro.md) - - [tokio 概览](tokio/overview.md) - - [使用初印象](tokio/getting-startted.md) - - [创建异步任务](tokio/spawning.md) - - [共享状态](tokio/shared-state.md) - - [消息传递](tokio/channels.md) - - [I/O](tokio/io.md) - - [解析数据帧](tokio/frame.md) - - [深入 async](tokio/async.md) - - [select](tokio/select.md) - - [类似迭代器的 Stream](tokio/stream.md)) - - [优雅的关闭](tokio/graceful-shutdown.md) - - [异步跟同步共存](tokio/bridging-with-sync.md) - - [Cargo 使用指南](cargo/intro.md) - [上手使用](cargo/getting-started.md) - [基础指南](cargo/guide/intro.md) @@ -151,9 +166,28 @@ - [通过 config.toml 对 Cargo 进行配置](cargo/reference/configuration.md) - [发布到 crates.io](cargo/reference/publishing-on-crates.io.md) - [构建脚本 build.rs](cargo/reference/build-script/intro.md) - - [构建脚本示例](cargo/reference/build-script/examples.md) + - [构建脚本示例](cargo/reference/build-script/examples.md) + +# 开发实践 +--- +- [企业落地实践](usecases/intro.md) + - [AWS 为何这么喜欢 Rust?](usecases/aws-rust.md) -- [手把手带你实现链表 doing](too-many-lists/intro.md) +- [日志和监控](logs/intro.md) + - [日志详解](logs/about-log.md) + - [日志门面 log](logs/log.md) + - [使用 tracing 记录日志](logs/tracing.md) + - [自定义 tracing 的输出格式](logs/tracing-logger.md) + - [监控](logs/observe/intro.md) + - [可观测性](logs/observe/about-observe.md) + - [分布式追踪](logs/observe/trace.md) +- [Rust 最佳实践](practice/intro.md) + - [日常开发三方库精选](practice/third-party-libs.md) + - [命名规范](practice/naming.md) + - [面试经验](practice/interview.md) + - [代码开发实践 todo](practice/best-pratice.md) + +- [手把手带你实现链表](too-many-lists/intro.md) - [我们到底需不需要链表](too-many-lists/do-we-need-it.md) - [不太优秀的单向链表:栈](too-many-lists/bad-stack/intro.md) - [数据布局](too-many-lists/bad-stack/layout.md) @@ -162,49 +196,61 @@ - [还可以的单向链表](too-many-lists/ok-stack/intro.md) - [优化类型定义](too-many-lists/ok-stack/type-optimizing.md) - [定义 Peek 函数](too-many-lists/ok-stack/peek.md) + - [IntoIter 和 Iter](too-many-lists/ok-stack/iter.md) + - [IterMut以及完整代码](too-many-lists/ok-stack/itermut.md) + - [持久化单向链表](too-many-lists/persistent-stack/intro.md) + - [数据布局和基本操作](too-many-lists/persistent-stack/layout.md) + - [Drop、Arc 及完整代码](too-many-lists/persistent-stack/drop-arc.md) + - [不咋样的双端队列](too-many-lists/deque/intro.md) + - [数据布局和基本操作](too-many-lists/deque/layout.md) + - [Peek](too-many-lists/deque/peek.md) + - [基本操作的对称镜像](too-many-lists/deque/symmetric.md) + - [迭代器](too-many-lists/deque/iterator.md) + - [最终代码](too-many-lists/deque/final-code.md) + - [不错的unsafe队列](too-many-lists/unsafe-queue/intro.md) + - [数据布局](too-many-lists/unsafe-queue/layout.md) + - [基本操作](too-many-lists/unsafe-queue/basics.md) + - [Miri](too-many-lists/unsafe-queue/miri.md) + - [栈借用](too-many-lists/unsafe-queue/stacked-borrow.md) + - [测试栈借用](too-many-lists/unsafe-queue/testing-stacked-borrow.md) + - [数据布局2](too-many-lists/unsafe-queue/layout2.md) + - [额外的操作](too-many-lists/unsafe-queue/extra-junk.md) + - [最终代码](too-many-lists/unsafe-queue/final-code.md) + - [使用高级技巧实现链表](too-many-lists/advanced-lists/intro.md) + - [生产级可用的双向链表](too-many-lists/advanced-lists/unsafe-deque.md) + - [双单向链表](too-many-lists/advanced-lists/double-singly.md) + - [栈上的链表](too-many-lists/advanced-lists/stack-allocated.md) -- [易混淆概念解析](confonding/intro.md) - - [切片和切片引用](confonding/slice.md) - - [Eq 和 PartialEq](confonding/eq.md) - - [String、&str 和 str todo](confonding/string.md) - - [原生指针、引用和智能指针 todo](confonding/pointer.md) - - [作用域、生命周期和 NLL todo](confonding/lifetime.md) - - [move、Copy 和 Clone todo](confonding/move-copy.md) - -- [对抗编译检查 doing](fight-with-compiler/intro.md) - - [幽灵数据(todo)](fight-with-compiler/phantom-data.md) - - [生命周期](fight-with-compiler/lifetime/intro.md) - - [生命周期过大-01](fight-with-compiler/lifetime/too-long1.md) - - [生命周期过大-02](fight-with-compiler/lifetime/too-long2.md) - - [循环中的生命周期](fight-with-compiler/lifetime/loop.md) - - [闭包碰到特征对象-01](fight-with-compiler/lifetime/closure-with-static.md) - - [重复借用](fight-with-compiler/borrowing/intro.md) - - [同时在函数内外使用引用](fight-with-compiler/borrowing/ref-exist-in-out-fn.md) - - [智能指针引起的重复借用错误](fight-with-compiler/borrowing/borrow-distinct-fields-of-struct.md) - - [类型未限制(todo)](fight-with-compiler/unconstrained.md) -- [Rust 常见陷阱](pitfalls/index.md) +# 高级专题 +--- - - [for 循环中使用外部数组](pitfalls/use-vec-in-for.md) - - [线程类型导致的栈溢出](pitfalls/stack-overflow.md) - - [算术溢出导致的 panic](pitfalls/arithmetic-overflow.md) - - [闭包中奇怪的生命周期](pitfalls/closure-with-lifetime.md) - - [可变变量不可变?](pitfalls/the-disabled-mutability.md) - - [可变借用失败引发的深入思考](pitfalls/multiple-mutable-references.md) - - [不太勤快的迭代器](pitfalls/lazy-iterators.md) - - [奇怪的序列 x..y](pitfalls/weird-ranges.md) - - [无处不在的迭代器](pitfalls/iterator-everywhere.md) - - [线程间传递消息导致主线程无法结束](pitfalls/main-with-channel-blocked.md) +- [征服编译错误](compiler/intro.md) + - [对抗编译检查](compiler/fight-with-compiler/intro.md) + - [生命周期](compiler/fight-with-compiler/lifetime/intro.md) + - [生命周期过大-01](compiler/fight-with-compiler/lifetime/too-long1.md) + - [生命周期过大-02](compiler/fight-with-compiler/lifetime/too-long2.md) + - [循环中的生命周期](compiler/fight-with-compiler/lifetime/loop.md) + - [闭包碰到特征对象-01](compiler/fight-with-compiler/lifetime/closure-with-static.md) + - [重复借用](compiler/fight-with-compiler/borrowing/intro.md) + - [同时在函数内外使用引用](compiler/fight-with-compiler/borrowing/ref-exist-in-out-fn.md) + - [智能指针引起的重复借用错误](compiler/fight-with-compiler/borrowing/borrow-distinct-fields-of-struct.md) + - [类型未限制(todo)](compiler/fight-with-compiler/unconstrained.md) + - [幽灵数据(todo)](compiler/fight-with-compiler/phantom-data.md) + - [Rust 常见陷阱](compiler/pitfalls/index.md) + - [for 循环中使用外部数组](compiler/pitfalls/use-vec-in-for.md) + - [线程类型导致的栈溢出](compiler/pitfalls/stack-overflow.md) + - [算术溢出导致的 panic](compiler/pitfalls/arithmetic-overflow.md) + - [闭包中奇怪的生命周期](compiler/pitfalls/closure-with-lifetime.md) + - [可变变量不可变?](compiler/pitfalls/the-disabled-mutability.md) + - [可变借用失败引发的深入思考](compiler/pitfalls/multiple-mutable-references.md) + - [不太勤快的迭代器](compiler/pitfalls/lazy-iterators.md) + - [奇怪的序列 x..y](compiler/pitfalls/weird-ranges.md) + - [无处不在的迭代器](compiler/pitfalls/iterator-everywhere.md) + - [线程间传递消息导致主线程无法结束](compiler/pitfalls/main-with-channel-blocked.md) + - [警惕 UTF-8 引发的性能隐患](compiler/pitfalls/utf8-performance.md) -- [Rust 最佳实践 doing](practice/intro.md) - - [日常开发三方库精选](practice/third-party-libs.md) - - [命名规范](practice/naming.md) - - [代码开发实践 todo](practice/best-pratice.md) - - [日志记录 todo](practice/logs.md) - - [可观测性监控 todo](practice/observability.md) - - [面试经验 doing](practice/interview.md) - -- [Rust 性能剖析 todo](profiling/intro.md) +- [Rust 性能优化 todo](profiling/intro.md) - [深入内存 todo](profiling/memory/intro.md) - [指针和引用 todo](profiling/memory/pointer-ref.md) - [未初始化内存 todo](profiling/memory/uninit.md) @@ -236,28 +282,28 @@ - [HashMap todo](std/hashmap.md) - [Iterator 常用方法 todo](std/iterator.md) -- [Ctrl-C/V: 编程常用代码片段 todo](cases/intro.md) - - [命令行解析 todo](cases/cmd.md) - - [配置文件解析 todo](cases/config.md) - - [编解码 todo](cases/encoding/intro.md) - - [JSON](cases/encoding/json.md) - - [CSV](cases/encoding/csv.md) - - [protobuf](cases/encoding/protobuf.md) - - [文件系统 todo](cases/file/intro.md) - - [文件读写](cases/file/file.md) - - [目录操作](cases/file/dir.md) - - [网络通信 todo](cases/protocol/intro.md) - - [HTTP](cases/protocol/http.md) - - [TCP](cases/protocol/tcp.md) - - [UDP](cases/protocol/udp.md) - - [gRPC](cases/protocol/grpc.md) - - [数据库访问 todo](cases/database.md) - - [正则表达式 todo](cases/regexp.md) - - [加密解密 todo](cases/crypto.md) - - [时间日期](cases/date.md) - - [开发调试 todo](cases/dev/intro.md) - - [日志](cases/dev/logs.md) - - [性能分析](cases/dev/profile.md) + + + -## 附录 -- [附录](appendix/intro.md) - - [A-关键字](appendix/keywords.md) - - [B-运算符与符号](appendix/operators.md) - - [C-表达式](appendix/expressions.md) - - [D-派生特征 trait](appendix/derive.md) - - [E-prelude 模块 todo](appendix/prelude.md) - - [F-Rust 版本说明](appendix/rust-version.md) - - [G-Rust 更新版本列表](appendix/rust-versions/intro.md) +# 附录 +--- + +- [Appendix]() + - [关键字](appendix/keywords.md) + - [运算符与符号](appendix/operators.md) + - [表达式](appendix/expressions.md) + - [派生特征 trait](appendix/derive.md) + - [prelude 模块 todo](appendix/prelude.md) + - [Rust 版本说明](appendix/rust-version.md) + - [Rust 历次版本更新解读](appendix/rust-versions/intro.md) - [1.58](appendix/rust-versions/1.58.md) - [1.59](appendix/rust-versions/1.59.md) + - [1.60](appendix/rust-versions/1.60.md) \ No newline at end of file diff --git a/src/about-book.md b/src/about-book.md index b2e9a377..5063e3b8 100644 --- a/src/about-book.md +++ b/src/about-book.md @@ -1,58 +1,106 @@ -# Rust 语言圣经 (The Course) + -- 在线阅读 - - 官方: [https://course.rs](https://course.rs) - - 知乎: [支持章节内目录跳转,很好用!](https://www.zhihu.com/column/c_1452781034895446017) +Rust语言真的好:连续六年成为全世界最受欢迎的语言、没有GC也无需手动内存管理、性能比肩 C++/C 还能直接调用它们的代码、安全性极高 - 总有公司说使用 Rust 后以前的大部分 bug 都将自动消失、全世界最好的包管理工具 Cargo 等等。但... -> 学习 Rust 光看书不够,精心设计的习题和项目实践可以让你事半功倍。[Rust By Practice](https://github.com/sunface/rust-by-practice) 是本书的配套习题和实践,覆盖了 easy to hard 各个难度,满足大家对 Rust 的所有期待。 -> -> [Rust 语言周刊](https://github.com/sunface/rust-weekly),每周一发布,精选过去一周的技术文章、业界新闻、开源项目和 Rust 语言动态。 -> -> Rust 优秀项目很多,如何在茫茫码海中与它们相遇?相比 Awesome Rust, [Fancy Rust](https://github.com/sunface/fancy-rust) 能带给你全新的体验和选择。 - -### 教程简介 - -**`Rust语言圣经`**涵盖从**入门到精通**所需的 Rust 知识,目录及内容都经过深思熟虑的设计,同时语言生动幽默,行文流畅自如,摆脱技术书籍常有的机器味和晦涩感。 - -在 Rust 基础教学的同时,我们还提供了(部分): - -- **深入度**,在基础教学的同时,提供了深入剖析。浅尝辄止并不能让我们站上紫禁之巅 -- **性能优化**,选择 Rust,意味着就要追求性能,因此你需要体系化的了解性能优化 -- **专题**,将 Rust 高级内容通过专题的方式一一呈现,内容内聚性极强 -- **难点和错误索引**,作为一本工具书,优秀的索引能力非常重要,遗忘不可怕,找不到才可怕 -- **场景化模版**,程序员上网查询如何操作文件是常事,没有人能记住所有代码,场景化模版可解君忧 - -总之在写作过程中我们始终铭记初心:为中国用户打造一门**全面的、深入的、持续更新的** Rust 教程。 新手用来入门,老手用来提高,高手用来提升生产力。 - -### 开源说明 - -在开源版权上,我们选择了 [No License](https://www.google.com.hk/url?sa=t&rct=j&q=&esrc=s&source=web&cd=&ved=2ahUKEwigkv-KtMT0AhXFdXAKHdI4BCcQFnoECAQQAw&url=https%3A%2F%2Fchoosealicense.com%2Fno-permission%2F&usg=AOvVaw3M2Q4IbdhnpJ2K71TF7SPB),这意味着读者可以随意的 fork 和阅读,但是**不能私下修改后再包装分发**,如果有这方面的需求,请联系我们,望理解。 +**有人说: "Rust 太难了,学了也没用"。** -Rust 语言圣经是**完全开源**的电子书,每个章节都至少用时 4-6 个小时才能初步完稿,牺牲了大量休闲娱乐、陪伴家人的时间,还没有任何钱赚。 +对于后面一句话我们持保留意见,如果以找工作为标准,那国内环境确实还不好,但如果你想成为更优秀的程序员或者是玩转开源,那 Rust 还真是不错的选择,具体原因见[下一章](https://course.rs/into-rust.html)。 -**如果大家觉得这本书作者真的用心了,希望你能帮我们点一个 🌟 `star`。感激不尽!:)** +至于 Rust 难学,那正是本书要解决的问题,如果看完后,你觉得没有学会 Rust,可以找我们退款,哦抱歉,这是开源书,那就退 🌟 吧:) -### 借鉴的书籍 +如果看到这里,大家觉得这本书的介绍并没有吸引到你,不要立即放弃,强烈建议读一下[进入 Rust 编程世界](https://course.rs/into-rust.html),那里会有不一样的精彩。 -站在巨人的肩膀上,能帮我们看的更远,特此感谢以下巨人: - -- [Rust Book](https://doc.rust-lang.org/book) -- [Rust nomicon](https://doc.rust-lang.org/nomicon/dot-operator.html) -- [Async Rust](https://rust-lang.github.io/async-book/01_getting_started/01_chapter.html) -- 详细清单参见 [这里](https://github.com/sunface/rust-course/blob/main/assets/writing-material/books.md) - -因为它们绝大部分是支持 APACHE + MIT 双协议的,因此我们选择了遵循其中的 MIT 协议,并在这里统一对借鉴的书籍进行说明。 - -### 贡献者 - -非常感谢本教程的所有贡献者们,正是有了你们,才有了现在的高质量 Rust 教程! - -- [@JesseAtSZ](https://github.com/JesseAtSZ) -- [@mg-chao](https://github.com/mg-chao) -- [@1132719438](https://github.com/1132719438) -- [@codemystery](https://github.com/codemystery) -- [@AllanDowney](https://github.com/AllanDowney) -- [@Mintnoii](https://github.com/Mintnoii) - -尤其感谢这些主要贡献者,谢谢你们花费大量时间贡献了多处`fix`和高质量的内容优化。非常感动,再次感谢~~ +> 本书完全开源,所有的文档内容都在 `GitHub` 上,至于里面还藏有什么秘密,大家点击右上角自行发现吧 :) +> +> 小秘密一: 你们可能会好奇,这本书到底与其它 Rust 书籍有[哪些不同](https://github.com/sunface/rust-course#教程简介) + +## 配套练习题 +对于学习编程而言,读一篇文章不如做几道练习题,此话虽然夸张,但是也不无道理。既然如此,即读书又做练习题,效果会不会更好?再加上练习题是书本的配套呢? :P + +- [Rust语言实战](https://github.com/sunface/rust-by-practice), Rust语言圣经配套习题,支持中英双语,可以在右上角切换 + +## 创作感悟 + +截至目前,Rust语言圣经已写了 170 余章,110 余万字,历经 800 多个小时,每一个章节都是手动写就,没有任何机翻和质量上的妥协( 相信深入阅读过的读者都能体会到这一点 )。 + +曾经有读者问过 "这么好的书为何要开源,而不是出版?",原因很简单:**只有完全开源才能完美地呈现出我想要的教学效果**。 + +总之,Rust 要在国内真正发展起来,必须得有一些追逐梦想的人在做着不计付出的事情,而我希望自己能贡献一份微薄之力。 + +但是要说完全无欲无求,那也是不可能的,看到项目多了一颗 🌟,那感觉...棒极了,因为它代表了读者的认可和称赞。 + +你们用指尖绘制的星空,那里繁星点点,每一颗都在鼓励着怀揣着开源梦想的程序员披荆斩棘、不断前行,不夸张的说,没有你们,开源世界就没有星光,自然也就不会有今天的开源盛世。 + +因此,**我恳请大家,如果觉得书还可以,就在你的指尖星空绘制一颗新的 🌟,指引我们继续砥砺前行**。这个人世间,因善意而美好。 + +最后,能通过开源在茫茫人海中与大家相识,这感觉真好 :D + +## 🏅 贡献者 + +非常感谢本教程的[所有贡献者](https://github.com/sunface/rust-course/graphs/contributors),正是有了你们,才有了现在的高质量 Rust 教程! + +
+ +**🏆 贡献榜前三**(根据难易度、贡献次数、活跃度综合评定): + + + + + + +
+ + +
+ Sunface 🥇 +
+
+ + +
+ AllanDowney 🥈 +
+
+ + +
+ JesseAtSZ 🥉 +
+
+ +
+ +🏅 核心贡献者: + + + + + + + +
+ + +
+ 1132719438 +
+
+ + +
+ zongzi531 +
+
+ + +
+ Mintnoii +
+
+ + +
+ Rustln +
+
diff --git a/src/advance/circle-self-ref/circle-reference.md b/src/advance/circle-self-ref/circle-reference.md index 6839f544..197c87ab 100644 --- a/src/advance/circle-self-ref/circle-reference.md +++ b/src/advance/circle-self-ref/circle-reference.md @@ -295,11 +295,11 @@ fn main() { ## unsafe 解决循环引用 -除了使用 Rust 标准库提供的这些类型,你还可以使用 `unsafe` 里的原生指针来解决这些棘手的问题,但是由于我们还没有讲解 `unsafe`,因此这里就不进行展开,只附上[源码链接](https://github.com/sunface/rust-algos/blob/fbcdccf3e8178a9039329562c0de0fd01a3372fb/src/unsafe/self-ref.md), 挺长的,需要耐心 o_o +除了使用 Rust 标准库提供的这些类型,你还可以使用 `unsafe` 里的裸指针来解决这些棘手的问题,但是由于我们还没有讲解 `unsafe`,因此这里就不进行展开,只附上[源码链接](https://github.com/sunface/rust-algos/blob/fbcdccf3e8178a9039329562c0de0fd01a3372fb/src/unsafe/self-ref.md), 挺长的,需要耐心 o_o 虽然 `unsafe` 不安全,但是在各种库的代码中依然很常见用它来实现自引用结构,主要优点如下: -- 性能高,毕竟直接用原生指针操作 +- 性能高,毕竟直接用裸指针操作 - 代码更简单更符合直觉: 对比下 `Option>>` ## 总结 diff --git a/src/advance/circle-self-ref/self-referential.md b/src/advance/circle-self-ref/self-referential.md index 4daf9d08..11fedf63 100644 --- a/src/advance/circle-self-ref/self-referential.md +++ b/src/advance/circle-self-ref/self-referential.md @@ -160,9 +160,9 @@ fn main() { } ``` -在这里,我们在 `pointer_to_value` 中直接存储原生指针,而不是 Rust 的引用,因此不再受到 Rust 借用规则和生命周期的限制,而且实现起来非常清晰、简洁。但是缺点就是,通过指针获取值时需要使用 `unsafe` 代码。 +在这里,我们在 `pointer_to_value` 中直接存储裸指针,而不是 Rust 的引用,因此不再受到 Rust 借用规则和生命周期的限制,而且实现起来非常清晰、简洁。但是缺点就是,通过指针获取值时需要使用 `unsafe` 代码。 -当然,上面的代码你还能通过原生指针来修改 `String`,但是需要将 `*const` 修改为 `*mut`: +当然,上面的代码你还能通过裸指针来修改 `String`,但是需要将 `*const` 修改为 `*mut`: ```rust #[derive(Debug)] @@ -230,7 +230,7 @@ use std::ptr::NonNull; // 下面是一个自引用数据结构体,因为 slice 字段是一个指针,指向了 data 字段 // 我们无法使用普通引用来实现,因为违背了 Rust 的编译规则 -// 因此,这里我们使用了一个原生指针,通过 NonNull 来确保它不会为 null +// 因此,这里我们使用了一个裸指针,通过 NonNull 来确保它不会为 null struct Unmovable { data: String, slice: NonNull, @@ -272,7 +272,7 @@ fn main() { 上面的代码也非常清晰,虽然使用了 `unsafe`,其实更多的是无奈之举,跟之前的 `unsafe` 实现完全不可同日而语。 -其实 `Pin` 在这里并没有魔法,它也并不是实现自引用类型的主要原因,最关键的还是里面的原生指针的使用,而 `Pin` 起到的作用就是确保我们的值不会被移走,否则指针就会指向一个错误的地址! +其实 `Pin` 在这里并没有魔法,它也并不是实现自引用类型的主要原因,最关键的还是里面的裸指针的使用,而 `Pin` 起到的作用就是确保我们的值不会被移走,否则指针就会指向一个错误的地址! ## 使用 ouroboros diff --git a/src/advance/concurrency-with-threads/concurrency-parallelism.md b/src/advance/concurrency-with-threads/concurrency-parallelism.md index e8230106..8339c5d9 100644 --- a/src/advance/concurrency-with-threads/concurrency-parallelism.md +++ b/src/advance/concurrency-with-threads/concurrency-parallelism.md @@ -4,7 +4,7 @@ 并行和并发其实并不难,但是也给一些用户造成了困扰,因此我们专门开辟一个章节,用于讲清楚这两者的区别。 -`Erlang` 之父 [`Joe Armstrong`]()(伟大的异步编程先驱,开创一个时代的殿堂级计算机科学家,我还犹记得当年刚学到 `Erlang` 时的震撼,respect!)用一张 5 岁小孩都能看到的图片解释了并发与并行的区别: +`Erlang` 之父 [`Joe Armstrong`]()(伟大的异步编程先驱,开创一个时代的殿堂级计算机科学家,我还犹记得当年刚学到 `Erlang` 时的震撼,respect!)用一张 5 岁小孩都能看懂的图片解释了并发与并行的区别: @@ -19,7 +19,7 @@ ## CPU 多核 -现在的个人计算机动辄拥有十来个核心(M1 Max/Intel 12 代),如果使用串行的方式那真是太低调了,因此我们把各种任务简单分成多个队列,每个队列都交给一个 CPU 核心去执行,当某个 CPU 核心没有任务时,它还能去其它核心的队列中偷任务(真·老黄牛),这样就实现了并行化处理。 +现在的个人计算机动辄拥有十来个核心(M1 Max/Intel 12 代),如果使用串行的方式那真是太低效了,因此我们把各种任务简单分成多个队列,每个队列都交给一个 CPU 核心去执行,当某个 CPU 核心没有任务时,它还能去其它核心的队列中偷任务(真·老黄牛),这样就实现了并行化处理。 #### 单核心并发 diff --git a/src/advance/concurrency-with-threads/message-passing.md b/src/advance/concurrency-with-threads/message-passing.md index d1aad470..dbf7ba23 100644 --- a/src/advance/concurrency-with-threads/message-passing.md +++ b/src/advance/concurrency-with-threads/message-passing.md @@ -226,7 +226,7 @@ fn main() { thread::sleep(Duration::from_secs(3)); println!("睡眠之后"); - println!("收到值 {}", rx.recv().unwrap()); + println!("receive {}", rx.recv().unwrap()); handle.join().unwrap(); } ``` @@ -239,7 +239,7 @@ fn main() { 发送之后 //···睡眠3秒 睡眠之后 -收到值 1 +receive 1 ``` 主线程因为睡眠阻塞了 3 秒,因此并没有进行消息接收,而子线程却在此期间轻松完成了消息的发送。等主线程睡眠结束后,才姗姗来迟的从通道中接收了子线程老早之前发送的消息。 @@ -279,11 +279,11 @@ fn main() { 发送之前 //···睡眠3秒 睡眠之后 -收到值 1 +receive 1 发送之后 ``` -可以看出,主线程由于睡眠被阻塞导致无法接收消息,因此子线程的发送也一直被阻塞,直到主线程结束睡眠并成功接收消息后,发送才成功:**发送之后**的输出是在**收到值 1**之后,说明**只有接收消息彻底成功后,发送消息才算完成**。 +可以看出,主线程由于睡眠被阻塞导致无法接收消息,因此子线程的发送也一直被阻塞,直到主线程结束睡眠并成功接收消息后,发送才成功:**发送之后**的输出是在**receive 1**之后,说明**只有接收消息彻底成功后,发送消息才算完成**。 #### 消息缓存 diff --git a/src/advance/concurrency-with-threads/send-sync.md b/src/advance/concurrency-with-threads/send-sync.md index 44dcdb27..df65953c 100644 --- a/src/advance/concurrency-with-threads/send-sync.md +++ b/src/advance/concurrency-with-threads/send-sync.md @@ -1,6 +1,6 @@ # 基于 Send 和 Sync 的线程安全 -为何 Rc、RefCell 和原生指针不可以在多线程间使用?如何让原生指针可以在多线程使用?我们一起来探寻下这些问题的答案。 +为何 Rc、RefCell 和裸指针不可以在多线程间使用?如何让裸指针可以在多线程使用?我们一起来探寻下这些问题的答案。 ## 无法用于多线程的`Rc` @@ -27,7 +27,7 @@ error[E0277]: `Rc` cannot be sent between threads safely = help: within `[closure@src/main.rs:5:27: 7:6]`, the trait `Send` is not implemented for `Rc` ``` -表面原因是`Rc`无法在线程间安全的转移,实际是编译器给予我们的那句帮助: `the trait Send is not implemented for Rc`(`Rc`未实现`Send`特征), 那么此处的`Send`特征又是何方神圣? +表面原因是`Rc`无法在线程间安全的转移,实际是编译器给予我们的那句帮助: ```the trait `Send` is not implemented for `Rc` ```(`Rc`未实现`Send`特征), 那么此处的`Send`特征又是何方神圣? ## Rc 和 Arc 源码对比 @@ -50,7 +50,7 @@ unsafe impl Sync for Arc {} `Send`和`Sync`是 Rust 安全并发的重中之重,但是实际上它们只是标记特征(marker trait,该特征未定义任何行为,因此非常适合用于标记), 来看看它们的作用: - 实现`Send`的类型可以在线程间安全的传递其所有权 -- 实现了`Sync`的类型可以在线程间安全的共享(通过引用) +- 实现`Sync`的类型可以在线程间安全的共享(通过引用) 这里还有一个潜在的依赖:一个类型要在线程间安全的共享的前提是,指向它的引用必须能在线程间传递。因为如果引用都不能被传递,我们就无法在多个线程间使用引用去访问同一个数据了。 @@ -62,7 +62,7 @@ unsafe impl Sync for Arc {} unsafe impl Sync for RwLock {} ``` -首先`RwLock`可以在线程间安全的共享,那它肯定是实现了`Sync`,但是我们的关注点不在这里。众多周知,`RwLock`可以并发的读,说明其中的值`T`必定也可以在线程间共享,那`T`必定要实现`Sync`。 +首先`RwLock`可以在线程间安全的共享,那它肯定是实现了`Sync`,但是我们的关注点不在这里。众所周知,`RwLock`可以并发的读,说明其中的值`T`必定也可以在线程间共享,那`T`必定要实现`Sync`。 果不其然,上述代码中,`T`的特征约束中就有一个`Sync`特征,那问题又来了,`Mutex`是不是相反?再来看看: @@ -80,19 +80,19 @@ unsafe impl Sync for Mutex {} 正是因为以上规则,Rust 中绝大多数类型都实现了`Send`和`Sync`,除了以下几个(事实上不止这几个,只不过它们比较常见): -- 原生指针两者都没实现,因为它本身就没有任何安全保证 +- 裸指针两者都没实现,因为它本身就没有任何安全保证 - `UnsafeCell`不是`Sync`,因此`Cell`和`RefCell`也不是 - `Rc`两者都没实现(因为内部的引用计数器不是线程安全的) -当然,如果是自定义的复合类型,那没实现那哥俩的就较为常见了:**只要复合类型中有一个成员不是`Send`或`Sync`,那么该符合类型也就不是`Send`或`Sync`**。 +当然,如果是自定义的复合类型,那没实现那哥俩的就较为常见了:**只要复合类型中有一个成员不是`Send`或`Sync`,那么该复合类型也就不是`Send`或`Sync`**。 **手动实现 `Send` 和 `Sync` 是不安全的**,通常并不需要手动实现 Send 和 Sync trait,实现者需要使用`unsafe`小心维护并发安全保证。 -至此,相关的概念大家已经掌握,但是我敢肯定,对于这两个滑不溜秋的家伙,大家依然会非常模糊,不知道它们该如何使用。那么我们来一起看看如何让原生指针可以在线程间安全的使用。 +至此,相关的概念大家已经掌握,但是我敢肯定,对于这两个滑不溜秋的家伙,大家依然会非常模糊,不知道它们该如何使用。那么我们来一起看看如何让裸指针可以在线程间安全的使用。 -## 为原生指针实现`Send` +## 为裸指针实现`Send` -上面我们提到原生指针既没实现`Send`,意味着下面代码会报错: +上面我们提到裸指针既没实现`Send`,意味着下面代码会报错: ```rust use std::thread; @@ -106,7 +106,7 @@ fn main() { } ``` -报错跟之前无二: `*mut u8 cannot be sent between threads safely`, 但是有一个问题,我们无法为其直接实现`Send`特征,好在可以用[`newtype`类型](../custom-type.md#newtype) :`struct MyBox(*mut u8);`。 +报错跟之前无二: ``` `*mut u8` cannot be sent between threads safely```, 但是有一个问题,我们无法为其直接实现`Send`特征,好在可以用[`newtype`类型](https://course.rs/advance/into-types/custom-type.html#newtype) :`struct MyBox(*mut u8);`。 还记得之前的规则吗:复合类型中有一个成员没实现`Send`,该复合类型就不是`Send`,因此我们需要手动为它实现: @@ -128,7 +128,7 @@ fn main() { 此时,我们的指针已经可以欢快的在多线程间撒欢,以上代码很简单,但有一点需要注意:`Send`和`Sync`是`unsafe`特征,实现时需要用`unsafe`代码块包裹。 -## 为原生指针实现`Sync` +## 为裸指针实现`Sync` 由于`Sync`是多线程间共享一个值,大家可能会想这么实现: @@ -188,9 +188,9 @@ unsafe impl Sync for MyBox {} ## 总结 -通过上面的两个原生指针的例子,我们了解了如何实现`Send`和`Sync`,以及如何只实现`Send`而不实现`Sync`,简单总结下: +通过上面的两个裸指针的例子,我们了解了如何实现`Send`和`Sync`,以及如何只实现`Send`而不实现`Sync`,简单总结下: 1. 实现`Send`的类型可以在线程间安全的传递其所有权, 实现`Sync`的类型可以在线程间安全的共享(通过引用) -2. 绝大部分类型都实现了`Send`和`Sync`,常见的未实现的有:原生指针、Cell/RefCell、Rc 等 +2. 绝大部分类型都实现了`Send`和`Sync`,常见的未实现的有:裸指针、`Cell`、`RefCell`、`Rc` 等 3. 可以为自定义类型实现`Send`和`Sync`,但是需要`unsafe`代码块 -4. 可以为部分 Rust 中的类型实现`Send`、`Sync`,但是需要使用`newtype`,例如文中的原生指针例子 +4. 可以为部分 Rust 中的类型实现`Send`、`Sync`,但是需要使用`newtype`,例如文中的裸指针例子 diff --git a/src/advance/concurrency-with-threads/sync1.md b/src/advance/concurrency-with-threads/sync1.md index 182c6897..bd028963 100644 --- a/src/advance/concurrency-with-threads/sync1.md +++ b/src/advance/concurrency-with-threads/sync1.md @@ -62,6 +62,24 @@ fn main() { 正因为智能指针的使用,使得我们无需任何操作就能获取其中的数据。 如果释放锁,你需要做的仅仅是做好锁的作用域管理,例如上述代码的内部花括号使用,建议读者尝试下去掉内部的花括号,然后再次尝试获取第二个锁`num1`,看看会发生什么,友情提示:不会报错,但是主线程会永远阻塞,因为不幸发生了死锁。 +```rust +use std::sync::Mutex; + +fn main() { + let m = Mutex::new(5); + + let mut num = m.lock().unwrap(); + *num = 6; + // 锁还没有被 drop 就尝试申请下一个锁,导致主线程阻塞 + // drop(num); // 手动 drop num ,可以让 num1 申请到下个锁 + let mut num1 = m.lock().unwrap(); + *num1 = 7; + // drop(num1); // 手动 drop num1 ,观察打印结果的不同 + + println!("m = {:?}", m); +} +``` + #### 多线程中使用 Mutex 单线程中使用锁,说实话纯粹是为了演示功能,毕竟多线程才是锁的舞台。 现在,我们再来看看,如何在多线程下使用`Mutex`来访问同一个资源. @@ -99,7 +117,7 @@ fn main() { } ``` -由于子线程需要通过`move`拿走锁的所有权,因此我们需要使用多所有权来保证每个线程都拿到数据的独立所有权,恰好智能指针[`Rc`](../smart-pointer/rc-arc.md)可以做到(**上面代码会报错**!具体往下看,别跳过-, -)。 +由于子线程需要通过`move`拿走锁的所有权,因此我们需要使用多所有权来保证每个线程都拿到数据的独立所有权,恰好智能指针[`Rc`](https://course.rs/advance/smart-pointer/rc-arc.html)可以做到(**上面代码会报错**!具体往下看,别跳过-, -)。 以上代码实现了在多线程中计数的功能,由于多个线程都需要去修改该计数器,因此我们需要使用锁来保证同一时间只有一个线程可以修改计数器,否则会导致脏数据:想象一下 A 线程和 B 线程同时拿到计数器,获取了当前值`1`, 并且同时对其进行了修改,最后值变成`2`,你会不会在风中凌乱?毕竟正确的值是`3`,因为两个线程各自加 1。 @@ -114,14 +132,14 @@ error[E0277]: `Rc>` cannot be sent between threads safely // `Rc`无法在线程中安全的传输 --> src/main.rs:11:22 | -11 | let handle = thread::spawn(move || { +13 | let handle = thread::spawn(move || { | ______________________^^^^^^^^^^^^^_- | | | | | `Rc>` cannot be sent between threads safely -12 | | let mut num = counter.lock().unwrap(); -13 | | -14 | | *num += 1; -15 | | }); +14 | | let mut num = counter.lock().unwrap(); +15 | | +16 | | *num += 1; +17 | | }); | |_________- within this `[closure@src/main.rs:11:36: 15:10]` | = help: within `[closure@src/main.rs:11:36: 15:10]`, the trait `Send` is not implemented for `Rc>` @@ -133,7 +151,7 @@ error[E0277]: `Rc>` cannot be sent between threads safely ##### 多线程安全的 Arc -好在,我们有`Arc`,得益于它的[内部计数器](../smart-pointer/rc-arc.md#多线程无力的rc)是多线程安全的,因此可以在多线程环境中使用: +好在,我们有`Arc`,得益于它的[内部计数器](https://course.rs/advance/smart-pointer/rc-arc.html#多线程无力的rc)是多线程安全的,因此可以在多线程环境中使用: ```rust use std::sync::{Arc, Mutex}; @@ -169,7 +187,7 @@ Result: 10 #### 内部可变性 -在之前章节,我们提到过[内部可变性](../smart-pointer/cell-refcell.md#内部可变性),其中`Rc`和`RefCell`的结合,可以实现单线程的内部可变性。 +在之前章节,我们提到过[内部可变性](https://course.rs/advance/smart-pointer/cell-refcell.html#内部可变性),其中`Rc`和`RefCell`的结合,可以实现单线程的内部可变性。 现在我们又有了新的武器,由于`Mutex`可以支持修改内部数据,当结合`Arc`一起使用时,可以实现多线程的内部可变性。 @@ -186,7 +204,7 @@ Result: 10 正因为这种困难性,导致很多用户都热衷于使用消息传递的方式来实现同步,例如 Go 语言直接把`channel`内置在语言特性中,甚至还有无锁的语言,例如`erlang`,完全使用`Actor`模型,依赖消息传递来完成共享和同步。幸好 Rust 的类型系统、所有权机制、智能指针等可以很好的帮助我们减轻使用锁时的负担。 -另一个值的注意的是在使用`Mutex`时,Rust 无法帮我们避免所有的逻辑错误,例如在之前章节,我们提到过使用`Rc`可能会导致[循环引用的问题](../circle-self-ref/circle-reference.md)。类似的,`Mutex`也存在使用上的风险,例如创建死锁(deadlock):当一个操作试图锁住两个资源,然后两个线程各自获取其中一个锁,并试图获取另一个锁时,就会造成死锁。 +另一个值的注意的是在使用`Mutex`时,Rust 无法帮我们避免所有的逻辑错误,例如在之前章节,我们提到过使用`Rc`可能会导致[循环引用的问题](https://course.rs/advance/circle-self-ref/circle-reference.html)。类似的,`Mutex`也存在使用上的风险,例如创建死锁(deadlock):当一个操作试图锁住两个资源,然后两个线程各自获取其中一个锁,并试图获取另一个锁时,就会造成死锁。 ## 死锁 @@ -231,22 +249,22 @@ fn main() { for _ in 0..1 { // 线程1 if i_thread % 2 == 0 { - // 锁住mutex1 + // 锁住MUTEX1 let guard: MutexGuard = MUTEX1.lock().unwrap(); - println!("线程 {} 锁住了mutex1,接着准备去锁mutex2 !", i_thread); + println!("线程 {} 锁住了MUTEX1,接着准备去锁MUTEX2 !", i_thread); - // 当前线程睡眠一小会儿,等待线程2锁住mutex2 + // 当前线程睡眠一小会儿,等待线程2锁住MUTEX2 sleep(Duration::from_millis(10)); - // 去锁mutex2 + // 去锁MUTEX2 let guard = MUTEX2.lock().unwrap(); // 线程2 } else { - // 锁住mutex2 + // 锁住MUTEX2 let _guard = MUTEX2.lock().unwrap(); - println!("线程 {} 锁住了mutex2, 准备去锁mutex1", i_thread); + println!("线程 {} 锁住了MUTEX2, 准备去锁MUTEX1", i_thread); let _guard = MUTEX1.lock().unwrap(); } @@ -265,9 +283,9 @@ fn main() { 在上面的描述中,我们用了"可能"二字,原因在于死锁在这段代码中不是必然发生的,总有一次运行你能看到最后一行打印输出。这是由于子线程的初始化顺序和执行速度并不确定,我们无法确定哪个线程中的锁先被执行,因此也无法确定两个线程对锁的具体使用顺序。 -但是,可以简单的说明下死锁发生的必然条件:线程 1 锁住了`mutex1`并且线程`2`锁住了`mutex2`,然后线程 1 试图去访问`mutex2`,同时线程`2`试图去访问`mutex1`,就会死锁。 因为线程 2 需要等待线程 1 释放`mutex1`后,才会释放`mutex2`,而与此同时,线程 1 需要等待线程 2 释放`mutex2`后才能释放`mutex1`,这种情况造成了两个线程都无法释放对方需要的锁,最终死锁。 +但是,可以简单的说明下死锁发生的必然条件:线程 1 锁住了`MUTEX1`并且线程`2`锁住了`MUTEX2`,然后线程 1 试图去访问`MUTEX2`,同时线程`2`试图去访问`MUTEX1`,就会死锁。 因为线程 2 需要等待线程 1 释放`MUTEX1`后,才会释放`MUTEX2`,而与此同时,线程 1 需要等待线程 2 释放`MUTEX2`后才能释放`MUTEX1`,这种情况造成了两个线程都无法释放对方需要的锁,最终死锁。 -那么为何某些时候,死锁不会发生?原因很简单,线程 2 在线程 1 锁`mutex1`之前,就已经全部执行完了,随之线程 2 的`mutex2`和`mutex1`被全部释放,线程 1 对锁的获取将不再有竞争者。 同理,线程 1 若全部被执行完,那线程 2 也不会被锁,因此我们在线程 1 中间加一个睡眠,增加死锁发生的概率。如果你在线程 2 中同样的位置也增加一个睡眠,那死锁将必然发生! +那么为何某些时候,死锁不会发生?原因很简单,线程 2 在线程 1 锁`MUTEX1`之前,就已经全部执行完了,随之线程 2 的`MUTEX2`和`MUTEX1`被全部释放,线程 1 对锁的获取将不再有竞争者。 同理,线程 1 若全部被执行完,那线程 2 也不会被锁,因此我们在线程 1 中间加一个睡眠,增加死锁发生的概率。如果你在线程 2 中同样的位置也增加一个睡眠,那死锁将必然发生! #### try_lock @@ -292,26 +310,26 @@ fn main() { for _ in 0..1 { // 线程1 if i_thread % 2 == 0 { - // 锁住mutex1 + // 锁住MUTEX1 let guard: MutexGuard = MUTEX1.lock().unwrap(); - println!("线程 {} 锁住了mutex1,接着准备去锁mutex2 !", i_thread); + println!("线程 {} 锁住了MUTEX1,接着准备去锁MUTEX2 !", i_thread); - // 当前线程睡眠一小会儿,等待线程2锁住mutex2 + // 当前线程睡眠一小会儿,等待线程2锁住MUTEX2 sleep(Duration::from_millis(10)); - // 去锁mutex2 + // 去锁MUTEX2 let guard = MUTEX2.try_lock(); - println!("线程1获取mutex2锁的结果: {:?}",guard); + println!("线程1获取MUTEX2锁的结果: {:?}",guard); // 线程2 } else { - // 锁住mutex2 + // 锁住MUTEX2 let _guard = MUTEX2.lock().unwrap(); - println!("线程 {} 锁住了mutex2, 准备去锁mutex1", i_thread); + println!("线程 {} 锁住了MUTEX2, 准备去锁MUTEX1", i_thread); sleep(Duration::from_millis(10)); let guard = MUTEX1.try_lock(); - println!("线程2获取mutex1锁的结果: {:?}",guard); + println!("线程2获取MUTEX1锁的结果: {:?}",guard); } } })); @@ -329,10 +347,10 @@ fn main() { 为了演示`try_lock`的作用,我们特定使用了之前必定会死锁的代码,并且将`lock`替换成`try_lock`,与之前的结果不同,这段代码将不会再有死锁发生: ```console -线程 0 锁住了mutex1,接着准备去锁mutex2 ! -线程 1 锁住了mutex2, 准备去锁mutex1 -线程2获取mutex1锁的结果: Err("WouldBlock") -线程1获取mutex2锁的结果: Ok(0) +线程 0 锁住了MUTEX1,接着准备去锁MUTEX2 ! +线程 1 锁住了MUTEX2, 准备去锁MUTEX1 +线程2获取MUTEX1锁的结果: Err("WouldBlock") +线程1获取MUTEX2锁的结果: Ok(0) 死锁没有发生 ``` diff --git a/src/advance/concurrency-with-threads/sync2.md b/src/advance/concurrency-with-threads/sync2.md index 0b9af5fc..c715b29b 100644 --- a/src/advance/concurrency-with-threads/sync2.md +++ b/src/advance/concurrency-with-threads/sync2.md @@ -6,7 +6,7 @@ 由于原子操作是通过指令提供的支持,因此它的性能相比锁和消息传递会好很多。相比较于锁而言,原子类型不需要开发者处理加锁和释放锁的问题,同时支持修改,读取等操作,还具备较高的并发性能,几乎所有的语言都支持原子类型。 -可以看出原子类型是无锁类型,但是无锁不代表无需等待,因为原子类型内部使用了`CAS`循环,当大量的冲突发生时,该等待还是得[等待](./thread.md#多线程的开销)!但是总归比锁要好。 +可以看出原子类型是无锁类型,但是无锁不代表无需等待,因为原子类型内部使用了`CAS`循环,当大量的冲突发生时,该等待还是得[等待](https://course.rs/advance/concurrency-with-threads/thread.html#多线程的开销)!但是总归比锁要好。 > CAS 全称是 Compare and swap, 它通过一条指令读取指定的内存地址,然后判断其中的值是否等于给定的前置值,如果相等,则将其修改为新的值 @@ -166,7 +166,7 @@ Y = 3; Y *= 2; X = 2; } ``` -还是可能出现`Y=2`,因为`Main`线程中的`X`和`Y`被同步到其它 CPU 缓存中的顺序未必一致。 +还是可能出现`Y = 2`,因为`Main`线程中的`X`和`Y`被同步到其它 CPU 缓存中的顺序未必一致。 #### 限定内存顺序的 5 个规则 diff --git a/src/advance/concurrency-with-threads/thread.md b/src/advance/concurrency-with-threads/thread.md index c58fed54..b8c8910e 100644 --- a/src/advance/concurrency-with-threads/thread.md +++ b/src/advance/concurrency-with-threads/thread.md @@ -263,7 +263,7 @@ for handle in handles { } ``` -按理来说,既然是无锁实现了,那么锁的开销应该几乎没有,性能会随着线程数的增加几近线程增长,但是真的是这样吗? +按理来说,既然是无锁实现了,那么锁的开销应该几乎没有,性能会随着线程数的增加接近线性增长,但是真的是这样吗? 下图是该代码在 `48` 核机器上的运行结果: @@ -475,10 +475,10 @@ fn main() { ```rust use std::thread; -use std::sync::{Once, ONCE_INIT}; +use std::sync::Once; static mut VAL: usize = 0; -static INIT: Once = ONCE_INIT; +static INIT: Once = Once::new(); fn main() { let handle1 = thread::spawn(move || { @@ -516,7 +516,7 @@ fn main() { ## 总结 -[Rust 的线程模型](./intro.md)是 `1:1` 模型,因为 Rust 要保持尽量小的运行时。 +[Rust 的线程模型](https://course.rs/advance/concurrency-with-threads/intro.html)是 `1:1` 模型,因为 Rust 要保持尽量小的运行时。 我们可以使用 `thread::spawn` 来创建线程,创建出的多个线程之间并不存在执行顺序关系,因此代码逻辑千万不要依赖于线程间的执行顺序。 diff --git a/src/confonding/cow.md b/src/advance/confonding/cow.md similarity index 100% rename from src/confonding/cow.md rename to src/advance/confonding/cow.md diff --git a/src/confonding/eq.md b/src/advance/confonding/eq.md similarity index 100% rename from src/confonding/eq.md rename to src/advance/confonding/eq.md diff --git a/src/confonding/intro.md b/src/advance/confonding/intro.md similarity index 100% rename from src/confonding/intro.md rename to src/advance/confonding/intro.md diff --git a/src/confonding/lifetime.md b/src/advance/confonding/lifetime.md similarity index 100% rename from src/confonding/lifetime.md rename to src/advance/confonding/lifetime.md diff --git a/src/confonding/move-copy.md b/src/advance/confonding/move-copy.md similarity index 100% rename from src/confonding/move-copy.md rename to src/advance/confonding/move-copy.md diff --git a/src/advance/confonding/pointer.md b/src/advance/confonding/pointer.md new file mode 100644 index 00000000..e07a9fcb --- /dev/null +++ b/src/advance/confonding/pointer.md @@ -0,0 +1 @@ +# 裸指针、引用和智能指针 todo diff --git a/src/confonding/slice.md b/src/advance/confonding/slice.md similarity index 89% rename from src/confonding/slice.md rename to src/advance/confonding/slice.md index 1abd097f..fab21e07 100644 --- a/src/confonding/slice.md +++ b/src/advance/confonding/slice.md @@ -24,7 +24,7 @@ error[E0277]: the size for values of type `str` cannot be known at compilation t | ^^^^^^ doesn't have a size known at compile-time ``` -编译器准确的告诉了我们原因:`str` 字符串切片它是 [`DST` 动态大小类型](https://course.rs/advance/custom-type.html#动态大小类型),这意味着编译器无法在编译期知道 `str` 类型的大小,只有到了运行期才能动态获知,这对于强类型、强安全的 Rust 语言来说是不可接受的。 +编译器准确的告诉了我们原因:`str` 字符串切片它是 [`DST` 动态大小类型](https://course.rs/advance/into-types/sized.html#动态大小类型-dst),这意味着编译器无法在编译期知道 `str` 类型的大小,只有到了运行期才能动态获知,这对于强类型、强安全的 Rust 语言来说是不可接受的。 也就是说,我们无法直接使用 `str`,而对于 `[u8]` 也是类似的,大家可以自己动手试试。 @@ -69,7 +69,7 @@ let s3: &[i32] = &arr[1..3]; 我们常常说使用切片,实际上我们在用的是切片的引用,我们也在频繁说使用字符串,实际上我们在使用的也是字符串切片的引用。 -总之,切片在 Rust 中是动态类型 DST,是无法被我们直接使用的,而我们在使用的都是切片的引用。 +总之,切片在 Rust 中是动态大小类型 DST,是无法被我们直接使用的,而我们在使用的都是切片的引用。 | 切片 | 切片引用 | | -------------- | --------------------- | diff --git a/src/confonding/string.md b/src/advance/confonding/string.md similarity index 80% rename from src/confonding/string.md rename to src/advance/confonding/string.md index 640a1e95..9111e1fc 100644 --- a/src/confonding/string.md +++ b/src/advance/confonding/string.md @@ -8,7 +8,7 @@ Rust 语言的类型可以大致分为两种:基本类型和标准库类型, ## str 如上所述,`str` 是唯一定义在 Rust 语言特性中的字符串,但是也是我们几乎不会用到的字符串类型,为何? -原因在于 `str` 字符串它是 [`DST` 动态大小类型](https://course.rs/advance/custom-type.html#动态大小类型),这意味着编译器无法在编译期知道 `str` 类型的大小,只有到了运行期才能动态获知,这对于强类型、强安全的 Rust 语言来说是不可接受的。 +原因在于 `str` 字符串它是 [`DST` 动态大小类型](https://course.rs/advance/into-types/sized.html#动态大小类型-dst),这意味着编译器无法在编译期知道 `str` 类型的大小,只有到了运行期才能动态获知,这对于强类型、强安全的 Rust 语言来说是不可接受的。 ```rust let string: str = "banana"; @@ -28,7 +28,7 @@ error[E0277]: the size for values of type `str` cannot be known at compilation t 同时还是 String 和 &str 的底层数据类型。 由于 str 是动态 -`str` 类型是硬编码进可执行文件,也无法被修改,但是 `String` 则是一个可增长、可改变且具有所有权的 UTF8 编码字符串,**当 Rust 用户提到字符串时,往往指的就是 `String` 类型和 `&str` 字符串切片类型,这两个类型都是 UTF8 编码**。 +`str` 类型是硬编码进可执行文件,也无法被修改,但是 `String` 则是一个可增长、可改变且具有所有权的 UTF-8 编码字符串,**当 Rust 用户提到字符串时,往往指的就是 `String` 类型和 `&str` 字符串切片类型,这两个类型都是 UTF-8 编码**。 除了 `String` 类型的字符串,Rust 的标准库还提供了其他类型的字符串,例如 `OsString`, `OsStr`, `CsString` 和` CsStr` 等,注意到这些名字都以 `String` 或者 `Str` 结尾了吗?它们分别对应的是具有所有权和被借用的变量。 diff --git a/src/advance/errors.md b/src/advance/errors.md index 4d67e2d8..7716f104 100644 --- a/src/advance/errors.md +++ b/src/advance/errors.md @@ -513,7 +513,7 @@ fn render() -> Result { 上面的代码会报错,原因在于 `render` 函数中的两个 `?` 返回的实际上是不同的错误:`env::var()` 返回的是 `std::env::VarError`,而 `read_to_string` 返回的是 `std::io::Error`。 -为了满足 `render` 函数的签名,我们就需要将 `env::VarError` 和 `io::Error` 归一化为同一种错误类型。要实现这个目的有两种方式: +为了满足 `render` 函数的签名,我们就需要将 `env::VarError` 和 `io::Error` 归一化为同一种错误类型。要实现这个目的有三种方式: - 使用特征对象 `Box` - 自定义错误类型 diff --git a/src/advance/functional-programing/closure.md b/src/advance/functional-programing/closure.md index be2b6447..6dd2a4fc 100644 --- a/src/advance/functional-programing/closure.md +++ b/src/advance/functional-programing/closure.md @@ -220,7 +220,7 @@ let add_one_v3 = |x| { x + 1 }; let add_one_v4 = |x| x + 1 ; ``` -可以看出第一行的函数和后面的闭包其实在形式上是非常接近的,同时三种不同的闭包也展示了三种不同的使用方式:省略参数、返回值和花括号对。 +可以看出第一行的函数和后面的闭包其实在形式上是非常接近的,同时三种不同的闭包也展示了三种不同的使用方式:省略参数、返回值类型和花括号对。 虽然类型推导很好用,但是它不是泛型,**当编译器推导出一种类型后,它就会一直使用该类型**: @@ -303,7 +303,7 @@ where } ``` -上面的缓存有一个很大的问题:只支持 `u32` 类型的值,若我们想要缓存 `String` 类型,显然就行不通了,因此需要将 `u32` 替换成泛型 `E`,该练习就留给读者自己完成,具体代码可以参考[这里](http://exercise.rs/functional-programming/closure.html) +上面的缓存有一个很大的问题:只支持 `u32` 类型的值,若我们想要缓存 `String` 类型,显然就行不通了,因此需要将 `u32` 替换成泛型 `E`,该练习就留给读者自己完成,具体代码可以参考[这里](https://practice.rs/functional-programing/cloure.html#closure-in-structs) ## 捕获作用域中的值 @@ -421,6 +421,15 @@ false 如果你想强制闭包取得捕获变量的所有权,可以在参数列表前添加 `move` 关键字,这种用法通常用于闭包的生命周期大于捕获变量的生命周期时,例如将闭包返回或移入其他线程。 +```rust +use std::thread; +let v = vec![1, 2, 3]; +let handle = thread::spawn(move || { + println!("Here's a vector: {:?}", v); +}); +handle.join().unwrap(); +``` + 2. `FnMut`,它以可变借用的方式捕获了环境中的值,因此可以修改该值: ```rust @@ -699,7 +708,7 @@ help: use `impl Fn(i32) -> i32` as the return type, as all return paths are of t 嗯,编译器提示我们加一个 `impl` 关键字,哦,这样一说,读者可能就想起来了,`impl Trait` 可以用来返回一个实现了指定特征的类型,那么这里 `impl Fn(i32) -> i32` 的返回值形式,说明我们要返回一个闭包类型,它实现了 `Fn(i32) -> i32` 特征。 -完美解决,但是,在[特征](../../basic/trait/trait.md)那一章,我们提到过,`impl Trait` 的返回方式有一个非常大的局限,就是你只能返回同样的类型,例如: +完美解决,但是,在[特征](https://course.rs/basic/trait/trait.html)那一章,我们提到过,`impl Trait` 的返回方式有一个非常大的局限,就是你只能返回同样的类型,例如: ```rust fn factory(x:i32) -> impl Fn(i32) -> i32 { @@ -758,3 +767,6 @@ fn factory(x:i32) -> Box i32> { ## 闭包的生命周期 这块儿内容在进阶生命周期章节中有讲,这里就不再赘述,读者可移步[此处](https://course.rs/advance/lifetime/advance.html#闭包函数的消除规则)进行回顾。 + + +{{#include ../../practice.md}} \ No newline at end of file diff --git a/src/advance/global-variable.md b/src/advance/global-variable.md index 71a16e3a..05078bbd 100644 --- a/src/advance/global-variable.md +++ b/src/advance/global-variable.md @@ -71,7 +71,7 @@ fn main() { } ``` -关于原子类型的讲解看[这篇文章](./concurrency-with-threads/sync2.md) +关于原子类型的讲解看[这篇文章](https://course.rs/advance/concurrency-with-threads/sync2.html) #### 示例:全局 ID 生成器 @@ -115,10 +115,10 @@ impl Factory{ ```rust use std::sync::Mutex; -static names: Mutex = Mutex::new(String::from("Sunface, Jack, Allen")); +static NAMES: Mutex = Mutex::new(String::from("Sunface, Jack, Allen")); fn main() { - let v = names.lock().unwrap(); + let v = NAMES.lock().unwrap(); println!("{}",v); } ``` @@ -129,10 +129,10 @@ fn main() { error[E0015]: calls in statics are limited to constant functions, tuple structs and tuple variants --> src/main.rs:3:42 | -3 | static names: Mutex = Mutex::new(String::from("sunface")); +3 | static NAMES: Mutex = Mutex::new(String::from("sunface")); ``` -但你又必须在声明时就对`names`进行初始化,此时就陷入了两难的境地。好在天无绝人之路,我们可以使用`lazy_static`包来解决这个问题。 +但你又必须在声明时就对`NAMES`进行初始化,此时就陷入了两难的境地。好在天无绝人之路,我们可以使用`lazy_static`包来解决这个问题。 #### lazy_static @@ -142,11 +142,11 @@ error[E0015]: calls in statics are limited to constant functions, tuple structs use std::sync::Mutex; use lazy_static::lazy_static; lazy_static! { - static ref names: Mutex = Mutex::new(String::from("Sunface, Jack, Allen")); + static ref NAMES: Mutex = Mutex::new(String::from("Sunface, Jack, Allen")); } fn main() { - let mut v = names.lock().unwrap(); + let mut v = NAMES.lock().unwrap(); v.push_str(", Myth"); println!("{}",v); } @@ -195,27 +195,27 @@ struct Config { a: String, b: String, } -static mut config: Option<&mut Config> = None; +static mut CONFIG: Option<&mut Config> = None; fn main() { unsafe { - config = Some(&mut Config { + CONFIG = Some(&mut Config { a: "A".to_string(), b: "B".to_string(), }); - println!("{:?}",config) + println!("{:?}", CONFIG) } } ``` -以上代码我们声明了一个全局动态配置`config`,并且其值初始化为`None`,然后在程序开始运行后,给它赋予相应的值,运行后报错: +以上代码我们声明了一个全局动态配置`CONFIG`,并且其值初始化为`None`,然后在程序开始运行后,给它赋予相应的值,运行后报错: ```console error[E0716]: temporary value dropped while borrowed --> src/main.rs:10:28 | -10 | config = Some(&mut Config { +10 | CONFIG = Some(&mut Config { | _________-__________________^ | |_________| | || @@ -228,19 +228,17 @@ error[E0716]: temporary value dropped while borrowed | creates a temporary which is freed while still in use ``` -可以看到,Rust 的借用和生命周期规则限制了我们做到这一点,因为试图将一个局部生命周期的变量赋值给全局生命周期的`config`,这明显是不安全的。 +可以看到,Rust 的借用和生命周期规则限制了我们做到这一点,因为试图将一个局部生命周期的变量赋值给全局生命周期的`CONFIG`,这明显是不安全的。 -好在`Rust`为我们提供了`Box::leak`方法,它可以将一个变量从内存中泄漏(听上去怪怪的,竟然做主动内存泄漏),然后将其变为`'static`生命周期,最终该变量将和程序活得一样久,因此可以赋值给全局静态变量`config`。 +好在`Rust`为我们提供了`Box::leak`方法,它可以将一个变量从内存中泄漏(听上去怪怪的,竟然做主动内存泄漏),然后将其变为`'static`生命周期,最终该变量将和程序活得一样久,因此可以赋值给全局静态变量`CONFIG`。 ```rust -use std::sync::Mutex; - #[derive(Debug)] struct Config { a: String, b: String } -static mut config: Option<&mut Config> = None; +static mut CONFIG: Option<&mut Config> = None; fn main() { let c = Box::new(Config { @@ -250,8 +248,8 @@ fn main() { unsafe { // 将`c`从内存中泄漏,变成`'static`生命周期 - config = Some(Box::leak(c)); - println!("{:?}", config); + CONFIG = Some(Box::leak(c)); + println!("{:?}", CONFIG); } } ``` @@ -266,7 +264,7 @@ struct Config { a: String, b: String, } -static mut config: Option<&mut Config> = None; +static mut CONFIG: Option<&mut Config> = None; fn init() -> Option<&'static mut Config> { Some(&mut Config { @@ -278,9 +276,9 @@ fn init() -> Option<&'static mut Config> { fn main() { unsafe { - config = init(); + CONFIG = init(); - println!("{:?}",config) + println!("{:?}", CONFIG) } } ``` @@ -293,7 +291,7 @@ struct Config { a: String, b: String, } -static mut config: Option<&mut Config> = None; +static mut CONFIG: Option<&mut Config> = None; fn init() -> Option<&'static mut Config> { let c = Box::new(Config { @@ -307,16 +305,71 @@ fn init() -> Option<&'static mut Config> { fn main() { unsafe { - config = init(); + CONFIG = init(); - println!("{:?}",config) + println!("{:?}", CONFIG) } } ``` ## 标准库中的 OnceCell -@todo +在 `Rust` 标准库中提供 `lazy::OnceCell` 和 `lazy::SyncOnceCell` 两种 `Cell`,前者用于单线程,后者用于多线程,它们用来存储堆上的信息,并且具有最多只能赋值一次的特性。 如实现一个多线程的日志组件 `Logger`: + +```rust +#![feature(once_cell)] + +use std::{lazy::SyncOnceCell, thread}; + +fn main() { + // 子线程中调用 + let handle = thread::spawn(|| { + let logger = Logger::global(); + logger.log("thread message".to_string()); + }); + + // 主线程调用 + let logger = Logger::global(); + logger.log("some message".to_string()); + + let logger2 = Logger::global(); + logger2.log("other message".to_string()); + + handle.join().unwrap(); +} + +#[derive(Debug)] +struct Logger; + +static LOGGER: SyncOnceCell = SyncOnceCell::new(); + +impl Logger { + fn global() -> &'static Logger { + // 获取或初始化 Logger + LOGGER.get_or_init(|| { + println!("Logger is being created..."); // 初始化打印 + Logger + }) + } + + fn log(&self, message: String) { + println!("{}", message) + } +} +``` + +以上代码我们声明了一个 `global()` 关联函数,并在其内部调用 `get_or_init` 进行初始化 `Logger`,之后在不同线程上多次调用 `Logger::global()` 获取其实例: + +```console +Logger is being created... +some message +other message +thread message +``` + +可以看到,`Logger is being created...` 在多个线程中使用也只被打印了一次。 + +特别注意,目前 `OnceCell` 和 `SyncOnceCell` API 暂未稳定,需启用特性 `#![feature(once_cell)]`。 ## 总结 diff --git a/src/advance/into-types/custom-type.md b/src/advance/into-types/custom-type.md index 09700815..b837a1a8 100644 --- a/src/advance/into-types/custom-type.md +++ b/src/advance/into-types/custom-type.md @@ -110,7 +110,7 @@ type Meters = u32 **类型别名并不是一个独立的全新的类型,而是某一个类型的别名**,因此编译器依然会把 `Meters` 当 `u32` 来使用: ```rust -type Meters = i32; +type Meters = u32; let x: u32 = 5; let y: Meters = 5; diff --git a/src/advance/into-types/enum-int.md b/src/advance/into-types/enum-int.md index f9e924a8..e85fb69c 100644 --- a/src/advance/into-types/enum-int.md +++ b/src/advance/into-types/enum-int.md @@ -139,6 +139,7 @@ fn main() { 但是上面的代码有个问题,你需要为每个枚举成员都实现一个转换分支,非常麻烦。好在可以使用宏来简化,自动根据枚举的定义来实现`TryFrom`特征: ```rust +#[macro_export] macro_rules! back_to_enum { ($(#[$meta:meta])* $vis:vis enum $name:ident { $($(#[$vmeta:meta])* $vname:ident $(= $val:expr)?,)* @@ -174,7 +175,7 @@ back_to_enum! { **这个方法原则上并不推荐,但是有其存在的意义,如果要使用,你需要清晰的知道自己为什么使用**。 -在之前的类型转换章节,我们提到过非常邪恶的[`transmute`转换](<../basic/converse.md#变形记(Transmutes)>),其实,当你知道数值一定不会超过枚举的范围时(例如枚举成员对应 1,2,3,传入的整数也在这个范围内),就可以使用这个方法完成变形。 +在之前的类型转换章节,我们提到过非常邪恶的[`transmute`转换](https://course.rs/basic/converse.html#变形记transmutes),其实,当你知道数值一定不会超过枚举的范围时(例如枚举成员对应 1,2,3,传入的整数也在这个范围内),就可以使用这个方法完成变形。 > 最好使用#[repr(..)]来控制底层类型的大小,免得本来需要 i32,结果传入 i64,最终内存无法对齐,产生奇怪的结果 diff --git a/src/advance/into-types/sized.md b/src/advance/into-types/sized.md index 9df9ee6e..b9d1fa4b 100644 --- a/src/advance/into-types/sized.md +++ b/src/advance/into-types/sized.md @@ -15,7 +15,7 @@ **正因为编译器无法在编译期获知类型大小,若你试图在代码中直接使用 DST 类型,将无法通过编译。** -现在给你一个挑战:想出几个 DST 类型。俺厚黑地说一句,估计大部分人都想不出这样的一个类型,就连我,如果不是查询着资料在写,估计也一时半会儿想不到一个。 +现在给你一个挑战:想出几个 DST 类型。俺厚黑地说一句,估计大部分人都想不出这样的一个类型,就连我,如果不是查询着资料在写,估计一时半会儿也想不到一个。 先来看一个最直白的: diff --git a/src/advance/lifetime/advance.md b/src/advance/lifetime/advance.md index d00bb683..37f5e126 100644 --- a/src/advance/lifetime/advance.md +++ b/src/advance/lifetime/advance.md @@ -77,6 +77,8 @@ fn main() { 这就解释了可变借用为啥会在 `main` 函数作用域内有效,最终导致 `foo.share()` 无法再进行不可变借用。 +总结下:`&mut self` 借用的生命周期和 `loan` 的生命周期相同,将持续到 `println` 结束。而在此期间 `foo.share()` 又进行了一次不可变 `&foo` 借用,违背了可变借用与不可变借用不能同时存在的规则,最终导致了编译错误。 + 上述代码实际上完全是正确的,但是因为生命周期系统的“粗糙实现”,导致了编译错误,目前来说,遇到这种生命周期系统不够聪明导致的编译错误,我们也没有太好的办法,只能修改代码去满足它的需求,并期待以后它会更聪明。 #### 例子 2 @@ -136,7 +138,7 @@ error[E0499]: cannot borrow `*map` as mutable more than once at a time 不安全代码(`unsafe`)经常会凭空产生引用或生命周期,这些生命周期被称为是 **无界(unbound)** 的。 -无界生命周期往往是在解引用一个原生指针(裸指针 raw pointer)时产生的,换句话说,它是凭空产生的,因为输入参数根本就没有这个生命周期: +无界生命周期往往是在解引用一个裸指针(裸指针 raw pointer)时产生的,换句话说,它是凭空产生的,因为输入参数根本就没有这个生命周期: ```rust fn f<'a, T>(x: *const T) -> &'a T { @@ -254,7 +256,7 @@ let closure_slision = |x: &i32| -> &i32 { x }; ## NLL (Non-Lexical Lifetime) -之前我们在[引用与借用](../../basic/ownership/borrowing.md#NLL)那一章其实有讲到过这个概念,简单来说就是:**引用的生命周期正常来说应该从借用开始一直持续到作用域结束**,但是这种规则会让多引用共存的情况变得更复杂: +之前我们在[引用与借用](https://course.rs/basic/ownership/borrowing.html#NLL)那一章其实有讲到过这个概念,简单来说就是:**引用的生命周期正常来说应该从借用开始一直持续到作用域结束**,但是这种规则会让多引用共存的情况变得更复杂: ```rust fn main() { diff --git a/src/advance/lifetime/basic.md b/src/advance/lifetime/basic.md index cc8da0a9..ffbd2ffd 100644 --- a/src/advance/lifetime/basic.md +++ b/src/advance/lifetime/basic.md @@ -44,7 +44,7 @@ error[E0597]: `x` does not live long enough // `x` 活得不够久 | - borrow later used here // 对 `x` 的借用在此处被使用 ``` -在这里 `r` 拥有更大的作用域,或者说**活得更久**。如果 Rust 不阻止该垂悬引用的发生,那么当 `x` 被释放后,`r` 所引用的值就不再是合法的,会导致我们程序发生异常行为,且该异常行为有时候会很难被发现。 +在这里 `r` 拥有更大的作用域,或者说**活得更久**。如果 Rust 不阻止该悬垂引用的发生,那么当 `x` 被释放后,`r` 所引用的值就不再是合法的,会导致我们程序发生异常行为,且该异常行为有时候会很难被发现。 ## 借用检查 @@ -578,7 +578,19 @@ Bang,一个复杂的玩意儿被甩到了你面前,就问怕不怕? 就关键点稍微解释下: - `'a: 'b`,是生命周期约束语法,跟泛型约束非常相似,用于说明 `'a` 必须比 `'b` 活得久 -- 为了实现这一点,必须把 `'a` 和 `'b` 都在同一个地方声明,你不能把 `'a` 在 `impl` 后面声明,而把 `'b` 在方法中声明 +- 可以把 `'a` 和 `'b` 都在同一个地方声明(如上),或者分开声明但通过 `where 'a: 'b` 约束生命周期关系,如下: + +```rust +impl<'a> ImportantExcerpt<'a> { + fn announce_and_return_part<'b>(&'a self, announcement: &'b str) -> &'b str + where + 'a: 'b, + { + println!("Attention please: {}", announcement); + self.part + } +} +``` 总之,实现方法比想象中简单:加一个约束,就能暗示编译器,尽管引用吧,反正我想引用的内容比我活得久,爱咋咋地,我怎么都不会引用到无效的内容! diff --git a/src/advance/lifetime/static.md b/src/advance/lifetime/static.md index 89607cbb..737694c9 100644 --- a/src/advance/lifetime/static.md +++ b/src/advance/lifetime/static.md @@ -57,7 +57,7 @@ fn get_memory_location() -> (usize, usize) { } fn get_str_at_location(pointer: usize, length: usize) -> &'static str { - // 使用原生指针需要 `unsafe{}` 语句块 + // 使用裸指针需要 `unsafe{}` 语句块 unsafe { from_utf8_unchecked(from_raw_parts(pointer as *const u8, length)) } } @@ -68,7 +68,7 @@ fn main() { "The {} bytes at 0x{:X} stored: {}", length, pointer, message ); - // 如果大家想知道为何处理原生指针需要 `unsafe`,可以试着反注释以下代码 + // 如果大家想知道为何处理裸指针需要 `unsafe`,可以试着反注释以下代码 // let message = get_str_at_location(1000, 10); } ``` @@ -80,7 +80,51 @@ fn main() { ## `T: 'static` -相比起来,我们的生命周期约束就弱得多了,它只能试图向编译器表达:如果可以的话,我想要一个可以一直存活的变量, see ? 跟 `&'static` 表达的强度完全不一样,下面用例子来说明: +相比起来,这种形式的约束就有些复杂了。 + +首先,在以下两种情况下,`T: 'static` 与 `&'static` 有相同的约束:`T` 必须活得和程序一样久。 + +```rust +use std::fmt::Debug; + +fn print_it( input: T) { + println!( "'static value passed in is: {:?}", input ); +} + +fn print_it1( input: impl Debug + 'static ) { + println!( "'static value passed in is: {:?}", input ); +} + + + +fn main() { + let i = 5; + + print_it(&i); + print_it1(&i); +} +``` + +以上代码会报错,原因很简单: `&i` 的生命周期无法满足 `'static` 的约束,如果大家将 `i` 修改为常量,那自然一切 OK。 + +见证奇迹的时候,请不要眨眼,现在我们来稍微修改下 `print_it` 函数: +```rust +use std::fmt::Debug; + +fn print_it( input: &T) { + println!( "'static value passed in is: {:?}", input ); +} + +fn main() { + let i = 5; + + print_it(&i); +} +``` + +这段代码竟然不报错了!原因在于我们约束的是 `T`,但是使用的却是它的引用 `&T`,换而言之,我们根本没有直接使用 `T`,因此编译器就没有去检查 `T` 的生命周期约束!它只要确保 `&T` 的生命周期符合规则即可,在上面代码中,它自然是符合的。 + +再来看一个例子: ```rust use std::fmt::Display; @@ -121,49 +165,29 @@ fn static_bound(t: &T) { } ``` -以上代码充分说明了两个问题: - -- `'static` 生命周期的数据可以一直存活,因此 `r1` 和 `r2` 才能在语句块内部被赋值 -- `T: 'static` 的约束真的很弱,`s1` 明明生命周期只在内部语句块内有效,但是该约束依然可以满足,`static_bound` 成功被调用 - -## 两者的区别 - -总之, `&'static` != `T: 'static` ,虽然它们看起来真的非常像。 - -为了进一步验证,我们修改下 `static_bound` 的签名 : +## static 到底针对谁? +大家有没有想过,到底是 `&'static` 这个引用还是该引用指向的数据活得跟程序一样久呢? +**答案是引用指向的数据**,而引用本身是要遵循其作用域范围的,我们来简单验证下: ```rust -use std::fmt::Display; - fn main() { - let s1 = "String".to_string(); + { + let static_string = "I'm in read-only memory"; + println!("static_string: {}", static_string); - static_bound(&s1); -} + // 当 `static_string` 超出作用域时,该引用不能再被使用,但是数据依然会存在于 binary 所占用的内存中 + } -fn static_bound(t: &'static T) { - println!("{}", t); + println!("static_string reference remains alive: {}", static_string); } ``` -在这里,不再使用生命周期约束来限制 `T`,而直接指定 `T` 的生命周期是 `&'static` ,不出所料,代码报错了: - -```console -error[E0597]: `s1` does not live long enough - --> src/main.rs:8:18 - | -8 | static_bound(&s1); - | -------------^^^- - | | | - | | borrowed value does not live long enough - | argument requires that `s1` is borrowed for `'static` -9 | } - | - `s1` dropped here while still borrowed -``` +以上代码不出所料会报错,原因在于虽然字符串字面量 "I'm in read-only memory" 的生命周期是 `'static`,但是持有它的引用并不是,它的作用域在内部花括号 `}` 处就结束了。 -原因很简单,`s1` 活得不够久,没有满足 `'static` 的生命周期要求。 -## 使用经验 +## 总结 + +总之, `&'static` 和 `T: 'static` 大体上相似,相比起来,后者的使用形式会更加复杂一些。 至此,相信大家对于 `'static` 和 `T: 'static` 也有了清晰的理解,那么我们应该如何使用它们呢? @@ -173,3 +197,4 @@ error[E0597]: `s1` does not live long enough - 如果你希望满足和取悦编译器,那就使用 `T: 'static`,很多时候它都能解决问题 > 一个小知识,在 Rust 标准库中,有 48 处用到了 &'static ,112 处用到了 `T: 'static` ,看来取悦编译器不仅仅是菜鸟需要的,高手也经常用到 :) + diff --git a/src/advance/macro.md b/src/advance/macro.md index e32678ef..f8bc3bca 100644 --- a/src/advance/macro.md +++ b/src/advance/macro.md @@ -311,7 +311,7 @@ hello_macro 由于过程宏所在的包跟我们的项目紧密相连,因此将它放在项目之中。现在,问题又来了,该如何在项目的 `src/main.rs` 中引用 `hello_macro_derive` 包的内容? -方法有两种,第一种是将 `hello_macro_derive` 发布到 `crates.io` 或 `github` 中,就像我们引用的其它依赖一样;另一种就是使用相对路径引入的本地化方式,修改 `hello_macro/Cargo.toml` 文件添加以下内容: +方法有两种,第一种是将 `hello_macro_derive` 发布到 `crates.io` 或 `GitHub` 中,就像我们引用的其它依赖一样;另一种就是使用相对路径引入的本地化方式,修改 `hello_macro/Cargo.toml` 文件添加以下内容: ```toml [dependencies] @@ -492,6 +492,7 @@ let sql = sql!(SELECT * FROM posts WHERE id=1); 3. [syn](https://crates.io/crates/syn) 和 [quote](https://crates.io/crates/quote) ,用于编写过程宏的包,它们的文档有很多值得学习的东西 4. [Structuring, testing and debugging procedural macro crates](https://www.reddit.com/r/rust/comments/rjumsg/any_good_resources_for_learning_rust_macros/),从测试、debug、结构化的角度来编写过程宏 5. [blog.turbo.fish](https://blog.turbo.fish),里面的过程宏系列文章值得一读 +6. [Rust 宏小册中文版](https://zjp-cn.github.io/tlborm/),非常详细的解释了宏各种知识 ## 总结 diff --git a/src/advance/smart-pointer/box.md b/src/advance/smart-pointer/box.md index 516380a4..8484182d 100644 --- a/src/advance/smart-pointer/box.md +++ b/src/advance/smart-pointer/box.md @@ -264,7 +264,7 @@ fn gen_static_str() -> &'static str{ 光看上面的描述,大家可能还是云里雾里、一头雾水。 -那么我说一个简单的场景,**你需要一个在运行期初始化的值,但是可以全局有效,也就是和整个程序活得一样久**,那么久可以使用 `Box::leak`,例如有一个存储配置的结构体实例,它是在运行期动态插入内容,那么就可以将其转为全局有效,虽然 `Rc/Arc` 也可以实现此功能,但是 `Box::leak` 是性能最高的。 +那么我说一个简单的场景,**你需要一个在运行期初始化的值,但是可以全局有效,也就是和整个程序活得一样久**,那么就可以使用 `Box::leak`,例如有一个存储配置的结构体实例,它是在运行期动态插入内容,那么就可以将其转为全局有效,虽然 `Rc/Arc` 也可以实现此功能,但是 `Box::leak` 是性能最高的。 ## 总结 diff --git a/src/advance/smart-pointer/drop.md b/src/advance/smart-pointer/drop.md index 7413bc04..a80a9ac6 100644 --- a/src/advance/smart-pointer/drop.md +++ b/src/advance/smart-pointer/drop.md @@ -156,7 +156,7 @@ fn main() { Bingo,完美拿走了所有权,而且这种实现保证了后续的使用必定会导致编译错误,因此非常安全! -细心的同学可能已经注意到,这里直接调用了 `drop` 函数,并没有引入任何模块信息,原因是该函数在[`std::prelude`](../../appendix/prelude.md)里。 +细心的同学可能已经注意到,这里直接调用了 `drop` 函数,并没有引入任何模块信息,原因是该函数在[`std::prelude`](https://course.rs/appendix/prelude.html)里。 ## Drop 使用场景 diff --git a/src/advance/smart-pointer/rc-arc.md b/src/advance/smart-pointer/rc-arc.md index 30b394d1..4e414349 100644 --- a/src/advance/smart-pointer/rc-arc.md +++ b/src/advance/smart-pointer/rc-arc.md @@ -52,7 +52,7 @@ fn main() { 不要被 `clone` 字样所迷惑,以为所有的 `clone` 都是深拷贝。这里的 `clone` **仅仅复制了智能指针并增加了引用计数,并没有克隆底层数据**,因此 `a` 和 `b` 是共享了底层的字符串 `s`,这种**复制效率是非常高**的。当然你也可以使用 `a.clone()` 的方式来克隆,但是从可读性角度,我们更加推荐 `Rc::clone` 的方式。 -实际上在 Rust 中,还有不少 `clone` 都是浅拷贝,例如[迭代器的克隆](https://course.rs/pitfalls/iterator-everywhere.html)。 +实际上在 Rust 中,还有不少 `clone` 都是浅拷贝,例如[迭代器的克隆](https://course.rs/compiler/pitfalls/iterator-everywhere.html)。 #### 观察引用计数的变化 diff --git a/src/advance/unsafe/intro.md b/src/advance/unsafe/intro.md index 28d5cd57..9a71f5fe 100644 --- a/src/advance/unsafe/intro.md +++ b/src/advance/unsafe/intro.md @@ -42,17 +42,17 @@ fn main() { } ``` -上面代码中, `r1` 是一个原生指针(又称裸指针,raw pointer),由于它具有破坏 Rust 内存安全的潜力,因此只能在 `unsafe` 代码块中使用,如果你去掉 `unsafe {}`,编译器会立刻报错。 +上面代码中, `r1` 是一个裸指针(raw pointer),由于它具有破坏 Rust 内存安全的潜力,因此只能在 `unsafe` 代码块中使用,如果你去掉 `unsafe {}`,编译器会立刻报错。 言归正传, `unsafe` 能赋予我们 5 种超能力,这些能力在安全的 Rust 代码中是无法获取的: -- 解引用原生指针,就如上例所示 +- 解引用裸指针,就如上例所示 - 调用一个 `unsafe` 或外部的函数 - 访问或修改一个可变的[静态变量](https://course.rs/advance/global-variable.html#静态变量) - 实现一个 `unsafe` 特征 - 访问 `union` 中的字段 -在本章中,我们将着重讲解原生指针和 FFI 的使用。 +在本章中,我们将着重讲解裸指针和 FFI 的使用。 ## unsafe 的安全保证 @@ -60,7 +60,7 @@ fn main() { 首先,`unsafe` 并不能绕过 Rust 的借用检查,也不能关闭任何 Rust 的安全检查规则,例如当你在 `unsafe` 中使用**引用**时,该有的检查一样都不会少。 -因此 `unsafe` 能给大家提供的也仅仅是之前的 5 种超能力,在使用这 5 种能力时,编译器才不会进行内存安全方面的检查,最典型的就是使用**原生指针**(引用和原生指针有很大的区别)。 +因此 `unsafe` 能给大家提供的也仅仅是之前的 5 种超能力,在使用这 5 种能力时,编译器才不会进行内存安全方面的检查,最典型的就是使用**裸指针**(引用和裸指针有很大的区别)。 ## 谈虎色变? diff --git a/src/advance/unsafe/superpowers.md b/src/advance/unsafe/superpowers.md index 5be4d80b..1d1c650c 100644 --- a/src/advance/unsafe/superpowers.md +++ b/src/advance/unsafe/superpowers.md @@ -2,24 +2,24 @@ 古龙有一部小说,名为"七种兵器",其中每一种都精妙绝伦,令人闻风丧胆,而 `unsafe` 也有五种兵器,它们可以让你拥有其它代码无法实现的能力,同时它们也像七种兵器一样令人闻风丧胆,下面一起来看看庐山真面目。 -## 解引用原生指针 +## 解引用裸指针 -原生指针(raw pointer) 又称裸指针,在功能上跟引用类似,同时它也需要显式地注明可变性。但是又和引用有所不同,原生指针长这样: `*const T` 和 `*mut T`,它们分别代表了不可变和可变。 +裸指针(raw pointer,又称原生指针) 在功能上跟引用类似,同时它也需要显式地注明可变性。但是又和引用有所不同,裸指针长这样: `*const T` 和 `*mut T`,它们分别代表了不可变和可变。 -大家在之前学过 `*` 操作符,知道它可以用于解引用,但是在原生指针 `*const T` 中,这里的 `*` 只是类型名称的一部分,并没有解引用的含义。 +大家在之前学过 `*` 操作符,知道它可以用于解引用,但是在裸指针 `*const T` 中,这里的 `*` 只是类型名称的一部分,并没有解引用的含义。 -至此,我们已经学过三种类似指针的概念:引用、智能指针和原生指针。与前两者不同,原生指针: +至此,我们已经学过三种类似指针的概念:引用、智能指针和裸指针。与前两者不同,裸指针: - 可以绕过 Rust 的借用规则,可以同时拥有一个数据的可变、不可变指针,甚至还能拥有多个可变的指针 - 并不能保证指向合法的内存 - 可以是 `null` - 没有实现任何自动的回收 (drop) -总之,原生指针跟 C 指针是非常像的,使用它需要以牺牲安全性为前提,但我们获得了更好的性能,也可以跟其它语言或硬件打交道。 +总之,裸指针跟 C 指针是非常像的,使用它需要以牺牲安全性为前提,但我们获得了更好的性能,也可以跟其它语言或硬件打交道。 -#### 基于引用创建原生指针 +#### 基于引用创建裸指针 -下面的代码**基于值的引用**同时创建了可变和不可变的原生指针: +下面的代码**基于值的引用**同时创建了可变和不可变的裸指针: ```rust let mut num = 5; @@ -28,9 +28,9 @@ let r1 = &num as *const i32; let r2 = &mut num as *mut i32; ``` -`as` 可以用于强制类型转换,在[之前章节](https://course.rs/basic/converse.html)中有讲解。在这里,我们将引用 `&num / &mut num` 强转为相应的原生指针 `*const i32 / *mut i32`。 +`as` 可以用于强制类型转换,在[之前章节](https://course.rs/basic/converse.html)中有讲解。在这里,我们将引用 `&num / &mut num` 强转为相应的裸指针 `*const i32 / *mut i32`。 -细心的同学可能会发现,在这段代码中并没有 `unsafe` 的身影,原因在于:**创建原生指针是安全的行为,而解引用原生指针才是不安全的行为** : +细心的同学可能会发现,在这段代码中并没有 `unsafe` 的身影,原因在于:**创建裸指针是安全的行为,而解引用裸指针才是不安全的行为** : ```rust fn main() { @@ -44,16 +44,16 @@ fn main() { } ``` -#### 基于内存地址创建原生指针 +#### 基于内存地址创建裸指针 -在上面例子中,我们基于现有的引用来创建原生指针,这种行为是很安全的。但是接下来的方式就不安全了: +在上面例子中,我们基于现有的引用来创建裸指针,这种行为是很安全的。但是接下来的方式就不安全了: ```rust let address = 0x012345usize; let r = address as *const i32; ``` -这里基于一个内存地址来创建原生指针,可以想像,这种行为是相当危险的。试图使用任意的内存地址往往是一种未定义的行为(undefined behavior),因为该内存地址有可能存在值,也有可能没有,就算有值,也大概率不是你需要的值。 +这里基于一个内存地址来创建裸指针,可以想像,这种行为是相当危险的。试图使用任意的内存地址往往是一种未定义的行为(undefined behavior),因为该内存地址有可能存在值,也有可能没有,就算有值,也大概率不是你需要的值。 同时编译器也有可能会优化这段代码,会造成没有任何内存访问发生,甚至程序还可能发生段错误(segmentation fault)。**总之,你几乎没有好的理由像上面这样实现代码,虽然它是可行的**。 @@ -82,7 +82,7 @@ fn main() { "The {} bytes at 0x{:X} stored: {}", length, pointer, message ); - // 如果大家想知道为何处理原生指针需要 `unsafe`,可以试着反注释以下代码 + // 如果大家想知道为何处理裸指针需要 `unsafe`,可以试着反注释以下代码 // let message = get_str_at_location(1000, 10); } ``` @@ -100,13 +100,13 @@ unsafe { } ``` -使用 `*` 可以对原生指针进行解引用,由于该指针的内存安全性并没有任何保证,因此我们需要使用 `unsafe` 来包裹解引用的逻辑(切记,`unsafe` 语句块的范围一定要尽可能的小,具体原因在上一章节有讲)。 +使用 `*` 可以对裸指针进行解引用,由于该指针的内存安全性并没有任何保证,因此我们需要使用 `unsafe` 来包裹解引用的逻辑(切记,`unsafe` 语句块的范围一定要尽可能的小,具体原因在上一章节有讲)。 -以上代码另一个值得注意的点就是:除了使用 `as` 来显式的转换,我们还使用了隐式的转换方式 `let c: *const i32 = &a;`。在实际使用中,我们建议使用 `as` 来转换,因为这种显式的方式更有助于提醒用户:你在使用的指针是原生指针,需要小心。 +以上代码另一个值得注意的点就是:除了使用 `as` 来显式的转换,我们还使用了隐式的转换方式 `let c: *const i32 = &a;`。在实际使用中,我们建议使用 `as` 来转换,因为这种显式的方式更有助于提醒用户:你在使用的指针是裸指针,需要小心。 -#### 基于智能指针创建原生指针 +#### 基于智能指针创建裸指针 -还有一种创建原生指针的方式,那就是基于智能指针来创建: +还有一种创建裸指针的方式,那就是基于智能指针来创建: ```rust let a: Box = Box::new(10); @@ -118,9 +118,9 @@ let c: *const i32 = Box::into_raw(a); #### 小结 -像之前代码演示的那样,使用原生指针可以让我们创建两个可变指针都指向同一个数据,如果使用安全的 Rust,你是无法做到这一点的,违背了借用规则,编译器会对我们进行无情的阻止。因此原生指针可以绕过借用规则,但是由此带来的数据竞争问题,就需要大家自己来处理了,总之,需要小心! +像之前代码演示的那样,使用裸指针可以让我们创建两个可变指针都指向同一个数据,如果使用安全的 Rust,你是无法做到这一点的,违背了借用规则,编译器会对我们进行无情的阻止。因此裸指针可以绕过借用规则,但是由此带来的数据竞争问题,就需要大家自己来处理了,总之,需要小心! -既然这么危险,为何还要使用原生指针?除了之前提到的性能等原因,还有一个重要用途就是跟 `C` 语言的代码进行交互( FFI ),在讲解 FFI 之前,先来看看如何调用 unsafe 函数或方法。 +既然这么危险,为何还要使用裸指针?除了之前提到的性能等原因,还有一个重要用途就是跟 `C` 语言的代码进行交互( FFI ),在讲解 FFI 之前,先来看看如何调用 unsafe 函数或方法。 ## 调用 unsafe 函数或方法 @@ -223,13 +223,13 @@ fn split_at_mut(slice: &mut [i32], mid: usize) -> (&mut [i32], &mut [i32]) { 相比安全实现,这段代码就显得没那么好理解了,甚至于我们还需要像 C 语言那样,通过指针地址的偏移去控制数组的分割。 -- `as_mut_ptr` 会返回指向 `slice` 首地址的原生指针 `*mut i32` +- `as_mut_ptr` 会返回指向 `slice` 首地址的裸指针 `*mut i32` - `slice::from_raw_parts_mut` 函数通过指针和长度来创建一个新的切片,简单来说,该切片的初始地址是 `ptr`,长度为 `mid` - `ptr.add(mid)` 可以获取第二个切片的初始地址,由于切片中的元素是 `i32` 类型,每个元素都占用了 4 个字节的内存大小,因此我们不能简单的用 `ptr + mid` 来作为初始地址,而应该使用 `ptr + 4 * mid`,但是这种使用方式并不安全,因此 `.add` 方法是最佳选择 -由于 `slice::from_raw_parts_mut` 使用原生指针作为参数,因此它是一个 `unsafe fn`,我们在使用它时,就必须用 `unsafe` 语句块进行包裹,类似的,`.add` 方法也是如此(还是那句话,不要将无关的代码包含在 `unsafe` 语句块中)。 +由于 `slice::from_raw_parts_mut` 使用裸指针作为参数,因此它是一个 `unsafe fn`,我们在使用它时,就必须用 `unsafe` 语句块进行包裹,类似的,`.add` 方法也是如此(还是那句话,不要将无关的代码包含在 `unsafe` 语句块中)。 -部分同学可能会有疑问,那这段代码我们怎么保证 `unsafe` 中使用的原生指针 `ptr` 和 `ptr.add(mid)` 是合法的呢?秘诀就在于 `assert!(mid <= len);` ,通过这个断言,我们保证了原生指针一定指向了 `slice` 切片中的某个元素,而不是一个莫名其妙的内存地址。 +部分同学可能会有疑问,那这段代码我们怎么保证 `unsafe` 中使用的裸指针 `ptr` 和 `ptr.add(mid)` 是合法的呢?秘诀就在于 `assert!(mid <= len);` ,通过这个断言,我们保证了裸指针一定指向了 `slice` 切片中的某个元素,而不是一个莫名其妙的内存地址。 再回到我们的主题:**虽然 split_at_mut 使用了 `unsafe`,但我们无需将其声明为 `unsafe fn`**,这种情况下就是使用安全的抽象包裹 `unsafe` 代码,这里的 `unsafe` 使用是非常安全的,因为我们从合法数据中创建了的合法指针。 @@ -315,7 +315,7 @@ pub extern "C" fn call_from_c() { ## 实现 unsafe 特征 -说实话,`unsafe` 的特征确实不多见,如果大家还记得的话,我们在之前的 [Send 和 Sync](https://course.rs/advance/concurrency-with-threads/send-sync.html#为原生指针实现sync) 章节中实现过 `unsafe` 特征 `Send`。 +说实话,`unsafe` 的特征确实不多见,如果大家还记得的话,我们在之前的 [Send 和 Sync](https://course.rs/advance/concurrency-with-threads/send-sync.html#为裸指针实现sync) 章节中实现过 `unsafe` 特征 `Send`。 之所以会有 `unsafe` 的特征,是因为该特征至少有一个方法包含有编译器无法验证的内容。`unsafe` 特征的声明很简单: @@ -333,7 +333,7 @@ fn main() {} 通过 `unsafe impl` 的使用,我们告诉编译器:相应的正确性由我们自己来保证。 -再回到刚提到的 `Send` 特征,若我们的类型中的所有字段都实现了 `Send` 特征,那该类型也会自动实现 `Send`。但是如果我们想要为某个类型手动实现 `Send` ,例如为原生指针,那么就必须使用 `unsafe`,相关的代码在之前的链接中也有,大家可以移步查看。 +再回到刚提到的 `Send` 特征,若我们的类型中的所有字段都实现了 `Send` 特征,那该类型也会自动实现 `Send`。但是如果我们想要为某个类型手动实现 `Send` ,例如为裸指针,那么就必须使用 `unsafe`,相关的代码在之前的链接中也有,大家可以移步查看。 总之,`Send` 特征标记为 `unsafe` 是因为 Rust 无法验证我们的类型是否能在线程间安全的传递,因此就需要通过 `unsafe` 来告诉编译器,它无需操心,剩下的交给我们自己来处理。 @@ -407,7 +407,7 @@ extern "C" { - 数据竞争 - 内存对齐问题 -但是需要注意的是,它只能帮助识别被执行代码路径的风险,哪些未被执行到的代码是没办法被识别的。 +但是需要注意的是,它只能帮助识别被执行代码路径的风险,那些未被执行到的代码是没办法被识别的。 #### Clippy @@ -427,7 +427,7 @@ extern "C" { ## 总结 -至此,`unsafe` 的五种兵器已介绍完毕,大家是否意犹未尽?我想说的是,就算意犹未尽,也没有其它武器了。 +至此,`unsafe` 的五种兵器已介绍完毕,大家是否意犹未尽?我想说的是,就算意犹未尽,也没有其它兵器了。 就像上一章中所提到的,`unsafe` 只应该用于这五种场景,其它场景,你应该坚决的使用安全的代码,否则就会像 `actix-web` 的前作者一样,被很多人议论,甚至被喷。。。 diff --git a/src/appendix/derive.md b/src/appendix/derive.md index 16260f05..0697ec52 100644 --- a/src/appendix/derive.md +++ b/src/appendix/derive.md @@ -16,7 +16,7 @@ 一个无法被派生的特征例子是为终端用户处理格式化的 `Display` 。你应该时常考虑使用合适的方法来为终端用户显示一个类型。终端用户应该看到类型的什么部分?他们会找出相关部分吗?对他们来说最关心的数据格式是什么样的?Rust 编译器没有这样的洞察力,因此无法为你提供合适的默认行为。 -本附录所提供的可派生特征列表其实并不全面:库可以为其内部的特征实现 `derive` ,因此除了本文列出的标准库 `derive` 之外,还有很多很多其它库的 `derive` 。实现 `derive` 涉及到过程宏的应用,这在[宏章节](../advance/macro.md)中有介绍。 +本附录所提供的可派生特征列表其实并不全面:库可以为其内部的特征实现 `derive` ,因此除了本文列出的标准库 `derive` 之外,还有很多很多其它库的 `derive` 。实现 `derive` 涉及到过程宏的应用,这在[宏章节](https://course.rs/advance/macro.html)中有介绍。 ### 用于开发者输出的 `Debug` @@ -78,6 +78,6 @@ `Default` 特征会帮你创建一个类型的默认值。 派生 `Default` 意味着自动实现了 `default` 函数。 `default` 函数的派生实现调用了类型每部分的 `default` 函数,这意味着类型中所有的字段也必须实现了 `Default`,这样才能够派生 `Default` 。 -`Default::default` 函数通常结合结构体更新语法一起使用,这在第五章的 [结构体更新语法](../basic/compound-type/struct.md#结构体更新语法) 部分有讨论。可以自定义一个结构体的一小部分字段而剩余字段则使用 `..Default::default()` 设置为默认值。 +`Default::default` 函数通常结合结构体更新语法一起使用,这在第五章的 [结构体更新语法](https://course.rs/basic/compound-type/struct.html#结构体更新语法) 部分有讨论。可以自定义一个结构体的一小部分字段而剩余字段则使用 `..Default::default()` 设置为默认值。 例如,当你在 `Option` 实例上使用 `unwrap_or_default` 方法时, `Default` 特征是必须的。如果 `Option` 是 `None` 的话, `unwrap_or_default` 方法将返回 `T` 类型的 `Default::default` 的结果。 diff --git a/src/appendix/keywords.md b/src/appendix/keywords.md index 2f53b443..70f33010 100644 --- a/src/appendix/keywords.md +++ b/src/appendix/keywords.md @@ -26,7 +26,7 @@ - `match` - 模式匹配 - `mod` - 定义一个模块 - `move` - 使闭包获取其所捕获项的所有权 -- `mut` - 在引用、原生指针或模式绑定中使用,表明变量是可变的 +- `mut` - 在引用、裸指针或模式绑定中使用,表明变量是可变的 - `pub` - 表示结构体字段、`impl` 块或模块的公共可见性 - `ref` - 通过引用绑定 - `return` - 从函数中返回 diff --git a/src/appendix/operators.md b/src/appendix/operators.md index 6db959ac..de57084c 100644 --- a/src/appendix/operators.md +++ b/src/appendix/operators.md @@ -25,7 +25,7 @@ | `*` | `expr * expr` | 算术乘法 | `Mul` | | `*=` | `var *= expr` | 算术乘法与赋值 | `MulAssign` | | `*` | `*expr` | 解引用 | | -| `*` | `*const type`, `*mut type` | 原生指针 | | +| `*` | `*const type`, `*mut type` | 裸指针 | | | `+` | `trait + trait`, `'a + trait` | 复合类型限制 | | | `+` | `expr + expr` | 算术加法 | `Add` | | `+=` | `var += expr` | 算术加法与赋值 | `AddAssign` | diff --git a/src/appendix/rust-versions/1.60.md b/src/appendix/rust-versions/1.60.md new file mode 100644 index 00000000..846f0f6f --- /dev/null +++ b/src/appendix/rust-versions/1.60.md @@ -0,0 +1,114 @@ +# Rust 新版解读 | 1.60 | 重点: 查看 Cargo 构建耗时详情、Cargo Feature 增加新语法 + +> 原文链接: https://blog.rust-lang.org/2022/04/07/Rust-1.60.0.html + + +通过 [rustup](https://www.rust-lang.org/tools/install) 安装的同学可以使用以下命令升级到 1.60 版本: +```shell +$ rustup update stable +``` + +## 基于源码的代码覆盖 +rustc 新增了基于 LLVM 的代码覆盖率测量,想要测试的同学可以通过以下方式重新构建你的项目: +```shell +RUSTFLAGS="-C instrument-coverage" cargo build +``` + +运行新生成的可执行文件将在当前目录下产生一个 `default.profraw` 文件( 路径和文件名可以通过环境变量进行[覆盖](https://doc.rust-lang.org/stable/rustc/instrument-coverage.html#running-the-instrumented-binary-to-generate-raw-coverage-profiling-data) )。 + +`llvm-tools-preview` 组件包含了 `llvm-profdata`,可以用于处理和合并原生的测量结果输出raw profile output)(测量区域执行数)。 + +`llvm-cov` 用于报告生成,它将 `llvm-profdata` 处理后的输出跟二进制可执行文件自身相结合,对于前者大家可能好理解,但是为何要跟后者可执行文件相结合呢?原因在于可执行文件中嵌入了一个从计数器到实际源代码单元的映射。 + +```shell +rustup component add llvm-tools-preview +$(rustc --print sysroot)/lib/rustlib/x86_64-unknown-linux-gnu/bin/llvm-profdata merge -sparse default.profraw -o default.profdata +$(rustc --print sysroot)/lib/rustlib/x86_64-unknown-linux-gnu/bin/llvm-cov show -Xdemangler=rustfilt target/debug/coverage-testing \ + -instr-profile=default.profdata \ + -show-line-counts-or-regions \ + -show-instantiations +``` + +基于一个简单的 hello world 可执行文件,执行以上命令就可以获得如下带有标记的结果: +```rust +1| 1|fn main() { +2| 1| println!("Hello, world!"); +3| 1|} +``` + +从结果中可以看出:每一行代码都已经被成功覆盖。 + +如果大家还想要了解更多,可以看下[官方的 rustc 文档](https://doc.rust-lang.org/rustc/instrument-coverage.html)。目前来说,基准功能已经稳定了,并将以某种形式存在于未来所有的 Rust 发布版本中。 但输出格式和产生这些输出的 LLVM 工具可能依然会发生变化,基于此,大家在使用时需要确保 `llvm-tools-preview` 和 rustc ( 用于编译代码的 )使用了相同的版本。 + +## 查看 Cargo 构建耗时 +新版本中,以下命令已经可以正常使用了: +```shell +$ cargo build --timings + Compiling hello-world v0.1.0 (hello-world) + Timing report saved to target/cargo-timings/cargo-timing-20220318T174818Z.html + Finished dev [unoptimized + debuginfo] target(s) in 0.98s +``` + +此命令会生成一个 `cargo build` 的耗时详情报告,除了上面提到的路径外,报告还会被拷贝到 `target/cargo-timings/cargo-timing.html`。这里是一个[在线示例](https://blog.rust-lang.org/images/2022-04-07-timing.html)。该报告在你需要提升构建速度时会非常有用,更多的信息请[查看文档](https://doc.rust-lang.org/nightly/cargo/reference/timings.html)。 + +## Cargo Feature 的新语法 + +> 关于 Cargo Features ,强烈推荐大家看看 [Cargo 使用指南](https://course.rs/cargo/reference/features/intro.html),可能是目前最好的中文翻译版本。 + +新版本为 Cargo Features 引入了两个新的语法: 命名空间 ( Namespaced )和弱依赖,它们可以让 features 跟可选依赖进行更好的交互。 + +Cargo 支持[可选依赖](https://course.rs/cargo/reference/features/intro.html#可选依赖)已经很久了,例如以下代码所示: +```toml +[dependencies] +jpeg-decoder = { version = "0.1.20", default-features = false, optional = true } + +[features] +# 通过开启 jpeg-decoder 依赖的 "rayon` feture,来启用并行化处理 +parallel = ["jpeg-decoder/rayon"] +``` + +这个例子有两点值得注意: + +- 可选依赖 `jpeg-decoder` 隐式地定义了一个同名的 feature,当启用 `jpeg-decoder` feature 时将同时启用 `jpeg-decoder` +- `"jpeg-decoder/rayon"` 语法会启用 `jpeg-decoder` 依赖,并且还会启用 `jpeg-decoder` 依赖的 `rayon` feature + +而命名空间正是为了处理第一个问题而出现的。新版本中,我们可以在 `[features]` 中使用 `dep:` 前缀来显式地引用一个可选的依赖。再无需像第一点一样:先隐式的将可选依赖暴露为一个 feature,再通过 feature 来启用它。 + +这样一来,我们将能更好的定义可选依赖所对应的 feture,包括将可选依赖隐藏在一个更具描述性的 feature 名称后面。 + +弱依赖用于处理第二点: 根据第二点,`optional-dependency/feature-name` 必定会启用 `optional-dependency` 这个可选依赖。然而在一些场景中,我们只希望在其它 features 已经启用了可选依赖 `optional-dependency` 时才去启用 `feature-name` 这个 feature。 + +从 1.60 开始,我们可以使用 `"package-name?/feature-name"` 这种带有 `?` 形式的语法: 只有当其它项已经启用了可选依赖 `package-name` 的情况下才去开启给定的 feature `feature-name`。 + +> 译者注:简单来说,要启用 `feature` 必须需要别人先启用了其前置的可选依赖,再也无法像之前的第二点一样,既能开启可选依赖,又能启用 feature。 + +例如,我们希望为自己的库增加一些序列化功能,它需要开启某个可选依赖中的指定 feature,可以这么做: +```toml +[dependencies] +serde = { version = "1.0.133", optional = true } +rgb = { version = "0.8.25", optional = true } + +[features] +serde = ["dep:serde", "rgb?/serde"] +``` + +这里定义了以下关系: + +1. 开启 `serde` feature 将启用可选的 `serde` 依赖 +2. 只有当 `rgp` 依赖在其它地方已经被启用后,此处才能启用 `rgb` 的 `serde` feature + +## 增量编译重启开启 +在 [1.59 更新说明中](https://course.rs/appendix/rust-versions/1.59.html),我们有提到因为某些问题,增量编译被默认关闭了,现在官方修复了其中一些,并且确认目前的状态不会再影响用户的使用,因此在 1.60 版本中,增量编译又重新默认开启了。 + +## Instant 单调性保证 +> 译者注:Instant 可以获取当前的时间,因此保证其单调增长是非常重要的,例如 uuid 的生成往往依赖于时间戳的单调增长,一旦时间回退,就可能出现 uuid 重复的情况。 + +在目前所有的平台上,`Instant` 会去尝试使用系统提供的 API 来保证单调性行为( 目前主要针对 tier 1 的平台 )。然而在实际场景中,这种单调性偶尔会因为硬件、虚拟化或操作系统bug 等原因而失效。 + +为了解决这些失效或是平台没有提供 API 的情况,`Instant::duration_since`, `Instant::elapsed` 和 `Instant::sub` 现在饱和为零( 这里不太好翻译,原文是 now saturate to zero,大概意思是非负?)。而在老版本中,这种时间回退的情况会导致 panic。 + +`Instant::checked_duration_since` 也可以用于检测和处理单调性失败或 `Instants` 的减法顺序不正确的情况。 + +但是目前的解决方法会遮掩一些错误的发生,因此在未来版本中,Rust 可能会重新就某些场景引入 panic 机制。 + +在 1.60 版本前,单调性主要通过标准库的互斥锁 Mutex 或原子性 atomic 来保证,但是在 `Instant::now()` 调用频繁时,可能会导致明显的性能问题。 diff --git a/src/async/async-await.md b/src/async-rust/async/async-await.md similarity index 98% rename from src/async/async-await.md rename to src/async-rust/async/async-await.md index a0d953b7..4f039ddb 100644 --- a/src/async/async-await.md +++ b/src/async-rust/async/async-await.md @@ -22,7 +22,7 @@ fn bar() -> impl Future { `async` 是懒惰的,直到被执行器 `poll` 或者 `.await` 后才会开始运行,其中后者是最常用的运行 `Future` 的方法。 当 `.await` 被调用时,它会尝试运行 `Future` 直到完成,但是若该 `Future` 进入阻塞,那就会让出当前线程的控制权。当 `Future` 后面准备再一次被运行时(例如从 `socket` 中读取到了数据),执行器会得到通知,并再次运行该 `Future` ,如此循环,直到完成。 -以上过程只是一个简述,详细内容在[底层探秘](./future-excuting.md)中已经被深入讲解过,因此这里不再赘述。 +以上过程只是一个简述,详细内容在[底层探秘](https://course.rs/async-rust/async/future-excuting.html)中已经被深入讲解过,因此这里不再赘述。 ## `async` 的生命周期 diff --git a/src/async/future-excuting.md b/src/async-rust/async/future-excuting.md similarity index 100% rename from src/async/future-excuting.md rename to src/async-rust/async/future-excuting.md diff --git a/src/async/getting-started.md b/src/async-rust/async/getting-started.md similarity index 92% rename from src/async/getting-started.md rename to src/async-rust/async/getting-started.md index 01051208..57c0b9e3 100644 --- a/src/async/getting-started.md +++ b/src/async-rust/async/getting-started.md @@ -18,8 +18,8 @@ 由于并发编程在现代社会非常重要,因此每个主流语言都对自己的并发模型进行过权衡取舍和精心设计,Rust 语言也不例外。下面的列表可以帮助大家理解不同并发模型的取舍: -- **OS 线程**, 它最简单,也无需改变任何编程模型(业务/代码逻辑),因此非常适合作为语言的原生并发模型,我们在[多线程章节](../advnce/../advance/concurrency-with-threads/concurrency-parallelism.md)也提到过,Rust 就选择了原生支持线程级的并发编程。但是,这种模型也有缺点,例如线程间的同步将变得更加困难,线程间的上下文切换损耗较大。使用线程池在一定程度上可以提升性能,但是对于 IO 密集的场景来说,线程池还是不够看。 -- **事件驱动(Event driven)**, 这个名词你可能比较陌生,如果说事件驱动常常跟回调( Callback )一起使用,相信大家就恍然大悟了。这种模型性能相当的好,但最大的问题就是存在回调地狱的风险:非线性的控制流和结果处理导致了数据流向和错误传播变得难以掌控,还会导致代码可维护性和可读性的大幅降低,大名鼎鼎的 JS 曾经就存在回调地狱。 +- **OS 线程**, 它最简单,也无需改变任何编程模型(业务/代码逻辑),因此非常适合作为语言的原生并发模型,我们在[多线程章节](https://course.rs/advance/concurrency-with-threads/concurrency-parallelism.html)也提到过,Rust 就选择了原生支持线程级的并发编程。但是,这种模型也有缺点,例如线程间的同步将变得更加困难,线程间的上下文切换损耗较大。使用线程池在一定程度上可以提升性能,但是对于 IO 密集的场景来说,线程池还是不够。 +- **事件驱动(Event driven)**, 这个名词你可能比较陌生,如果说事件驱动常常跟回调( Callback )一起使用,相信大家就恍然大悟了。这种模型性能相当的好,但最大的问题就是存在回调地狱的风险:非线性的控制流和结果处理导致了数据流向和错误传播变得难以掌控,还会导致代码可维护性和可读性的大幅降低,大名鼎鼎的 `JavaScript` 曾经就存在回调地狱。 - **协程(Coroutines)** 可能是目前最火的并发模型,`Go` 语言的协程设计就非常优秀,这也是 `Go` 语言能够迅速火遍全球的杀手锏之一。协程跟线程类似,无需改变编程模型,同时,它也跟 `async` 类似,可以支持大量的任务并发运行。但协程抽象层次过高,导致用户无法接触到底层的细节,这对于系统编程语言和自定义异步运行时是难以接受的 - **actor 模型**是 erlang 的杀手锏之一,它将所有并发计算分割成一个一个单元,这些单元被称为 `actor` , 单元之间通过消息传递的方式进行通信和数据传递,跟分布式系统的设计理念非常相像。由于 `actor` 模型跟现实很贴近,因此它相对来说更容易实现,但是一旦遇到流控制、失败重试等场景时,就会变得不太好用 - **async/await**, 该模型性能高,还能支持底层编程,同时又像线程和协程那样无需过多的改变编程模型,但有得必有失,`async` 模型的问题就是内部实现机制过于复杂,对于用户来说,理解和使用起来也没有线程和协程简单,好在前者的复杂性开发者们已经帮我们封装好,而理解和使用起来不够简单,正是本章试图解决的问题。 @@ -36,7 +36,7 @@ - **Future 在 Rust 中是惰性的**,只有在被轮询(`poll`)时才会运行, 因此丢弃一个 `future` 会阻止它未来再被运行, 你可以将`Future`理解为一个在未来某个时间点被调度执行的任务。 - **Async 在 Rust 中使用开销是零**, 意味着只有你能看到的代码(自己的代码)才有性能损耗,你看不到的(`async` 内部实现)都没有性能损耗,例如,你可以无需分配任何堆内存、也无需任何动态分发来使用 `async` ,这对于热点路径的性能有非常大的好处,正是得益于此,Rust 的异步编程性能才会这么高。 - **Rust 没有内置异步调用所必须的运行时**,但是无需担心,Rust 社区生态中已经提供了非常优异的运行时实现,例如大明星 [`tokio`](https://tokio.rs) -- **运行时同时支持单线程和多线程**,这两者拥有各自的优缺点, 稍后会讲 +- **运行时同时支持单线程和多线程**,这两者拥有各自的优缺点,稍后会讲 #### Rust: async vs 多线程 @@ -54,6 +54,13 @@ 总之,`async`编程并没有比多线程更好,最终还是根据你的使用场景作出合适的选择,如果无需高并发,或者也不在意线程切换带来的性能损耗,那么多线程使用起来会简单、方便的多!最后再简单总结下: +> 若大家使用 tokio,那 CPU 密集的任务尤其需要用线程的方式去处理,例如使用 `spawn_blocking` 创建一个阻塞的线程取完成相应 CPU 密集任务。 +> +> 至于具体的原因,不仅是上文说到的那些,还有一个是:tokio 是协作式地调度器,如果某个 CPU 密集的异步任务是通过 tokio 创建的,那理论上来说,该异步任务需要跟其它的异步任务交错执行,最终大家都得到了执行,皆大欢喜。但实际情况是,CPU 密集的任务很可能会一直霸着着 CPU,此时 tokio 的调度方式决定了该任务会一直被执行,这意味着,其它的异步任务无法得到执行的机会,最终这些任务都会因为得不到资源而饿死。 +> +> 而使用 `spawn_blocking` 后,会创建一个单独的 OS 线程,该线程并不会被 tokio 所调度( 被 OS 所调度 ),因此它所执行的 CPU 密集任务也不会导致 tokio 调度的那些异步任务被饿死 + + - 有大量 `IO` 任务需要并发运行时,选 `async` 模型 - 有部分 `IO` 任务需要并发运行时,选多线程,如果想要降低线程创建和销毁的开销,可以使用线程池 - 有大量 `CPU` 密集任务需要并行运行时,例如并行计算,选多线程模型,且让线程数等于或者稍大于 `CPU` 核心数 @@ -234,7 +241,7 @@ warning: unused implementer of `futures::Future` that must be used hello, world! ``` -不出所料,`main`函数中的`future`我们通过`block_on`函数进行了运行,但是这里的`hello_cat`返回的`Future`却没有任何人去执行它,不过好在编译器友善的给出了提示:`futures do nothing unless you .await or poll them `,两种解决方法:使用`.await`语法或者对`Future`进行轮询(`poll`)。 +不出所料,`main`函数中的`future`我们通过`block_on`函数进行了运行,但是这里的`hello_cat`返回的`Future`却没有任何人去执行它,不过好在编译器友善的给出了提示:```futures do nothing unless you `.await` or poll them```,两种解决方法:使用`.await`语法或者对`Future`进行轮询(`poll`)。 后者较为复杂,暂且不表,先来使用`.await`试试: diff --git a/src/async-rust/async/intro.md b/src/async-rust/async/intro.md new file mode 100644 index 00000000..0b55ac86 --- /dev/null +++ b/src/async-rust/async/intro.md @@ -0,0 +1,5 @@ +# 异步编程 + +接下来,我们将深入了解 async/await 的使用方式及背后的原理。 + +> 本章在内容上大量借鉴和翻译了原版英文书籍[Asynchronous Programming In Rust](https://rust-lang.github.io/async-book/01_getting_started/01_chapter.html), 特此感谢 diff --git a/src/async/multi-futures-simultaneous.md b/src/async-rust/async/multi-futures-simultaneous.md similarity index 100% rename from src/async/multi-futures-simultaneous.md rename to src/async-rust/async/multi-futures-simultaneous.md diff --git a/src/async/pain-points-and-workarounds.md b/src/async-rust/async/pain-points-and-workarounds.md similarity index 97% rename from src/async/pain-points-and-workarounds.md rename to src/async-rust/async/pain-points-and-workarounds.md index ba512253..7a6a4fed 100644 --- a/src/async/pain-points-and-workarounds.md +++ b/src/async-rust/async/pain-points-and-workarounds.md @@ -154,7 +154,7 @@ enum Recursive { } ``` -这是典型的[动态大小类型](../advance/custom-type.md#动态大小类型),它的大小会无限增长,因此编译器会直接报错: +这是典型的[动态大小类型](https://course.rs/advance/into-types/sized.html#动态大小类型-dst),它的大小会无限增长,因此编译器会直接报错: ```shell error[E0733]: recursion in an `async fn` requires boxing diff --git a/src/async/pin-unpin.md b/src/async-rust/async/pin-unpin.md similarity index 97% rename from src/async/pin-unpin.md rename to src/async-rust/async/pin-unpin.md index c2752f6b..8932155a 100644 --- a/src/async/pin-unpin.md +++ b/src/async-rust/async/pin-unpin.md @@ -16,7 +16,7 @@ struct SelfRef { } ``` -在上面的结构体中,`pointer_to_value` 是一个原生指针,指向第一个字段 `value` 持有的字符串 `String` 。很简单对吧?现在考虑一个情况, 若`String` 被移动了怎么办? +在上面的结构体中,`pointer_to_value` 是一个裸指针,指向第一个字段 `value` 持有的字符串 `String` 。很简单对吧?现在考虑一个情况, 若`String` 被移动了怎么办? 此时一个致命的问题就出现了:新的字符串的内存地址变了,而 `pointer_to_value` 依然指向之前的地址,一个重大 bug 就出现了! @@ -168,7 +168,7 @@ impl Test { } ``` -`Test` 提供了方法用于获取字段 `a` 和 `b` 的值的引用。这里`b` 是 `a` 的一个引用,但是我们并没有使用引用类型而是用了原生指针,原因是:Rust 的借用规则不允许我们这样用,因为不符合生命周期的要求。 此时的 `Test` 就是一个自引用结构体。 +`Test` 提供了方法用于获取字段 `a` 和 `b` 的值的引用。这里`b` 是 `a` 的一个引用,但是我们并没有使用引用类型而是用了裸指针,原因是:Rust 的借用规则不允许我们这样用,因为不符合生命周期的要求。 此时的 `Test` 就是一个自引用结构体。 如果不移动任何值,那么上面的例子将没有任何问题,例如: diff --git a/src/async/web-server.md b/src/async-rust/async/web-server.md similarity index 99% rename from src/async/web-server.md rename to src/async-rust/async/web-server.md index a03308c8..7a32a7be 100644 --- a/src/async/web-server.md +++ b/src/async-rust/async/web-server.md @@ -300,7 +300,7 @@ impl Write for MockTcpStream { } ``` -最后,我们的 mock 需要实现 `Unpin` 特征,表示它可以在内存中安全的移动,具体内容在[前面章节](./pin-unpin.md)有讲。 +最后,我们的 mock 需要实现 `Unpin` 特征,表示它可以在内存中安全的移动,具体内容在[前面章节](https://course.rs/async-rust/async/pin-unpin.html)有讲。 ```rust use std::marker::Unpin; diff --git a/src/async-rust/intro.md b/src/async-rust/intro.md new file mode 100644 index 00000000..0e5123fd --- /dev/null +++ b/src/async-rust/intro.md @@ -0,0 +1,11 @@ +# Rust 异步编程 +在艰难的学完 Rust 入门和进阶所有的 70 个章节后,我们终于来到了这里。假如之前攀登的是珠穆朗玛峰,那么现在攀登的就是乔戈里峰( 比珠峰还难攀爬... )。 + +如果你想开发 Web 服务器、数据库驱动、消息服务等需要高并发的服务,那么本章的内容将值得认真对待和学习,将从以下方面深入讲解 Rust 的异步编程: + +- Rust 异步编程的通用概念介绍 +- Future 以及异步任务调度 +- async/await 和 Pin/Unpin +- 异步编程常用的三方库 +- tokio 库 +- 一些示例 \ No newline at end of file diff --git a/src/tokio/async.md b/src/async-rust/tokio/async.md similarity index 100% rename from src/tokio/async.md rename to src/async-rust/tokio/async.md diff --git a/src/tokio/bridging-with-sync.md b/src/async-rust/tokio/bridging-with-sync.md similarity index 100% rename from src/tokio/bridging-with-sync.md rename to src/async-rust/tokio/bridging-with-sync.md diff --git a/src/tokio/channels.md b/src/async-rust/tokio/channels.md similarity index 100% rename from src/tokio/channels.md rename to src/async-rust/tokio/channels.md diff --git a/src/tokio/frame.md b/src/async-rust/tokio/frame.md similarity index 100% rename from src/tokio/frame.md rename to src/async-rust/tokio/frame.md diff --git a/src/tokio/getting-startted.md b/src/async-rust/tokio/getting-startted.md similarity index 100% rename from src/tokio/getting-startted.md rename to src/async-rust/tokio/getting-startted.md diff --git a/src/tokio/graceful-shutdown.md b/src/async-rust/tokio/graceful-shutdown.md similarity index 100% rename from src/tokio/graceful-shutdown.md rename to src/async-rust/tokio/graceful-shutdown.md diff --git a/src/tokio/intro.md b/src/async-rust/tokio/intro.md similarity index 100% rename from src/tokio/intro.md rename to src/async-rust/tokio/intro.md diff --git a/src/tokio/io.md b/src/async-rust/tokio/io.md similarity index 100% rename from src/tokio/io.md rename to src/async-rust/tokio/io.md diff --git a/src/tokio/overview.md b/src/async-rust/tokio/overview.md similarity index 88% rename from src/tokio/overview.md rename to src/async-rust/tokio/overview.md index f21e194c..787220ee 100644 --- a/src/tokio/overview.md +++ b/src/async-rust/tokio/overview.md @@ -76,6 +76,14 @@ Rust 语言的安全可靠性顺理成章的影响了 `tokio` 的可靠性,曾 - 读取大量的文件, 读取文件的瓶颈主要在于操作系统,因为 OS 没有提供异步文件读取接口,大量的并发并不会提升文件读取的并行性能,反而可能会造成不可忽视的性能损耗,因此建议使用线程(或线程池)的方式 - 发送 HTTP 请求,`tokio` 的优势是给予你并发处理大量任务的能力,对于这种轻量级 HTTP 请求场景,`tokio` 除了增加你的代码复杂性,并无法带来什么额外的优势。因此,对于这种场景,你可以使用 [`reqwest`](https://github.com/seanmonstar/reqwest) 库,它会更加简单易用。 + +> 若大家使用 tokio,那 CPU 密集的任务尤其需要用线程的方式去处理,例如使用 `spawn_blocking` 创建一个阻塞的线程取完成相应 CPU 密集任务。 +> +> 原因是:tokio 是协作式地调度器,如果某个 CPU 密集的异步任务是通过 tokio 创建的,那理论上来说,该异步任务需要跟其它的异步任务交错执行,最终大家都得到了执行,皆大欢喜。但实际情况是,CPU 密集的任务很可能会一直霸着着 CPU,此时 tokio 的调度方式决定了该任务会一直被执行,这意味着,其它的异步任务无法得到执行的机会,最终这些任务都会因为得不到资源而饿死。 +> +> 而使用 `spawn_blocking` 后,会创建一个单独的 OS 线程,该线程并不会被 tokio 所调度( 被 OS 所调度 ),因此它所执行的 CPU 密集任务也不会导致 tokio 调度的那些异步任务被饿死 + + ## 总结 离开三方开源社区提供的异步运行时, `async/await` 什么都不是,甚至还不如一堆破铜烂铁,除非你选择根据自己的需求手撸一个。 diff --git a/src/tokio/select.md b/src/async-rust/tokio/select.md similarity index 100% rename from src/tokio/select.md rename to src/async-rust/tokio/select.md diff --git a/src/tokio/shared-state.md b/src/async-rust/tokio/shared-state.md similarity index 100% rename from src/tokio/shared-state.md rename to src/async-rust/tokio/shared-state.md diff --git a/src/tokio/spawning.md b/src/async-rust/tokio/spawning.md similarity index 98% rename from src/tokio/spawning.md rename to src/async-rust/tokio/spawning.md index a48f5732..fb88590f 100644 --- a/src/tokio/spawning.md +++ b/src/async-rust/tokio/spawning.md @@ -169,7 +169,7 @@ help: to force the async block to take ownership of `v` (and any other 在报错的同时,Rust 编译器还给出了相当有帮助的提示:为 `async` 语句块使用 `move` 关键字,这样就能将 `v` 的所有权从 `main` 函数转移到新创建的任务中。 -但是 `move` 有一个问题,一个数据只能被一个任务使用,如果想要多个任务使用一个数据,就有些强人所难。不知道还有多少同学记得 [`Arc`](../advance/smart-pointer/rc-arc.md),它可以轻松解决该问题,还是线程安全的。 +但是 `move` 有一个问题,一个数据只能被一个任务使用,如果想要多个任务使用一个数据,就有些强人所难。不知道还有多少同学记得 [`Arc`](https://course.rs/advance/smart-pointer/rc-arc.html),它可以轻松解决该问题,还是线程安全的。 在上面的报错中,还有一句很奇怪的信息`function requires argument type to outlive 'static`, 函数要求参数类型的生命周期必须比 `'static` 长,问题是 `'static` 已经活得跟整个程序一样久了,难道函数的参数还能活得更久?大家可能会觉得编译器秀逗了,毕竟其它语言编译器也有秀逗的时候:) diff --git a/src/tokio/stream.md b/src/async-rust/tokio/stream.md similarity index 100% rename from src/tokio/stream.md rename to src/async-rust/tokio/stream.md diff --git a/src/async/intro.md b/src/async/intro.md deleted file mode 100644 index a888f990..00000000 --- a/src/async/intro.md +++ /dev/null @@ -1,14 +0,0 @@ -# 异步编程 - -在艰难的学完 Rust 入门和进阶所有的 55 个章节后,我们终于来到了这里。假如之前攀登的是珠穆拉玛峰,那么现在攀登的就是乔戈里峰( 比珠峰还难攀爬... ),本章将学习的内容是关于 async 异步编程。 - -如果你想开发 Web 服务器、数据库驱动、消息服务等需要高并发的服务,那么本章的内容将值得认真对待和学习,将从以下方面深入讲解 Rust 的异步编程: - -- Rust 异步编程的通用概念介绍 -- Future 以及异步任务调度 -- async/await 和 Pin/Unpin -- 异步编程常用的三方库 -- tokio 库 -- 一些示例 - -> 本章在内容上大量借鉴和翻译了原版英文书籍[Asynchronous Programming In Rust](https://rust-lang.github.io/async-book/01_getting_started/01_chapter.html), 特此感谢 diff --git a/src/basic/base-type/char-bool.md b/src/basic/base-type/char-bool.md index ca907aa8..0f57e0ba 100644 --- a/src/basic/base-type/char-bool.md +++ b/src/basic/base-type/char-bool.md @@ -63,7 +63,7 @@ fn main() { 只能说,再不起眼的东西,都有其用途,在目前为止的学习过程中,大家已经看到过很多次 `fn main()` 函数的使用吧?那么这个函数返回什么呢? -没错, `main` 函数就返回这个单元类型 `()`,你不能说 `main` 函数无返回值,因为没有返回值的函数在 Rust 中是有单独的定义的:`发散函数`,顾名思义,无法收敛的函数。 +没错, `main` 函数就返回这个单元类型 `()`,你不能说 `main` 函数无返回值,因为没有返回值的函数在 Rust 中是有单独的定义的:`发散函数( diverge function )`,顾名思义,无法收敛的函数。 例如常见的 `println!()` 的返回值也是单元类型 `()`。 diff --git a/src/basic/base-type/function.md b/src/basic/base-type/function.md index 637e8591..99f931c1 100644 --- a/src/basic/base-type/function.md +++ b/src/basic/base-type/function.md @@ -168,11 +168,11 @@ error[E0308]: mismatched types // 类型不匹配 | - help: consider removing this semicolon ``` -还记得我们在[语句与表达式](./statement-expression.md)中讲过的吗?只有表达式能返回值,而 `;` 结尾的是语句,在 Rust 中,一定要严格区分**表达式**和**语句**的区别,这个在其它语言中往往是被忽视的点。 +还记得我们在[语句与表达式](https://course.rs/basic/base-type/statement-expression.html)中讲过的吗?只有表达式能返回值,而 `;` 结尾的是语句,在 Rust 中,一定要严格区分**表达式**和**语句**的区别,这个在其它语言中往往是被忽视的点。 -##### 永不返回的函数`!` +##### 永不返回的发散函数 `!` -当用 `!` 作函数返回类型的时候,表示该函数永不返回,特别的,这种语法往往用做会导致程序崩溃的函数: +当用 `!` 作函数返回类型的时候,表示该函数永不返回( diverge function ),特别的,这种语法往往用做会导致程序崩溃的函数: ```rust fn dead_end() -> ! { diff --git a/src/basic/base-type/statement-expression.md b/src/basic/base-type/statement-expression.md index 526bf64b..e5d6ce4e 100644 --- a/src/basic/base-type/statement-expression.md +++ b/src/basic/base-type/statement-expression.md @@ -1,4 +1,4 @@ -# 语句和表达式 +# 语句和表达式 Rust 的函数体是由一系列语句组成,最后由一个表达式来返回值,例如: @@ -55,7 +55,7 @@ error[E0658]: `let` expressions in this position are experimental ``` -以上的错误告诉我们 `let` 是语句,不是表达式,因此它不返回值,也就不能给其它变量赋值。但是该错误还透漏了一个重要的信息, `let` 作为表达式已经是试验功能了,也许不久的将来,我们在 [`stable rust`](../../appendix/rust-version.md) 下可以这样使用。 +以上的错误告诉我们 `let` 是语句,不是表达式,因此它不返回值,也就不能给其它变量赋值。但是该错误还透漏了一个重要的信息, `let` 作为表达式已经是试验功能了,也许不久的将来,我们在 [`stable rust`](https://course.rs/appendix/rust-version.html) 下可以这样使用。 ## 表达式 @@ -92,4 +92,3 @@ fn main() { > [Rust By Practice](https://zh.practice.rs/basic-types/statements-expressions.html),支持代码在线编辑和运行,并提供详细的[习题解答](https://github.com/sunface/rust-by-practice)。 - diff --git a/src/basic/collections/hashmap.md b/src/basic/collections/hashmap.md index 499a3548..fc292e12 100644 --- a/src/basic/collections/hashmap.md +++ b/src/basic/collections/hashmap.md @@ -24,7 +24,7 @@ my_gems.insert("河边捡的误以为是宝石的破石头", 18); 很简单对吧?跟其它语言没有区别,聪明的同学甚至能够猜到该 `HashMap` 的类型:`HashMap<&str,i32>`。 -但是还有一点,你可能没有注意,那就是使用 `HashMap` 需要手动通过 `use ...` 从标准库中引入到我们当前的作用域中来,仔细回忆下,之前使用另外两个集合类型 `String` 和 `Vec` 时,我们是否有手动引用过?答案是 `No`,因为 `HashMap` 并没有包含在 Rust 的 [`prelude`](../../appendix/prelude.md) 中(Rust 为了简化用户使用,提前将最常用的类型自动引入到作用域中)。 +但是还有一点,你可能没有注意,那就是使用 `HashMap` 需要手动通过 `use ...` 从标准库中引入到我们当前的作用域中来,仔细回忆下,之前使用另外两个集合类型 `String` 和 `Vec` 时,我们是否有手动引用过?答案是 `No`,因为 `HashMap` 并没有包含在 Rust 的 [`prelude`](https://course.rs/appendix/prelude.html) 中(Rust 为了简化用户使用,提前将最常用的类型自动引入到作用域中)。 所有的集合类型都是动态的,意味着它们没有固定的内存大小,因此它们底层的数据都存储在内存堆上,然后通过一个存储在栈中的引用类型来访问。同时,跟其它集合类型一致,`HashMap` 也是内聚性的,即所有的 `K` 必须拥有同样的类型,`V` 也是如此。 @@ -299,7 +299,7 @@ assert_eq!(hash.get(&42), Some(&"the answer")); > 目前,`HashMap` 使用的哈希函数是 `SipHash`,它的性能不是很高,但是安全性很高。`SipHash` 在中等大小的 `Key` 上,性能相当不错,但是对于小型的 `Key` (例如整数)或者大型 `Key` (例如字符串)来说,性能还是不够好。若你需要极致性能,例如实现算法,可以考虑这个库:[ahash](https://github.com/tkaitchuck/ahash) -最后,如果你想要了解 `HashMap` 更多的用法,请参见本书的标准库解析章节:[HashMap 常用方法](../../std/hashmap.md) +最后,如果你想要了解 `HashMap` 更多的用法,请参见本书的标准库解析章节:[HashMap 常用方法](https://course.rs/std/hashmap.html) ## 课后练习 diff --git a/src/basic/collections/intro.md b/src/basic/collections/intro.md index 7372c8b7..219e294f 100644 --- a/src/basic/collections/intro.md +++ b/src/basic/collections/intro.md @@ -8,6 +8,6 @@ 紧接着,第二个集合在全场的嘘声和羡慕眼光中闪亮登场,只见里面的元素排成一对一对的,彼此都手牵着手,非对方莫属,这种情深深雨蒙蒙的样子真是...挺欠扁的。 它就是 `HashMap` 类型,该类型允许你在里面存储 `KV` 对,每一个 `K` 都有唯一的 `V` 与之配对。 -最后,请用热烈的掌声迎接我们的 `String` 集合,哦,抱歉,`String` 集合天生低调,见不得前两个那样,因此被气走了,你可以去[这里](../compound-type/string-slice)找它。 +最后,请用热烈的掌声迎接我们的 `String` 集合,哦,抱歉,`String` 集合天生低调,见不得前两个那样,因此被气走了,你可以去[这里](https://course.rs/basic/compound-type/string-slice.html)找它。 言归正传,本章所讲的 `Vector`、`HashMap` 再加上之前的 `String` 类型,是标准库中最最常用的集合类型,可以说,几乎任何一段代码中都可以找到它们的身影,那么先来看看 `Vector`。 diff --git a/src/basic/collections/vector.md b/src/basic/collections/vector.md index 71b68e0e..beb2460e 100644 --- a/src/basic/collections/vector.md +++ b/src/basic/collections/vector.md @@ -37,7 +37,7 @@ v.push(1); let v = vec![1, 2, 3]; ``` -同样,此处的 `v` 也无需标注类型,编译器只需检查它内部的元素即可自动推导出 `v` 的类型是 `Vec` (Rust 中,整数默认类型是 `i32`,在[数值类型](../base-type/numbers.md#整数类型)中有详细介绍)。 +同样,此处的 `v` 也无需标注类型,编译器只需检查它内部的元素即可自动推导出 `v` 的类型是 `Vec` (Rust 中,整数默认类型是 `i32`,在[数值类型](https://course.rs/basic/base-type/numbers.html#整数类型)中有详细介绍)。 ## 更新 Vector @@ -104,7 +104,7 @@ let does_not_exist = v.get(100); ##### 同时借用多个数组元素 -既然涉及到借用数组元素,那么很可能会遇到同时借用多个数组元素的情况,还记得在[所有权和借用](../ownership/borrowing.md#借用规则总结)章节咱们讲过的借用规则嘛?如果记得,就来看看下面的代码:) +既然涉及到借用数组元素,那么很可能会遇到同时借用多个数组元素的情况,还记得在[所有权和借用](https://course.rs/basic/ownership/borrowing.html#借用规则总结)章节咱们讲过的借用规则嘛?如果记得,就来看看下面的代码:) ```rust let mut v = vec![1, 2, 3, 4, 5]; @@ -116,7 +116,7 @@ v.push(6); println!("The first element is: {}", first); ``` -先不运行,来推断下结果,首先 `first = &v[0]` 进行了不可变借用,`v.push` 进行了可变借用,如果 `first` 在 `v.push` 之后不再使用,那么该段代码可以成功编译(原因见[引用的作用域](../ownership/borrowing.md#可变引用与不可变引用不能同时存在))。 +先不运行,来推断下结果,首先 `first = &v[0]` 进行了不可变借用,`v.push` 进行了可变借用,如果 `first` 在 `v.push` 之后不再使用,那么该段代码可以成功编译(原因见[引用的作用域](https://course.rs/basic/ownership/borrowing.html#可变引用与不可变引用不能同时存在))。 可是上面的代码中,`first` 这个不可变借用在可变借用 `v.push` 后被使用了,那么妥妥的,编译器就会报错: @@ -229,9 +229,9 @@ fn main() { 比枚举实现要稍微复杂一些,我们为 `V4` 和 `V6` 都实现了特征 `IpAddr`,然后将它俩的实例用 `Box::new` 包裹后,存在了数组 `v` 中,需要注意的是,这里必需手动的指定类型:`Vec>`,表示数组 `v` 存储的是特征 `IpAddr` 的对象,这样就实现了在数组中存储不同的类型。 -在实际使用场景中,特征对象数组要比枚举数组常见很多,主要原因在于[特征对象](../trait/trait-object.md)非常灵活,而编译器对枚举的限制较多,且无法动态增加类型。 +在实际使用场景中,特征对象数组要比枚举数组常见很多,主要原因在于[特征对象](https://course.rs/basic/trait/trait-object.html)非常灵活,而编译器对枚举的限制较多,且无法动态增加类型。 -最后,如果你想要了解 `Vector` 更多的用法,请参见本书的标准库解析章节:[`Vector`常用方法](../../std/vector.md) +最后,如果你想要了解 `Vector` 更多的用法,请参见本书的标准库解析章节:[`Vector`常用方法](https://course.rs/std/vector.html) ## 课后练习 diff --git a/src/basic/comment.md b/src/basic/comment.md index 3d70f2ff..443e6a06 100644 --- a/src/basic/comment.md +++ b/src/basic/comment.md @@ -323,7 +323,7 @@ impl AsyncReceiver { 除了跳转到标准库,你还可以通过指定具体的路径跳转到自己代码或者其它库的指定项,例如在 `lib.rs` 中添加以下代码: ```rust -mod a { +pub mod a { /// `add_one` 返回一个[`Option`]类型 /// 跳转到[`crate::MySpecialFormatter`] pub fn add_one(x: i32) -> Option { @@ -331,7 +331,7 @@ mod a { } } -struct MySpecialFormatter; +pub struct MySpecialFormatter; ``` 使用 `crate::MySpecialFormatter` 这种路径就可以实现跳转到 `lib.rs` 中定义的结构体上。 @@ -387,7 +387,7 @@ pub struct BigY; Created binary (application) `art` package ``` -系统提示我们创建了一个二进制 `Package`,根据[之前章节](./crate-module/crate.md)学过的内容,可以知道该 `Package` 包含一个同名的二进制包:包名为 `art`,包根为 `src/main.rs`,该包可以编译成二进制然后运行。 +系统提示我们创建了一个二进制 `Package`,根据[之前章节](https://course.rs/basic/crate-module/crate.html)学过的内容,可以知道该 `Package` 包含一个同名的二进制包:包名为 `art`,包根为 `src/main.rs`,该包可以编译成二进制然后运行。 现在,在 `src` 目录下创建一个 `lib.rs` 文件,同样,根据之前学习的知识,创建该文件等于又创建了一个库类型的包,包名也是 `art`,包根为 `src/lib.rs`,该包是是库类型的,因此往往作为依赖库被引入。 @@ -429,7 +429,7 @@ pub mod utils { /// ```rust /// use art::utils::mix; /// use art::kinds::{PrimaryColor,SecondaryColor}; - /// assert_eq!(mix(PrimaryColor::Yellow, PrimaryColor::Blue), SecondaryColor::Green) + /// assert!(matches!(mix(PrimaryColor::Yellow, PrimaryColor::Blue), SecondaryColor::Green)); /// ``` pub fn mix(c1: PrimaryColor, c2: PrimaryColor) -> SecondaryColor { SecondaryColor::Green diff --git a/src/basic/compound-type/array.md b/src/basic/compound-type/array.md index 0327e67d..04d65ee0 100644 --- a/src/basic/compound-type/array.md +++ b/src/basic/compound-type/array.md @@ -22,7 +22,7 @@ fn main() { } ``` -数组语法跟 JavaScript 很像,也跟大多数编程语言很像。由于它的元素类型大小固定,且长度也是固定,因此**数组 `array` 是存储在栈上**,性能也会非常优秀。与此对应,**动态数组 `Vector` 是存储在堆上**,因此长度可以动态改变。当你不确定是使用数组还是动态数组时,那就应该使用后者,具体见[动态数组 Vector](../collections/vector.md)。 +数组语法跟 JavaScript 很像,也跟大多数编程语言很像。由于它的元素类型大小固定,且长度也是固定,因此**数组 `array` 是存储在栈上**,性能也会非常优秀。与此对应,**动态数组 `Vector` 是存储在堆上**,因此长度可以动态改变。当你不确定是使用数组还是动态数组时,那就应该使用后者,具体见[动态数组 Vector](https://course.rs/basic/collections/vector.html)。 举个例子,在需要知道一年中各个月份名称的程序中,你很可能希望使用的是数组而不是动态数组。因为月份是固定的,它总是只包含 12 个元素: @@ -113,7 +113,7 @@ note: run with `RUST_BACKTRACE=1` environment variable to display a backtrace ## 数组切片 -在之前的[章节](./string-slice.md#切片slice),我们有讲到 `切片` 这个概念,它允许你引用集合中的部分连续片段,而不是整个集合,对于数组也是,数组切片允许我们引用数组的一部分: +在之前的[章节](https://course.rs/basic/compound-type/string-slice.html#切片slice),我们有讲到 `切片` 这个概念,它允许你引用集合中的部分连续片段,而不是整个集合,对于数组也是,数组切片允许我们引用数组的一部分: ```rust let a: [i32; 5] = [1, 2, 3, 4, 5]; @@ -166,13 +166,12 @@ fn main() { 做个总结,数组虽然很简单,但是其实还是存在几个要注意的点: -- **数组类型容易跟数组切片混淆**,[T;n]描述了一个数组的类型,而[T]描述了切片的类型, 因为切片是运行期的数据结构,它的长度无法在编译器得知,因此不能用[T;n]的形式去描述 +- **数组类型容易跟数组切片混淆**,[T;n]描述了一个数组的类型,而[T]描述了切片的类型, 因为切片是运行期的数据结构,它的长度无法在编译期得知,因此不能用[T;n]的形式去描述 - `[u8; 3]`和`[u8; 4]`是不同的类型,数组的长度也是类型的一部分 - **在实际开发中,使用最多的是数组切片[T]**,我们往往通过引用的方式去使用`&[T]`,因为后者有固定的类型大小 至此,关于数据类型部分,我们已经全部学完了,对于 Rust 学习而言,我们也迈出了坚定的第一步,后面将开始更高级特性的学习。未来如果大家有疑惑需要检索知识,一样可以继续回顾过往的章节,因为本书不仅仅是一门 Rust 的教程,还是一本厚重的 Rust 工具书。 - ## 课后练习 -> [Rust By Practice](https://zh.practice.rs/compound-types/array.html),支持代码在线编辑和运行,并提供详细的[习题解答](https://github.com/sunface/rust-by-practice)。 \ No newline at end of file +> [Rust By Practice](https://zh.practice.rs/compound-types/array.html),支持代码在线编辑和运行,并提供详细的[习题解答](https://github.com/sunface/rust-by-practice)。 diff --git a/src/basic/compound-type/enum.md b/src/basic/compound-type/enum.md index 20fc6321..8920a28b 100644 --- a/src/basic/compound-type/enum.md +++ b/src/basic/compound-type/enum.md @@ -225,7 +225,7 @@ enum Option { 其中 `T` 是泛型参数,`Some(T)`表示该枚举成员的数据类型是 `T`,换句话说,`Some` 可以包含任何类型的数据。 -`Option` 枚举是如此有用以至于它被包含在了 [`prelude`](../../appendix/prelude.md)(prelude 属于 Rust 标准库,Rust 会将最常用的类型、函数等提前引入其中,省得我们再手动引入)之中,你不需要将其显式引入作用域。另外,它的成员 `Some` 和 `None` 也是如此,无需使用 `Option::` 前缀就可直接使用 `Some` 和 `None`。总之,不能因为 `Some(T)` 和 `None` 中没有 `Option::` 的身影,就否认它们是 `Option` 下的卧龙凤雏。 +`Option` 枚举是如此有用以至于它被包含在了 [`prelude`](https://course.rs/appendix/prelude.html)(prelude 属于 Rust 标准库,Rust 会将最常用的类型、函数等提前引入其中,省得我们再手动引入)之中,你不需要将其显式引入作用域。另外,它的成员 `Some` 和 `None` 也是如此,无需使用 `Option::` 前缀就可直接使用 `Some` 和 `None`。总之,不能因为 `Some(T)` 和 `None` 中没有 `Option::` 的身影,就否认它们是 `Option` 下的卧龙凤雏。 再来看以下代码: @@ -271,7 +271,7 @@ not satisfied 总的来说,为了使用 `Option` 值,需要编写处理每个成员的代码。你想要一些代码只当拥有 `Some(T)` 值时运行,允许这些代码使用其中的 `T`。也希望一些代码在值为 `None` 时运行,这些代码并没有一个可用的 `T` 值。`match` 表达式就是这么一个处理枚举的控制流结构:它会根据枚举的成员运行不同的代码,这些代码可以使用匹配到的值中的数据。 -这里先简单看一下 `match` 的大致模样,在[模式匹配](../match-pattern/intro.md)中,我们会详细讲解: +这里先简单看一下 `match` 的大致模样,在[模式匹配](https://course.rs/basic/match-pattern/intro.html)中,我们会详细讲解: ```rust fn plus_one(x: Option) -> Option { diff --git a/src/basic/compound-type/intro.md b/src/basic/compound-type/intro.md index c65724d7..f610dd8f 100644 --- a/src/basic/compound-type/intro.md +++ b/src/basic/compound-type/intro.md @@ -2,7 +2,7 @@ 行百里者半五十,欢迎大家来到这里,虽然还不到中点,但是已经不远了。如果说之前学的基础数据类型是原子,那么本章将讲的数据类型可以认为是分子。 -本章的重点在复合类型上,顾名思义,复合类型是由其它类型组合而成的,最典型的就是结构体 `struct` 和枚举 `enum`。例如平面上的一个点 `point(x,y)`,它由两个数值类型的值 `x` 和 `y` 组合而来。我们无法单独去维护这两个数值,因为单独一个 `x` 或者 `y` 是含义不完整的,无法标识平面上的一个点,应该把它们看作一个整体去理解和处理。 +本章的重点在复合类型上,顾名思义,复合类型是由其它类型组合而成的,最典型的就是结构体 `struct` 和枚举 `enum`。例如平面上的一个点 `point(x, y)`,它由两个数值类型的值 `x` 和 `y` 组合而来。我们无法单独去维护这两个数值,因为单独一个 `x` 或者 `y` 是含义不完整的,无法标识平面上的一个点,应该把它们看作一个整体去理解和处理。 来看一段代码,它使用我们之前学过的内容来构建文件操作: diff --git a/src/basic/compound-type/string-slice.md b/src/basic/compound-type/string-slice.md index 6fcd009e..f84cd10c 100644 --- a/src/basic/compound-type/string-slice.md +++ b/src/basic/compound-type/string-slice.md @@ -1,6 +1,6 @@ # 字符串 -在其他语言,字符串往往是送分题,因为实在是太简单了,例如 `"hello, world"` 就是字符串章节的几乎全部内容了,但是如果你带着同样的想法来学 Rust,我保证,绝对会栽跟头, **因此这一章大家一定要重视,仔细阅读,这里有很多其它 Rust 书籍中没有的内容**。 +在其他语言,字符串往往是送分题,因为实在是太简单了,例如 `"hello, world"` 就是字符串章节的几乎全部内容了,但是如果你带着同样的想法来学 Rust,我保证,绝对会栽跟头,**因此这一章大家一定要重视,仔细阅读,这里有很多其它 Rust 书籍中没有的内容**。 首先来看段很简单的代码: @@ -49,7 +49,7 @@ let world = &s[6..11]; `hello` 没有引用整个 `String s`,而是引用了 `s` 的一部分内容,通过 `[0..5]` 的方式来指定。 -这就是创建切片的语法,使用方括号包括的一个序列: **[开始索引..终止索引]**,其中开始索引是切片中第一个元素的索引位置,而终止索引是最后一个元素后面的索引位置,也就是这是一个 `右半开区间`。在切片数据结构内部会保存开始的位置和切片的长度,其中长度是通过 `终止索引` - `开始索引` 的方式计算得来的。 +这就是创建切片的语法,使用方括号包括的一个序列:**[开始索引..终止索引]**,其中开始索引是切片中第一个元素的索引位置,而终止索引是最后一个元素后面的索引位置,也就是这是一个 `右半开区间`。在切片数据结构内部会保存开始的位置和切片的长度,其中长度是通过 `终止索引` - `开始索引` 的方式计算得来的。 对于 `let world = &s[6..11];` 来说,`world` 是一个切片,该切片的指针指向 `s` 的第 7 个字节(索引从 0 开始, 6 是第 7 个字节),且该切片的长度是 `5` 个字节。 @@ -95,7 +95,7 @@ let slice = &s[..]; > ``` > > 因为我们只取 `s` 字符串的前两个字节,但是本例中每个汉字占用三个字节,因此没有落在边界处,也就是连 `中` 字都取不完整,此时程序会直接崩溃退出,如果改成 `&s[0..3]`,则可以正常通过编译。 -> 因此,当你需要对字符串做切片索引操作时,需要格外小心这一点, 关于该如何操作 UTF-8 字符串,参见[这里](#操作-utf8-字符串) +> 因此,当你需要对字符串做切片索引操作时,需要格外小心这一点, 关于该如何操作 UTF-8 字符串,参见[这里](#操作-utf-8-字符串) 字符串切片的类型标识是 `&str`,因此我们可以这样声明一个函数,输入 `String` 类型,返回它的切片: `fn first_word(s: &String) -> &str `。 @@ -178,69 +178,6 @@ Rust 在语言级别,只有一种字符串类型: `str`,它通常是以引 除了 `String` 类型的字符串,Rust 的标准库还提供了其他类型的字符串,例如 `OsString`, `OsStr`, `CsString` 和` CsStr` 等,注意到这些名字都以 `String` 或者 `Str` 结尾了吗?它们分别对应的是具有所有权和被借用的变量。 -#### 操作字符串 - -由于 `String` 是可变字符串,因此我们可以对它进行创建、增删操作,下面的代码汇总了相关的操作方式: - -```rust -fn main() { - // 创建一个空String - let mut s = String::new(); - // 将&str类型的"hello,world"添加到s中 - s.push_str("hello,world"); - // 将字符'!'推入s中 - s.push('!'); - // 最后s的内容是"hello,world!" - assert_eq!(s,"hello,world!"); - - // 从现有的&str切片创建String类型 - let mut s = "hello,world".to_string(); - // 将字符'!'推入s中 - s.push('!'); - // 最后s的内容是"hello,world!" - assert_eq!(s,"hello,world!"); - - // 从现有的&str切片创建String类型 - // String与&str都是UTF-8编码,因此支持中文 - let mut s = String::from("你好,世界"); - // 将字符'!'推入s中 - s.push('!'); - // 最后s的内容是"你好,世界!" - assert_eq!(s,"你好,世界!"); - - let s1 = String::from("hello,"); - let s2 = String::from("world!"); - // 在下句中,s1的所有权被转移走了,因此后面不能再使用s1 - let s3 = s1 + &s2; - assert_eq!(s3,"hello,world!"); - // 下面的语句如果去掉注释,就会报错 - // println!("{}",s1); -} -``` - -在上面代码中,有一处需要解释的地方,就是使用 `+` 来对字符串进行相加操作, 这里之所以使用 `s1 + &s2` 的形式,是因为 `+` 使用了 `add` 方法,该方法的定义类似: - -```rust -fn add(self, s: &str) -> String { -``` - -因为该方法涉及到更复杂的特征功能,因此我们这里简单说明下, `self` 是 `String` 类型的字符串 `s1`,该函数说明,只能将 `&str` 类型的字符串切片添加到 `String` 类型的 `s1` 上,然后返回一个新的 `String` 类型,所以 `let s3 = s1 + &s2;` 就很好解释了,将 `String` 类型的 `s1` 与 `&str` 类型的 `s2` 进行相加,最终得到 `String` 类型的 `s3`。 - -由此可推,以下代码也是合法的: - -```rust -let s1 = String::from("tic"); -let s2 = String::from("tac"); -let s3 = String::from("toe"); - -// String = String + &str + &str + &str + &str -let s = s1 + "-" + &s2 + "-" + &s3; -``` - -`String + &str`返回一个 `String`,然后再继续跟一个 `&str` 进行 `+` 操作,返回一个 `String` 类型,不断循环,最终生成一个 `s`,也是 `String` 类型。 - -在上面代码中,我们做了一个有些难以理解的 `&String` 操作,下面来展开讲讲。 - ## String 与 &str 的转换 在之前的代码中,已经见到好几种从 `&str` 类型生成 `String` 类型的操作: @@ -285,7 +222,7 @@ fn say_hello(s: &str) { #### 深入字符串内部 -字符串的底层的数据存储格式实际上是[ `u8` ],一个字节数组。对于 `let hello = String::from("Hola");` 这行代码来说, `hello` 的长度是 `4` 个字节,因为 `"hola"` 中的每个字母在 UTF-8 编码中仅占用 1 个字节,但是对于下面的代码呢? +字符串的底层的数据存储格式实际上是[ `u8` ],一个字节数组。对于 `let hello = String::from("Hola");` 这行代码来说,`hello` 的长度是 `4` 个字节,因为 `"hola"` 中的每个字母在 UTF-8 编码中仅占用 1 个字节,但是对于下面的代码呢? ```rust let hello = String::from("中国人"); @@ -339,7 +276,355 @@ note: run with `RUST_BACKTRACE=1` environment variable to display a backtrace 因此在通过索引区间来访问字符串时,**需要格外的小心**,一不注意,就会导致你程序的崩溃! -## 操作 UTF8 字符串 +## 操作字符串 + +由于 `String` 是可变字符串,下面介绍 Rust 字符串的修改,添加,删除等常用方法: + +#### 追加 (Push) + +在字符串尾部可以使用 `push()` 方法追加字符 `char`,也可以使用 `push_str()` 方法追加字符串字面量。这两个方法都是**在原有的字符串上追加,并不会返回新的字符串**。由于字符串追加操作要修改原来的字符串,则该字符串必须是可变的,即**字符串变量必须由 `mut` 关键字修饰**。 + +示例代码如下: + +```rust +fn main() { + let mut s = String::from("Hello "); + s.push('r'); + println!("追加字符 push() -> {}", s); + + s.push_str("ust!"); + println!("追加字符串 push_str() -> {}", s); +} +``` + +代码运行结果: + +```console +追加字符 push() -> Hello r +追加字符串 push_str() -> Hello rust! +``` + +#### 插入 (Insert) + +可以使用 `insert()` 方法插入单个字符 `char`,也可以使用 `insert_str()` 方法插入字符串字面量,与 `push()` 方法不同,这俩方法需要传入两个参数,第一个参数是字符(串)插入插入位置的索引,第二个参数是要插入的字符(串),索引从 0 开始计数,如果越界则会发生错误。由于字符串插入操作要**修改原来的字符串**,则该字符串必须是可变的,即**字符串变量必须由 `mut` 关键字修饰**。 + +示例代码如下: + +```rust +fn main() { + let mut s = String::from("Hello rust!"); + s.insert(5, ','); + println!("插入字符 insert() -> {}", s); + s.insert_str(6, " I like"); + println!("插入字符串 insert_str() -> {}", s); +} +``` + +代码运行结果: + +```console +插入字符 insert() -> Hello, rust! +插入字符串 insert_str() -> Hello, I like rust! +``` + +#### 替换 (Replace) + +如果想要把字符串中的某个字符串替换成其它的字符串,那可以使用 `replace()` 方法。与替换有关的方法有三个。 + +1、`replace` + +该方法可适用于 `String` 和 `&str` 类型。`replace()` 方法接收两个参数,第一个参数是要被替换的字符串,第二个参数是新的字符串。该方法会替换所有匹配到的字符串。**该方法是返回一个新的字符串,而不是操作原来的字符串**。 + +示例代码如下: + +```rust +fn main() { + let string_replace = String::from("I like rust. Learning rust is my favorite!"); + let new_string_replace = string_replace.replace("rust", "RUST"); + dbg!(new_string_replace); +} +``` + +代码运行结果: + +```console +new_string_replace = "I like RUST. Learning RUST is my favorite!" +``` + +2、`replacen` + +该方法可适用于 `String` 和 `&str` 类型。`replacen()` 方法接收三个参数,前两个参数与 `replace()` 方法一样,第三个参数则表示替换的个数。**该方法是返回一个新的字符串,而不是操作原来的字符串**。 + +示例代码如下: + +```rust +fn main() { + let string_replace = "I like rust. Learning rust is my favorite!"; + let new_string_replacen = string_replace.replacen("rust", "RUST", 1); + dbg!(new_string_replacen); +} +``` + +代码运行结果: + +```console +new_string_replacen = "I like RUST. Learning rust is my favorite!" +``` + +3、`replace_range` + +该方法仅适用于 `String` 类型。`replace_range` 接收两个参数,第一个参数是要替换字符串的范围(Range),第二个参数是新的字符串。**该方法是直接操作原来的字符串,不会返回新的字符串。该方法需要使用 `mut` 关键字修饰**。 + +示例代码如下: + +```rust +fn main() { + let mut string_replace_range = String::from("I like rust!"); + string_replace_range.replace_range(7..8, "R"); + dbg!(string_replace_range); +} +``` + +代码运行结果: + +```console +string_replace_range = "I like Rust!" +``` + +#### 删除 (Delete) + +与字符串删除相关的方法有 4 个,他们分别是 `pop()`,`remove()`,`truncate()`,`clear()`。这四个方法仅适用于 `String` 类型。 + +1、 `pop` —— 删除并返回字符串的最后一个字符 + +**该方法是直接操作原来的字符串**。但是存在返回值,其返回值是一个 `Option` 类型,如果字符串为空,则返回 `None`。 +示例代码如下: + +```rust +fn main() { + let mut string_pop = String::from("rust pop 中文!"); + let p1 = string_pop.pop(); + let p2 = string_pop.pop(); + dbg!(p1); + dbg!(p2); + dbg!(string_pop); +} +``` + +代码运行结果: + +```console +p1 = Some( + '!', +) +p2 = Some( + '文', +) +string_pop = "rust pop 中" +``` + +2、 `remove` —— 删除并返回字符串中指定位置的字符 + +**该方法是直接操作原来的字符串**。但是存在返回值,其返回值是删除位置的字符串,只接收一个参数,表示该字符起始索引位置。`remove()` 方法是按照字节来处理字符串的,如果参数所给的位置不是合法的字符边界,则会发生错误。 + +示例代码如下: + +```rust +fn main() { + let mut string_remove = String::from("测试remove方法"); + println!( + "string_remove 占 {} 个字节", + std::mem::size_of_val(string_remove.as_str()) + ); + // 删除第一个汉字 + string_remove.remove(0); + // 下面代码会发生错误 + // string_remove.remove(1); + // 直接删除第二个汉字 + // string_remove.remove(3); + dbg!(string_remove); +} +``` + +代码运行结果: + +```console +string_remove 占 18 个字节 +string_remove = "试remove方法" +``` + +3、`truncate` —— 删除字符串中从指定位置开始到结尾的全部字符 + +**该方法是直接操作原来的字符串**。无返回值。该方法 `truncate()` 方法是按照字节来处理字符串的,如果参数所给的位置不是合法的字符边界,则会发生错误。 + +示例代码如下: + +```rust +fn main() { + let mut string_truncate = String::from("测试truncate"); + string_truncate.truncate(3); + dbg!(string_truncate); +} +``` + +代码运行结果: + +```console +string_truncate = "测" +``` + +4、`clear` —— 清空字符串 + +**该方法是直接操作原来的字符串**。调用后,删除字符串中的所有字符,相当于 `truncate()` 方法参数为 0 的时候。 + +示例代码如下: + +```rust +fn main() { + let mut string_clear = String::from("string clear"); + string_clear.clear(); + dbg!(string_clear); +} +``` + +代码运行结果: + +```console +string_clear = "" +``` + +#### 连接 (Catenate) + +1、使用 `+` 或者 `+=` 连接字符串 + +使用 `+` 或者 `+=` 连接字符串,要求右边的参数必须为字符串的切片引用(Slice)类型。其实当调用 `+` 的操作符时,相当于调用了 `std::string` 标准库中的 [`add()`](https://doc.rust-lang.org/std/string/struct.String.html#method.add) 方法,这里 `add()` 方法的第二个参数是一个引用的类型。因此我们在使用 `+`, 必须传递切片引用类型。不能直接传递 `String` 类型。**`+` 和 `+=` 都是返回一个新的字符串。所以变量声明可以不需要 `mut` 关键字修饰**。 + +示例代码如下: + +```rust +fn main() { + let string_append = String::from("hello "); + let string_rust = String::from("rust"); + // &string_rust会自动解引用为&str + let result = string_append + &string_rust; + let mut result = result + "!"; + result += "!!!"; + + println!("连接字符串 + -> {}", result); +} +``` + +代码运行结果: + +```console +连接字符串 + -> hello rust!!!! +``` + +`add()` 方法的定义: + +```rust +fn add(self, s: &str) -> String +``` + +因为该方法涉及到更复杂的特征功能,因此我们这里简单说明下: + +```rust +fn main() { + let s1 = String::from("hello,"); + let s2 = String::from("world!"); + // 在下句中,s1的所有权被转移走了,因此后面不能再使用s1 + let s3 = s1 + &s2; + assert_eq!(s3,"hello,world!"); + // 下面的语句如果去掉注释,就会报错 + // println!("{}",s1); +} +``` + +`self` 是 `String` 类型的字符串 `s1`,该函数说明,只能将 `&str` 类型的字符串切片添加到 `String` 类型的 `s1` 上,然后返回一个新的 `String` 类型,所以 `let s3 = s1 + &s2;` 就很好解释了,将 `String` 类型的 `s1` 与 `&str` 类型的 `s2` 进行相加,最终得到 `String` 类型的 `s3`。 + +由此可推,以下代码也是合法的: + +```rust +let s1 = String::from("tic"); +let s2 = String::from("tac"); +let s3 = String::from("toe"); + +// String = String + &str + &str + &str + &str +let s = s1 + "-" + &s2 + "-" + &s3; +``` + +`String + &str`返回一个 `String`,然后再继续跟一个 `&str` 进行 `+` 操作,返回一个 `String` 类型,不断循环,最终生成一个 `s`,也是 `String` 类型。 + +`s1` 这个变量通过调用 `add()` 方法后,所有权被转移到 `add()` 方法里面, `add()` 方法调用后就被释放了,同时 `s1` 也被释放了。再使用 `s1` 就会发生错误。这里涉及到[所有权转移(Move)](https://course.rs/basic/ownership/ownership.html#转移所有权)的相关知识。 + +2、使用 `format!` 连接字符串 + +`format!` 这种方式适用于 `String` 和 `&str` 。`format!` 的用法与 `print!` 的用法类似,详见[格式化输出](https://course.rs/basic/formatted-output.html#printprintlnformat)。 + +示例代码如下: + +```rust +fn main() { + let s1 = "hello"; + let s2 = String::from("rust"); + let s = format!("{} {}!", s1, s2); + println!("{}", s); +} + +``` + +代码运行结果: + +```console +hello rust! +``` + +## 字符串转义 + +我们可以通过转义的方式 `\` 输出 ASCII 和 Unicode 字符。 + +```rust +fn main() { + // 通过 \ + 字符的十六进制表示,转义输出一个字符 + let byte_escape = "I'm writing \x52\x75\x73\x74!"; + println!("What are you doing\x3F (\\x3F means ?) {}", byte_escape); + + // \u 可以输出一个 unicode 字符 + let unicode_codepoint = "\u{211D}"; + let character_name = "\"DOUBLE-STRUCK CAPITAL R\""; + + println!( + "Unicode character {} (U+211D) is called {}", + unicode_codepoint, character_name + ); + + // 换行了也会保持之前的字符串格式 + let long_string = "String literals + can span multiple lines. + The linebreak and indentation here ->\ + <- can be escaped too!"; + println!("{}", long_string); +} +``` + +当然,在某些情况下,可能你会希望保持字符串的原样,不要转义: +```rust +fn main() { + println!("{}", "hello \\x52\\x75\\x73\\x74"); + let raw_str = r"Escapes don't work here: \x3F \u{211D}"; + println!("{}", raw_str); + + // 如果字符串包含双引号,可以在开头和结尾加 # + let quotes = r#"And then I said: "There is no escape!""#; + println!("{}", quotes); + + // 如果还是有歧义,可以继续增加,没有限制 + let longer_delimiter = r###"A string with "# in it. And even "##!"###; + println!("{}", longer_delimiter); +} +``` + +## 操作 UTF-8 字符串 前文提到了几种使用 UTF-8 字符串的方式,下面来一一说明。 @@ -424,10 +709,14 @@ for b in "中国人".bytes() { 这个模式对编写 Rust 代码的方式有着深远的影响,在后面章节我们会进行更深入的介绍。 - ## 课后练习 -> Rust By Practice,支持代码在线编辑和运行,并提供详细的[习题解答](https://github.com/sunface/rust-by-practice)。 -> - [字符串](https://zh.practice.rs/compound-types/string.html) -> - [切片](https://zh.practice.rs/compound-types/slice.html) -> - [String](https://zh.practice.rs/collections/String.html) \ No newline at end of file +- [字符串](https://zh.practice.rs/compound-types/string.html) +- [切片](https://zh.practice.rs/compound-types/slice.html) +- [String](https://zh.practice.rs/collections/String.html) + +
+ +## 引用资料 + +1. https://blog.csdn.net/a1595901624/article/details/119294443 diff --git a/src/basic/compound-type/struct.md b/src/basic/compound-type/struct.md index 7811c687..76271cce 100644 --- a/src/basic/compound-type/struct.md +++ b/src/basic/compound-type/struct.md @@ -2,7 +2,7 @@ 上一节中提到需要一个更高级的数据结构来帮助我们更好的抽象问题,结构体 `struct` 恰恰就是这样的复合数据结构,它是由其它数据类型组合而来。 其它语言也有类似的数据结构,不过可能有不同的名称,例如 `object`、 `record` 等。 -结构体跟之前讲过的[元组](./tuple.md)有些相像:都是由多种类型组合而成。但是与元组不同的是,结构体可以为内部的每个字段起一个富有含义的名称。因此结构体更加灵活更加强大,你无需依赖这些字段的顺序来访问和解析它们。 +结构体跟之前讲过的[元组](https://course.rs/basic/compound-type/tuple.html)有些相像:都是由多种类型组合而成。但是与元组不同的是,结构体可以为内部的每个字段起一个富有含义的名称。因此结构体更加灵活更加强大,你无需依赖这些字段的顺序来访问和解析它们。 ## 结构体语法 @@ -124,7 +124,7 @@ fn build_user(email: String, username: String) -> User { > > 聪明的读者肯定要发问了:明明有三个字段进行了自动赋值,为何只有 `username` 发生了所有权转移? > -> 仔细回想一下[所有权](../ownership/ownership.md#拷贝浅拷贝)那一节的内容,我们提到了 `Copy` 特征:实现了 `Copy` 特征的类型无需所有权转移,可以直接在赋值时进行 +> 仔细回想一下[所有权](https://course.rs/basic/ownership/ownership.html#拷贝浅拷贝)那一节的内容,我们提到了 `Copy` 特征:实现了 `Copy` 特征的类型无需所有权转移,可以直接在赋值时进行 > 数据拷贝,其中 `bool` 和 `u64` 类型就实现了 `Copy` 特征,因此 `active` 和 `sign_in_count` 字段在赋值给 `user2` 时,仅仅发生了拷贝,而不是所有权转移。 > > 值得注意的是:`username` 所有权被转移给了 `user2`,导致了 `user1` 无法再被使用,但是并不代表 `user1` 内部的其它字段不能被继续使用,例如: @@ -204,7 +204,7 @@ println!("{:?}", user1); ## 单元结构体(Unit-like Struct) -还记得之前讲过的基本没啥用的[单元类型](../base-type/char-bool.md#单元类型)吧?单元结构体就跟它很像,没有任何字段和属性,但是好在,它还挺有用。 +还记得之前讲过的基本没啥用的[单元类型](https://course.rs/basic/base-type/char-bool.html#单元类型)吧?单元结构体就跟它很像,没有任何字段和属性,但是好在,它还挺有用。 如果你定义一个类型,但是不关心该类型的内容, 只关心它的行为时,就可以使用 `单元结构体`: @@ -223,7 +223,7 @@ impl SomeTrait for AlwaysEqual { 在之前的 `User` 结构体的定义中,有一处细节:我们使用了自身拥有所有权的 `String` 类型而不是基于引用的 `&str` 字符串切片类型。这是一个有意而为之的选择:因为我们想要这个结构体拥有它所有的数据,而不是从其它地方借用数据。 -你也可以让 `User` 结构体从其它对象借用数据,不过这么做,就需要引入[生命周期(lifetimes)](../../advance/lifetime/basic.md)这个新概念(也是一个复杂的概念),简而言之,生命周期能确保结构体的作用范围要比它所借用的数据的作用范围要小。 +你也可以让 `User` 结构体从其它对象借用数据,不过这么做,就需要引入[生命周期(lifetimes)](https://course.rs/advance/lifetime/basic.html)这个新概念(也是一个复杂的概念),简而言之,生命周期能确保结构体的作用范围要比它所借用的数据的作用范围要小。 总之,如果你想在结构体中使用一个引用,就必须加上生命周期,否则就会报错: @@ -274,11 +274,11 @@ help: consider introducing a named lifetime parameter | ``` -未来在[生命周期](../../advance/lifetime/basic.md)中会讲到如何修复这个问题以便在结构体中存储引用,不过在那之前,我们会避免在结构体中使用引用类型。 +未来在[生命周期](https://course.rs/advance/lifetime/basic.html)中会讲到如何修复这个问题以便在结构体中存储引用,不过在那之前,我们会避免在结构体中使用引用类型。 ## 使用 `#[derive(Debug)]` 来打印结构体的信息 -在前面的代码中我们使用 `#[derive(Debug)]` 对结构体进行了标记,这样才能使用 `println("{:?}", s)` 的方式对其进行打印输出,如果不加,看看会发生什么: +在前面的代码中我们使用 `#[derive(Debug)]` 对结构体进行了标记,这样才能使用 `println!("{:?}", s);` 的方式对其进行打印输出,如果不加,看看会发生什么: ```rust struct Rectangle { @@ -424,8 +424,7 @@ $ cargo run 可以看到,我们想要的 debug 信息几乎都有了:代码所在的文件名、行号、表达式以及表达式的值,简直完美! - - ## 课后练习 -> [Rust By Practice](https://zh.practice.rs/compound-types/struct.html),支持代码在线编辑和运行,并提供详细的[习题解答](https://github.com/sunface/rust-by-practice)。 \ No newline at end of file +> [Rust By Practice](https://zh.practice.rs/compound-types/struct.html),支持代码在线编辑和运行,并提供详细的[习题解答](https://github.com/sunface/rust-by-practice)。 + diff --git a/src/basic/converse.md b/src/basic/converse.md index cc56abc5..d642943f 100644 --- a/src/basic/converse.md +++ b/src/basic/converse.md @@ -80,9 +80,9 @@ fn main() { } ``` -上面代码中引入了 `std::convert::TryInto` 特征,但是却没有使用它,可能有些同学会为此困惑,主要原因在于**如果你要使用一个特征的方法,那么你需要引入该特征到当前的作用域中**,我们在上面用到了 `try_into` 方法,因此需要引入对应的特征。但是 Rust 又提供了一个非常便利的办法,把最常用的标准库中的特征通过[`std::prelude`](std::convert::TryInto)模块提前引入到当前作用域中,其中包括了 `std::convert::TryInto`,你可以尝试删除第一行的代码 `use ...`,看看是否会报错。 +上面代码中引入了 `std::convert::TryInto` 特征,但是却没有使用它,可能有些同学会为此困惑,主要原因在于**如果你要使用一个特征的方法,那么你需要引入该特征到当前的作用域中**,我们在上面用到了 `try_into` 方法,因此需要引入对应的特征。但是 Rust 又提供了一个非常便利的办法,把最常用的标准库中的特征通过[`std::prelude`](https://course.rs/appendix/prelude.html)模块提前引入到当前作用域中,其中包括了 `std::convert::TryInto`,你可以尝试删除第一行的代码 `use ...`,看看是否会报错。 -`try_into` 会尝试进行一次转换,并返回一个 `Result`,此时就可以对其进行相应的错误处理。由于我们的例子只是为了快速测试,因此使用了 `unwrap` 方法,该方法在发现错误时,会直接调用 `panic` 导致程序的崩溃退出,在实际项目中,请不要这么使用,具体见[panic](./exception-error.md#panic)部分。 +`try_into` 会尝试进行一次转换,并返回一个 `Result`,此时就可以对其进行相应的错误处理。由于我们的例子只是为了快速测试,因此使用了 `unwrap` 方法,该方法在发现错误时,会直接调用 `panic` 导致程序的崩溃退出,在实际项目中,请不要这么使用,具体见[panic](https://course.rs/basic/result-error/panic.html#调用-panic)部分。 最主要的是 `try_into` 转换会捕获大类型向小类型转换时导致的溢出错误: @@ -275,11 +275,46 @@ impl Clone for Container { - 这种转换永远都是未定义的 - 不,你不能这么做 - 不要多想,你没有那种幸运 -4. 变形为一个未指定生命周期的引用会导致[无界生命周期](../advance/lifetime/advance.md) +4. 变形为一个未指定生命周期的引用会导致[无界生命周期](https://course.rs/advance/lifetime/advance.html) 5. 在复合类型之间互相变换时,你需要保证它们的排列布局是一模一样的!一旦不一样,那么字段就会得到不可预期的值,这也是未定义的行为,至于你会不会因此愤怒, **WHO CARES** ,你都用了变形了,老兄! 对于第 5 条,你该如何知道内存的排列布局是一样的呢?对于 `repr(C)` 类型和 `repr(transparent)` 类型来说,它们的布局是有着精确定义的。但是对于你自己的"普通却自信"的 Rust 类型 `repr(Rust)` 来说,它可不是有着精确定义的。甚至同一个泛型类型的不同实例都可以有不同的内存布局。 `Vec` 和 `Vec` 它们的字段可能有着相同的顺序,也可能没有。对于数据排列布局来说,**什么能保证,什么不能保证**目前还在 Rust 开发组的[工作任务](https://rust-lang.github.io/unsafe-code-guidelines/layout.html)中呢。 你以为你之前凝视的是深渊吗?不,你凝视的只是深渊的大门。 `mem::transmute_copy` 才是真正的深渊,它比之前的还要更加危险和不安全。它从 `T` 类型中拷贝出 `U` 类型所需的字节数,然后转换成 `U`。 `mem::transmute` 尚有大小检查,能保证两个数据的内存大小一致,现在这哥们干脆连这个也丢了,只不过 `U` 的尺寸若是比 `T` 大,会是一个未定义行为。 -当然,你也可以通过原生指针转换和 `unions` (todo!)获得所有的这些功能,但是你将无法获得任何编译提示或者检查。原生指针转换和 `unions` 也不是魔法,无法逃避上面说的规则。 +当然,你也可以通过裸指针转换和 `unions` (todo!)获得所有的这些功能,但是你将无法获得任何编译提示或者检查。裸指针转换和 `unions` 也不是魔法,无法逃避上面说的规则。 + +`transmute` 虽然危险,但作为一本工具书,知识当然要全面,下面列举两个有用的 `transmute` 应用场景 :)。 + +- 将裸指针变成函数指针: + +```rust +fn foo() -> i32 { + 0 +} + +let pointer = foo as *const (); +let function = unsafe { + // 将裸指针转换为函数指针 + std::mem::transmute::<*const (), fn() -> i32>(pointer) +}; +assert_eq!(function(), 0); +``` + +- 延长生命周期,或者缩短一个静态生命周期寿命: + +```rust +struct R<'a>(&'a i32); + +// 将 'b 生命周期延长至 'static 生命周期 +unsafe fn extend_lifetime<'b>(r: R<'b>) -> R<'static> { + std::mem::transmute::, R<'static>>(r) +} + +// 将 'static 生命周期缩短至 'c 生命周期 +unsafe fn shorten_invariant_lifetime<'b, 'c>(r: &'b mut R<'static>) -> &'b mut R<'c> { + std::mem::transmute::<&'b mut R<'static>, &'b mut R<'c>>(r) +} +``` + +以上例子非常先进!但是是非常不安全的 Rust 行为! diff --git a/src/basic/crate-module/crate.md b/src/basic/crate-module/crate.md index 3f3815ce..8b1239f6 100644 --- a/src/basic/crate-module/crate.md +++ b/src/basic/crate-module/crate.md @@ -105,6 +105,6 @@ error: a bin target must be available for `cargo run` - 基准性能测试 `benchmark` 文件:`benches` 目录下 - 项目示例:`examples` 目录下 -这种目录结构基本上是 Rust 的标准目录结构,在 `github` 的大多数项目上,你都将看到它的身影。 +这种目录结构基本上是 Rust 的标准目录结构,在 `GitHub` 的大多数项目上,你都将看到它的身影。 理解了包的概念,我们再来看看构成包的基本单元:模块。 diff --git a/src/basic/crate-module/module.md b/src/basic/crate-module/module.md index c39e5c7d..eba9d122 100644 --- a/src/basic/crate-module/module.md +++ b/src/basic/crate-module/module.md @@ -38,7 +38,7 @@ mod front_of_house { ## 模块树 -在[上一节](./crate.md)中,我们提到过 `src/main.rs` 和 `src/lib.rs` 被称为包根(crate root),这个奇葩名称的来源(我不想承认是自己翻译水平太烂-,-)是由于这两个文件的内容形成了一个模块 `crate`,该模块位于包的树形结构(由模块组成的树形结构)的根部: +在[上一节](https://course.rs/basic/crate-module/crate.html)中,我们提到过 `src/main.rs` 和 `src/lib.rs` 被称为包根(crate root),这个奇葩名称的来源(我不想承认是自己翻译水平太烂-,-)是由于这两个文件的内容形成了一个模块 `crate`,该模块位于包的树形结构(由模块组成的树形结构)的根部: ```console crate @@ -261,7 +261,7 @@ mod back_of_house { ## 使用 `self` 引用模块 -`self` 其实就是引用自身模块中的项,也就是说和我们之前章节的代码类似,都调用同一模块中的内容,区别在于之间章节中直接通过名称调用即可,而 `self`,你得多此一举: +`self` 其实就是引用自身模块中的项,也就是说和我们之前章节的代码类似,都调用同一模块中的内容,区别在于之前章节中直接通过名称调用即可,而 `self`,你得多此一举: ```rust fn serve_order() { diff --git a/src/basic/crate-module/use.md b/src/basic/crate-module/use.md index 8430fdfd..c1aeb391 100644 --- a/src/basic/crate-module/use.md +++ b/src/basic/crate-module/use.md @@ -6,7 +6,7 @@ ## 基本引入方式 -在 Rust 中,引入模块中的项有两种方式:[绝对路径和相对路径](./module.md#用路径引用模块),这两者在前面章节都有讲过,就不再赘述,先来看看使用绝对路径的引入方式。 +在 Rust 中,引入模块中的项有两种方式:[绝对路径和相对路径](https://course.rs/basic/crate-module/module.html#用路径引用模块),这两者在前面章节都有讲过,就不再赘述,先来看看使用绝对路径的引入方式。 #### 绝对路径引入模块 @@ -143,7 +143,7 @@ pub fn eat_at_restaurant() { ## 使用第三方包 -之前我们一直在引入标准库模块或者自定义模块,现在来引入下第三方包中的模块,关于如何引入外部依赖,我们在 [Cargo 入门](../../first-try/cargo.md#package配置段落)中就有讲,这里直接给出操作步骤: +之前我们一直在引入标准库模块或者自定义模块,现在来引入下第三方包中的模块,关于如何引入外部依赖,我们在 [Cargo 入门](https://course.rs/first-try/cargo.html#package-配置段落)中就有讲,这里直接给出操作步骤: 1. 修改 `Cargo.toml` 文件,在 `[dependencies]` 区域添加一行:`rand = "0.8.3"` 2. 此时,如果你用的是 `VSCode` 和 `rust-analyzer` 插件,该插件会自动拉取该库,你可能需要等它完成后,再进行下一步(VSCode 左下角有提示) @@ -234,7 +234,7 @@ fn main() { ## 受限的可见性 -在上一节中,我们学习了[可见性](./module.md#代码可见性)这个概念,这也是模块体系中最为核心的概念,控制了模块中哪些内容可以被外部看见,但是在实际使用时,光被外面看到还不行,我们还想控制哪些人能看,这就是 Rust 提供的受限可见性。 +在上一节中,我们学习了[可见性](https://course.rs/basic/crate-module/module.html#代码可见性)这个概念,这也是模块体系中最为核心的概念,控制了模块中哪些内容可以被外部看见,但是在实际使用时,光被外面看到还不行,我们还想控制哪些人能看,这就是 Rust 提供的受限可见性。 例如,在 Rust 中,包是一个模块树,我们可以通过 `pub(crate) item;` 这种方式来实现:`item` 虽然是对外可见的,但是只在当前包内可见,外部包无法引用到该 `item`。 diff --git a/src/basic/flow-control.md b/src/basic/flow-control.md index 3890a120..d17544bc 100644 --- a/src/basic/flow-control.md +++ b/src/basic/flow-control.md @@ -6,7 +6,7 @@ ## 使用 if 来做分支控制 -> if else 无处不在 - 鲁迅 +> if else 无处不在 -- 鲁迅 但凡你能找到一门编程语言没有 `if else`,那么一定更要反馈给鲁迅,反正不是我说的:) 总之,只要你拥有其它语言的编程经验,就一定会有以下认知:`if else` **表达式**根据条件执行不同的代码分支: @@ -38,7 +38,7 @@ fn main() { 以上代码有以下几点要注意: - **`if` 语句块是表达式**,这里我们使用 `if` 表达式的返回值来给 `number` 进行赋值:`number` 的值是 `5` -- 用 `if` 来赋值时,要保证每个分支返回的类型一样(事实上,这种说法不完全准确,见[这里](../appendix/expressions.md#if表达式)),此处返回的 `5` 和 `6` 就是同一个类型,如果返回类型不一致就会报错 +- 用 `if` 来赋值时,要保证每个分支返回的类型一样(事实上,这种说法不完全准确,见[这里](https://course.rs/appendix/expressions.html#if表达式)),此处返回的 `5` 和 `6` 就是同一个类型,如果返回类型不一致就会报错 ```console error[E0308]: if and else have incompatible types @@ -56,7 +56,7 @@ error[E0308]: if and else have incompatible types found type `&str` ``` -#### 使用 else if 来处理多重条件 +## 使用 else if 来处理多重条件 可以将 `else if` 与 `if`、`else` 组合在一起实现更复杂的条件分支判断: @@ -82,20 +82,20 @@ fn main() { 如果代码中有大量的 `else if ` 会让代码变得极其丑陋,不过不用担心,下一章的 `match` 专门用以解决多分支模式匹配的问题。 -## 循环控制 +# 循环控制 循环无处不在,上到数钱,下到数年,你能想象的很多场景都存在循环,因此它也是流程控制中最重要的组成部分之一。 在 Rust 语言中有三种循环方式:`for`、`while` 和 `loop`,其中 `for` 循环是 Rust 循环王冠上的明珠。 -#### for 循环 +## for 循环 `for` 循环是 Rust 的大杀器: ```rust fn main() { for i in 1..=5 { - println!("{}",i); + println!("{}", i); } } ``` @@ -140,10 +140,10 @@ for item in &mut collection { ```rust fn main() { - let a = [4,3,2,1]; + let a = [4, 3, 2, 1]; // `.iter()` 方法把 `a` 数组变成一个迭代器 - for (i,v) in a.iter().enumerate() { - println!("第{}个元素是{}",i+1,v); + for (i, v) in a.iter().enumerate() { + println!("第{}个元素是{}", i + 1, v); } } ``` @@ -183,7 +183,7 @@ for item in collection { 由于 `for` 循环无需任何条件限制,也不需要通过索引来访问,因此是最安全也是最常用的,通过与下面的 `while` 的对比,我们能看到为什么 `for` 会更加安全。 -#### `continue` +## `continue` 使用 `continue` 可以跳过当前当次的循环,开始下次的循环: @@ -192,7 +192,7 @@ for item in collection { if i == 2 { continue; } - println!("{}",i); + println!("{}", i); } ``` @@ -203,7 +203,7 @@ for item in collection { 3 ``` -#### `break` +## `break` 使用 `break` 可以直接跳出当前整个循环: @@ -212,17 +212,17 @@ for item in collection { if i == 2 { break; } - println!("{}",i); + println!("{}", i); } ``` -上面代码对 1 到 3 的序列进行迭代,在遇到值为 2 时的跳出整个循环,后面的循环不在执行,输出如下: +上面代码对 1 到 3 的序列进行迭代,在遇到值为 2 时的跳出整个循环,后面的循环不再执行,输出如下: ```console 1 ``` -#### while 循环 +## while 循环 如果你需要一个条件来循环,当该条件为 `true` 时,继续循环,条件为 `false`,跳出循环,那么 `while` 就非常适用: @@ -262,7 +262,7 @@ fn main() { if n > 5 { break } - println!("{}",n); + println!("{}", n); n+=1; } @@ -317,7 +317,7 @@ fn main() { 可以看出,`for` 并不会使用索引去访问数组,因此更安全也更简洁,同时避免 `运行时的边界检查`,性能更高。 -#### loop 循环 +## loop 循环 对于循环而言,`loop` 循环毋庸置疑,是适用面最高的,它可以适用于所有循环场景(虽然能用,但是在很多场景下, `for` 和 `while` 才是最优选择),因为 `loop` 就是一个简单的无限循环,你可以在内部实现逻辑通过 `break` 关键字来控制循环何时结束。 @@ -368,8 +368,6 @@ fn main() { - **break 可以单独使用,也可以带一个返回值**,有些类似 `return` - **loop 是一个表达式**,因此可以返回一个值 - ## 课后练习 > [Rust By Practice](https://zh.practice.rs/flow-control.html),支持代码在线编辑和运行,并提供详细的[习题解答](https://github.com/sunface/rust-by-practice)。 - diff --git a/src/basic/formatted-output.md b/src/basic/formatted-output.md index 047e34de..9270deae 100644 --- a/src/basic/formatted-output.md +++ b/src/basic/formatted-output.md @@ -86,7 +86,7 @@ fn main() { } ``` -对于数值、字符串、数组,可以直接使用 `{:?}` 进行输出,但是对于结构体,需要[派生`Debug`](../appendix/derive.md)特征后,才能进行输出,总之很简单。 +对于数值、字符串、数组,可以直接使用 `{:?}` 进行输出,但是对于结构体,需要[派生`Debug`](https://course.rs/appendix/derive.html)特征后,才能进行输出,总之很简单。 #### `Display` 特征 @@ -168,7 +168,7 @@ fn main() { #### 为外部类型实现 `Display` 特征 -在 Rust 中,无法直接为外部类型实现外部特征,但是可以使用[`newtype`](./custom-type.md#newtype)解决此问题: +在 Rust 中,无法直接为外部类型实现外部特征,但是可以使用[`newtype`](https://course.rs/advance/into-types/custom-type.html#newtype)解决此问题: ```rust struct Array(Vec); @@ -193,7 +193,7 @@ fn main() { 至此,关于 `{}` 与 `{:?}` 的内容已介绍完毕,下面让我们正式开始格式化输出的旅程。 -## 指定位置参数 +## 位置参数 除了按照依次顺序使用值去替换占位符之外,还能让指定位置的参数去替换某个占位符,例如 `{1}`,表示用第二个参数替换该占位符(索引从 0 开始): @@ -207,7 +207,7 @@ fn main() { } ``` -## 带名称的变量 +## 具名参数 除了像上面那样指定位置外,我们还可以为参数指定名称: diff --git a/src/basic/intro.md b/src/basic/intro.md index 125ab266..2e891641 100644 --- a/src/basic/intro.md +++ b/src/basic/intro.md @@ -44,9 +44,10 @@ fn main() { ``` > 注意 -> 在上面的 `add` 函数中,不要为 `i+j` 添加 `;`,这会改变语法导致函数返回 `()` 而不是 `i32`,具体参见[语句和表达式](./base-type/statement-expression.md) +> 在上面的 `add` 函数中,不要为 `i+j` 添加 `;`,这会改变语法导致函数返回 `()` 而不是 `i32`,具体参见[语句和表达式](https://course.rs/basic/base-type/statement-expression.html) 有几点可以留意下: - 字符串使用双引号 `""` 而不是单引号 `''`,Rust 中单引号是留给单个字符类型(`char`)使用的 - Rust 使用 `{}` 来作为格式化输出占位符,其它语言可能使用的是 `%s`,`%d`,`%p` 等,由于 `println!` 会自动推导出具体的类型,因此无需手动指定 + diff --git a/src/basic/match-pattern/all-patterns.md b/src/basic/match-pattern/all-patterns.md index 64c5a080..7ef7c049 100644 --- a/src/basic/match-pattern/all-patterns.md +++ b/src/basic/match-pattern/all-patterns.md @@ -139,7 +139,7 @@ fn main() { 这段代码创建了变量 `x` 和 `y`,与结构体 `p` 中的 `x` 和 `y` 字段相匹配。其结果是变量 `x` 和 `y` 包含结构体 `p` 中的值。 -也可以使用字面值作为结构体模式的一部分进行进行解构,而不是为所有的字段创建变量。这允许我们测试一些字段为特定值的同时创建其他字段的变量。 +也可以使用字面值作为结构体模式的一部分进行解构,而不是为所有的字段创建变量。这允许我们测试一些字段为特定值的同时创建其他字段的变量。 下文展示了固定某个字段的匹配方式: diff --git a/src/basic/match-pattern/match-if-let.md b/src/basic/match-pattern/match-if-let.md index 78c91390..0ea112d3 100644 --- a/src/basic/match-pattern/match-if-let.md +++ b/src/basic/match-pattern/match-if-let.md @@ -145,7 +145,7 @@ fn value_in_cents(coin: Coin) -> u8 { 上面代码中,在匹配 `Coin::Quarter(state)` 模式时,我们把它内部存储的值绑定到了 `state` 变量上,因此 `state` 变量就是对应的 `UsState` 枚举类型。 -例如有一个印了阿拉斯加州标记的 25 分硬币:`Coin::Quarter(UsState::Alaska))`, 它在匹配时,`state` 变量将被绑定 `UsState::Alaska` 的枚举值。 +例如有一个印了阿拉斯加州标记的 25 分硬币:`Coin::Quarter(UsState::Alaska)`, 它在匹配时,`state` 变量将被绑定 `UsState::Alaska` 的枚举值。 再来看一个更复杂的例子: @@ -241,7 +241,7 @@ error[E0004]: non-exhaustive patterns: `West` not covered // 非穷尽匹配,` #### `_` 通配符 -当我们不想在匹配的时候列出所有值的时候,可以使用 Rust 提供的一个特殊**模式**,例如,`u8` 可以拥有 0 到 255 的有效的值,但是我们只关心 `1、3、5 和 7` 这几个值,不想列出其它的 `0、2、4、6、8、9 一直到 255` 的值。那么, 我们不必一个一个列出所有值, 因为可以使用使用特殊的模式 `_` 替代: +当我们不想在匹配的时候列出所有值的时候,可以使用 Rust 提供的一个特殊**模式**,例如,`u8` 可以拥有 0 到 255 的有效的值,但是我们只关心 `1、3、5 和 7` 这几个值,不想列出其它的 `0、2、4、6、8、9 一直到 255` 的值。那么, 我们不必一个一个列出所有值, 因为可以使用特殊的模式 `_` 替代: ```rust let some_u8_value = 0u8; @@ -264,7 +264,7 @@ match some_u8_value { ```rust let v = Some(3u8); - match v{ + match v { Some(3) => println!("three"), _ => (), } @@ -323,7 +323,7 @@ assert!(matches!(bar, Some(x) if x > 2)); ## 变量覆盖 -无论是是 `match` 还是 `if let`,他们都可以在模式匹配时覆盖掉老的值,绑定新的值: +无论是 `match` 还是 `if let`,他们都可以在模式匹配时覆盖掉老的值,绑定新的值: ```rust fn main() { diff --git a/src/basic/match-pattern/pattern-match.md b/src/basic/match-pattern/pattern-match.md index cf8b8088..a82e252a 100644 --- a/src/basic/match-pattern/pattern-match.md +++ b/src/basic/match-pattern/pattern-match.md @@ -155,7 +155,7 @@ let Some(x) = some_option_value; 因为右边的值可能不为 `Some`,而是 `None`,这种时候就不能进行匹配,也就是上面的代码遗漏了 `None` 的匹配。 -类似 `let` 和 `for`、`match` 都必须要求完全覆盖匹配,才能通过编译。 +类似 `let` 和 `for`、`match` 都必须要求完全覆盖匹配,才能通过编译( 不可驳模式匹配 )。 但是对于 `if let`,就可以这样使用: @@ -165,4 +165,4 @@ if let Some(x) = some_option_value { } ``` -因为 `if let` 允许匹配一种模式,而忽略其余的模式。 +因为 `if let` 允许匹配一种模式,而忽略其余的模式( 可驳模式匹配 )。 diff --git a/src/basic/method.md b/src/basic/method.md index 0ade558c..9a654125 100644 --- a/src/basic/method.md +++ b/src/basic/method.md @@ -251,7 +251,7 @@ impl Rectangle { ## 为枚举实现方法 -枚举类型之所以强大,不仅仅在于它好用、可以[同一化类型](./compound-type/enum.md#同一化类型),还在于,我们可以像结构体一样,为枚举实现方法: +枚举类型之所以强大,不仅仅在于它好用、可以[同一化类型](https://course.rs/basic/compound-type/enum.html#同一化类型),还在于,我们可以像结构体一样,为枚举实现方法: ```rust #![allow(unused)] diff --git a/src/basic/ownership/borrowing.md b/src/basic/ownership/borrowing.md index 6abe055f..e89940bc 100644 --- a/src/basic/ownership/borrowing.md +++ b/src/basic/ownership/borrowing.md @@ -4,7 +4,7 @@ Rust 通过 `借用(Borrowing)` 这个概念来达成上述的目的,**获取变量的引用,称之为借用(borrowing)**。正如现实生活中,如果一个人拥有某样东西,你可以从他那里借来,当使用完毕后,也必须要物归原主。 -### 引用与解引用 +## 引用与解引用 常规引用是一个指针类型,指向了对象存储的内存地址。在下面代码中,我们创建一个 `i32` 值的引用 `y`,然后使用解引用运算符来解出 `y` 所使用的值: @@ -35,7 +35,7 @@ error[E0277]: can't compare `{integer}` with `&{integer}` 不允许比较整数与引用,因为它们是不同的类型。必须使用解引用运算符解出引用所指向的值。 -### 不可变引用 +## 不可变引用 下面的代码,我们用 `s1` 的引用作为参数传递给 `calculate_length` 函数,而不是把 `s1` 的所有权转移给该函数: @@ -102,7 +102,7 @@ error[E0596]: cannot borrow `*some_string` as mutable, as it is behind a `&` ref 正如变量默认不可变一样,引用指向的值默认也是不可变的,没事,来一起看看如何解决这个问题。 -### 可变引用 +## 可变引用 只需要一个小调整,即可修复上面代码的错误: @@ -118,9 +118,9 @@ fn change(some_string: &mut String) { } ``` -首先,声明 `s` 是可变类型,其次创建一个可变的引用 `&mut s` 和接受可变引用的函数 `some_string: &mut String`。 +首先,声明 `s` 是可变类型,其次创建一个可变的引用 `&mut s` 和接受可变引用参数 `some_string: &mut String` 的函数。 -##### 可变引用同时只能存在一个 +#### 可变引用同时只能存在一个 不过可变引用并不是随心所欲、想用就用的,它有一个很大的限制: **同一作用域,特定数据只能有一个可变引用**: @@ -173,7 +173,7 @@ let mut s = String::from("hello"); let r2 = &mut s; ``` -##### 可变引用与不可变引用不能同时存在 +#### 可变引用与不可变引用不能同时存在 下面的代码会导致一个错误: @@ -310,7 +310,6 @@ fn no_dangle() -> String { - 同一时刻,你只能拥有要么一个可变引用, 要么任意多个不可变引用 - 引用必须总是有效的 - ## 课后练习 -> [Rust By Practice](https://zh.practice.rs/ownership/borrowing.html),支持代码在线编辑和运行,并提供详细的[习题解答](https://github.com/sunface/rust-by-practice)。 \ No newline at end of file +> [Rust By Practice](https://zh.practice.rs/ownership/borrowing.html),支持代码在线编辑和运行,并提供详细的[习题解答](https://github.com/sunface/rust-by-practice)。 diff --git a/src/basic/ownership/ownership.md b/src/basic/ownership/ownership.md index ef3ef21f..c5733f15 100644 --- a/src/basic/ownership/ownership.md +++ b/src/basic/ownership/ownership.md @@ -100,7 +100,7 @@ let s = "hello" #### 简单介绍 String 类型 -之前提到过,本章会用 `String` 作为例子,因此这里会进行一下简单的介绍,具体的 `String` 学习请参见 [String 类型](../compound-type/string-slice.md)。 +之前提到过,本章会用 `String` 作为例子,因此这里会进行一下简单的介绍,具体的 `String` 学习请参见 [String 类型](https://course.rs/basic/compound-type/string-slice.html)。 我们已经见过字符串字面值 `let s ="hello"`,`s` 是被硬编码进程序里的字符串值(类型为 `&str` )。字符串字面值是很方便的,但是它并不适用于所有场景。原因有二: @@ -262,7 +262,7 @@ Rust 有一个叫做 `Copy` 的特征,可以用在类似整型这样在栈中 - 所有浮点数类型,比如 `f64`。 - 字符类型,`char`。 - 元组,当且仅当其包含的类型也都是 `Copy` 的时候。比如,`(i32, i32)` 是 `Copy` 的,但 `(i32, String)` 就不是。 -- 引用类型,例如[转移所有权](#转移所有权)中的最后一个例子 +- 不可变引用 `&T` ,例如[转移所有权](#转移所有权)中的最后一个例子,**但是注意: 可变引用 `&mut T` 是不可以 Copy的** ## 函数传值与返回 diff --git a/src/basic/result-error/panic.md b/src/basic/result-error/panic.md index 4aa1fc67..068240b5 100644 --- a/src/basic/result-error/panic.md +++ b/src/basic/result-error/panic.md @@ -95,7 +95,7 @@ note: Some details are omitted, run with `RUST_BACKTRACE=full` for a verbose bac 其中,默认的方式就是 `栈展开`,这意味着 Rust 会回溯栈上数据和函数调用,因此也意味着更多的善后工作,好处是可以给出充分的报错信息和栈调用信息,便于事后的问题复盘。`直接终止`,顾名思义,不清理数据就直接退出程序,善后工作交与操作系统来负责。 -对于绝大多数用户,使用默认选择是最好的,但是当你关心最终编译出的二进制可执行文件大小时,那么可以尝试去使用直接终止的方式,例如下面的配置修改 `Cargo.toml` 文件,实现在 [`release`](../first-try/cargo.md#手动编译和运行项目) 模式下遇到 `panic` 直接终止: +对于绝大多数用户,使用默认选择是最好的,但是当你关心最终编译出的二进制可执行文件大小时,那么可以尝试去使用直接终止的方式,例如下面的配置修改 `Cargo.toml` 文件,实现在 [`release`](https://course.rs/first-try/cargo.html#手动编译和运行项目) 模式下遇到 `panic` 直接终止: ```rust [profile.release] @@ -172,7 +172,7 @@ let home: IpAddr = "127.0.0.1".parse().unwrap(); 当调用 `panic!` 宏时,它会 1. 格式化 `panic` 信息,然后使用该信息作为参数,调用 `std::panic::panic_any()` 函数 -2. `panic_any` 会检查应用是否使用了 `panic hook`,如果使用了,该 `hook` 函数就会被调用(`hook` 是一个钩子函数,是外部代码设置的,用于在 `panic` 触发时,执行外部代码所需的功能) +2. `panic_any` 会检查应用是否使用了 [`panic hook`](https://doc.rust-lang.org/std/panic/fn.set_hook.html),如果使用了,该 `hook` 函数就会被调用(`hook` 是一个钩子函数,是外部代码设置的,用于在 `panic` 触发时,执行外部代码所需的功能) 3. 当 `hook` 函数返回后,当前的线程就开始进行栈展开:从 `panic_any` 开始,如果寄存器或者栈因为某些原因信息错乱了,那很可能该展开会发生异常,最终线程会直接停止,展开也无法继续进行 4. 展开的过程是一帧一帧的去回溯整个栈,每个帧的数据都会随之被丢弃,但是在展开过程中,你可能会遇到被用户标记为 `catching` 的帧(通过 `std::panic::catch_unwind()` 函数标记),此时用户提供的 `catch` 函数会被调用,展开也随之停止:当然,如果 `catch` 选择在内部调用 `std::panic::resume_unwind()` 函数,则展开还会继续。 diff --git a/src/basic/result-error/result.md b/src/basic/result-error/result.md index 73db59e1..c08cc7ae 100644 --- a/src/basic/result-error/result.md +++ b/src/basic/result-error/result.md @@ -30,7 +30,7 @@ fn main() { > 有几种常用的方式,此处更推荐第二种方法: > > - 第一种是查询标准库或者三方库文档,搜索 `File`,然后找到它的 `open` 方法 -> - 在 [Rust IDE](../../first-try/editor.md) 章节,我们推荐了 `VSCode` IDE 和 `rust-analyzer` 插件,如果你成功安装的话,那么就可以在 `VSCode` 中很方便的通过代码跳转的方式查看代码,同时 `rust-analyzer` 插件还会对代码中的类型进行标注,非常方便好用! +> - 在 [Rust IDE](https://course.rs/first-try/editor.html) 章节,我们推荐了 `VSCode` IDE 和 `rust-analyzer` 插件,如果你成功安装的话,那么就可以在 `VSCode` 中很方便的通过代码跳转的方式查看代码,同时 `rust-analyzer` 插件还会对代码中的类型进行标注,非常方便好用! > - 你还可以尝试故意标记一个错误的类型,然后让编译器告诉你: ```rust @@ -53,7 +53,7 @@ error[E0308]: mismatched types 上面代码,故意将 `f` 类型标记成整形,编译器立刻不乐意了,你是在忽悠我吗?打开文件操作返回一个整形?来,大哥来告诉你返回什么:`std::result::Result`,我的天呐,怎么这么长的类型! -别慌,其实很简单,首先 `Result` 本身是定义在 `std::result` 中的,但是因为 `Result` 很常用,所以就被包含在了 [`prelude`](../../appendix/prelude.md) 中(将常用的东东提前引入到当前作用域内),因此无需手动引入 `std::result::Result`,那么返回类型可以简化为 `Result`,你看看是不是很像标准的 `Result` 枚举定义?只不过 `T` 被替换成了具体的类型 `std::fs::File`,是一个文件句柄类型,`E` 被替换成 `std::io::Error`,是一个 IO 错误类型. +别慌,其实很简单,首先 `Result` 本身是定义在 `std::result` 中的,但是因为 `Result` 很常用,所以就被包含在了 [`prelude`](https://course.rs/appendix/prelude.html) 中(将常用的东东提前引入到当前作用域内),因此无需手动引入 `std::result::Result`,那么返回类型可以简化为 `Result`,你看看是不是很像标准的 `Result` 枚举定义?只不过 `T` 被替换成了具体的类型 `std::fs::File`,是一个文件句柄类型,`E` 被替换成 `std::io::Error`,是一个 IO 错误类型. 这个返回值类型说明 `File::open` 调用如果成功则返回一个可以进行读写的文件句柄,如果失败,则返回一个 IO 错误:文件不存在或者没有访问文件的权限等。总之 `File::open` 需要一个方式告知调用者是成功还是失败,并同时返回具体的文件句柄(成功)或错误信息(失败),万幸的是,这些信息可以通过 `Result` 枚举提供: @@ -105,7 +105,7 @@ fn main() { - 如果是文件不存在错误 `ErrorKind::NotFound`,就创建文件,这里创建文件`File::create` 也是返回 `Result`,因此继续用 `match` 对其结果进行处理:创建成功,将新的文件句柄赋值给 `f`,如果失败,则 `panic` - 剩下的错误,一律 `panic` -虽然很清晰,但是代码还是有些啰嗦,我们会在[简化错误处理](../../advance/errors.md)一章重点讲述如何写出更优雅的错误。 +虽然很清晰,但是代码还是有些啰嗦,我们会在[简化错误处理](https://course.rs/advance/errors.html)一章重点讲述如何写出更优雅的错误。 ## 失败就 panic: unwrap 和 expect diff --git a/src/basic/trait/advance-trait.md b/src/basic/trait/advance-trait.md index 085723f4..6fe8f723 100644 --- a/src/basic/trait/advance-trait.md +++ b/src/basic/trait/advance-trait.md @@ -20,7 +20,7 @@ pub trait Iterator { 同时,`next` 方法也返回了一个 `Item` 类型,不过使用 `Option` 枚举进行了包裹,假如迭代器中的值是 `i32` 类型,那么调用 `next` 方法就将获取一个 `Option` 的值。 -还记得 `Self` 吧?在之前的章节[提到过](https://course.rs/basic/trait/trait-object#self与self), `Self` 用来指代当前的特征实例,那么 `Self::Item` 就用来指代特征实例中具体的 `Item` 类型: +还记得 `Self` 吧?在之前的章节[提到过](https://course.rs/basic/trait/trait-object#self-与-self), **`Self` 用来指代当前调用者的具体类型,那么 `Self::Item` 就用来指代该类型实现中定义的 `Item` 类型**: ```rust impl Iterator for Counter { @@ -30,9 +30,14 @@ impl Iterator for Counter { // --snip-- } } + +fn main() { + let c = Counter{..} + c.next() +} ``` -在上述代码中,我们为 `Counter` 类型实现了 `Iterator` 特征,那么 `Self` 就是当前的 `Iterator` 特征对象, `Item` 就是 `u32` 类型。 +在上述代码中,我们为 `Counter` 类型实现了 `Iterator` 特征,变量 `c` 是特征 `Iterator` 的实例,也是 `next` 方法的调用者。 结合之前的黑体内容可以得出:对于 `next` 方法而言,`Self` 是调用者 `c` 的具体类型: `Counter`,而 `Self::Item` 是 `Counter` 中定义的 `Item` 类型: `u32`。 聪明的读者之所以聪明,是因为你们喜欢联想和举一反三,同时你们也喜欢提问:为何不用泛型,例如如下代码: @@ -227,7 +232,7 @@ Up! 因为 `fly` 方法的参数是 `self`,当显式调用时,编译器就可以根据调用的类型( `self` 的类型)决定具体调用哪个方法。 -这个时候问题又来了,如果方法没有 `self` 参数呢?稍等,估计有读者会问:还有方法没有 `self` 参数?看到这个疑问,作者的眼泪不禁流了下来,大明湖畔的[关联函数](../method.md#关联函数),你还记得嘛? +这个时候问题又来了,如果方法没有 `self` 参数呢?稍等,估计有读者会问:还有方法没有 `self` 参数?看到这个疑问,作者的眼泪不禁流了下来,大明湖畔的[关联函数](https://course.rs/basic/method.html#关联函数),你还记得嘛? 但是成年人的世界,就算再伤心,事还得做,咱们继续: diff --git a/src/basic/trait/generic.md b/src/basic/trait/generic.md index b18c0361..5d7713bf 100644 --- a/src/basic/trait/generic.md +++ b/src/basic/trait/generic.md @@ -55,7 +55,7 @@ fn main() { fn largest(list: &[T]) -> T { ``` -该泛型函数的作用是从列表中找出最大的值,其中列表中的元素类型为 T。首先 `largest` 对泛型参数 `T` 进行了声明,然后才在函数参数中进行使用该泛型参数 `list: &[T]` (还记得 `&[T]` 类型吧?这是[数组切片](../compound-type/array#数组切片))。 +该泛型函数的作用是从列表中找出最大的值,其中列表中的元素类型为 T。首先 `largest` 对泛型参数 `T` 进行了声明,然后才在函数参数中进行使用该泛型参数 `list: &[T]` (还记得 `&[T]` 类型吧?这是[数组切片](https://course.rs/basic/compound-type/array.html#数组切片))。 总之,我们可以这样理解这个函数定义:函数 `largest` 有泛型类型 `T`,它有个参数 `list`,其类型是元素为 `T` 的数组切片,最后,该函数返回值的类型也是 `T`。 @@ -294,7 +294,7 @@ impl Point { 在之前的泛型中,可以抽象为一句话:针对类型实现的泛型,所有的泛型都是为了抽象不同的类型,那有没有针对值的泛型?可能很多同学感觉很难理解,值怎么使用泛型?不急,我们先从数组讲起。 -在[数组](../compound-type/array.md)那节,有提到过很重要的一点:`[i32; 2]` 和 `[i32; 3]` 是不同的数组类型,比如下面的代码: +在[数组](https://course.rs/basic/compound-type/array.html)那节,有提到过很重要的一点:`[i32; 2]` 和 `[i32; 3]` 是不同的数组类型,比如下面的代码: ```rust fn display_array(arr: [i32; 3]) { diff --git a/src/basic/trait/trait-object.md b/src/basic/trait/trait-object.md index f6ed93d4..b52fef95 100644 --- a/src/basic/trait/trait-object.md +++ b/src/basic/trait/trait-object.md @@ -108,7 +108,10 @@ pub struct Screen { **特征对象**指向实现了 `Draw` 特征的类型的实例,也就是指向了 `Button` 或者 `SelectBox` 的实例,这种映射关系是存储在一张表中,可以在运行时通过特征对象找到具体调用的类型方法。 -可以通过 `&` 引用或者 `Box` 智能指针的方式来创建特征对象: +可以通过 `&` 引用或者 `Box` 智能指针的方式来创建特征对象。 + +> `Boxt` 在后面章节会[详细讲解](https://course.rs/advance/smart-pointer/box.html),大家现在把它当成一个引用即可,只不过它包裹的值会被强制分配在堆上 + ```rust trait Draw { @@ -127,7 +130,9 @@ impl Draw for f64 { } } +// 若 T 实现了 Draw 特征, 则调用该函数时传入的 Box 可以被隐式转换成函数参数签名中的 Box fn draw1(x: Box) { + // 由于实现了 Deref 特征,Box 智能指针会自动解引用为它所包裹的值,然后调用该值对应的类型上定义的 `draw` 方法 x.draw(); } @@ -140,7 +145,10 @@ fn main() { // do_something(&x); let y = 8u8; + // x 和 y 的类型 T 都实现了 `Draw` 特征,因为 Box 可以在函数调用时隐式地被转换为特征对象 Box + // 基于 x 的值创建一个 Box 类型的智能指针,指针指向的数据被放置在了堆上 draw1(Box::new(x)); + // 基于 y 的值创建一个 Box 类型的智能指针 draw1(Box::new(y)); draw2(&x); draw2(&y); diff --git a/src/basic/trait/trait.md b/src/basic/trait/trait.md index c45ef721..b83c55ec 100644 --- a/src/basic/trait/trait.md +++ b/src/basic/trait/trait.md @@ -270,7 +270,7 @@ impl Pair { } ``` -`cmd_display` 方法,并不是所有的 `Pair` 结构体对象都可以拥有,只有 `T` 同时实现了 `Display + PartialOrd` 的 `Pair` 才可以拥有此方法。 +`cmp_display` 方法,并不是所有的 `Pair` 结构体对象都可以拥有,只有 `T` 同时实现了 `Display + PartialOrd` 的 `Pair` 才可以拥有此方法。 该函数可读性会更好,因为泛型参数、参数、返回值都在一起,可以快速的阅读,同时每个泛型参数的特征也在新的代码行中通过**特征约束**进行了约束。 **也可以有条件地实现特征**, 例如,标准库为任何实现了 `Display` 特征的类型实现了 `ToString` 特征: @@ -339,11 +339,11 @@ fn returns_summarizable(switch: bool) -> impl Summary { expected struct `Post`, found struct `Weibo` ``` -报错提示我们 `if` 和 `else` 返回了不同的类型。如果想要实现返回不同的类型,需要使用下一章节中的[特征对象](./trait-object.md)。 +报错提示我们 `if` 和 `else` 返回了不同的类型。如果想要实现返回不同的类型,需要使用下一章节中的[特征对象](https://course.rs/basic/trait/trait-object.html)。 ## 修复上一节中的 `largest` 函数 -还记得上一节中的[例子](./generic#泛型详解)吧,当时留下一个疑问,该如何解决编译报错: +还记得上一节中的[例子](https://course.rs/basic/trait/generic.html#泛型详解)吧,当时留下一个疑问,该如何解决编译报错: ```rust error[E0369]: binary operation `>` cannot be applied to type `T` // 无法在 `T` 类型上应用`>`运算符 @@ -390,7 +390,7 @@ error[E0507]: cannot move out of borrowed content | cannot move out of borrowed content ``` -错误的核心是 `cannot move out of type [T], a non-copy slice`,原因是 `T` 没有[实现 `Copy` 特性](../ownership/ownership.md#拷贝浅拷贝),因此我们只能把所有权进行转移,毕竟只有 `i32` 等基础类型才实现了 `Copy` 特性,可以存储在栈上,而 `T` 可以指代任何类型(严格来说是实现了 `PartialOrd` 特征的所有类型)。 +错误的核心是 `cannot move out of type [T], a non-copy slice`,原因是 `T` 没有[实现 `Copy` 特性](https://course.rs/basic/ownership/ownership.html#拷贝浅拷贝),因此我们只能把所有权进行转移,毕竟只有 `i32` 等基础类型才实现了 `Copy` 特性,可以存储在栈上,而 `T` 可以指代任何类型(严格来说是实现了 `PartialOrd` 特征的所有类型)。 因此,为了让 `T` 拥有 `Copy` 特性,我们可以增加特征约束: @@ -420,7 +420,7 @@ fn main() { } ``` -如果并不希望限制 `largest` 函数只能用于实现了 `Copy` 特征的类型,我们可以在 `T` 的特征约束中指定 [`Clone` 特征](../ownership/ownership.md#克隆深拷贝) 而不是 `Copy` 特征。并克隆 `list` 中的每一个值使得 `largest` 函数拥有其所有权。使用 `clone` 函数意味着对于类似 `String` 这样拥有堆上数据的类型,会潜在地分配更多堆上空间,而堆分配在涉及大量数据时可能会相当缓慢。 +如果并不希望限制 `largest` 函数只能用于实现了 `Copy` 特征的类型,我们可以在 `T` 的特征约束中指定 [`Clone` 特征](https://course.rs/basic/ownership/ownership.html#克隆深拷贝) 而不是 `Copy` 特征。并克隆 `list` 中的每一个值使得 `largest` 函数拥有其所有权。使用 `clone` 函数意味着对于类似 `String` 这样拥有堆上数据的类型,会潜在地分配更多堆上空间,而堆分配在涉及大量数据时可能会相当缓慢。 另一种 `largest` 的实现方式是返回在 `list` 中 `T` 值的引用。如果我们将函数返回值从 `T` 改为 `&T` 并改变函数体使其能够返回一个引用,我们将不需要任何 `Clone` 或 `Copy` 的特征约束而且也不会有任何的堆分配。尝试自己实现这种替代解决方式吧! @@ -434,7 +434,7 @@ fn main() { 总之,`derive` 派生出来的是 Rust 默认给我们提供的特征,在开发过程中极大的简化了自己手动实现相应特征的需求,当然,如果你有特殊的需求,还可以自己手动重载该实现。 -详细的 `derive` 列表参见[附录-派生特征](../../appendix/derive.md)。 +详细的 `derive` 列表参见[附录-派生特征](https://course.rs/appendix/derive.html)。 ## 调用方法需要引入特征 @@ -458,13 +458,13 @@ fn main() { 上面代码中引入了 `std::convert::TryInto` 特征,但是却没有使用它,可能有些同学会为此困惑,主要原因在于**如果你要使用一个特征的方法,那么你需要引入该特征到当前的作用域中**,我们在上面用到了 `try_into` 方法,因此需要引入对应的特征。 -但是 Rust 又提供了一个非常便利的办法,即把最常用的标准库中的特征通过 [`std::prelude`](std::convert::TryInto) 模块提前引入到当前作用域中,其中包括了 `std::convert::TryInto`,你可以尝试删除第一行的代码 `use ...`,看看是否会报错。 +但是 Rust 又提供了一个非常便利的办法,即把最常用的标准库中的特征通过 [`std::prelude`](https://course.rs/appendix/prelude.html) 模块提前引入到当前作用域中,其中包括了 `std::convert::TryInto`,你可以尝试删除第一行的代码 `use ...`,看看是否会报错。 ## 几个综合例子 #### 为自定义类型实现 `+` 操作 -在 Rust 中除了数值类型的加法,`String` 也可以做[加法](../compound-type/string-slice.md#操作字符串),因为 Rust 为该类型实现了 `std::ops::Add` 特征,同理,如果我们为自定义类型实现了该特征,那就可以自己实现 `Point1 + Point2` 的操作: +在 Rust 中除了数值类型的加法,`String` 也可以做[加法](https://course.rs/basic/compound-type/string-slice.html#操作字符串),因为 Rust 为该类型实现了 `std::ops::Add` 特征,同理,如果我们为自定义类型实现了该特征,那就可以自己实现 `Point1 + Point2` 的操作: ```rust use std::ops::Add; @@ -580,4 +580,4 @@ fn main() { ## 课后练习 -> [Rust By Practice](https://zh.practice.rs/generics-traits/traits.html),支持代码在线编辑和运行,并提供详细的[习题解答](https://github.com/sunface/rust-by-practice)。 \ No newline at end of file +> [Rust By Practice](https://zh.practice.rs/generics-traits/traits.html),支持代码在线编辑和运行,并提供详细的[习题解答](https://github.com/sunface/rust-by-practice)。 diff --git a/src/basic/variable.md b/src/basic/variable.md index a5306165..6c8d0be8 100644 --- a/src/basic/variable.md +++ b/src/basic/variable.md @@ -14,7 +14,7 @@ 在命名方面,和其它语言没有区别,不过当给变量命名时,需要遵循 [Rust 命名规范](https://course.rs/practice/naming.html)。 -> Rust 语言有一些**关键字**(_keywords_),和其他语言一样,这些关键字都是被保留给 Rust 语言使用的,因此,它们不能被用作变量或函数的名称。在 [附录 A](../appendix/keywords) 中可找到关键字列表。 +> Rust 语言有一些**关键字**(_keywords_),和其他语言一样,这些关键字都是被保留给 Rust 语言使用的,因此,它们不能被用作变量或函数的名称。在 [附录 A](https://course.rs/appendix/keywords.html) 中可找到关键字列表。 ## 变量绑定 @@ -97,7 +97,36 @@ The value of x is: 6 例如,在使用大型数据结构或者热点代码路径(被大量频繁调用)的情形下,在同一内存位置更新实例可能比复制并返回新分配的实例要更快。使用较小的数据结构时,通常创建新的实例并以更具函数式的风格来编写程序,可能会更容易理解,所以值得以较低的性能开销来确保代码清晰。 -### 变量解构 +## 使用下划线开头忽略未使用的变量 + +如果你创建了一个变量却不在任何地方使用它,Rust 通常会给你一个警告,因为这可能会是个 BUG。但是有时创建一个不会被使用的变量是有用的,比如你正在设计原型或刚刚开始一个项目。这时**你希望告诉 Rust 不要警告未使用的变量,为此可以用下划线作为变量名的开头**: + +```rust +fn main() { + let _x = 5; + let y = 10; +} +``` + +使用 `cargo run` 运行下试试: + +```shell +warning: unused variable: `y` + --> src/main.rs:3:9 + | +3 | let y = 10; + | ^ help: 如果 y 故意不被使用,请添加一个下划线前缀: `_y` + | + = note: `#[warn(unused_variables)]` on by default +``` + +可以看到,两个变量都是只有声明,没有使用,但是编译器却独独给出了 `y` 未被使用的警告,充分说明了 `_` 变量名前缀在这里发挥的作用。 + +值得注意的是,这里编译器还很善意的给出了提示( Rust 的编译器非常强大,这里的提示只是小意思 ): 将 `y` 修改 `_y` 即可。这里就不再给出代码,留给大家手动尝试并观察下运行结果。 + +更多关于 `_x` 的使用信息,请阅读后面的[模式匹配章节](https://course.rs/basic/match-pattern/all-patterns.html?highlight=_#使用下划线开头忽略未使用的变量)。 + +## 变量解构 `let` 表达式不仅仅用于变量的绑定,还能进行复杂变量的解构:从一个相对复杂的变量中,匹配出该变量的一部分内容: @@ -125,6 +154,7 @@ fn main() { let (a, b, c, d, e); (a, b) = (1, 2); + // _ 代表匹配一个值,但是我们不关心具体的值是什么,因此没有是一个变量名而是使用了 _ [c, .., d, _] = [1, 2, 3, 4, 5]; Struct { e, .. } = Struct { e: 5 }; @@ -138,14 +168,14 @@ fn main() { > 这里用到了模式匹配的一些语法,如果大家看不懂没关系,可以在学完模式匹配章节后,再回头来看。 -### 变量和常量之间的差异 +## 变量和常量之间的差异 变量的值不能更改可能让你想起其他另一个很多语言都有的编程概念:**常量**(_constant_)。与不可变变量一样,常量也是绑定到一个常量名且不允许更改的值,但是常量和变量之间存在一些差异: - 常量不允许使用 `mut`。**常量不仅仅默认不可变,而且自始至终不可变**,因为常量在编译完成后,已经确定它的值。 - 常量使用 `const` 关键字而不是 `let` 关键字来声明,并且值的类型**必须**标注。 -我们将在下一节[数据类型](./base-type/index.md)中介绍,因此现在暂时无需关心细节。 +我们将在下一节[数据类型](https://course.rs/basic/base-type/index.html)中介绍,因此现在暂时无需关心细节。 下面是一个常量声明的例子,其常量名为 `MAX_POINTS`,值设置为 `100,000`。(Rust 常量的命名约定是全部字母都使用大写,并使用下划线分隔单词,另外对数字字面量可插入下划线以提高可读性): @@ -157,7 +187,7 @@ const MAX_POINTS: u32 = 100_000; > 在实际使用中,最好将程序中用到的硬编码值都声明为常量,对于代码后续的维护有莫大的帮助。如果将来需要更改硬编码的值,你也只需要在代码中更改一处即可。 -### 变量遮蔽(shadowing) +## 变量遮蔽(shadowing) Rust 允许声明相同的变量名,在后面声明的变量会遮蔽掉前面声明的,如下所示: @@ -222,7 +252,7 @@ error[E0308]: mismatched types error: aborting due to previous error ``` -显然,Rust 对类型的要求很严格,不允许将整数类型 `usize` 赋值给字符串类型。`usize` 是一种 CPU 相关的整数类型,在[数值类型](./base-type/numbers#整数类型)中有详细介绍。 +显然,Rust 对类型的要求很严格,不允许将整数类型 `usize` 赋值给字符串类型。`usize` 是一种 CPU 相关的整数类型,在[数值类型](https://course.rs/basic/base-type/numbers.html#整数类型)中有详细介绍。 万事开头难,到目前为止,都进展很顺利,那下面开始,咱们正式进入 Rust 的类型世界,看看有哪些挑战在前面等着大家。 @@ -230,3 +260,4 @@ error: aborting due to previous error ## 课后练习 > [Rust By Practice](https://zh.practice.rs/variables.html),支持代码在线编辑和运行,并提供详细的[习题解答](https://github.com/sunface/rust-by-practice)。 + diff --git a/src/cargo/guide/build-cache.md b/src/cargo/guide/build-cache.md index 1096529c..2eddbc83 100644 --- a/src/cargo/guide/build-cache.md +++ b/src/cargo/guide/build-cache.md @@ -15,7 +15,7 @@ | 目录 | 描述 | | ---------------- | ----------------------------------------------------------------------- | | `target/debug/` | 包含了 `dev` profile 的构建输出(`cargo build` 或 `cargo build --debug`) | -| `target/release` | `release` profile 的构建输出,`cargo build --release` | +| `target/release/` | `release` profile 的构建输出,`cargo build --release` | | `target/foo/` | 自定义 `foo` profile 的构建输出,`cargo build --profile=foo` | 出于历史原因: @@ -30,7 +30,7 @@ | 目录 | 示例 | | -------------------------- | --------------------------------------- | -| `target//debug` | `target/thumbv7em-none-eabihf/debug/` | +| `target//debug/` | `target/thumbv7em-none-eabihf/debug/` | | `target//release/` | `target/thumbv7em-none-eabihf/release/` | > **注意:**,当没有使用 `--target` 时,`Cargo` 会与构建脚本和过程宏一起共享你的依赖包,对于每个 `rustc` 命令调用而言,[`RUSTFLAGS`](https://course.rs/cargo/reference/configuration.html#配置文件概览) 也将被共享。 diff --git a/src/cargo/guide/cargo-toml-lock.md b/src/cargo/guide/cargo-toml-lock.md index e86bca9a..fba95add 100644 --- a/src/cargo/guide/cargo-toml-lock.md +++ b/src/cargo/guide/cargo-toml-lock.md @@ -9,7 +9,7 @@ ## 是否上传本地的 `Cargo.lock` -当本地开发时,`Cargo.lock` 自然是非常重要的,但是当你要把项目上传到 `Git` 时,例如 `Github`,那是否上传 `Cargo.lock` 就成了一个问题。 +当本地开发时,`Cargo.lock` 自然是非常重要的,但是当你要把项目上传到 `Git` 时,例如 `GitHub`,那是否上传 `Cargo.lock` 就成了一个问题。 关于是否上传,有如下经验准则: @@ -39,7 +39,7 @@ version = "0.1.0" regex = { git = "https://github.com/rust-lang/regex.git" } ``` -可以看到,只有一个依赖,且该依赖的来源是 `Github` 上一个特定的仓库。由于我们没有指定任何版本信息,`Cargo` 会自动拉取该依赖库的最新版本( `master` 或 `main` 分支上的最新 `commit` )。 +可以看到,只有一个依赖,且该依赖的来源是 `GitHub` 上一个特定的仓库。由于我们没有指定任何版本信息,`Cargo` 会自动拉取该依赖库的最新版本( `master` 或 `main` 分支上的最新 `commit` )。 这种使用方式,其实就错失了包管理工具的最大的优点:版本管理。例如你在今天构建使用了版本 `A`,然后过了一段时间后,由于依赖包的升级,新的构建却使用了大更新版本 `B`,结果因为版本不兼容,导致了构建失败。 diff --git a/src/cargo/guide/download-package.md b/src/cargo/guide/download-package.md index 651e1f4d..6a7afc37 100644 --- a/src/cargo/guide/download-package.md +++ b/src/cargo/guide/download-package.md @@ -1,13 +1,13 @@ # 下载并构建 Package -如果看中 `Github` 上的某个开源 Rust 项目,那下载并构建它将是非常简单的。 +如果看中 `GitHub` 上的某个开源 Rust 项目,那下载并构建它将是非常简单的。 ```shell $ git clone https://github.com/rust-lang/regex.git $ cd regex ``` -如上所示,直接从 `github` 上克隆下来想要的项目,然后使用 `cargo build` 进行构建即可: +如上所示,直接从 `GitHub` 上克隆下来想要的项目,然后使用 `cargo build` 进行构建即可: ```shell $ cargo build diff --git a/src/cargo/guide/tests-ci.md b/src/cargo/guide/tests-ci.md index 97dd25a4..cbc31ff6 100644 --- a/src/cargo/guide/tests-ci.md +++ b/src/cargo/guide/tests-ci.md @@ -27,9 +27,9 @@ test result: ok. 0 passed; 0 failed; 0 ignored; 0 measured; 0 filtered out 在有了持续集成后,只要编写好相应的编译、测试、发布配置文件,那持续集成平台会自动帮助我们完成整个相关的流程,期间无需任何人介入,高效且可靠。 -#### Github Actions +#### GitHub Actions -关于如何使用 `Github Actions` 进行持续集成,在[之前的章节](https://course.rs/test/ci.html)已经有过详细的介绍,这里就不再赘述。 +关于如何使用 `GitHub Actions` 进行持续集成,在[之前的章节](https://course.rs/test/ci.html)已经有过详细的介绍,这里就不再赘述。 #### Travis CI diff --git a/src/cargo/reference/build-script/examples.md b/src/cargo/reference/build-script/examples.md index cdba5d5f..9dd7c1e2 100644 --- a/src/cargo/reference/build-script/examples.md +++ b/src/cargo/reference/build-script/examples.md @@ -358,4 +358,4 @@ pub fn sha3_224() -> MessageDigest { } ``` -当然,大家在使用时一定要小心,因为这可能会导致生成的二进制文件进一步依赖当前的构建环境。例如,当二进制可执行文件需要在另一个操作系统中分发运行时,那它依赖的信息对于该操作系统可能是不存在! +当然,大家在使用时一定要小心,因为这可能会导致生成的二进制文件进一步依赖当前的构建环境。例如,当二进制可执行文件需要在另一个操作系统中分发运行时,那它依赖的信息对于该操作系统可能是不存在的! diff --git a/src/cargo/reference/build-script/intro.md b/src/cargo/reference/build-script/intro.md index edd2842a..f568868e 100644 --- a/src/cargo/reference/build-script/intro.md +++ b/src/cargo/reference/build-script/intro.md @@ -32,7 +32,7 @@ fn main() { > Note: [`package.build`](https://course.rs/cargo/reference/manifest.html#build) 可以用于改变构建脚本的名称,或者直接禁用该功能 -#### 构建脚本的生命期 +#### 构建脚本的生命周期 在项目被构建之前,Cargo 会将构建脚本编译成一个可执行文件,然后运行该文件并执行相应的任务。 @@ -40,7 +40,7 @@ fn main() { 需要注意的是,Cargo 也不是每次都会重新编译构建脚本,只有当脚本的内容或依赖发生变化时才会。默认情况下,任何文件变化都会触发重新编译,如果你希望对其进行定制,可以使用 `rerun-if`命令,后文会讲。 -在构建成本成功执行后,我们的项目就会开始进行编译。如果构建脚本的运行过程中发生错误,脚本应该通过返回一个非 0 码来立刻退出,在这种情况下,构建脚本的输出会被打印到终端中。 +在构建脚本成功执行后,我们的项目就会开始进行编译。如果构建脚本的运行过程中发生错误,脚本应该通过返回一个非 0 码来立刻退出,在这种情况下,构建脚本的输出会被打印到终端中。 #### 构建脚本的输入 @@ -72,8 +72,8 @@ $ cargo run -vv 以下是 Cargo 能识别的通信指令以及简介,如果大家希望深入了解每个命令,可以点击具体的链接查看官方文档的说明。 - [`cargo:rerun-if-changed=PATH`](https://doc.rust-lang.org/stable/cargo/reference/build-scripts.html#rerun-if-changed) — 当指定路径的文件发生变化时,Cargo 会重新运行脚本 -- [`cargo:rerun-if-env-changed=VAR`](https://doc.rust-lang.org/stable/cargo/reference/build-scripts.html#rerun-if-env-changed) — 当指定的环境变量发生变化时,Cargo 会重新运行脚本告诉 -- [`cargo:rustc-link-arg=FLAG`](https://doc.rust-lang.org/stable/cargo/reference/build-scripts.html#rustc-link-arg) – 将自定义的 flags 传给 linker,用于后续的基准性能测试 benchmark、 可执行文件 binary,、`cdylib` 包、示例 和测试。 +- [`cargo:rerun-if-env-changed=VAR`](https://doc.rust-lang.org/stable/cargo/reference/build-scripts.html#rerun-if-env-changed) — 当指定的环境变量发生变化时,Cargo 会重新运行脚本 +- [`cargo:rustc-link-arg=FLAG`](https://doc.rust-lang.org/stable/cargo/reference/build-scripts.html#rustc-link-arg) – 将自定义的 flags 传给 linker,用于后续的基准性能测试 benchmark、 可执行文件 binary,、`cdylib` 包、示例和测试 - [`cargo:rustc-link-arg-bin=BIN=FLAG`](https://doc.rust-lang.org/stable/cargo/reference/build-scripts.html#rustc-link-arg-bin) – 自定义的 flags 传给 linker,用于可执行文件 `BIN` - [`cargo:rustc-link-arg-bins=FLAG`](https://doc.rust-lang.org/stable/cargo/reference/build-scripts.html#rustc-link-arg-bins) – 自定义的 flags 传给 linker,用于可执行文件 - [`cargo:rustc-link-arg-tests=FLAG`](https://doc.rust-lang.org/stable/cargo/reference/build-scripts.html#rustc-link-arg-tests) – 自定义的 flags 传给 linker,用于测试 @@ -90,7 +90,7 @@ $ cargo run -vv ## 构建脚本的依赖 -构建脚本也可以引入其它基于 Cargo 的依赖包,只需要修改在 `Cargo.toml` 中添加以下内容: +构建脚本也可以引入其它基于 Cargo 的依赖包,只需要在 `Cargo.toml` 中添加或修改以下内容: ```toml [build-dependencies] @@ -115,7 +115,7 @@ links = "foo" Cargo 要求一个本地库最多只能被一个项目所链接,换而言之,你无法让两个项目链接到同一个本地库,但是有一种方法可以降低这种限制,感兴趣的同学可以看看[官方文档](https://doc.rust-lang.org/stable/cargo/reference/build-scripts.html#-sys-packages)。 -假设 A 项目的构建脚本生成任意数量的 kv 形式的元数据,那这些元数据传递给将 A 用作依赖包的项目的构建脚本。例如,如果包 `bar` 依赖于 `foo`,当 `foo` 生成 `key==value` 形式的构建脚本元数据时,那么 `bar` 的构建脚本就可以通过环境变量的形式使用该元数据:`DEP_FOO_KEY=value`。 +假设 A 项目的构建脚本生成任意数量的 kv 形式的元数据,那这些元数据将传递给 A 用作依赖包的项目的构建脚本。例如,如果包 `bar` 依赖于 `foo`,当 `foo` 生成 `key=value` 形式的构建脚本元数据时,那么 `bar` 的构建脚本就可以通过环境变量的形式使用该元数据:`DEP_FOO_KEY=value`。 需要注意的是,该元数据只能传给直接相关者,对于间接的,例如依赖的依赖,就无能为力了。 diff --git a/src/cargo/reference/deps-overriding.md b/src/cargo/reference/deps-overriding.md index 74466d7c..971e3eaf 100644 --- a/src/cargo/reference/deps-overriding.md +++ b/src/cargo/reference/deps-overriding.md @@ -75,7 +75,7 @@ $ cargo build 修复 bug 后,我们可以提交 pr 给 `uuid`,一旦 pr 被合并到了 `master` 分支,你可以直接通过以下方式来使用补丁: -```shell +```toml [patch.crates-io] uuid = { git = 'https://github.com/uuid-rs/uuid' } ``` @@ -108,7 +108,7 @@ uuid = { git = 'https://github.com/uuid-rs/uuid' } #### 间接使用 `patch` -现在假设项目 `A` 的依赖是 `B` 和 `uuid`,而 `B` 的依赖也是 `uuid`,此时我们可以让 `A` 和 `B` 都使用来自 `github` 的 `patch` 版本,配置如下: +现在假设项目 `A` 的依赖是 `B` 和 `uuid`,而 `B` 的依赖也是 `uuid`,此时我们可以让 `A` 和 `B` 都使用来自 `GitHub` 的 `patch` 版本,配置如下: ```toml [package] @@ -129,7 +129,7 @@ uuid = { git = 'https://github.com/uuid-rs/uuid' } 若我们想要覆盖的依赖并不是来自 `crates.io` ,就需要对 `[patch]` 做一些修改。例如依赖是 `git` 仓库,然后使用本地路径来覆盖它: -```shell +```toml [patch."https://github.com/your/repository"] my-library = { path = "../my-library/path" } ``` @@ -154,7 +154,7 @@ uuid = { git = "https://github.com/uuid-rs/uuid", branch = "2.0.0" } 这里需要注意,**与之前的小版本不同,大版本的 `patch` 不会发生间接的传递!**,例如: -```shell +```toml [package] name = "my-binary" version = "0.1.0" diff --git a/src/cargo/reference/features/examples.md b/src/cargo/reference/features/examples.md index 00d50d22..feed1ec0 100644 --- a/src/cargo/reference/features/examples.md +++ b/src/cargo/reference/features/examples.md @@ -12,7 +12,7 @@ ### 行为扩展 -[`serde_json`](https://crates.io/crates/serde_json) 拥有一个 [`preserve_order` feature](https://github.com/serde-rs/json/blob/v1.0.60/Cargo.toml#L53-L56),可以用于在序列化时保留 JSON 键值队的顺序。同时,该 feature 还会启用一个可选依赖 [indexmap](https://crates.io/crates/indexmap)。 +[`serde_json`](https://crates.io/crates/serde_json) 拥有一个 [`preserve_order` feature](https://github.com/serde-rs/json/blob/v1.0.60/Cargo.toml#L53-L56),可以用于在序列化时保留 JSON 键值对的顺序。同时,该 feature 还会启用一个可选依赖 [indexmap](https://crates.io/crates/indexmap)。 当这么做时,一定要小心不要破坏了 SemVer 的版本兼容性,也就是说:启用 feature 后,代码依然要能正常工作。 @@ -40,7 +40,7 @@ 在这种情况下,将过程宏所在的包定义为可选依赖,是很不错的选择。这样做还有一个好处:有时过程宏的版本必须要跟父包进行同步,但是我们又不希望所有的用户都进行同步。 -其中给一个例子就是 [serde](https://crates.io/crates/serde) ,它有一个 [derive](https://github.com/serde-rs/serde/blob/v1.0.118/serde/Cargo.toml#L34-L35) feature 可以启用 [serde_derive](https://crates.io/crates/serde_derive) 过程宏。由于 `serde_derive` 包跟 `serde` 的关系非常紧密,因此它使用了[版本相同的需求](https://github.com/serde-rs/serde/blob/v1.0.118/serde/Cargo.toml#L17)来保证两者的版本同步性。 +其中一个例子就是 [serde](https://crates.io/crates/serde) ,它有一个 [derive](https://github.com/serde-rs/serde/blob/v1.0.118/serde/Cargo.toml#L34-L35) feature 可以启用 [serde_derive](https://crates.io/crates/serde_derive) 过程宏。由于 `serde_derive` 包跟 `serde` 的关系非常紧密,因此它使用了[版本相同的需求](https://github.com/serde-rs/serde/blob/v1.0.118/serde/Cargo.toml#L17)来保证两者的版本同步性。 ## 只能用于 nightly 的 feature @@ -52,7 +52,7 @@ Rust 有些实验性的 API 或语言特性只能在 nightly 版本下使用, ## 实验性 feature -有一些包会提前将一些实验性的 API 放出去,既然是实验性的,自然无法保证其稳定性。在这种情况下,通过会在文档中将相应的 features 标记为实验性,意味着它们在未来可能会发生大的改变(甚至 minor 版本都可能发生)。 +有一些包会提前将一些实验性的 API 放出去,既然是实验性的,自然无法保证其稳定性。在这种情况下,通常会在文档中将相应的 features 标记为实验性,意味着它们在未来可能会发生大的改变(甚至 minor 版本都可能发生)。 其中一个例子是 [async-std](https://crates.io/crates/async-std) 包,它拥有一个 [unstable feature](https://github.com/async-rs/async-std/blob/v1.8.0/Cargo.toml#L38-L42),用来[标记一些新的 API](https://github.com/async-rs/async-std/blob/v1.8.0/src/macros.rs#L46),表示人们已经可以选择性的使用但是还没有准备好去依赖它。 diff --git a/src/cargo/reference/features/intro.md b/src/cargo/reference/features/intro.md index e91fa58d..77fd08ee 100644 --- a/src/cargo/reference/features/intro.md +++ b/src/cargo/reference/features/intro.md @@ -25,7 +25,7 @@ pub mod webp; 在 `Cargo.toml` 中定义的 `feature` 会被 `Cargo` 通过命令行参数 `--cfg` 传给 `rustc`,最终由后者完成编译:`rustc --cfg ...`。若项目中的代码想要测试 `feature` 是否存在,可以使用 [`cfg` 属性](https://doc.rust-lang.org/stable/reference/conditional-compilation.html#the-cfg-attribute)或 [`cfg` 宏](https://doc.rust-lang.org/stable/std/macro.cfg.html)。 -之前我们提到了一个 `feature` 还可以开启其他 `feature`,举个例子,例如 `ICO` 图片格式包含 `BMP` 和 `PNG`,因此当 `ICO` 图片格式被启用后,它还得确保启用 `BMP` 和 `PNG` 格式: +之前我们提到了一个 `feature` 还可以开启其他 `feature`,举个例子,例如 ICO 图片格式包含 BMP 和 PNG 格式,因此当 `ico` 被启用后,它还得确保启用 `bmp` 和 `png` : ```toml [features] @@ -70,11 +70,11 @@ webp = [] gif = { version = "0.11.1", optional = true } ``` -**这种可选依赖的写法会自动定义一个与依赖同名的 feature,也就是 `gif` feature**,这样一来,当我们启用 `gif` feautre 时,该依赖库也会被自动引入并启用:例如通过 `--feature gif` 的方式启用 feauture。 +**这种可选依赖的写法会自动定义一个与依赖同名的 feature,也就是 `gif` feature**,这样一来,当我们启用 `gif` feature 时,该依赖库也会被自动引入并启用:例如通过 `--feature gif` 的方式启用 feature 。 -> 注意:目前来说,`[fetuare]` 中定义的 feature 还不能与已引入的依赖库同名。但是在 `nightly` 中已经提供了实验性的功能用于改变这一点: [namespaced features](https://doc.rust-lang.org/stable/cargo/reference/unstable.html#namespaced-features) +> 注意:目前来说,`[feature]` 中定义的 feature 还不能与已引入的依赖库同名。但是在 `nightly` 中已经提供了实验性的功能用于改变这一点: [namespaced features](https://doc.rust-lang.org/stable/cargo/reference/unstable.html#namespaced-features) -当然,**我们还可以通过显式定义 feature 的方式来启用这些可选依赖库**,例如为了支持 `AVIF` 图片格式,我们需要引入两个依赖包,由于 `AVIF` 是通过 feature 引入的可选格式,因此它依赖的两个包也必须声明为可选的: +当然,**我们还可以通过显式定义 feature 的方式来启用这些可选依赖库**,例如为了支持 AVIF 图片格式,我们需要引入两个依赖包,由于 `avif` 是通过 feature 引入的可选格式,因此它依赖的两个包也必须声明为可选的: ```toml [dependencies] @@ -91,7 +91,7 @@ avif = ["ravif", "rgb"] ## 依赖库自身的 feature -就像我们的项目可以定义 `feature` 一样,依赖库也可以定义它自己的 feature、也有需要启用的 feature 列表,当引入该依赖库时,我们可以通过以下方式为其启用相关的 features : +就像我们的项目可以定义 `feature` 一样,依赖库也可以定义它自己的 `feature`,也有需要启用的 `feature` 列表,当引入该依赖库时,我们可以通过以下方式为其启用相关的 `features` : ```toml [dependencies] @@ -109,7 +109,7 @@ flate2 = { version = "1.0.3", default-features = false, features = ["zlib"] } > 注意:这种方式未必能成功禁用 `default`,原因是可能会有其它依赖也引入了 `flate2`,并且没有对 `default` 进行禁用,那此时 `default` 依然会被启用。 > -> 查看下文的 [feature 同一化](#feature同一化) 获取更多信息 +> 查看下文的 [feature 同一化](#feature-同一化) 获取更多信息 除此之外,还能通过下面的方式来间接开启依赖库的 feature : @@ -134,7 +134,7 @@ parallel = ["jpeg-decoder/rayon"] - `--features FEATURES`: 启用给出的 feature 列表,可以使用逗号或空格进行分隔,若你是在终端中使用,还需要加上双引号,例如 `--features "foo bar"`。 若在工作空间中构建多个 `package`,可以使用 `package-name/feature-name` 为特定的成员启用 features - `--all-features`: 启用命令行上所选择的所有包的所有 features -- `--no-default-features`: 对选择的包禁用 `default` featue +- `--no-default-features`: 对选择的包禁用 `default` feature ## feature 同一化 @@ -150,7 +150,7 @@ parallel = ["jpeg-decoder/rayon"] 例如,如果我们想可选的支持 `no_std` 环境(不使用标准库),那么有两种做法: -- 默认代码使用标准库的,当该 `no_std` feature 启用时,禁用相关的标准库代码 +- 默认代码使用标准库的,当 `no_std` feature 启用时,禁用相关的标准库代码 - 默认代码使用非标准库的,当 `std` feature 启用时,才使用标准库的代码 前者就是功能削减,与之相对,后者是功能添加,根据之前的内容,我们应该选择后者的做法: @@ -203,7 +203,7 @@ test_cargo v0.1.0 (/Users/sunfei/development/rust/demos/test_cargo) `cargo tree -f "{p} {f}"` 命令会提供一个更加紧凑的视图: ```shell -% cargo tree -f "{p} {f}" +$ cargo tree -f "{p} {f}" test_cargo v0.1.0 (/Users/sunfei/development/rust/demos/test_cargo) └── uuid v0.8.2 default,std ``` @@ -211,7 +211,7 @@ test_cargo v0.1.0 (/Users/sunfei/development/rust/demos/test_cargo) `cargo tree -e features -i foo`,该命令会显示 `features` 会如何"流入"指定的包 `foo` 中: ```shell -cargo tree -e features -i uuid +$ cargo tree -e features -i uuid uuid v0.8.2 ├── uuid feature "default" │ └── test_cargo v0.1.0 (/Users/sunfei/development/rust/demos/test_cargo) @@ -238,8 +238,8 @@ resolver = "2" V2 版本的解析器可以在某些情况下避免 feature 同一化的发生,具体的情况在[这里](https://doc.rust-lang.org/stable/cargo/reference/resolver.html#feature-resolver-version-2)有描述,下面做下简单的总结: - 为特定平台开启的 `features` 且此时并没有被构建,会被忽略 -- `Build-dependencies` 和 `proc-macros` 不再跟普通的依赖共享 `features` -- `Dev-dependencies` 的 `features` 不会被启用,除非正在构建的对象需要它们(例如测试对象、示例对象等) +- `build-dependencies` 和 `proc-macros` 不再跟普通的依赖共享 `features` +- `dev-dependencies` 的 `features` 不会被启用,除非正在构建的对象需要它们(例如测试对象、示例对象等) 对于部分场景而言,feature 同一化确实是需要避免的,例如,一个构建依赖开启了 `std` feature,而同一个依赖又被用于 `no_std` 环境,很明显,开启 `std` 将导致错误的发生。 @@ -249,7 +249,7 @@ V2 版本的解析器可以在某些情况下避免 feature 同一化的发生 ## 构建脚本 -[构建脚本](https://course.rs/cargo/reference/build-script/intro.html)可以通过 `CARGO_FEATURE_` 环境变量获取启用的 `feauture` 列表,其中 `` 是 feature 的名称,该名称被转换成大全写字母,且 `-` 被转换为 `_`。 +[构建脚本](https://course.rs/cargo/reference/build-script/intro.html)可以通过 `CARGO_FEATURE_` 环境变量获取启用的 `feature` 列表,其中 `` 是 feature 的名称,该名称被转换成大全写字母,且 `-` 被转换为 `_`。 ## required-features @@ -257,14 +257,14 @@ V2 版本的解析器可以在某些情况下避免 feature 同一化的发生 ## SemVer 兼容性 -启用一个 feautre 不应该引入一个不兼容 SemVer 的改变。例如,启用的 feature 不应该改变现有的 API,因为这会给用户造成不兼容的破坏性变更。 如果大家想知道哪些变化是兼容的,可以参见[官方文档](https://doc.rust-lang.org/stable/cargo/reference/semver.html)。 +启用一个 feature 不应该引入一个不兼容 SemVer 的改变。例如,启用的 feature 不应该改变现有的 API,因为这会给用户造成不兼容的破坏性变更。 如果大家想知道哪些变化是兼容的,可以参见[官方文档](https://doc.rust-lang.org/stable/cargo/reference/semver.html)。 总之,在新增/移除 feature 或可选依赖时,你需要小心,因此这些可能会造成向后不兼容性。更多信息参见[这里](https://doc.rust-lang.org/stable/cargo/reference/semver.html#cargo),简单总结如下: - 在发布 `minor` 版本时,以下通常是安全的: - [新增 feature](https://doc.rust-lang.org/stable/cargo/reference/semver.html#cargo-feature-add) 或[可选依赖](https://doc.rust-lang.org/stable/cargo/reference/semver.html#cargo-dep-add) - [修改某个依赖的 features](https://doc.rust-lang.org/stable/cargo/reference/semver.html#cargo-change-dep-feature) -- 在发布 `minor` 时,以下操作应该避免: +- 在发布 `minor` 版本时,以下操作应该避免: - [移除 feature](https://doc.rust-lang.org/stable/cargo/reference/semver.html#cargo-feature-remove) 或[可选依赖](https://doc.rust-lang.org/stable/cargo/reference/semver.html#cargo-remove-opt-dep) - [将现有的公有代码放在某个 feature 之后](https://doc.rust-lang.org/stable/cargo/reference/semver.html#cargo-remove-opt-dep) - [从 feature 列表中移除一个 feature](https://doc.rust-lang.org/stable/cargo/reference/semver.html#cargo-feature-remove-another) diff --git a/src/cargo/reference/manifest.md b/src/cargo/reference/manifest.md index 5dccea4b..f1df2936 100644 --- a/src/cargo/reference/manifest.md +++ b/src/cargo/reference/manifest.md @@ -26,28 +26,28 @@ - [`publish`](#the-publish-field) — 用于阻止项目的发布 - [`metadata`](#metadata) — 额外的配置信息,用于提供给外部工具 - [`default-run`](#default-run) — [`cargo run`] 所使用的默认可执行文件( binary ) - - [`autobins`](cargo-target.md#对象自动发现) — 禁止可执行文件的自动发现 - - [`autoexamples`](cargo-target.md#对象自动发现) — 禁止示例文件的自动发现 - - [`autotests`](cargo-target.md#对象自动发现) — 禁止测试文件的自动发现 - - [`autobenches`](cargo-target.md#对象自动发现) — 禁止 bench 文件的自动发现 + - [`autobins`](https://course.rs/cargo/reference/cargo-target.html#对象自动发现) — 禁止可执行文件的自动发现 + - [`autoexamples`](https://course.rs/cargo/reference/cargo-target.html#对象自动发现) — 禁止示例文件的自动发现 + - [`autotests`](https://course.rs/cargo/reference/cargo-target.html#对象自动发现) — 禁止测试文件的自动发现 + - [`autobenches`](https://course.rs/cargo/reference/cargo-target.html#对象自动发现) — 禁止 bench 文件的自动发现 - [`resolver`](resolver.md#resolver-versions) — 设置依赖解析器( dependency resolver) -- Cargo Target 列表: (查看 [Target 配置](cargo-target.md#Target配置) 获取详细设置) - - [`[lib]`](./cargo-target.md#库对象library) — Library target 设置. - - [`[[bin]]`](cargo-target.md#二进制对象binaries) — Binary target 设置. - - [`[[example]]`](cargo-target.md#示例对象examples) — Example target 设置. - - [`[[test]]`](cargo-target.md#测试对象tests) — Test target 设置. - - [`[[bench]]`](cargo-target.md#基准性能对象benches) — Benchmark target 设置. +- Cargo Target 列表: (查看 [Target 配置](https://course.rs/cargo/reference/cargo-target.html#Target配置) 获取详细设置) + - [`[lib]`](https://course.rs/cargo/reference/cargo-target.html#库对象library) — Library target 设置. + - [`[[bin]]`](https://course.rs/cargo/reference/cargo-target.html#二进制对象binaries) — Binary target 设置. + - [`[[example]]`](https://course.rs/cargo/reference/cargo-target.html#示例对象examples) — Example target 设置. + - [`[[test]]`](https://course.rs/cargo/reference/cargo-target.html#测试对象tests) — Test target 设置. + - [`[[bench]]`](https://course.rs/cargo/reference/cargo-target.html#基准性能对象benches) — Benchmark target 设置. - Dependency tables: - - [`[dependencies]`](specify-deps.md) — 项目依赖包 - - [`[dev-dependencies]`](specify-deps.md#dev-dependencies) — 用于 examples、tests 和 benchmarks 的依赖包 - - [`[build-dependencies]`](specify-deps.md#build-dependencies) — 用于构建脚本的依赖包 - - [`[target]`](specify-deps.md#根据平台引入依赖) — 平台特定的依赖包 + - [`[dependencies]`](https://course.rs/cargo/reference/specify-deps.html) — 项目依赖包 + - [`[dev-dependencies]`](https://course.rs/cargo/reference/specify-deps.html#dev-dependencies) — 用于 examples、tests 和 benchmarks 的依赖包 + - [`[build-dependencies]`](https://course.rs/cargo/reference/specify-deps.html#build-dependencies) — 用于构建脚本的依赖包 + - [`[target]`](https://course.rs/cargo/reference/specify-deps.html#根据平台引入依赖) — 平台特定的依赖包 - [`[badges]`](#badges) — 用于在注册服务(例如 crates.io ) 上显示项目的一些状态信息,例如当前的维护状态:活跃中、寻找维护者、deprecated -- [`[features]`](features.md) — `features` 可以用于条件编译 -- [`[patch]`](deps-overriding.md) — 推荐使用的依赖覆盖方式 -- [`[replace]`](deps-overriding.md#不推荐的replace) — 不推荐使用的依赖覆盖方式 (deprecated). -- [`[profile]`](profiles.md) — 编译器设置和优化 -- [`[workspace]`](workspaces.md) — 工作空间的定义 +- [`[features]`](https://course.rs/cargo/reference/features/intro.html) — `features` 可以用于条件编译 +- [`[patch]`](https://course.rs/cargo/reference/deps-overriding.html) — 推荐使用的依赖覆盖方式 +- [`[replace]`](https://course.rs/cargo/reference/deps-overriding.html#不推荐的replace) — 不推荐使用的依赖覆盖方式 (deprecated). +- [`[profile]`](https://course.rs/cargo/reference/profiles.html) — 编译器设置和优化 +- [`[workspace]`](https://course.rs/cargo/reference/workspaces.html) — 工作空间的定义 下面,我们将对其中一些部分进行详细讲解。 @@ -80,7 +80,7 @@ authors = ["Alice ", "Bob "] #### version -Cargo 使用了[语义化版本控制](https://semver.org)的概念,例如字符串 `"0.1.12"` 是一个 `semver` 格式的版本号,符合 `"x.y.z"` 的形式,其中 `x` 被称为主版本(major), `y` 被称为小版本 `minor` ,而 `z` 被称为 补丁 `patch`,可以看出从左到右,版本的影响范围逐步降低,补丁的更新是无关痛痒的,并不会造成 API 的兼容性被破坏。 +Cargo 使用了[语义化版本控制](https://semver.org)的概念,例如字符串 `"0.1.12"` 是一个 `semver` 格式的版本号,符合 `"x.y.z"` 的形式,其中 `x` 被称为主版本`major`, `y` 被称为小版本 `minor` ,而 `z` 被称为补丁 `patch`,可以看出从左到右,版本的影响范围逐步降低,补丁的更新是无关痛痒的,并不会造成 API 的兼容性被破坏。 使用该规则,你还需要遵循一些基本规则: @@ -160,7 +160,7 @@ documentation = "https://docs.rs/bitflags" #### readme -`readme` 字段指向项目的 `Readme.md` 文件,该文件应该存在项目的根目录下(跟 `Cargo.toml` 同级),用于向用户描述项目的详细信息,支持 `Markdown` 格式。大家看到的 `crates.io` 上的项目首页就是基于该文件的内容进行渲染的。 +`readme` 字段指向项目的 `README.md` 文件,该文件应该存在项目的根目录下(跟 `Cargo.toml` 同级),用于向用户描述项目的详细信息,支持 `Markdown` 格式。大家看到的 `crates.io` 上的项目首页就是基于该文件的内容进行渲染的。 ```toml [package] @@ -184,7 +184,7 @@ homepage = "https://serde.rs/" #### repository -设置项目的源代码仓库地址,例如 `github` 链接: +设置项目的源代码仓库地址,例如 `GitHub` 链接: ```toml [package] @@ -390,9 +390,9 @@ maintenance = { status = "..." } ## [dependencies] -在[之前章节](http://course.rs/cargo/reference/specify-deps.html)中,我们已经详细介绍过 `[dependencies]` 、 `[dev-dependencies]` 和 `[build-dependencies]`,这里就不再赘述。 +在[之前章节](https://course.rs/cargo/reference/specify-deps.html)中,我们已经详细介绍过 `[dependencies]` 、 `[dev-dependencies]` 和 `[build-dependencies]`,这里就不再赘述。 ## [profile.*] -该部分可以对编译器进行配置,例如 debug 和优化,在后续的[编译器优化](http://course.rs/cargo/reference/profiles.html)章节有详细介绍。 +该部分可以对编译器进行配置,例如 debug 和优化,在后续的[编译器优化](https://course.rs/cargo/reference/profiles.html)章节有详细介绍。 diff --git a/src/cargo/reference/profiles.md b/src/cargo/reference/profiles.md index 9c407225..4bbcdabb 100644 --- a/src/cargo/reference/profiles.md +++ b/src/cargo/reference/profiles.md @@ -25,7 +25,7 @@ overflow-checks = false # 关闭整数溢出检查 需要注意的是,每一种 profile 都可以单独的进行设置,例如上面的 `[profile.dev]`。 -如果是工作空间的话,只有根 package 的 `Cargo.toml` 中的 `[profile` 设置才会被使用,其它成员或依赖包中的设置会被自动忽略。 +如果是工作空间的话,只有根 package 的 `Cargo.toml` 中的 `[profile]` 设置才会被使用,其它成员或依赖包中的设置会被自动忽略。 另外,profile 还能在 Cargo 自身的配置文件中进行覆盖,总之,通过 `.cargo/config.toml` 或环境变量的方式所指定的 `profile` 配置会覆盖项目的 `Cargo.toml` 中相应的配置。 @@ -126,9 +126,9 @@ cargo build --profile release-lto 支持的选项包括: -- `false`: 只会对代码生成单元中的本地包进行 `thin LTO` 优化,若代码生成单元数为 1 或者 `opt-level` 为 0,则不会进行任何 LTO 优化 -- `true` 或 `fat`:对依赖图中的所有包进行 `fat LTO` 优化 -- `thin`:对依赖图的所有包进行 [`thin LTO`](http://blog.llvm.org/2016/06/thinlto-scalable-and-incremental-lto.html),相比 `fat` 来说,它仅牺牲了一点性能,但是换来了链接时间的可观减少 +- `false`: 只会对代码生成单元中的本地包进行 `"thin" LTO` 优化,若代码生成单元数为 1 或者 `opt-level` 为 0,则不会进行任何 LTO 优化 +- `true` 或 `"fat"`:对依赖图中的所有包进行 `"fat" LTO` 优化 +- `"thin"`:对依赖图的所有包进行 [`"thin" LTO`](http://blog.llvm.org/2016/06/thinlto-scalable-and-incremental-lto.html),相比 `"fat"` 来说,它仅牺牲了一点性能,但是换来了链接时间的可观减少 - `off`: 禁用 LTO 如果大家想了解跨语言 LTO,可以看下 [-C linker-plugin-lto](https://doc.rust-lang.org/stable/rustc/codegen-options/index.html#linker-plugin-lto) 标志。 diff --git a/src/cargo/reference/publishing-on-crates.io.md b/src/cargo/reference/publishing-on-crates.io.md index d10b4ce3..b4f36108 100644 --- a/src/cargo/reference/publishing-on-crates.io.md +++ b/src/cargo/reference/publishing-on-crates.io.md @@ -1,12 +1,12 @@ # 发布到 crates.io -如果你想要把自己的开源项目分享给全世界,那最好的办法自然是 github。但如果是 Rust 的库,那除了发布到 github 外,我们还可以将其发布到 [crates.io](https://crates.io) 上,然后其它用户就可以很简单的对其进行引用。 +如果你想要把自己的开源项目分享给全世界,那最好的办法自然是 GitHub。但如果是 Rust 的库,那除了发布到 GitHub 外,我们还可以将其发布到 [crates.io](https://crates.io) 上,然后其它用户就可以很简单的对其进行引用。 > 注意:发布包到 `crates.io` 后,特定的版本无法被覆盖,要发布就必须使用新的版本号,代码也无法被删除! ## 首次发布之前 -**首先,我们需要一个账号**:访问 crates.io 的[主页](https://crates.io),然后在右上角使用 Github 账户登陆,接着访问你的[账户设置](https://crates.io/settings/profile)页面,进入到 API Tokens 标签页下,生成新的 Token,并使用该 Token 在终端中进行登录: +**首先,我们需要一个账号**:访问 crates.io 的[主页](https://crates.io),然后在右上角使用 GitHub 账户登陆,接着访问你的[账户设置](https://crates.io/settings/profile)页面,进入到 API Tokens 标签页下,生成新的 Token,并使用该 Token 在终端中进行登录: ```shell $ cargo login abcdefghijklmnopqrstuvwxyz012345 @@ -52,7 +52,7 @@ $ cargo publish --dry-run 你可以在 `target/package` 目录下观察生成的 `.crate` 文件。例如,目前 `crates.io` 要求该文件的大小不能超过 10MB,你可以通过手动检查该文件的大小来确保不会无意间打包进一些较大的资源文件,比如测试数据、网站文档或生成的代码等。我们还可以使用以下命令来检查其中包含的文件: ```shell -$cargo package --list +$ cargo package --list ``` 当打包时,Cargo 会自动根据版本控制系统的配置来忽略指定的文件,例如 `.gitignore`。除此之外,你还可以通过 [`exclude`](https://course.rs/cargo/reference/manifest.html#exclude和include) 来排除指定的文件: @@ -123,12 +123,12 @@ $ cargo owner --add github:rust-lang:owners $ cargo owner --remove github:rust-lang:owners ``` -命令中使用的 ownerID 必须是 Github 用户名或 Team 名。 +命令中使用的 ownerID 必须是 GitHub 用户名或 Team 名。 一旦一个用户 `B` 通过 `--add` 被加入到 `owner` 列表中,他将拥有该包相关的所有权利。例如发布新版本、yank 一个版本,还能增加和移除 owner,包含添加 `B` 为 owner 的 `A` 都可以被移除! 因此,我们必须严肃的指出:**不要将你不信任的人添加为 owner !** 免得哪天反目成仇后,他把你移除了 - , - -但是对于 Team 又有所不同,通过 `-add` 添加的 Github Team owner,只拥有受限的权利。它们可以发布或 yank 某个版本,但是他们**不能添加或移除** owner!总之,Team 除了可以很方便的管理所有者分组的同时,还能防止一些未知的恶意。 +但是对于 Team 又有所不同,通过 `-add` 添加的 GitHub Team owner,只拥有受限的权利。它们可以发布或 yank 某个版本,但是他们**不能添加或移除** owner!总之,Team 除了可以很方便的管理所有者分组的同时,还能防止一些未知的恶意。 如果大家在添加 team 时遇到问题,可以看看官方的[相关文档](https://doc.rust-lang.org/stable/cargo/reference/publishing.html#github-permissions),由于绝大多数人都无需此功能,因此这里不再详细展开。 diff --git a/src/cargo/reference/specify-deps.md b/src/cargo/reference/specify-deps.md index 5dc239a2..93f4d140 100644 --- a/src/cargo/reference/specify-deps.md +++ b/src/cargo/reference/specify-deps.md @@ -1,6 +1,6 @@ # 指定依赖项 -我们的项目可以引用在 `crates.io` 或 `github` 上的依赖包,也可以引用存放在本地文件系统中的依赖包。 +我们的项目可以引用在 `crates.io` 或 `GitHub` 上的依赖包,也可以引用存放在本地文件系统中的依赖包。 大家可能会想,直接从前两个引用即可,为何还提供了本地方式?可以设想下,如果你要有一个正处于开发中的包,然后需要在本地的另一个项目中引用测试,那是将该包先传到网上,然后再引用简单,还是直接从本地路径的方式引用简单呢?答案显然不言而喻。 @@ -15,13 +15,13 @@ time = "0.1.12" ``` -字符串 `"0.1.12"` 是一个 [`semver`](https://semver.org) 格式的版本号,符合 `"x.y.z"` 的形式,其中 `x` 被称为主版本(major), `y` 被称为小版本 `minor` ,而 `z` 被称为 补丁 `patch`,可以看出从左到右,版本的影响范围逐步降低,补丁的更新是无关痛痒的,并不会造成 API 的兼容性被破坏。 +字符串 `"0.1.12"` 是一个 [`semver`](https://semver.org) 格式的版本号,符合 `"x.y.z"` 的形式,其中 `x` 被称为主版本`major`, `y` 被称为小版本 `minor` ,而 `z` 被称为补丁 `patch`,可以看出从左到右,版本的影响范围逐步降低,补丁的更新是无关痛痒的,并不会造成 API 的兼容性被破坏。 `"0.1.12"` 中并没有任何额外的符号,在版本语义上,它跟使用了 `^` 的 `"^0.1.12"` 是相同的,都是指定非常具体的版本进行引入。 但是 `^` 能做的更多。 -> npm 使用的就是 `semver` 版本号,从 JS 过来的同学应该非常熟悉。 +> npm 使用的就是 `semver` 版本号,从 `JavaScript` 过来的同学应该非常熟悉。 #### `^` 指定版本 @@ -83,7 +83,7 @@ time = "0.1.12" >= 1.2, < 1.5 ``` -需要注意,以上的版本号规则仅仅针对 `crate.io` 和基于它搭建的注册服务(例如科大服务源) ,其它注册服务(例如 github )有自己相应的规则。 +需要注意,以上的版本号规则仅仅针对 `crate.io` 和基于它搭建的注册服务(例如科大服务源) ,其它注册服务(例如 GitHub )有自己相应的规则。 ## 从其它注册服务引入依赖包 @@ -141,7 +141,7 @@ regex = { git = "https://github.com/rust-lang/regex", branch = "next" } 任何非 `tag` 和 `branch` 的类型都可以通过 `rev` 来引入,例如通过最近一次 `commit` 的哈希值引入: `rev = "4c59b707"`,再比如远程仓库提供的的具名引用: `rev = "refs/pull/493/head"`。 -一旦 `git` 依赖被拉取下来,该版本就会被记录到 `Cargo.lock` 中进行锁定。因此 `git` 仓库中后续新的提交不再会被自动拉取,除非你通过 `cargo upadte` 来升级。需要注意的是锁定一旦被删除,那 Cargo 依然会按照 `Cargo.toml` 中配置的地址和版本去拉取新的版本,如果你配置的版本不正确,那可能会拉取下来一个不兼容的新版本! +一旦 `git` 依赖被拉取下来,该版本就会被记录到 `Cargo.lock` 中进行锁定。因此 `git` 仓库中后续新的提交不再会被自动拉取,除非你通过 `cargo update` 来升级。需要注意的是锁定一旦被删除,那 Cargo 依然会按照 `Cargo.toml` 中配置的地址和版本去拉取新的版本,如果你配置的版本不正确,那可能会拉取下来一个不兼容的新版本! **因此不要依赖锁定来完成版本的控制,而应该老老实实的在 `Cargo.toml` 小心配置你希望使用的版本。** diff --git a/src/cargo/reference/workspaces.md b/src/cargo/reference/workspaces.md index ce7f6a70..e3d7b751 100644 --- a/src/cargo/reference/workspaces.md +++ b/src/cargo/reference/workspaces.md @@ -39,7 +39,7 @@ members = [ **对于没有主 `package` 的场景或你希望将所有的 `package` 组织在单独的目录中时,这种方式就非常适合。** -例如 [rust-analyzer](https://github.com/rust-analyzer/rust-analyzer) 就是这样的项目,它的根目录中的 `Cargo.toml` 中并没有 `[package]`,说明该根目录不是一个 `package`,但是却有 `[workspacke]` : +例如 [rust-analyzer](https://github.com/rust-analyzer/rust-analyzer) 就是这样的项目,它的根目录中的 `Cargo.toml` 中并没有 `[package]`,说明该根目录不是一个 `package`,但是却有 `[workspace]` : ```toml [workspace] diff --git a/src/cases/cmd.md b/src/cases/cmd.md deleted file mode 100644 index ed9e9191..00000000 --- a/src/cases/cmd.md +++ /dev/null @@ -1 +0,0 @@ -# 命令行 diff --git a/src/cases/config.md b/src/cases/config.md deleted file mode 100644 index 33eb3d73..00000000 --- a/src/cases/config.md +++ /dev/null @@ -1 +0,0 @@ -# 配置文件 todo diff --git a/src/cases/crypto.md b/src/cases/crypto.md deleted file mode 100644 index f9455099..00000000 --- a/src/cases/crypto.md +++ /dev/null @@ -1 +0,0 @@ -# 加密解密 todo diff --git a/src/cases/database.md b/src/cases/database.md deleted file mode 100644 index de785679..00000000 --- a/src/cases/database.md +++ /dev/null @@ -1 +0,0 @@ -# 数据库访问 todo diff --git a/src/cases/date.md b/src/cases/date.md deleted file mode 100644 index a434528a..00000000 --- a/src/cases/date.md +++ /dev/null @@ -1 +0,0 @@ -# 时间日期 diff --git a/src/cases/dev/intro.md b/src/cases/dev/intro.md deleted file mode 100644 index f0cc50f0..00000000 --- a/src/cases/dev/intro.md +++ /dev/null @@ -1 +0,0 @@ -# 开发调试 diff --git a/src/cases/dev/logs.md b/src/cases/dev/logs.md deleted file mode 100644 index 65c2dbdd..00000000 --- a/src/cases/dev/logs.md +++ /dev/null @@ -1 +0,0 @@ -# 日志 diff --git a/src/cases/dev/profile.md b/src/cases/dev/profile.md deleted file mode 100644 index 124678e8..00000000 --- a/src/cases/dev/profile.md +++ /dev/null @@ -1 +0,0 @@ -# 性能分析 diff --git a/src/cases/encoding/csv.md b/src/cases/encoding/csv.md deleted file mode 100644 index 19f2031e..00000000 --- a/src/cases/encoding/csv.md +++ /dev/null @@ -1 +0,0 @@ -# CSV diff --git a/src/cases/encoding/intro.md b/src/cases/encoding/intro.md deleted file mode 100644 index 0e61f3d0..00000000 --- a/src/cases/encoding/intro.md +++ /dev/null @@ -1 +0,0 @@ -# 编解码 diff --git a/src/cases/encoding/json.md b/src/cases/encoding/json.md deleted file mode 100644 index 02ed5a24..00000000 --- a/src/cases/encoding/json.md +++ /dev/null @@ -1 +0,0 @@ -# JSON diff --git a/src/cases/encoding/protobuf.md b/src/cases/encoding/protobuf.md deleted file mode 100644 index 4fdb7ce0..00000000 --- a/src/cases/encoding/protobuf.md +++ /dev/null @@ -1 +0,0 @@ -# protobuf diff --git a/src/cases/file/dir.md b/src/cases/file/dir.md deleted file mode 100644 index c996c7a0..00000000 --- a/src/cases/file/dir.md +++ /dev/null @@ -1 +0,0 @@ -# 目录操作 diff --git a/src/cases/file/file.md b/src/cases/file/file.md deleted file mode 100644 index 9286f56a..00000000 --- a/src/cases/file/file.md +++ /dev/null @@ -1 +0,0 @@ -# 文件读写 diff --git a/src/cases/file/intro.md b/src/cases/file/intro.md deleted file mode 100644 index 0f8e6d56..00000000 --- a/src/cases/file/intro.md +++ /dev/null @@ -1 +0,0 @@ -# 文件系统 todo diff --git a/src/cases/intro.md b/src/cases/intro.md deleted file mode 100644 index c6b7d124..00000000 --- a/src/cases/intro.md +++ /dev/null @@ -1 +0,0 @@ -# 场景化用例 diff --git a/src/cases/protocol/grpc.md b/src/cases/protocol/grpc.md deleted file mode 100644 index 37b724e9..00000000 --- a/src/cases/protocol/grpc.md +++ /dev/null @@ -1 +0,0 @@ -# gRPC diff --git a/src/cases/protocol/http.md b/src/cases/protocol/http.md deleted file mode 100644 index 03fe6a2d..00000000 --- a/src/cases/protocol/http.md +++ /dev/null @@ -1 +0,0 @@ -# HTTP diff --git a/src/cases/protocol/intro.md b/src/cases/protocol/intro.md deleted file mode 100644 index aaab51db..00000000 --- a/src/cases/protocol/intro.md +++ /dev/null @@ -1 +0,0 @@ -# 网络通信 todo diff --git a/src/cases/protocol/tcp.md b/src/cases/protocol/tcp.md deleted file mode 100644 index fd208cbf..00000000 --- a/src/cases/protocol/tcp.md +++ /dev/null @@ -1 +0,0 @@ -# TCP diff --git a/src/cases/protocol/udp.md b/src/cases/protocol/udp.md deleted file mode 100644 index 2827b96c..00000000 --- a/src/cases/protocol/udp.md +++ /dev/null @@ -1 +0,0 @@ -# UDP diff --git a/src/cases/regexp.md b/src/cases/regexp.md deleted file mode 100644 index b79ef0b1..00000000 --- a/src/cases/regexp.md +++ /dev/null @@ -1 +0,0 @@ -# 正则表达式 todo diff --git a/src/fight-with-compiler/borrowing/borrow-distinct-fields-of-struct.md b/src/compiler/fight-with-compiler/borrowing/borrow-distinct-fields-of-struct.md similarity index 100% rename from src/fight-with-compiler/borrowing/borrow-distinct-fields-of-struct.md rename to src/compiler/fight-with-compiler/borrowing/borrow-distinct-fields-of-struct.md diff --git a/src/fight-with-compiler/borrowing/intro.md b/src/compiler/fight-with-compiler/borrowing/intro.md similarity index 100% rename from src/fight-with-compiler/borrowing/intro.md rename to src/compiler/fight-with-compiler/borrowing/intro.md diff --git a/src/fight-with-compiler/borrowing/ref-exist-in-out-fn.md b/src/compiler/fight-with-compiler/borrowing/ref-exist-in-out-fn.md similarity index 100% rename from src/fight-with-compiler/borrowing/ref-exist-in-out-fn.md rename to src/compiler/fight-with-compiler/borrowing/ref-exist-in-out-fn.md diff --git a/src/fight-with-compiler/intro.md b/src/compiler/fight-with-compiler/intro.md similarity index 100% rename from src/fight-with-compiler/intro.md rename to src/compiler/fight-with-compiler/intro.md diff --git a/src/fight-with-compiler/lifetime/closure-with-static.md b/src/compiler/fight-with-compiler/lifetime/closure-with-static.md similarity index 92% rename from src/fight-with-compiler/lifetime/closure-with-static.md rename to src/compiler/fight-with-compiler/lifetime/closure-with-static.md index cfd829ce..c5e00479 100644 --- a/src/fight-with-compiler/lifetime/closure-with-static.md +++ b/src/compiler/fight-with-compiler/lifetime/closure-with-static.md @@ -69,7 +69,7 @@ error[E0310]: the parameter type `impl Fn(&str) -> Res` may not live long enough callback: Option Res>>, ``` -众所周知,闭包跟哈姆雷特一样,每一个都有[自己的类型](../../advance/functional-programing/closure.md#闭包作为函数返回值),因此我们无法通过类型标注的方式来声明一个闭包,那么只有一个办法,就是使用特征对象,因此上面代码中,通过`Box`的方式把闭包特征封装成一个特征对象。 +众所周知,闭包跟哈姆雷特一样,每一个都有[自己的类型](https://course.rs/advance/functional-programing/closure.html#闭包作为函数返回值),因此我们无法通过类型标注的方式来声明一个闭包,那么只有一个办法,就是使用特征对象,因此上面代码中,通过`Box`的方式把闭包特征封装成一个特征对象。 ## 深入挖掘报错原因 @@ -89,7 +89,7 @@ struct Foo<'a> { }; ``` -除非`x`字段借用了`'static`的引用,否则`'a`肯定比`'static`要小,那么该结构体实例的生命周期肯定不是`'static`: `'a: 'static`的限制不会被满足([HRTB](../../advance/lifetime/advance.md#生命周期约束HRTB))。 +除非`x`字段借用了`'static`的引用,否则`'a`肯定比`'static`要小,那么该结构体实例的生命周期肯定不是`'static`: `'a: 'static`的限制不会被满足([HRTB](https://course.rs/advance/lifetime/advance.html#生命周期约束HRTB))。 对于特征对象来说,它没有包含非`'static`的引用,因此它隐式的具有`'static`生命周期, `Box`就跟`Box`是等价的。 diff --git a/src/fight-with-compiler/lifetime/intro.md b/src/compiler/fight-with-compiler/lifetime/intro.md similarity index 100% rename from src/fight-with-compiler/lifetime/intro.md rename to src/compiler/fight-with-compiler/lifetime/intro.md diff --git a/src/fight-with-compiler/lifetime/loop.md b/src/compiler/fight-with-compiler/lifetime/loop.md similarity index 99% rename from src/fight-with-compiler/lifetime/loop.md rename to src/compiler/fight-with-compiler/lifetime/loop.md index a99c0cb5..3c1355ed 100644 --- a/src/fight-with-compiler/lifetime/loop.md +++ b/src/compiler/fight-with-compiler/lifetime/loop.md @@ -168,7 +168,7 @@ impl A { 我们来逐步深入分析下: -1. 首先为`two`方法增加一下生命周期标识: `fn two<'a>(&'a mut self) -> &'a i32 { .. }`, 这里根据生命周期的[消除规则](../../advance/lifetime/basic.md#三条消除规则)添加的 +1. 首先为`two`方法增加一下生命周期标识: `fn two<'a>(&'a mut self) -> &'a i32 { .. }`, 这里根据生命周期的[消除规则](https://course.rs/advance/lifetime/basic.html#三条消除规则)添加的 2. 根据生命周期标识可知:`two`中返回的`k`的生命周期必须是`'a` 3. 根据第 2 条,又可知:`let k = self.one();`中对`self`的借用生命周期也是`'a` 4. 因为`k`的借用发生在`loop`循环内,因此它需要小于等于循环的生命周期,但是根据之前的推断,它又要大于等于函数的生命周期`'a`,而函数的生命周期又大于等于循环生命周期, diff --git a/src/fight-with-compiler/lifetime/too-long1.md b/src/compiler/fight-with-compiler/lifetime/too-long1.md similarity index 100% rename from src/fight-with-compiler/lifetime/too-long1.md rename to src/compiler/fight-with-compiler/lifetime/too-long1.md diff --git a/src/fight-with-compiler/lifetime/too-long2.md b/src/compiler/fight-with-compiler/lifetime/too-long2.md similarity index 100% rename from src/fight-with-compiler/lifetime/too-long2.md rename to src/compiler/fight-with-compiler/lifetime/too-long2.md diff --git a/src/fight-with-compiler/phantom-data.md b/src/compiler/fight-with-compiler/phantom-data.md similarity index 100% rename from src/fight-with-compiler/phantom-data.md rename to src/compiler/fight-with-compiler/phantom-data.md diff --git a/src/fight-with-compiler/unconstrained.md b/src/compiler/fight-with-compiler/unconstrained.md similarity index 100% rename from src/fight-with-compiler/unconstrained.md rename to src/compiler/fight-with-compiler/unconstrained.md diff --git a/src/compiler/intro.md b/src/compiler/intro.md new file mode 100644 index 00000000..ff079d20 --- /dev/null +++ b/src/compiler/intro.md @@ -0,0 +1 @@ +# 征服编译错误 diff --git a/src/pitfalls/arithmetic-overflow.md b/src/compiler/pitfalls/arithmetic-overflow.md similarity index 100% rename from src/pitfalls/arithmetic-overflow.md rename to src/compiler/pitfalls/arithmetic-overflow.md diff --git a/src/pitfalls/closure-with-lifetime.md b/src/compiler/pitfalls/closure-with-lifetime.md similarity index 100% rename from src/pitfalls/closure-with-lifetime.md rename to src/compiler/pitfalls/closure-with-lifetime.md diff --git a/src/pitfalls/index.md b/src/compiler/pitfalls/index.md similarity index 100% rename from src/pitfalls/index.md rename to src/compiler/pitfalls/index.md diff --git a/src/pitfalls/iterator-everywhere.md b/src/compiler/pitfalls/iterator-everywhere.md similarity index 92% rename from src/pitfalls/iterator-everywhere.md rename to src/compiler/pitfalls/iterator-everywhere.md index 3124087c..55c9fccd 100644 --- a/src/pitfalls/iterator-everywhere.md +++ b/src/compiler/pitfalls/iterator-everywhere.md @@ -39,7 +39,7 @@ fn count(self) -> usize ## 迭代器回顾 -在[迭代器](../advance/functional-programing/iterator.md#消费者与适配器)章节中,我们曾经学习过两个概念:迭代器适配器和消费者适配器,前者用于对迭代器中的元素进行操作,最终生成一个新的迭代器,例如`map`、`filter`等方法;而后者用于消费掉迭代器,最终产生一个结果,例如`collect`方法, 一个典型的示例如下: +在[迭代器](https://course.rs/advance/functional-programing/iterator.html#消费者与适配器)章节中,我们曾经学习过两个概念:迭代器适配器和消费者适配器,前者用于对迭代器中的元素进行操作,最终生成一个新的迭代器,例如`map`、`filter`等方法;而后者用于消费掉迭代器,最终产生一个结果,例如`collect`方法, 一个典型的示例如下: ```rust let v1: Vec = vec![1, 2, 3]; diff --git a/src/pitfalls/lazy-iterators.md b/src/compiler/pitfalls/lazy-iterators.md similarity index 92% rename from src/pitfalls/lazy-iterators.md rename to src/compiler/pitfalls/lazy-iterators.md index a8d9707e..5d51d2e0 100644 --- a/src/pitfalls/lazy-iterators.md +++ b/src/compiler/pitfalls/lazy-iterators.md @@ -53,7 +53,7 @@ println!("{:?}",resolvers); ## 回顾下迭代器 -在迭代器章节中,我们曾经提到过,迭代器的[适配器](../advance/functional-programing/iterator.md#消费者与适配器)分为两种:消费者适配器和迭代器适配器,前者用来将一个迭代器变为指定的集合类型,往往通过`collect`实现;后者用于生成一个新的迭代器,例如上例中的`map`。 +在迭代器章节中,我们曾经提到过,迭代器的[适配器](https://course.rs/advance/functional-programing/iterator.html#消费者与适配器)分为两种:消费者适配器和迭代器适配器,前者用来将一个迭代器变为指定的集合类型,往往通过`collect`实现;后者用于生成一个新的迭代器,例如上例中的`map`。 还提到过非常重要的一点: **迭代器适配器都是懒惰的,只有配合消费者适配器使用时,才会进行求值**. diff --git a/src/pitfalls/main-with-channel-blocked.md b/src/compiler/pitfalls/main-with-channel-blocked.md similarity index 100% rename from src/pitfalls/main-with-channel-blocked.md rename to src/compiler/pitfalls/main-with-channel-blocked.md diff --git a/src/pitfalls/multiple-mutable-references.md b/src/compiler/pitfalls/multiple-mutable-references.md similarity index 100% rename from src/pitfalls/multiple-mutable-references.md rename to src/compiler/pitfalls/multiple-mutable-references.md diff --git a/src/pitfalls/stack-overflow.md b/src/compiler/pitfalls/stack-overflow.md similarity index 100% rename from src/pitfalls/stack-overflow.md rename to src/compiler/pitfalls/stack-overflow.md diff --git a/src/pitfalls/the-disabled-mutability.md b/src/compiler/pitfalls/the-disabled-mutability.md similarity index 100% rename from src/pitfalls/the-disabled-mutability.md rename to src/compiler/pitfalls/the-disabled-mutability.md diff --git a/src/pitfalls/use-vec-in-for.md b/src/compiler/pitfalls/use-vec-in-for.md similarity index 100% rename from src/pitfalls/use-vec-in-for.md rename to src/compiler/pitfalls/use-vec-in-for.md diff --git a/src/compiler/pitfalls/utf8-performance.md b/src/compiler/pitfalls/utf8-performance.md new file mode 100644 index 00000000..74712ab3 --- /dev/null +++ b/src/compiler/pitfalls/utf8-performance.md @@ -0,0 +1,36 @@ +# 警惕 UTF-8 引发的性能隐患 +大家应该都知道, 虽然 Rust 的字符串 `&str`、`String` 在底层是通过 `Vec` 实现的:字符串数据以字节数组的形式存在堆上,但在使用时,它们都是 UTF-8 编码的,例如: +```rust +fn main() { + let s: &str = "中国人"; + for c in s.chars() { + println!("{}", c) // 依次输出:中 、 国 、 人 + } + + let c = &s[0..3]; // 1. "中" 在 UTF-8 中占用 3 个字节 2. Rust 不支持字符串索引,因此只能通过切片的方式获取 "中" + assert_eq!(c, "中"); +} +``` + +从上述代码,可以很清晰看出,Rust 的字符串确实是 UTF-8 编码的,这就带来一个隐患:可能在某个转角,你就会遇到来自糟糕性能的示爱。 + +## 问题描述 & 解决 +例如我们尝试写一个词法解析器,里面用到了以下代码 `self.source.chars().nth(self.index).unwrap();` 去获取下一个需要处理的字符,大家可能会以为 `.nth` 的访问应该非常快吧?事实上它确实很快,但是并不妨碍这段代码在循环处理 70000 长度的字符串时,需要消耗 5s 才能完成! + +这么看来,唯一的问题就在于 `.chars()` 上了。 + +其实原因很简单,简单到我们不需要用代码来说明,只需要文字描述即可传达足够的力量:每一次循环时,`.chars().nth(index)` 都需要对字符串进行一次 UTF-8 解析,这个解析实际上是相当昂贵的,特别是当配合循环时,算法的复杂度就是平方级的。 + +既然找到原因,那解决方法也很简单:只要将 `self.source.chars()` 的迭代器存储起来就行,这样每次 `.nth` 调用都会复用已经解析好的迭代器,而不是重新去解析一次 UTF-8 字符串。 + +当然,我们还可以使用三方库来解决这个问题,例如 [str_indices](https://crates.io/crates/str_indices)。 + +## 总结 +最终的优化结果如下: + +- 保存迭代器后: 耗时 `5s` -> `4ms` +- 进一步使用 `u8` 字节数组来替换 `char`,最后使用 `String::from_utf8` 来构建 UTF-8 字符串: 耗时 `4ms` -> `400us` + +**肉眼可见的巨大提升,12500 倍!** + +总之,我们在热点路径中使用字符串做 UTF-8 的相关操作时,就算不提前优化,也要做到心里有数,这样才能在问题发生时,进退自如。 \ No newline at end of file diff --git a/src/pitfalls/weird-ranges.md b/src/compiler/pitfalls/weird-ranges.md similarity index 100% rename from src/pitfalls/weird-ranges.md rename to src/compiler/pitfalls/weird-ranges.md diff --git a/src/confonding/pointer.md b/src/confonding/pointer.md deleted file mode 100644 index 146132f8..00000000 --- a/src/confonding/pointer.md +++ /dev/null @@ -1 +0,0 @@ -# 原生指针、引用和智能指针 todo diff --git a/src/errorindex/borrowing/intro.md b/src/errorindex/borrowing/intro.md deleted file mode 100644 index fcc4d744..00000000 --- a/src/errorindex/borrowing/intro.md +++ /dev/null @@ -1 +0,0 @@ -# 所有权和借用 diff --git a/src/errorindex/intro.md b/src/errorindex/intro.md deleted file mode 100644 index 7258196c..00000000 --- a/src/errorindex/intro.md +++ /dev/null @@ -1,3 +0,0 @@ -# 复杂错误索引 - -读者可以在本章中通过错误前缀来索引查询相应的解决方案,简单的错误并不在本章的内容范畴之内。 \ No newline at end of file diff --git a/src/errorindex/lifetime/intro.md b/src/errorindex/lifetime/intro.md deleted file mode 100644 index b859823e..00000000 --- a/src/errorindex/lifetime/intro.md +++ /dev/null @@ -1 +0,0 @@ -# 生命周期 todo diff --git a/src/first-try/cargo.md b/src/first-try/cargo.md index a008da22..738dcec4 100644 --- a/src/first-try/cargo.md +++ b/src/first-try/cargo.md @@ -114,7 +114,7 @@ $ cargo check Finished dev [unoptimized + debuginfo] target(s) in 0.06s ``` -> Rust 虽然编译速度还行,但是还是不能 Go 语言相提并论,因为 Rust 需要做很多复杂的编译优化和语言特性解析,甚至连如何优化编译速度都成了一门学问: [优化编译速度](../profiling/compiler/speed-up.md) +> Rust 虽然编译速度还行,但是还是不能 Go 语言相提并论,因为 Rust 需要做很多复杂的编译优化和语言特性解析,甚至连如何优化编译速度都成了一门学问: [优化编译速度](https://course.rs/profiling/compiler/speed-up.html) ## Cargo.toml 和 Cargo.lock @@ -165,6 +165,7 @@ geometry = { path = "crates/geometry" } ## 基于 cargo 的项目组织结构 -前文有提到 `cargo` 默认生成的项目结构,真实的项目肯定会有所不同,但是在目前的学习阶段,还无需关注。感兴趣的同学可以移步:[Cargo 项目结构](https://course.rs/cargo/guide/package-layout.html ) +前文有提到 `cargo` 默认生成的项目结构,真实的项目肯定会有所不同,但是在目前的学习阶段,还无需关注。感兴趣的同学可以移步:[Cargo 项目结构](https://course.rs/cargo/guide/package-layout.html) 至此,大家对 Rust 项目的创建和管理已经有了初步的了解,那么来完善刚才的`"世界,你好"`项目吧。 + diff --git a/src/first-try/editor.md b/src/first-try/editor.md index a8770d0b..2a750cd7 100644 --- a/src/first-try/editor.md +++ b/src/first-try/editor.md @@ -46,3 +46,4 @@ 4. `CodeLLDB`, Debugger 程序 好了,至此,VSCode 的配置就已经全部结束,是不是很简单?下面让我们来用 `Cargo` 创建一个 Rust 项目,然后用 VSCode 打开。 + diff --git a/src/first-try/hello-world.md b/src/first-try/hello-world.md index 0d6d39a1..9121320e 100644 --- a/src/first-try/hello-world.md +++ b/src/first-try/hello-world.md @@ -4,9 +4,9 @@ ## 多国语言的"世界,你好" -还记得大明湖畔等你的 [VSCode IDE](./editor.md) 和通过 `Cargo` 创建的 [世界,你好](./cargo.md) 工程吗? +还记得大明湖畔等你的 [VSCode IDE](https://course.rs/first-try/editor.html) 和通过 `Cargo` 创建的 [世界,你好](https://course.rs/first-try/cargo.html) 工程吗? -现在使用 VSCode 打开 [上一节](./cargo.md) 中创建的 `world_hello` 工程,然后进入 `main.rs` 文件。(此文件是当前 Rust 工程的入口文件,和其它语言几无区别。) +现在使用 VSCode 打开 [上一节](https://course.rs/first-try/cargo.html) 中创建的 `world_hello` 工程,然后进入 `main.rs` 文件。(此文件是当前 Rust 工程的入口文件,和其它语言几无区别。) 接下来,对世界友人给予热切的问候: @@ -111,12 +111,13 @@ fn main() { - 高阶函数编程:函数可以作为参数也能作为返回值,例如 `.map(|field| field.trim())`,这里 `map` 方法中使用闭包函数作为参数,也可以称呼为 `匿名函数`、`lambda 函数`。 - 类型标注:`if let Ok(length) = fields[1].parse::()`,通过 `::` 的使用,告诉编译器 `length` 是一个 `f32` 类型的浮点数。这种类型标注不是很常用,但是在编译器无法推断出你的数据类型时,就很有用了。 - 条件编译:`if cfg!(debug_assertions)`,说明紧跟其后的输出(打印)只在 `debug` 模式下生效。 -- 隐式返回:Rust 提供了 `return` 关键字用于函数返回,但是在很多时候,我们可以省略它。因为 Rust 是 [**基于表达式的语言**](../basic/base-type/statement-expression.md)。 +- 隐式返回:Rust 提供了 `return` 关键字用于函数返回,但是在很多时候,我们可以省略它。因为 Rust 是 [**基于表达式的语言**](https://course.rs/basic/base-type/statement-expression.html)。 在终端中运行上述代码时,会看到很多 `debug: ...` 的输出,上面有讲,这些都是 `条件编译` 的输出,那么该怎么消除掉这些输出呢? -读者大大普遍冰雪聪明,肯定已经想到:是的,在 [认识 Cargo](./cargo.md#手动编译和运行项目)中,曾经介绍过 `--release` 参数,因为 `cargo run` 默认是运行 `debug` 模式。因此想要消灭那些 `debug:` 输出,需要更改为其它模式,其中最常用的模式就是 `--release` 也就是生产发布的模式。 +读者大大普遍冰雪聪明,肯定已经想到:是的,在 [认识 Cargo](https://course.rs/first-try/cargo.html#手动编译和运行项目)中,曾经介绍过 `--release` 参数,因为 `cargo run` 默认是运行 `debug` 模式。因此想要消灭那些 `debug:` 输出,需要更改为其它模式,其中最常用的模式就是 `--release` 也就是生产发布的模式。 具体运行代码就不给了,留给大家作为一个小练习,建议亲自动手尝试下。 至此,Rust 安装入门就已经结束。相信看到这里,你已经发现了本书与其它书的区别,其中最大的区别就是:**这本书就像优秀的国外课本一样,不太枯燥。也希望这本不太枯燥的书,能伴你长行,犹如一杯奶茶,细细品之,唇齿留香。** + diff --git a/src/first-try/installation.md b/src/first-try/installation.md index f732c803..2d9dd2d1 100644 --- a/src/first-try/installation.md +++ b/src/first-try/installation.md @@ -161,4 +161,5 @@ cargo 1.57.0 (b2e52d7ca 2021-10-21) 安装 Rust 的同时也会在本地安装一个文档服务,方便我们离线阅读:运行 `rustup doc` 让浏览器打开本地文档。 -每当遇到标准库提供的类型或函数不知道怎么用时,都可以在 API 文档中查找到!具体参见 [在标准库寻找你想要的内容](../std/search.md)。 +每当遇到标准库提供的类型或函数不知道怎么用时,都可以在 API 文档中查找到!具体参见 [在标准库寻找你想要的内容](https://course.rs/std/search.html)。 + diff --git a/src/first-try/intro.md b/src/first-try/intro.md index 35d24c14..187db0bc 100644 --- a/src/first-try/intro.md +++ b/src/first-try/intro.md @@ -8,3 +8,4 @@ 2. 搭建 VSCode 所需的环境 3. 简单介绍 Cargo 4. 实现一个酷炫多国语言版本的“世界,你好”的程序,并且谈谈对 Rust 语言的初印象 + diff --git a/src/first-try/slowly-downloading.md b/src/first-try/slowly-downloading.md new file mode 100644 index 00000000..1efd7b79 --- /dev/null +++ b/src/first-try/slowly-downloading.md @@ -0,0 +1,89 @@ +# 下载依赖很慢或卡住? +在目前,大家还不需要自己搭建的镜像下载服务,因此只需知道下载依赖库的地址是 [crates.io](https://crates.io),是由 Rust 官方搭建的镜像下载和管理服务。 + +但悲剧的是,它的默认镜像地址是在国外,这就导致了某些时候难免会遇到下载缓慢或者卡住的情况,下面我们一起来看看。 + + +## 下载很慢 +解决下载缓慢有两种方式: + +1. 开启命令行或者全局翻墙 +经常有同学反馈,我明明开启翻墙了,但是下载依然还是很慢,无论是命令行中下载还是 VSCode 的 rust-analyzer 插件自动拉取。 + +事实上,翻墙工具默认开启的仅仅是浏览器的翻墙代理,对于命令行或者软件中的访问,并不会代理流量,因此这些访问还是通过正常网络进行的,自然会失败。 + +因此,大家需要做的是在你使用的翻墙工具中 `复制终端代理命令` 或者开启全局翻墙。由于每个翻墙软件的使用方式不同,因此具体的还是需要自己研究下。以我使用的 `ClashX` 为例,点击 `复制终端代理命令` 后,会自动复制一些 `export` 文本,将这些文本复制到命令行终端中,执行一下,就可以自动完成代理了。 + +```shell +export https_proxy=http://127.0.0.1:7890 http_proxy=http://127.0.0.1:7890 all_proxy=socks5://127.0.0.1:7891 +``` + +2. 修改 Rust 的下载镜像为国内的镜像地址 +这个效果最直接,但是就是稍有些麻烦。 + +为了使用 `crates.io` 之外的注册服务,我们需要对 `$HOME/.cargo/config.toml` ($CARGO_HOME 下) 文件进行配置,添加新的服务提供商,有两种方式可以实现:增加新的镜像地址和覆盖默认的镜像地址。 + +> 这里推荐使用[科大的注册服务](http://mirrors.ustc.edu.cn/help/crates.io-index.html)来提升下载速度,以下注册服务的链接都是科大的 + +#### 增加新的镜像地址 + + +**首先是在 `crates.io` 之外添加新的注册服务**,在 `$HOME/.cargo/config.toml` 中添加以下内容: + +```toml +[registries] +ustc = { index = "https://mirrors.ustc.edu.cn/crates.io-index/" } +``` + +这种方式只会新增一个新的镜像地址,因此在引入依赖的时候,需要指定该地址,例如在项目中引入 `time` 包,你需要在 `Cargo.toml` 中使用以下方式引入: + +```toml +[dependencies] +time = { registry = "ustc" } +``` + +**在重新配置后,初次构建可能要较久的时间**,因为要下载更新 `ustc` 注册服务的索引文件,还挺大的... + +#### 覆盖默认的镜像地址 +事实上,我们更推荐第二种方式,因为第一种方式在项目大了后,实在是很麻烦,全部修改后,万一以后不用这个镜像了,你又要全部修改成其它的。 + +而第二种方式,则不需要修改 `Cargo.toml` 文件,因为它**因为它是直接使用新注册服务来替代默认的 `crates.io`**。 + +```toml +[source.crates-io] +replace-with = 'ustc' + +[source.ustc] +registry = "git://mirrors.ustc.edu.cn/crates.io-index" +``` + +首先,创建一个新的镜像源 `[source.ustc]`,然后将默认的 `crates-io` 替换成新的镜像源: `replace-with = 'ustc'`。 + +简单吧?只要这样配置后,以往需要去 `crates.io` 下载的包,会全部从科大的镜像地址下载,速度刷刷的.. 我的 300M 大刀( 宽带 )终于有了用武之地。 + +**这里强烈推荐大家在学习完后面的基本章节后,看一下 [Cargo 使用指南章节](https://course.rs/cargo/intro.html),对于你的 Rust 之旅会有莫大的帮助!** + + +## 下载卡住 +下载卡住其实就一个原因:下载太慢了。 + +根据经验来看,卡住不动往往发生在更新索引时。毕竟 Rust 的包越来越多,索引也越来越大,如果不使用国内镜像,卡住还蛮正常的,好在,我们也无需经常更新索引 :P + +#### Blocking waiting for file lock on package cache +不过这里有一个坑,需要大家注意,如果你同时打开了 VSCODE 和命令行,然后修改了 `Cargo.toml`,此时 VSCODE 的 rust-analyzer 插件会自动检测到依赖的变更,去下载新的依赖。 + +在 VSCODE 下载的过程中( 特别是更新索引,可能会耗时很久),假如你又在命令行中运行类似 `cargo run` 或者 `cargo build` 的命令,就会提示一行有些看不太懂的内容: + +```shell +$ cargo build + Blocking waiting for file lock on package cache + Blocking waiting for file lock on package cache +``` + +其实这个报错就是因为 VSCODE 的下载太慢了,而且该下载构建还锁住了当前的项目,导致你无法在另一个地方再次进行构建。 + +解决办法也很简单: + +- 增加下载速度,见前面内容 +- 耐心等待持有锁的用户构建完成 +- 强行停止正在构建的进程,例如杀掉 IDE 使用的 rust-analyer 插件进程,然后删除 `$HOME/.cargo/.package_cache` 目录 \ No newline at end of file diff --git a/src/sth-you-should-not-do.md b/src/first-try/sth-you-should-not-do.md similarity index 99% rename from src/sth-you-should-not-do.md rename to src/first-try/sth-you-should-not-do.md index e2d2c22a..5d0d936e 100644 --- a/src/sth-you-should-not-do.md +++ b/src/first-try/sth-you-should-not-do.md @@ -65,3 +65,4 @@ CS(Computer Science:计算机科学)课程中我们会学习大量的常 对于新手而言,最应该避免的就是从**链表开始练手**,最应该做的就是认真仔细地学习一本优秀的书。 总之,认真学 Rust,既然选择了,就相信自己,你的前方会是星辰大海! + diff --git a/src/github.md b/src/github.md new file mode 100644 index 00000000..c27f9530 --- /dev/null +++ b/src/github.md @@ -0,0 +1 @@ +# GitHub diff --git a/src/index-list.md b/src/index-list.md index 88f2f9d6..48814759 100644 --- a/src/index-list.md +++ b/src/index-list.md @@ -362,3 +362,4 @@ [整形字面量]: https://course.rs/basic/base-type/numbers.html#整数类型 [back](#head) + diff --git a/src/into-rust.md b/src/into-rust.md index 1812c83b..bbfd6074 100644 --- a/src/into-rust.md +++ b/src/into-rust.md @@ -1,4 +1,7 @@ -# 进入 Rust 编程世界 + +
正在努力学 Rust 的 Ferris
+ +
## Rust 发展历程 @@ -130,7 +133,7 @@ Rust 语言表达能力更强,性能更高。同时线程安全方面 Rust 也 - Google 除了在安卓系统的部分模块中使用 Rust 外,还在它最新的操作系统 Fuchsia 中重度使用 Rust - Facebook 使用 Rust 来增强自己的网页端、移动端和 API 服务的性能,同时还写了 Hack 编程语言的虚拟机 - Microsoft 使用 Rust 为 Azure 平台提供一些组件,其中包括 IoT 的核心服务 -- Github 和 npmjs.com,使用 Rust 提供高达每天 13 亿次的 npm 包下载 +- GitHub 和 npmjs.com,使用 Rust 提供高达每天 13 亿次的 npm 包下载 - Rust 目前已经成为全世界区块链平台的首选开发语言 - TiDB,国内最有名的开源分布式数据库 @@ -159,4 +162,5 @@ Rust 语言表达能力更强,性能更高。同时线程安全方面 Rust 也 > 本书是完全开源的,但是并不意味着质量上的妥协,这里的每一个章节都花费了大量的心血和时间才能完成,为此牺牲了陪伴家人、日常娱乐的时间,虽然我们并不后悔,但是如果能得到读者您的鼓励,我们将感激不尽。 > -> 既然是开源,那最大的鼓励不是 money,而是 star:) **如果大家觉得这本书作者真的用心了,就帮我们[点一个 🌟 ](https;//github.com/sunface/rust-course)吧,这将是我们继续前行最大的动力** +> 既然是开源,那最大的鼓励不是 money,而是 star:) **如果大家觉得这本书作者真的用心了,就帮我们[点一个 🌟 ](https://github.com/sunface/rust-course)吧,这将是我们继续前行最大的动力** + diff --git a/src/logs/about-log.md b/src/logs/about-log.md new file mode 100644 index 00000000..5c22a86a --- /dev/null +++ b/src/logs/about-log.md @@ -0,0 +1,63 @@ +# 详解日志 +相比起监控,日志好理解的多:在某个时间点向指定的地方输出一条信息,里面记录着重要性、时间、地点和发生的事件,这就是日志。 + +> 注意,本文和 Rust 无关,我们争取从一个中立的角度去介绍何为日志 + + +## 日志级别和输出位置 + +#### 日志级别 + +日志级别是对基本的“滚动文本”式日志记录的一个重要补充。每条日志消息都会基于其重要性或严重程度分配到一个日志级别。例如,对于某个程序,“你的电脑着火了”是一个非常重要的消息,而“无法找到配置文件”的重要等级可能就低一些;但对于另外一些程序,"无法找到配置文件" 可能才是最严重的错误,会直接导致程序无法正常启动,而“电脑着火”? 我们可能会记录为一条 `Debug` 日志(参见下文) :D。 + + +至于到底该如何定义日志级别,这是仁者见仁的事情,并没有一个约定俗成的方式,就连很多大公司,都无法保证自己的开发者严格按照它所制定的规则来输出日。而下面是我认为的日志级别以及相关定义: + +- Fatal: 程序发生致命错误,祝你好运。这种错误往往来自于程序逻辑的严重异常,例如之前提到的“无法找到配置文件”,再比如无法分配足够的硬盘空间、内存不够用等。遇到这种错误,建议立即退出或者重启程序,然后记录下相应的错误信息 + +- Error: 错误,一般指的是程序级别的错误或者严重的业务错误,但这种错误并不会影响程序的运行。一般的用户错误,例如用户名、密码错误等,不使用 Error 级别 + +- Warn: 警告,说明这条记录信息需要注意,但是不确定是否发生了错误,因此需要相关的开发来辨别下。或者这条信息既不是错误,但是级别又没有低到 info 级别,就可以用 Warn 来给出警示。例如某条用户连接异常关闭、无法找到相关的配置只能使用默认配置、XX秒后重试等 + +- Info: 信息,这种类型的日志往往用于记录程序的运行信息,例如用户操作或者状态的变化,再比如之前的用户名、密码错误,用户请求的开始和结束都可以记录为这个级别 + +- Debug: 调试信息,顾名思义是给开发者用的,用于了解程序当前的详细运行状况, 例如用户请求详细信息跟踪、读取到的配置信息、连接握手发包(连接的建立和结束往往是 Info 级别),就可以记录为 Debug 信息 + +可以看出,日志级别很多,特别是 Debug 日志,如果在生产环境中开启,简直就是一场灾难,每秒几百上千条都很正常。因此我们需要控制日志的最低级别:将最低级别设置为 Info 时,意味着低于 Info 的日志都不会输出,对于上面的分级来说,Debug 日志将不会被输出。 + +有些开发为了让特定的日志在控制上显示更明显,还会为不同的级别使用不同颜色的文字。 + +#### 输出位置 +通常来说,日志可以输出两个地方:终端控制台和文件。对于前者,我们还有一个称呼标准输出,例如使用 `println!` 打印到终端的信息就是输出到标准输出中。 + +如果没有日志持久化的需求,你只是为了调试程序,建议输出到控制台即可。悄悄的说一句,我们还可以为不同的级别设定不同的输出位置,例如 `Debug` 日志输出到控制台,既方便开发查看,但又不会占用硬盘,而 `Info` 和 `Warning` 日志可以输出到文件 `info.log` 中,至于 `Error`、`Fatal` 则可以输出到 `error.log` 中。 + +但是如果大家以为只有输出到文件才能持久化日志,那你就错了,在后面的日志采集我们会详细介绍,先来看看日志查看。 + +## 日志查看 + +关于如何查看日志,相信大家都非常熟悉了,常用的方式有三种(事实上,可能也只有这三种): + +- 在控制台查看,即可以直接查看输出到标准输出的日志,还可以使用 tail、cat、grep 等命令从日志文件中搜索查询或者以实时滚动的方式查看最新的日志 +- 最简单的,进入到日志文件中,进行字符串搜索,或者从头到尾、从尾到头进行逐行查看 +- 在可视化界面上查看,但是这个往往要配合日志采集工具,将日志采集到 ElasticSearch 或者其它搜索平台、数据中,然后再通过 kibana、grafana 等图形化服务进行搜索、查看,最重要的是可以进行日志的聚合统计,例如可以很方便的在 kibana 中查询满足指定条件的日志在某段时间内出现了多少次。 + +大家现在知道了,可视化,首先需要将日志集中采集起来,那么该如何采集日志呢? + +## 日志采集 + +之前我们提到,不是只有输出到文件才能持久化日志,事实上,输出到控制台也能持久化日志。 + +其中的**秘诀就在于使用一个日志采集工具去从控制台的标准输出读取日志数据,然后将读取到的数据发送到日志存储平台**,例如 ElasticSearch,进行集中存储。当然,在存储前,还需要进行日志格式、数据的处理,以便只保留我们需要的格式和日志数据。 + +最典型的就是容器或容器云环境的日志采集,基本都是通过上面的方式进行的:容器中的进程将日志输出到标准输出,然后一个单独的日志采集服务直接读取标准输出中的日志,再通过网络发送到日志处理、存储的平台。大家发现了吗?这个流程完全不会在应用运行的本地或宿主机上存储任何日志,所以特别适合容器环境! + +目前常用的日志采集工具有 filebeat、vector( Rust 开发,功能强大,性能非常高 ) 等,它们都是以 agent 的形式运行在你的应用程序旁边( 在同一个 pod 或虚拟机上 ),提供贴心的服务。 + +## 中心化日志存储 + +最后,我们再来简单介绍下日志存储。提到存储,首先不得不提的就是日志使用方式。 + +其实,除了 Debug 的时候,我们使用日志基本都是基于某个关键字进行搜索的,将日志存储在各台主机上的硬盘文件中,然后逐个去查询显然是非常非常低效的,最好的方式就是将日志集中收集上来后,存储在一个搜索平台中,例如 ElasticSearch。 + +当然,存储的时候肯定也不是简单的一行一行存储,而是需要将一条日志的多个关键词切取出来,然后以关键词索引的方式进行存储( 简化模型 ),这样我们就可以在后续使用时,通过关键词来搜索日志了。 diff --git a/src/logs/intro.md b/src/logs/intro.md new file mode 100644 index 00000000..7c3d20a3 --- /dev/null +++ b/src/logs/intro.md @@ -0,0 +1,6 @@ +# 日志和监控 +这几年 AIOps 特别火,但是你要是逮着一个运维问一下,他估计很难说出个所以然来,毕竟概念和现实往往是脱节的,前者的发展速度肯定远快于后者。 + +好在我大概了解这块儿领域,可以说智能化运维的核心就在于日志和监控,换而言之?何为智能,不就是基于已有的海量数据分析后进行决策吗?当然,你要说以前的知识库类型的运维决策也是智能,我也没办法杠: D + +总之,不仅仅是对于开发者,对于整个技术链条的参与者,甚至包括老板,**日志和监控都是开发实践中最最重要的一环**。 \ No newline at end of file diff --git a/src/logs/log.md b/src/logs/log.md new file mode 100644 index 00000000..c6909601 --- /dev/null +++ b/src/logs/log.md @@ -0,0 +1,235 @@ +# 日志门面 log + +就如同 slf4j 是 Java 的日志门面库,[log](https://github.com/rust-lang/log) 也是 Rust 的日志门面库( 这不是我自己编的,官方用语: logging facade ),它目前是由官方提供维护工作,更新较为活跃,因此大家可以放心使用。 + +使用方式很简单,只要在 `Cargo.toml` 中引入即可: +```toml +[dependencies] +log = "0.4" +``` + +> 日志门面不是说排场很大的意思,而是指相应的日志 API 已成为事实上的标准,会被其它日志框架所使用。通过这种统一的门面,开发者就可以不必再拘泥于日志框架的选择,未来大不了再换一个日志框架就是 + +既然是门面,`log` 自然定义了一套统一的日志特征和 API,将日志的操作进行了抽象。 + +## Log 特征 + +例如,它定义了一个 `Log` 特征: +```rust +pub trait Log: Sync + Send { + fn enabled(&self, metadata: &Metadata<'_>) -> bool; + fn log(&self, record: &Record<'_>); + fn flush(&self); +} +``` + +- `enabled` 用于判断某条带有元数据的日志是否能被记录,它对于 `log_enabled!` 宏特别有用 +- `log` 会记录 `record` 所代表的日志 +- `flush` 会将缓存中的日志数据刷到输出中,例如标准输出或者文件中 + +## 日志宏 + +`log` 还为我们提供了一整套标准的宏,用于方便地记录日志。`trace!`、`debug!`、`info!`、`warn!`、`error!`,这几个大家是否很眼熟,是的,它们跟我们上一章节提到的日志级别几乎一模一样,唯一的区别就是这里乱入了一个 `trace!`,它比 `debug!` 的日志级别还要低、记录的信息还要详细,这么说吧,如果你想事无巨细的追踪某个流程的所有信息,就可以用它了。 + +```rust +use log::{info, trace, warn}; + +pub fn shave_the_yak(yak: &mut Yak) { + trace!("Commencing yak shaving"); + + loop { + match find_a_razor() { + Ok(razor) => { + info!("Razor located: {}", razor); + yak.shave(razor); + break; + } + Err(err) => { + warn!("Unable to locate a razor: {}, retrying", err); + } + } + } +} +``` + +上面的例子使用 `trace!` 记录了一条可有可无的信息:准备开始剃须,然后开始寻找剃须刀,找到后就用 `info!` 记录一条可能事后也没人看的信息:找到剃须刀;没找到的话,就记录一条 `warn!` 信息,这条信息就有一定价值了,不仅告诉我们没找到的原因,还记录了发生的次数,有助于事后定位问题。 + +可以看出,这里的日志级别使用跟我们上一章节描述的基本吻合。 + +除了以上常用的,`log` 还提供了 `log!` 和 `log_enabled!` 宏,后者用于确定一条消息在当前模块中,对于给定的日志级别是否能够被记录 + +```rust +use log::Level::Debug; +use log::{debug, log_enabled}; + +// 判断能否记录 Debug 消息 +if log_enabled!(Debug) { + let data = expensive_call(); + // 下面的日志记录较为昂贵,因此我们先在前面判断了是否能够记录,能,才继续这里的逻辑 + debug!("expensive debug data: {} {}", data.x, data.y); +} +if log_enabled!(target: "Global", Debug) { + let data = expensive_call(); + debug!(target: "Global", "expensive debug data: {} {}", data.x, data.y); +} +``` + +而 `log!` 宏就简单的多,它是一个通用的日志记录方式,因此需要我们手动指定日志级别: +```rust +use log::{log, Level}; + +let data = (42, "Forty-two"); +let private_data = "private"; + +log!(Level::Error, "Received errors: {}, {}", data.0, data.1); +log!(target: "app_events", Level::Warn, "App warning: {}, {}, {}", + data.0, data.1, private_data); +``` + +## 日志输出在哪里? +我不知道有没有同学尝试运行过上面的代码,但是我知道,就算你们运行了,也看不到任何输出。 + +为什么?原因很简单,`log` 仅仅是日志门面库,**它并不具备完整的日志库功能!**,因此你无法在控制台中看到任何日志输出,这种情况下,说实话,远不如一个 `println!` 有用! + +但是别急,让我们看看该如何让 `log` 有用起来。 + + +## 使用具体的日志库 +`log` 包这么设计,其实是有很多好处的。 + +### Rust 库的开发者 +最直接的好处就是,如果你是一个 Rust 库开发者,那你自己或库的用户肯定都不希望这个库绑定任何具体的日志库,否则用户想使用 `log1` 来记录日志,你的库却使用了 `log2`,这就存在很多问题了! + +因此,**作为库的开发者,你只要在库中使用门面库即可**,将具体的日志库交给用户去选择和绑定。 +```rust +use log::{info, trace, warn}; +pub fn deal_with_something() { + // 开始处理 + + // 记录一些日志 + trace!("a trace log"); + info!("a info long: {}", "abc"); + warn!("a warning log: {}, retrying", err); + + // 结束处理 +} +``` + +### 应用开发者 +如果是应用开发者,那你的应用运行起来,却看不到任何日志输出,这种场景想想都捉急。此时就需要去选择一个具体的日志库了。 + +目前来说,已经有了不少日志库实现,官方也[推荐了一些](https://github.com/rust-lang/log#in-executables) +,大家可以根据自己的需求来选择,不过 [env_logger](https://docs.rs/env_logger/*/env_logger/) 是一个相当不错的选择。 + +`log` 还提供了 [set_logger](https://docs.rs/log/0.4.8/log/fn.set_logger.html) 函数用于设置日志库,[set_max_level](https://docs.rs/log/0.4.8/log/fn.set_max_level.html) 用于设置最大日志级别,但是如果你选了具体的日志库,它往往会提供更高级的 API,无需我们手动调用这两个函数,例如下面的 `env_logger` 就是如此。 + +#### env_logger + +修改 `Cargo.toml` , 添加以下内容: +```toml +# in Cargo.toml + +[dependencies] +log = "0.4.0" +env_logger = "0.9" +``` + +在 `src/main.rs` 中添加如下代码: +```rust +use log::{debug, error, log_enabled, info, Level}; + +fn main() { + // 注意,env_logger 必须尽可能早的初始化 + env_logger::init(); + + debug!("this is a debug {}", "message"); + error!("this is printed by default"); + + if log_enabled!(Level::Info) { + let x = 3 * 4; // expensive computation + info!("the answer was: {}", x); + } +} +``` + +在运行程序时,可以通过环境变量来设定日志级别: +```shell +$ RUST_LOG=error ./main +[2017-11-09T02:12:24Z ERROR main] this is printed by default +``` + +我们还可以为单独一个模块指定日志级别: +```shell +$ RUST_LOG=main=info ./main +[2017-11-09T02:12:24Z ERROR main] this is printed by default +[2017-11-09T02:12:24Z INFO main] the answer was: 12 +``` + +还能为某个模块开启所有日志级别: +```shell +$ RUST_LOG=main ./main +[2017-11-09T02:12:24Z DEBUG main] this is a debug message +[2017-11-09T02:12:24Z ERROR main] this is printed by default +[2017-11-09T02:12:24Z INFO main] the answer was: 12 +``` + +需要注意的是,如果文件名包含 `-`,你需要将其替换成下划线来使用,原因是 Rust 的模块和包名不支持使用 `-`。 +```shell +$ RUST_LOG=my_app ./my-app +[2017-11-09T02:12:24Z DEBUG my_app] this is a debug message +[2017-11-09T02:12:24Z ERROR my_app] this is printed by default +[2017-11-09T02:12:24Z INFO my_app] the answer was: 12 +``` + +默认情况下,`env_logger` 会输出到标准错误 `stderr`,如果你想要输出到标准输出 `stdout`,可以使用 `Builder` 来改变日志对象( target ): +```rust +use std::env; +use env_logger::{Builder, Target}; + +let mut builder = Builder::from_default_env(); +builder.target(Target::Stdout); + +builder.init(); +``` + +默认 +```rust + if cfg!(debug_assertions) { + eprintln!("debug: {:?} -> {:?}", + record, fields); + } +``` + +### 日志库开发者 +对于这类开发者而言,自然要实现自己的 `Log` 特征咯: + +```rust +use log::{Record, Level, Metadata}; +struct SimpleLogger; +impl log::Log for SimpleLogger { + fn enabled(&self, metadata: &Metadata) -> bool { + metadata.level() <= Level::Info + } + fn log(&self, record: &Record) { + if self.enabled(record.metadata()) { + println!("{} - {}", record.level(), record.args()); + } + } + fn flush(&self) {} +} +``` + +除此之外,我们还需要像 `env_logger` 一样包装下 `set_logger` 和 `set_max_level`: +```rust +use log::{SetLoggerError, LevelFilter}; +static LOGGER: SimpleLogger = SimpleLogger; +pub fn init() -> Result<(), SetLoggerError> { + log::set_logger(&LOGGER) + .map(|()| log::set_max_level(LevelFilter::Info)) +} +``` + + +## 更多示例 +关于 `log` 门面库和具体的日志库还有更多的使用方式,详情请参见锈书的[开发者工具](https://rusty.rs/devtools/log.html)一章。 + diff --git a/src/logs/observe/about-observe.md b/src/logs/observe/about-observe.md new file mode 100644 index 00000000..5401e805 --- /dev/null +++ b/src/logs/observe/about-observe.md @@ -0,0 +1,80 @@ +# 可观测性 + +在监控章节的[引言](https://course.rs/logs/observe/intro.html)中,我们提到了老板、前端、后端眼中的监控是各不相同的,那么有没有办法将监控模型进行抽象、统一呢? + +来简单分析一下: + +- 业务指标实时展示,这是一个指标型的数据( metric ) +- 手机 APP 上传的数据,包含了日志( log )和指标类型( metric ),如果考虑到 APP 作为一次 HTTP 请求的发起端,那还涉及到请求链路的跟踪( trace) +- 后端链路跟踪是 trace,请求错误率、QPS 是 metric,异常日志是 log + +喔,好像线索很明显哎,我们貌似可以把监控模型分为三种:指标 metric、日志 log 和 链路 trace。 + +先别急,我们对总结出来的三种类型进行下对比,看看彼此之间是否存在关联性( 良好的模型设计,彼此之间应该是无关联的 ): + +- 指标:用于表示在某一段时间内,一个行为出现的次数和分布 +- 日志:记录在某一个时间点发生的一次事件 +- 链路:记录一次请求所经过的完整的服务链路,可能会横跨线程、进程,也可能会横跨服务( 分布式、微服务 ) + +按照这个定义来看,三种类型几乎没有关联性,是不是意味着我们的监控模型非常成功? + +恭喜你,刚才总结出的监控模型正是这几年非常火热的可观测性监控的三大基础:Metrics / Log / Trace。 + +## 各自为战的三种模型 + +但是如果按照这个模型,我们将监控分成三个部分开发,彼此没有关联,并且在使用之时,也带着孤立的观点去看待这些数据和功能,那可观测性就失去了其应有的意义。 + +例如要看指标趋势变化就使用 metrics,查看详细问题使用 log,要看请求链路、链路各部分的耗时、服务依赖都使用 trace,虽然看起来很美好,但是它们都在各自为战。 + +例如一个很常见的场景,现在我们通过 metrics 获得了一个告警,发现某个服务的 SLA 降低、错误率上升,此时该如何排查错误原因? 查看日志?你如何确保日志跟错误率上升有内在的联系呢?而且一个大型服务,它的各种类型的日志、错误都是非常频繁的,要大海捞针般地找出特定的日志,非常难。 + +由于缺乏数据模型上的关联,最后只能各自为战:发现了错误率上升,就人工去找日志和链路,运气好,就能很快地查明原因,运气不好?等待老板和用户的咆哮吧 + +这个过程很不美好,需要工程师们充分理解每一项数据的底层逻辑,而在大型微服务架构中,没有一个工程师可以清晰的知道所有的底层逻辑,此时就需要分工协作去排查,那问题处理的复杂度和挑战性最终会急剧增加。 + +## 模型纽带 + +看来,要解决这个问题,我们需要一个纽带,来把三个模型串联起来,目前来看,trace 是最适合的。 + +因为问题的跟踪和解决其实就是沿着数据的流向来的,我们只要在 trace 流动的过程中,在沿途把相关的 log 收集上来,然后再针对收到的各种 trace,根据其标签去统计相应的指标。 + +这一样,是不是就成功地将三个模型关联在了一起?而且还不是强扭的瓜! + +再回到之前假设的场景:当我们对某个 Metric 波动发生兴趣时,可以直接将造成此波动的 Trace 关联检索出来,然后查看这些 Trace 在各个微服务中的所有执行细节,最后发现是底层某个微服务在执行请求过程中发生了 Panic,这个错误不断向上传播导致了服务对外 SLA 下降。 + +如果可观测平台做得更完善一些,将微服务的变更事件数据也呈现出来,那么一个工程师就可以快速完成整个排障和根因定位的过程,甚至不需要人,通过机器就可以自动完成整个排障和根因定位过程。 + + +看到这里,相信大家都已经明白了 trace 的重要性以及可观测性监控到底优秀在哪里。那么问题来了,该如何落地? + +## 数据采集 + +首先,没有数据,就没有一切,因此我们需要先把监控数据采集上来。 + +除了跨服务的数据统一规范外,由于现在的微服务往往使用多种语言实现,我们的数据采集还要支持不同的语言,选择一个合适的数据采集 SDK 就成了重中之重。 + +目前来说,我们最推荐大家采用 [OpenTelemetry](https://opentelemetry.io) 作为可观测性解决方案,它提供了完整的数据协议规范、API和多语言采集 SDK,我们将在下个章节进行详细介绍。 + +## 数据处理和存储 +虽然在我们之前的模型设计完善后,数据彼此之间存在内在关联性,但是不代表它们就能够按照同样的格式来存储了,甚至都无法保证使用同一个数据库来存储。 + +就目前而言,对于三种模型的数据处理和存储推荐如下: + +- Trace,使用 jaeger 接收采集上来的 trace 数据,经过处理后存储到一个分布式数据库中,例如 cassandra、scyllaDB 等 +- Log,如果对日志的关键词索引有较高的要求,还是建议使用 ElasticeSearch,如果可以提前在日志中通过 kv 的形式打上标签,然后未来也只需要通过标签来索引,那可以考虑使用 loki +- Metrics,啥都不用说了,prometheus 走起,当然还可以使用 influxdb,后者正在使用 Rust 重写,期待未来的一飞冲天 + +## 数据查询和展示 + +大家知道可观测性现在为什么很多人搞不清楚吗?就是因为你怎么做都可以,比如之前的存储,就有很多解决方案,而且还都不错。 + +对于数据展示也是,你可以使用上面的 `jaeger`、`promethes` 自带的 UI,也可以使用 `grafana` 这种统一性的 UI,而从我个人来说,更推荐使用 `grafana`,毕竟 UI 的统一性和内联性对于监控数据的查询是非常重要的。 + +再说了,`grafana` 的 UI 做的好看啊,没人能拒绝美好的事物吧 :D + + +好了,一篇口水文终于结束了,在后续章节我们将学习如何使用 `OpenTelemetry + Jaeger + Prometheus + Grafana` 搭建一套可用的监控服务,先来看看如何搭建和使用分布式追踪监控。 + +> "tracing 呢?你这个监控服务怎么没有它的身影,日志章节口口声声的爱,现在就忘记了吗?" +> +> "别急,我还记得呢,先卖个关子" \ No newline at end of file diff --git a/src/logs/observe/intro.md b/src/logs/observe/intro.md new file mode 100644 index 00000000..de923357 --- /dev/null +++ b/src/logs/observe/intro.md @@ -0,0 +1,11 @@ +# 监控 + +监控是一个很大的领域,大到老板、前端开发、后端开发理解的监控可能都不相同。 + +- 老板眼中的监控:业务大数据实时展示 +- 前端眼中的监控:手机 APP 收集上来的异常、崩溃、用户操作日志等 +- 后端眼中的监控: 请求链路跟踪、一段时间内的请求错误率、QPS 过高、异常日志等 + +正是因为这些复杂性,导致很多同学难以准确的说出监控到底是什么。 + +下面,我们将试图解释清楚监控的概念,并引入一个全新的概念:可观测性。 diff --git a/src/logs/observe/trace.md b/src/logs/observe/trace.md new file mode 100644 index 00000000..d27dd3f3 --- /dev/null +++ b/src/logs/observe/trace.md @@ -0,0 +1 @@ +# 分布式追踪 diff --git a/src/logs/tracing-logger.md b/src/logs/tracing-logger.md new file mode 100644 index 00000000..71f42f9e --- /dev/null +++ b/src/logs/tracing-logger.md @@ -0,0 +1,629 @@ +# 使用 tracing 输出自定义的 Rust 日志 + +在 [tracing](https://docs.rs/crate/tracing/latest) 包出来前,Rust 的日志也就 `log` 有一战之力,但是 `log` 的功能相对来说还是鸡简单一些。在大名鼎鼎的 tokio 开发团队推出 `tracing` 后,我现在坚定的认为 `tracing` 就是未来! + + +> 截至目前,rust编译器团队、GraphQL 都在使用 tracing,而且 tokio 在密谋一件大事:基于 tracing 开发一套终端交互式 debug 工具: [console](https://github.com/tokio-rs/console)! + + +基于这种坚定的信仰,我们决定将公司之前使用的 `log` 包替换成 `tracing` ,但是有一个问题:后者提供的 JSON logger 总感觉不是那个味儿。这意味着,对于程序员来说,最快乐的时光又要到来了:定制自己的开发工具。 + +好了,闲话少说,下面我们一起来看看该如何构建自己的 logger,以及深入了解 tracing 的一些原理,当然你也可以只选择来凑个热闹,总之,开始吧! + +## 打地基(1) + +首先,使用 `cargo new --bin test-tracing` 创建一个新的二进制类型( binary )的项目。 + +然后引入以下依赖: +```toml +# in cargo.toml + +[dependencies] +serde_json = "1" +tracing = "0.1" +tracing-subscriber = "0.3" +``` + +其中 `tracing-subscriber` 用于订阅正在发生的日志、监控事件,然后可以对它们进行进一步的处理。`serde_json` 可以帮我们更好的处理格式化的 JSON,毕竟咱们要解决的问题就来自于 JSON logger。 + +下面来实现一个基本功能:设置自定义的 logger,并使用 `info!` 来打印一行日志。 + +```rust +// in examples/figure_0/main.rs + +use tracing::info; +use tracing_subscriber::prelude::*; + +mod custom_layer; +use custom_layer::CustomLayer; + +fn main() { + // 设置 `tracing-subscriber` 对 tracing 数据的处理方式 + tracing_subscriber::registry().with(CustomLayer).init(); + + // 打印一条简单的日志。用 `tracing` 的行话来说,`info!` 将创建一个事件 + info!(a_bool = true, answer = 42, message = "first example"); +} +``` + +大家会发现,上面引入了一个模块 `custom_layer`, 下面从该模块开始,来实现我们的自定义 logger。首先,`tracing-subscriber` 提供了一个特征 [`Layer`](https://docs.rs/tracing-subscriber/0.3/tracing_subscriber/layer/trait.Layer.html) 专门用于处理 `tracing` 的各种事件( span, event )。 + +```rust +// in examples/figure_0/custom_layer.rs + +use tracing_subscriber::Layer; + +pub struct CustomLayer; + +impl Layer for CustomLayer where S: tracing::Subscriber {} +``` + +由于还没有填入任何代码,运行该示例比你打的水漂还无力 - 毫无效果。 + + +## 捕获事件 + +在 `tracing` 中,当 `info!`、`error!` 等日志宏被调用时,就会产生一个相应的[事件 Event](https://docs.rs/tracing/0.1/tracing/event/struct.Event.html)。 + +而我们首先,就要为之前的 `Layer` 特征实现 `on_event` 方法。 + +```rust,editable +// in examples/figure_0/custom_layer.rs + +where + S: tracing::Subscriber, +{ + fn on_event( + &self, + event: &tracing::Event<'_>, + _ctx: tracing_subscriber::layer::Context<'_, S>, + ) { + println!("Got event!"); + println!(" level={:?}", event.metadata().level()); + println!(" target={:?}", event.metadata().target()); + println!(" name={:?}", event.metadata().name()); + for field in event.fields() { + println!(" field={}", field.name()); + } + } +} +``` + +从代码中可以看出,我们打印了事件中包含的事件名、日志等级以及事件发生的代码路径。运行后,可以看到以下输出: + +```properties +$ cargo run --example figure_1 + +Got event! + level=Level(Info) + target="figure_1" + name="event examples/figure_1/main.rs:10" + field=a_bool + field=answer + field=message +``` + +但是奇怪的是,我们无法通过 API 来获取到具体的 `field` 值。还有就是,上面的输出还不是 JSON 格式。 + +现在问题来了,要创建自己的 logger,不能获取 `filed` 显然是不靠谱的。 + +### 访问者模式 + +在设计上,`tracing` 作出了一个选择:永远不会自动存储产生的事件数据( spans, events )。如果我们要获取这些数据,就必须自己手动存储。 + +解决办法就是使用访问者模式(Visitor Pattern):手动实现 `Visit` 特征去获取事件中的值。`Visit` 为每个 `tracing` 可以处理的类型都提供了对应的 `record_X` 方法。 + +```rust +// in examples/figure_2/custom_layer.rs + +struct PrintlnVisitor; + +impl tracing::field::Visit for PrintlnVisitor { + fn record_f64(&mut self, field: &tracing::field::Field, value: f64) { + println!(" field={} value={}", field.name(), value) + } + + fn record_i64(&mut self, field: &tracing::field::Field, value: i64) { + println!(" field={} value={}", field.name(), value) + } + + fn record_u64(&mut self, field: &tracing::field::Field, value: u64) { + println!(" field={} value={}", field.name(), value) + } + + fn record_bool(&mut self, field: &tracing::field::Field, value: bool) { + println!(" field={} value={}", field.name(), value) + } + + fn record_str(&mut self, field: &tracing::field::Field, value: &str) { + println!(" field={} value={}", field.name(), value) + } + + fn record_error( + &mut self, + field: &tracing::field::Field, + value: &(dyn std::error::Error + 'static), + ) { + println!(" field={} value={}", field.name(), value) + } + + fn record_debug(&mut self, field: &tracing::field::Field, value: &dyn std::fmt::Debug) { + println!(" field={} value={:?}", field.name(), value) + } +} +``` + + + +然后在之前的 `on_event` 中来使用这个新的访问者: `event.record(&mut visitor)` 可以访问其中的所有值。 + +```rust +// in examples/figure_2/custom_layer.rs + +fn on_event( + &self, + event: &tracing::Event<'_>, + _ctx: tracing_subscriber::layer::Context<'_, S>, +) { + println!("Got event!"); + println!(" level={:?}", event.metadata().level()); + println!(" target={:?}", event.metadata().target()); + println!(" name={:?}", event.metadata().name()); + let mut visitor = PrintlnVisitor; + event.record(&mut visitor); +} +``` + +这段代码看起来有模有样,来运行下试试: +```properties +$ cargo run --example figure_2 + +Got event! + level=Level(Info) + target="figure_2" + name="event examples/figure_2/main.rs:10" + field=a_bool value=true + field=answer value=42 + field=message value=first example +``` + +Bingo ! 一切完美运行 ! + +### 构建 JSON logger +目前为止,离我们想要的 JSON logger 只差一步了。下面来实现一个 `JsonVisitor` 替代之前的 `PrintlnVisitor` 用于构建一个 JSON 对象。 + +```rust +// in examples/figure_3/custom_layer.rs + + +impl<'a> tracing::field::Visit for JsonVisitor<'a> { + fn record_f64(&mut self, field: &tracing::field::Field, value: f64) { + self.0 + .insert(field.name().to_string(), serde_json::json!(value)); + } + + fn record_i64(&mut self, field: &tracing::field::Field, value: i64) { + self.0 + .insert(field.name().to_string(), serde_json::json!(value)); + } + + fn record_u64(&mut self, field: &tracing::field::Field, value: u64) { + self.0 + .insert(field.name().to_string(), serde_json::json!(value)); + } + + fn record_bool(&mut self, field: &tracing::field::Field, value: bool) { + self.0 + .insert(field.name().to_string(), serde_json::json!(value)); + } + + fn record_str(&mut self, field: &tracing::field::Field, value: &str) { + self.0 + .insert(field.name().to_string(), serde_json::json!(value)); + } + + fn record_error( + &mut self, + field: &tracing::field::Field, + value: &(dyn std::error::Error + 'static), + ) { + self.0.insert( + field.name().to_string(), + serde_json::json!(value.to_string()), + ); + } + + fn record_debug(&mut self, field: &tracing::field::Field, value: &dyn std::fmt::Debug) { + self.0.insert( + field.name().to_string(), + serde_json::json!(format!("{:?}", value)), + ); + } +} +``` + +```rust +// in examples/figure_3/custom_layer.rs + +fn on_event( + &self, + event: &tracing::Event<'_>, + _ctx: tracing_subscriber::layer::Context<'_, S>, +) { + // Covert the values into a JSON object + let mut fields = BTreeMap::new(); + let mut visitor = JsonVisitor(&mut fields); + event.record(&mut visitor); + + // Output the event in JSON + let output = serde_json::json!({ + "target": event.metadata().target(), + "name": event.metadata().name(), + "level": format!("{:?}", event.metadata().level()), + "fields": fields, + }); + println!("{}", serde_json::to_string_pretty(&output).unwrap()); +} +``` + +继续运行: +```properties +$ cargo run --example figure_3 + +{ + "fields": { + "a_bool": true, + "answer": 42, + "message": "first example" + }, + "level": "Level(Info)", + "name": "event examples/figure_3/main.rs:10", + "target": "figure_3" +} +``` + +终于,我们实现了自己的 logger,并且成功地输出了一条 JSON 格式的日志。并且新实现的 `Layer` 就可以添加到 `tracing-subscriber` 中用于记录日志事件。 + +下面再来一起看看如何使用`tracing` 提供的 `period-of-time spans` 为日志增加更详细的上下文信息。 + + +### 何为 span +在之前我们多次提到 span 这个词,但是何为 span? + +不知道大家知道分布式追踪不?在分布式系统中每一个请求从开始到返回,会经过多个服务,这条请求路径被称为请求跟踪链路( trace ),可以看出,一条链路是由多个部分组成,我们可以简单的把其中一个部分认为是一个 span。 + +跟 log 是对某个时间点的记录不同,span 记录的是一个时间段。当程序开始执行一系列任务时,span 就会开始,当这个系列任务结束后,span 也随之结束。 + +由此可见,tracing 其实不仅仅是一个日志库,它还是一个分布式追踪的库,可以帮助我们采集信息,然后上传给 jaeger 等分布式追踪平台,最终实现对指定应用程序的监控。 + +在理解后,再来看看该如何为自定义的 logger 实现 spans。 + +### 打地基(2) +先来创建一个外部 span 和一个内部 span,从概念上来说,spans 和 events 创建的东东类似以下嵌套结构: + +- 进入外部 span + - 进入内部 span + - 事件已创建,内部 span 是它的父 span,外部 span 是它的祖父 span + - 结束内部 span +- 结束外部 span + +> 有些同学可能还是不太理解,你就把 span 理解成为监控埋点,进入 span == 埋点开始,结束 span == 埋点结束 + +在下面的代码中,当使用 `span.enter()` 创建的 span 超出作用域时,将自动退出:根据 `Drop` 特征触发的顺序,`inner_span` 将先退出,然后才是 `outer_span` 的退出。 + +```rust +// in examples/figure_5/main.rs + +use tracing::{debug_span, info, info_span}; +use tracing_subscriber::prelude::*; + +mod custom_layer; +use custom_layer::CustomLayer; + +fn main() { + tracing_subscriber::registry().with(CustomLayer).init(); + + let outer_span = info_span!("outer", level = 0); + let _outer_entered = outer_span.enter(); + + let inner_span = debug_span!("inner", level = 1); + let _inner_entered = inner_span.enter(); + + info!(a_bool = true, answer = 42, message = "first example"); +} +``` + +再回到事件处理部分,通过使用 `examples/figure_0/main.rs` 我们能获取到事件的父 span,当然,前提是它存在。但是在实际场景中,直接使用 `ctx.event_scope(event)` 来迭代所有 span 会更加简单好用。 + +注意,这种迭代顺序类似于栈结构,以上面的代码为例,先被迭代的是 `inner_span`,然后才是 `outer_span`。 + +当然,如果你不想以类似于出栈的方式访问,还可以使用 `scope.from_root()` 直接反转,此时的访问将从最外层开始: `outer -> innter`。 + +对了,为了使用 `ctx.event_scope()`,我们的订阅者还需实现 `LookupRef`。提前给出免责声明:这里的实现方式有些诡异,大家可能难以理解,但是..我们其实也无需理解,只要这么用即可。 + +> 译者注:这里用到了高阶生命周期 HRTB( Higher Ranke Trait Bounds ) 的概念,一般的读者无需了解,感兴趣的可以看看(这里)[https://doc.rust-lang.org/nomicon/hrtb.html] + +```rust +// in examples/figure_5/custom_layer.rs + +impl Layer for CustomLayer +where + S: tracing::Subscriber, + // 好可怕! 还好我们不需要理解它,只要使用即可 + S: for<'lookup> tracing_subscriber::registry::LookupSpan<'lookup>, +{ + fn on_event(&self, event: &tracing::Event<'_>, ctx: tracing_subscriber::layer::Context<'_, S>) { + // 父 span + let parent_span = ctx.event_span(event).unwrap(); + println!("parent span"); + println!(" name={}", parent_span.name()); + println!(" target={}", parent_span.metadata().target()); + + println!(); + + // 迭代范围内的所有的 spans + let scope = ctx.event_scope(event).unwrap(); + for span in scope.from_root() { + println!("an ancestor span"); + println!(" name={}", span.name()); + println!(" target={}", span.metadata().target()); + } + } +} +``` + +运行下看看效果: +```properties +$ cargo run --example figure_5 + +parent span + name=inner + target=figure_5 + +an ancestor span + name=outer + target=figure_5 +an ancestor span + name=inner + target=figure_5 +``` + +细心的同学可能会发现,这里怎么也没有 field 数据?没错,而且恰恰是这些 field 包含的数据才让日志和监控有意义。那我们可以像之前一样,使用访问器 Visitor 来解决吗? + +### span 的数据在哪里 + +答案是:No。因为 `ctx.event_scope ` 返回的东东没有任何办法可以访问其中的字段。 + +不知道大家还记得我们为何之前要使用访问器吗?很简单,因为 `tracing` 默认不会去存储数据,既然如此,那 `span` 这种跨了某个时间段的,就更不可能去存储数据了。 + +现在只能看看 `Layer` 特征有没有提供其它的方法了,哦呦,发现了一个 `on_new_span`,从名字可以看出,该方法是在 `span` 创建时调用的。 + +```rust +// in examples/figure_6/custom_layer.rs + +impl Layer for CustomLayer +where + S: tracing::Subscriber, + S: for<'lookup> tracing_subscriber::registry::LookupSpan<'lookup>, +{ + fn on_new_span( + &self, + attrs: &tracing::span::Attributes<'_>, + id: &tracing::span::Id, + ctx: tracing_subscriber::layer::Context<'_, S>, + ) { + let span = ctx.span(id).unwrap(); + println!("Got on_new_span!"); + println!(" level={:?}", span.metadata().level()); + println!(" target={:?}", span.metadata().target()); + println!(" name={:?}", span.metadata().name()); + + // Our old friend, `println!` exploration. + let mut visitor = PrintlnVisitor; + attrs.record(&mut visitor); + } +} +``` + +```properties +$ cargo run --example figure_6 +Got on_new_span! + level=Level(Info) + target="figure_7" + name="outer" + field=level value=0 +Got on_new_span! + level=Level(Debug) + target="figure_7" + name="inner" + field=level value=1 +``` + +芜湖! 我们的数据回来了!但是这里有一个隐患:只能在创建的时候去访问数据。如果仅仅是为了记录 spans,那没什么大问题,但是如果我们随后需要记录事件然后去尝试访问之前的 span 呢?此时 span 的数据已经不存在了! + +如果 `tracing` 不能存储数据,那我们这些可怜的开发者该怎么办? + +### 自己存储 span 数据 + +何为一个优秀的程序员?能偷懒的时候绝不多动半跟手指,但是需要勤快的时候,也是自己动手丰衣足食的典型。 + +因此,既然 `tracing` 不支持,那就自己实现吧。先确定一个目标:捕获 span 的数据,然后存储在某个地方以便后续访问。 + +好在 `tracing-subscriber` 提供了扩展 extensions 的方式,可以让我们轻松地存储自己的数据,该扩展甚至可以跟每一个 span 联系在一起! + +虽然我们可以把之前见过的 `BTreeMap` 存在扩展中,但是由于扩展数据是被 registry 中的所有layers 所共享的,因此出于私密性的考虑,还是只保存私有字段比较合适。这里使用一个 newtype 模式来创建新的类型: +```rust +// in examples/figure_8/custom_layer.rs + +#[derive(Debug)] +struct CustomFieldStorage(BTreeMap); +``` + +每次发现一个新的 span 时,都基于它来构建一个 JSON 对象,然后将其存储在扩展数据中。 + +```rust +// in examples/figure_8/custom_layer.rs + +fn on_new_span( + &self, + attrs: &tracing::span::Attributes<'_>, + id: &tracing::span::Id, + ctx: tracing_subscriber::layer::Context<'_, S>, +) { + // 基于 field 值来构建我们自己的 JSON 对象 + let mut fields = BTreeMap::new(); + let mut visitor = JsonVisitor(&mut fields); + attrs.record(&mut visitor); + + // 使用之前创建的 newtype 包裹下 + let storage = CustomFieldStorage(fields); + + // 获取内部 span 数据的引用 + let span = ctx.span(id).unwrap(); + // 获取扩展,用于存储我们的 span 数据 + let mut extensions = span.extensions_mut(); + // 存储! + extensions.insert::(storage); +} +``` + +这样,未来任何时候我们都可以取到该 span 包含的数据( 例如在 `on_event` 方法中 )。 + +```rust +// in examples/figure_8/custom_layer.rs + +fn on_event(&self, event: &tracing::Event<'_>, ctx: tracing_subscriber::layer::Context<'_, S>) { + let scope = ctx.event_scope(event).unwrap(); + println!("Got event!"); + for span in scope.from_root() { + let extensions = span.extensions(); + let storage = extensions.get::().unwrap(); + println!(" span"); + println!(" target={:?}", span.metadata().target()); + println!(" name={:?}", span.metadata().name()); + println!(" stored fields={:?}", storage); + } +} +``` + +### 功能齐全的 JSON logger +截至目前,我们已经学了不少东西,下面来利用这些知识实现最后的 JSON logger。 + +```rust +// in examples/figure_9/custom_layer.rs + +fn on_event(&self, event: &tracing::Event<'_>, ctx: tracing_subscriber::layer::Context<'_, S>) { + // All of the span context + let scope = ctx.event_scope(event).unwrap(); + let mut spans = vec![]; + for span in scope.from_root() { + let extensions = span.extensions(); + let storage = extensions.get::().unwrap(); + let field_data: &BTreeMap = &storage.0; + spans.push(serde_json::json!({ + "target": span.metadata().target(), + "name": span.name(), + "level": format!("{:?}", span.metadata().level()), + "fields": field_data, + })); + } + + // The fields of the event + let mut fields = BTreeMap::new(); + let mut visitor = JsonVisitor(&mut fields); + event.record(&mut visitor); + + // And create our output + let output = serde_json::json!({ + "target": event.metadata().target(), + "name": event.metadata().name(), + "level": format!("{:?}", event.metadata().level()), + "fields": fields, + "spans": spans, + }); + println!("{}", serde_json::to_string_pretty(&output).unwrap()); +} +``` + +```properties +$ cargo run --example figure_9 + +{ + "fields": { + "a_bool": true, + "answer": 42, + "message": "first example" + }, + "level": "Level(Info)", + "name": "event examples/figure_9/main.rs:16", + "spans": [ + { + "fields": { + "level": 0 + }, + "level": "Level(Info)", + "name": "outer", + "target": "figure_9" + }, + { + "fields": { + "level": 1 + }, + "level": "Level(Debug)", + "name": "inner", + "target": "figure_9" + } + ], + "target": "figure_9" +} +``` + +嗯,完美。 + +### 等等,你说功能齐全? + +上面的代码在发布到生产环境后,依然运行地相当不错,但是我发现还缺失了一个功能: span 在创建之后,依然要能记录数据。 + +```rust +// in examples/figure_10/main.rs + +let outer_span = info_span!("outer", level = 0, other_field = tracing::field::Empty); +let _outer_entered = outer_span.enter(); +// Some code... +outer_span.record("other_field", &7); +``` + +如果基于之前的代码运行上面的代码,我们将不会记录 `other_field`,因为该字段在收到 `on_new_span` 事件时,还不存在。 + +对此,`Layer` 提供了 `on_record` 方法: +```rust +// in examples/figure_10/custom_layer.rs + +fn on_record( + &self, + id: &tracing::span::Id, + values: &tracing::span::Record<'_>, + ctx: tracing_subscriber::layer::Context<'_, S>, +) { + // 获取正在记录数据的 span + let span = ctx.span(id).unwrap(); + + // 获取数据的可变引用,该数据是在 on_new_span 中创建的 + let mut extensions_mut = span.extensions_mut(); + let custom_field_storage: &mut CustomFieldStorage = + extensions_mut.get_mut::().unwrap(); + let json_data: &mut BTreeMap = &mut custom_field_storage.0; + + // 使用我们的访问器老朋友 + let mut visitor = JsonVisitor(json_data); + values.record(&mut visitor); +} +``` + + +终于,在最后,我们拥有了一个功能齐全的自定义的 JSON logger,大家快去尝试下吧。当然,你也可以根据自己的需求来定制专属于你的 logger,毕竟方法是一通百通的。 + +> 在以下 github 仓库,可以找到完整的代码: https://github.com/bryanburgers/tracing-blog-post +> +> 本文由 Rustt 提供翻译 +> 原文链接: https://github.com/studyrs/Rustt/blob/main/Articles/%5B2022-04-07%5D%20在%20Rust%20中使用%20tracing%20自定义日志.md diff --git a/src/logs/tracing.md b/src/logs/tracing.md new file mode 100644 index 00000000..808ef519 --- /dev/null +++ b/src/logs/tracing.md @@ -0,0 +1,501 @@ +# 使用 tracing 记录日志 +严格来说,tracing 并不是一个日志库,而是一个分布式跟踪的 SDK,用于采集监控数据的。 + +随着微服务的流行,现在一个产品有多个系统组成是非常常见的,这种情况下,一条用户请求可能会横跨几个甚至几十个服务。此时再用传统的日志方式去跟踪这条用户请求就变得较为困难,这就是分布式追踪在现代化监控系统中这么炽手可热的原因。 + +关于分布式追踪,在后面的监控章节进行详细介绍,大家只要知道:分布式追踪的核心就是在请求的开始生成一个 `trace_id`,然后将该 `trace_id` 一直往后透穿,请求经过的每个服务都会使用该 `trace_id` 记录相关信息,最终将整个请求形成一个完整的链路予以记录下来。 + +那么后面当要查询这次请求的相关信息时,只要使用 `trace_id` 就可以获取整个请求链路的所有信息了,非常简单好用。看到这里,相信大家也明白为什么这个库的名称叫 `tracing` 了吧? + +至于为何把它归到日志库的范畴呢?因为 `tracing` 支持 `log` 门面库的 API,因此,它既可以作为分布式追踪的 SDK 来使用,也可以作为日志库来使用。 + +> 在分布式追踪中,trace_id 都是由 SDK 自动生成和往后透穿,对于用户的使用来说是完全透明的。如果你要手动用日志的方式来实现请求链路的追踪,那么就必须考虑 trace_id 的手动生成、透传,以及不同语言之间的协议规范等问题 + +## 一个简单例子 + +开始之前,需要先将 `tracing` 添加到项目的 `Cargo.toml` 中: + +```toml +[dependencies] +tracing = "0.1" +``` + +注意,在写作本文时,`0.2` 版本已经快要出来了,所以具体使用的版本请大家以阅读时为准。 + +下面的例子中将同时使用 `log` 和 `tracing` : +```rust +use log; +use tracing_subscriber::{fmt, layer::SubscriberExt, util::SubscriberInitExt}; + +fn main() { + // 只有注册 subscriber 后, 才能在控制台上看到日志输出 + tracing_subscriber::registry() + .with(fmt::layer()) + .init(); + + // 调用 `log` 包的 `info!` + log::info!("Hello world"); + + let foo = 42; + // 调用 `tracing` 包的 `info!` + tracing::info!(foo, "Hello from tracing"); +} +``` + +可以看出,门面库的排场还是有的,`tracing` 在 API 上明显是使用了 `log` 的规范。 + +运行后,输出如下日志: +```shell +2022-04-09T14:34:28.965952Z INFO test_tracing: Hello world +2022-04-09T14:34:28.966011Z INFO test_tracing: Hello from tracing foo=42 +``` + +还可以看出,`log` 的日志格式跟 `tracing` 一模一样,结合上一章节的知识,相信聪明的同学已经明白了这是为什么。 + +那么 `tracing` 跟 `log` 的具体日志实现框架有何区别呢?别急,我们再来接着看。 + + +## 异步编程中的挑战 + +除了分布式追踪,在异步编程中使用传统的日志也是存在一些问题的,最大的挑战就在于异步任务的执行没有确定的顺序,那么输出的日志也将没有确定的顺序并混在一起,无法按照我们想要的逻辑顺序串联起来。 + +**归根到底,在于日志只能针对某个时间点进行记录,缺乏上下文信息,而线程间的执行顺序又是不确定的,因此日志就有些无能为力**。而 `tracing` 为了解决这个问题,引入了 `span` 的概念( 这个概念也来自于分布式追踪 ),一个 `span` 代表了一个时间段,拥有开始和结束时间,在此期间的所有类型数据、结构化数据、文本数据都可以记录其中。 + +大家发现了吗? `span` 是可以拥有上下文信息的,这样就能帮我们把信息按照所需的逻辑性串联起来了。 + +## 核心概念 + +`tracing` 中最重要的三个概念是 `span`、`event` 和 `collector`,下面我们来一一简单介绍下。 + +### span +相比起日志只能记录在某个时间点发生的事件,`span` 最大的意义就在于它可以记录一个过程,也就是在某一段时间内发生的事件流。既然是记录时间段,那自然有开始和结束: + +```rust +use tracing::{span, Level}; +fn main() { + let span = span!(Level::TRACE, "my_span"); + + // `enter` 返回一个 RAII ,当其被 drop 时,将自动结束该 span + let enter = span.enter(); + // 这里开始进入 `my_span` 的上下文 + // 下面执行一些任务,并记录一些信息到 `my_span` 中 + // ... +} // 这里 enter 将被 drop,`my_span` 也随之结束 +``` + +### Event 事件 +`Event` 代表了某个时间点发生的事件,这方面它跟日志类似,但是不同的是,`Event` 还可以产生在 span 的上下文中。 + +```rust +use tracing::{event, span, Level}; +use tracing_subscriber::{fmt, layer::SubscriberExt, util::SubscriberInitExt}; + +fn main() { + tracing_subscriber::registry().with(fmt::layer()).init(); + // 在 span 的上下文之外记录一次 event 事件 + event!(Level::INFO, "something happened"); + + let span = span!(Level::INFO, "my_span"); + let _guard = span.enter(); + + // 在 "my_span" 的上下文中记录一次 event + event!(Level::DEBUG, "something happened inside my_span"); +} +``` + +```shell +2022-04-09T14:51:38.382987Z INFO test_tracing: something happened +2022-04-09T14:51:38.383111Z DEBUG my_span: test_tracing: something happened inside my_span +``` + +虽然 `event` 在哪里都可以使用,**但是最好只在 span 的上下文中使用**:用于代表一个时间点发生的事件,例如记录 HTTP 请求返回的状态码,从队列中获取一个对象,等等。 + +### Collector 收集器 +当 `Span` 或 `Event` 发生时,它们会被实现了 `Collect` 特征的收集器所记录或聚合。这个过程是通过通知的方式实现的:当 `Event` 发生或者 `Span` 开始/结束时,会调用 `Collect` 特征的[相应方法](https://tracing-rs.netlify.app/tracing/trait.collect#tymethod.event)通知 Collector。 + +#### tracing-subscriber +我们前面提到只有使用了 [`tracing-subscriber`](https://docs.rs/tracing-subscriber/) 后,日志才能输出到控制台中。 + +之前大家可能还不理解,现在应该明白了,它是一个 Collector,可以将记录的日志收集后,再输出到控制台中。 + +## 使用方法 + +### `span!` 宏 +`span!` 宏可以用于创建一个 `Span` 结构体,然后通过调用结构体的 `enter` 方法来开始,再通过超出作用域时的 `drop` 来结束。 + +```rust +use tracing::{span, Level}; +fn main() { + let span = span!(Level::TRACE, "my_span"); + + // `enter` 返回一个 RAII ,当其被 drop 时,将自动结束该 span + let enter = span.enter(); + // 这里开始进入 `my_span` 的上下文 + // 下面执行一些任务,并记录一些信息到 `my_span` 中 + // ... +} // 这里 enter 将被 drop,`my_span` 也随之结束 +``` + +### #[instrument] +如果想要将某个函数的整个函数体都设置为 span 的范围,最简单的方法就是为函数标记上 `#[instrument]`,此时 tracing 会自动为函数创建一个 span,span 名跟函数名相同,在输出的信息中还会自动带上函数参数。 + +```rust +use tracing::{info, instrument}; +use tracing_subscriber::{fmt, layer::SubscriberExt, util::SubscriberInitExt}; + +#[instrument] +fn foo(ans: i32) { + info!("in foo"); +} + +fn main() { + tracing_subscriber::registry().with(fmt::layer()).init(); + foo(42); +} +``` + +```shell +2022-04-10T02:44:12.885556Z INFO foo{ans=42}: test_tracing: in foo +``` + +关于 `#[instrument]` 详细说明,请参见[官方文档](https://tracing-rs.netlify.app/tracing/attr.instrument.html)。 + +### in_scope +对于没有内置 tracing 支持或者无法使用 `#instrument` 的函数,例如外部库的函数,我们可以使用 `Span` 结构体的 `in_scope` 方法,它可以将同步代码包裹在一个 span 中: +```rust +use tracing::info_span; + +let json = info_span!("json.parse").in_scope(|| serde_json::from_slice(&buf))?; +``` + +### 在 async 中使用 span +需要注意,如果是在异步编程时使用,要避免以下使用方式: +```rust +async fn my_async_function() { + let span = info_span!("my_async_function"); + + // WARNING: 该 span 直到 drop 后才结束,因此在 .await 期间,span 依然处于工作中状态 + let _enter = span.enter(); + + // 在这里 span 依然在记录,但是 .await 会让出当前任务的执行权,然后运行时会去运行其它任务,此时这个 span 可能会记录其它任务的执行信息,最终记录了不正确的 trace 信息 + some_other_async_function().await + + // ... +} +``` + +我们建议使用以下方式,简单又有效: +```rust +use tracing::{info, instrument}; +use tokio::{io::AsyncWriteExt, net::TcpStream}; +use std::io; + +#[instrument] +async fn write(stream: &mut TcpStream) -> io::Result { + let result = stream.write(b"hello world\n").await; + info!("wrote to stream; success={:?}", result.is_ok()); + result +} +``` + +那有同学可能要问了,是不是我们无法在异步代码中使用 `span.enter` 了,答案是:是也不是。 + +是,你无法直接使用 `span.enter` 语法了,原因上面也说过,但是可以通过下面的方式来曲线使用: +```rust +use tracing::Instrument; + +let my_future = async { + // ... +}; + +my_future + .instrument(tracing::info_span!("my_future")) + .await +``` + + +### spans 嵌套 +`tracing` 的 span 不仅仅是上面展示的基本用法,它们还可以进行嵌套! +```rust +use tracing::{debug, info, span, Level}; +use tracing_subscriber::{fmt, layer::SubscriberExt, util::SubscriberInitExt}; + +fn main() { + tracing_subscriber::registry().with(fmt::layer()).init(); + + let scope = span!(Level::DEBUG, "foo"); + let _enter = scope.enter(); + info!("Hello in foo scope"); + debug!("before entering bar scope"); + { + let scope = span!(Level::DEBUG, "bar", ans = 42); + let _enter = scope.enter(); + debug!("enter bar scope"); + info!("In bar scope"); + debug!("end bar scope"); + } + debug!("end bar scope"); +} +``` + +```shell +INFO foo: log_test: Hello in foo scope +DEBUG foo: log_test: before entering bar scope +DEBUG foo:bar{ans=42}: log_test: enter bar scope +INFO foo:bar{ans=42}: log_test: In bar scope +DEBUG foo:bar{ans=42}: log_test: end bar scope +DEBUG foo: log_test: end bar scope +``` + +在上面的日志中,`foo:bar` 不仅包含了 `foo` 和 `bar` span 名,还显示了它们之间的嵌套关系。 + + +## 对宏进行配置 + +### 日志级别和目标 +`span!` 和 `event!` 宏都需要设定相应的日志级别,而且它们支持可选的 `target` 或 `parent` 参数( 只能二者选其一 ),该参数用于描述事件发生的位置,如果父 span 没有设置,`target` 参数也没有提供,那这个位置默认分别是当前的 span 和 当前的模块。 + +```rust +use tracing::{debug, info, span, Level,event}; +use tracing_subscriber::{fmt, layer::SubscriberExt, util::SubscriberInitExt}; + +fn main() { + tracing_subscriber::registry().with(fmt::layer()).init(); + + let s = span!(Level::TRACE, "my span"); + // 没进入 span,因此输出日志将不回带上 span 的信息 + event!(target: "app_events", Level::INFO, "something has happened 1!"); + + // 进入 span ( 开始 ) + let _enter = s.enter(); + // 没有设置 target 和 parent + // 这里的对象位置分别是当前的 span 名和模块名 + event!(Level::INFO, "something has happened 2!"); + // 设置了 target + // 这里的对象位置分别是当前的 span 名和 target + event!(target: "app_events",Level::INFO, "something has happened 3!"); + + let span = span!(Level::TRACE, "my span 1"); + // 这里就更为复杂一些,留给大家作为思考题 + event!(parent: &span, Level::INFO, "something has happened 4!"); +} +``` + +### 记录字段 +我们可以通过语法 `field_name = field_value` 来输出结构化的日志 + +```rust +// 记录一个事件,带有两个字段: +// - "answer", 值是 42 +// - "question", 值是 "life, the universe and everything" +event!(Level::INFO, answer = 42, question = "life, the universe, and everything"); + +// 日志输出 -> INFO test_tracing: answer=42 question="life, the universe, and everything" +``` + +#### 捕获环境变量 +还可以捕获环境中的变量: + +```rust +let user = "ferris"; + +// 下面的简写方式 +span!(Level::TRACE, "login", user); +// 等价于: +span!(Level::TRACE, "login", user = user); +``` + +```rust +use tracing::{info, span, Level}; +use tracing_subscriber::{fmt, layer::SubscriberExt, util::SubscriberInitExt}; + +fn main() { + tracing_subscriber::registry().with(fmt::layer()).init(); + + let user = "ferris"; + let s = span!(Level::TRACE, "login", user); + let _enter = s.enter(); + + info!(welcome="hello", user); + // 下面一行将报错,原因是这种写法是格式化字符串的方式,必须使用 info!("hello {}", user) + // info!("hello", user); +} + +// 日志输出 -> INFO login{user="ferris"}: test_tracing: welcome="hello" user="ferris" +``` + +#### 字段名的多种形式 +字段名还可以包含 `.` : +```rust +let user = "ferris"; +let email = "ferris@rust-lang.org"; +event!(Level::TRACE, user, user.email = email); + +// 还可以使用结构体 +let user = User { + name: "ferris", + email: "ferris@rust-lang.org", +}; + +// 直接访问结构体字段,无需赋值即可使用 +span!(Level::TRACE, "login", user.name, user.email); + +// 字段名还可以使用字符串 +event!(Level::TRACE, "guid:x-request-id" = "abcdef", "type" = "request"); + +// 日志输出 -> +// TRACE test_tracing: user="ferris" user.email="ferris@rust-lang.org" +// TRACE test_tracing: user.name="ferris" user.email="ferris@rust-lang.org" +// TRACE test_tracing: guid:x-request-id="abcdef" type="request" +``` + +#### ? +`?` 符号用于说明该字段将使用 `fmt::Debug` 来格式化。 + +```rust + #[derive(Debug)] +struct MyStruct { + field: &'static str, +} + +let my_struct = MyStruct { + field: "Hello world!", +}; + +// `my_struct` 将使用 Debug 的形式输出 +event!(Level::TRACE, greeting = ?my_struct); +// 等价于: +event!(Level::TRACE, greeting = tracing::field::debug(&my_struct)); + +// 下面代码将报错, my_struct 没有实现 Display +// event!(Level::TRACE, greeting = my_struct); + +// 日志输出 -> TRACE test_tracing: greeting=MyStruct { field: "Hello world!" } +``` + +#### % +`%` 说明字段将用 `fmt::Display` 来格式化。 + +```rust +// `my_struct.field` 将使用 `fmt::Display` 的格式化形式输出 +event!(Level::TRACE, greeting = %my_struct.field); +// 等价于: +event!(Level::TRACE, greeting = tracing::field::display(&my_struct.field)); + +// 作为对比,大家可以看下 Debug 和正常的字段输出长什么样 +event!(Level::TRACE, greeting = ?my_struct.field); +event!(Level::TRACE, greeting = my_struct.field); + +// 下面代码将报错, my_struct 没有实现 Display +// event!(Level::TRACE, greeting = %my_struct); +``` + +```shell +2022-04-10T03:49:00.834330Z TRACE test_tracing: greeting=Hello world! +2022-04-10T03:49:00.834410Z TRACE test_tracing: greeting=Hello world! +2022-04-10T03:49:00.834422Z TRACE test_tracing: greeting="Hello world!" +2022-04-10T03:49:00.834433Z TRACE test_tracing: greeting="Hello world!" +``` + +#### Empty +字段还能标记为 `Empty`,用于说明该字段目前没有任何值,但是可以在后面进行记录。 + +```rust +use tracing::{trace_span, field}; + +let span = trace_span!("my_span", greeting = "hello world", parting = field::Empty); + +// ... + +// 现在,为 parting 记录一个值 +span.record("parting", &"goodbye world!"); +``` + +#### 格式化字符串 +除了以字段的方式记录信息,我们还可以使用格式化字符串的方式( 同 `println!` 、`format!` )。 + +> 注意,当字段跟格式化的方式混用时,必须把格式化放在最后,如下所示 + +```rust +let question = "the ultimate question of life, the universe, and everything"; +let answer = 42; +event!( + Level::DEBUG, + question.answer = answer, + question.tricky = true, + "the answer to {} is {}.", question, answer +); + +// 日志输出 -> DEBUG test_tracing: the answer to the ultimate question of life, the universe, and everything is 42. question.answer=42 question.tricky=true +``` + +### 文件输出 +截至目前,我们上面的日志都是输出到控制台中。 + +针对文件输出,`tracing` 提供了一个专门的库 [tracing-appender](https://github.com/tokio-rs/tracing/tree/master/tracing-appender),大家可以查看官方文档了解更多。 + + +## 一个综合例子 + +最后,再来看一个综合的例子,使用了 [color-eyre](https://github.com/yaahc/color-eyre) 和 文件输出,前者用于为输出的日志加上更易读的颜色。 + +```rust +use color_eyre::{eyre::eyre, Result}; +use tracing::{error, info, instrument}; +use tracing_appender::{non_blocking, rolling}; +use tracing_error::ErrorLayer; +use tracing_subscriber::{ + filter::EnvFilter, fmt, layer::SubscriberExt, util::SubscriberInitExt, Registry, +}; + +#[instrument] +fn return_err() -> Result<()> { + Err(eyre!("Something went wrong")) +} + +#[instrument] +fn call_return_err() { + info!("going to log error"); + if let Err(err) = return_err() { + // 推荐大家运行下,看看这里的输出效果 + error!(?err, "error"); + } +} + +fn main() -> Result<()> { + let env_filter = EnvFilter::try_from_default_env().unwrap_or_else(|_| EnvFilter::new("info")); + // 输出到控制台中 + let formatting_layer = fmt::layer().pretty().with_writer(std::io::stderr); + + // 输出到文件中 + let file_appender = rolling::never("logs", "app.log"); + let (non_blocking_appender, _guard) = non_blocking(file_appender); + let file_layer = fmt::layer() + .with_ansi(false) + .with_writer(non_blocking_appender); + + // 注册 + Registry::default() + .with(env_filter) + // ErrorLayer 可以让 color-eyre 获取到 span 的信息 + .with(ErrorLayer::default()) + .with(formatting_layer) + .with(file_layer) + .init(); + + // 安裝 color-eyre 的 panic 处理句柄 + color_eyre::install()?; + + call_return_err(); + + Ok(()) +} +``` + +## 总结 & 推荐 +至此,`tracing` 的介绍就已结束,相信大家都看得出,它比上个章节的 `log` 及兄弟们要更加复杂一些,一方面是因为它能更好的支持异步编程环境,另一方面就是它还是一个分布式追踪的库,对于后者,我们将在后续的监控章节进行讲解。 + +如果你让我推荐使用哪个,那我的建议是: + +- 对于简单的工程,例如用于 POC( Proof of Concepts ) 目的,使用 `log` 即可 +- 对于需要认真对待,例如生产级或优秀的开源项目,建议使用 tracing 的方式,一举解决日志和监控的后顾之忧 \ No newline at end of file diff --git a/src/practice.md b/src/practice.md new file mode 100644 index 00000000..4e74df7c --- /dev/null +++ b/src/practice.md @@ -0,0 +1,3 @@ +## 课后习题 + +[https://practice.rs](https://practice.rs) \ No newline at end of file diff --git a/src/practice/interview.md b/src/practice/interview.md index b4b2ce81..cfab021b 100644 --- a/src/practice/interview.md +++ b/src/practice/interview.md @@ -13,3 +13,6 @@ - [字节跳动 Rust/C++ 实习](https://www.nowcoder.com/discuss/538078) - [记一次面试](https://huangjj27.github.io/interview.html) - [字节跳动面试经历](https://blog.sbw.so/u/byte-dance-rust-cpp-interview-experience.html) + + +To be continued.. \ No newline at end of file diff --git a/src/practice/intro.md b/src/practice/intro.md index 7f89d0ee..805221d7 100644 --- a/src/practice/intro.md +++ b/src/practice/intro.md @@ -1,2 +1,3 @@ # Rust最佳实践 + 对于生产级项目而言,运行稳定性和可维护性是非常重要的,本章就一起来看看 Rust 项目有哪些最佳实践准则。 \ No newline at end of file diff --git a/src/practice/logs.md b/src/practice/logs.md deleted file mode 100644 index 2acc0d2e..00000000 --- a/src/practice/logs.md +++ /dev/null @@ -1,9 +0,0 @@ -# 日志和监控 todo - - -```rust - if cfg!(debug_assertions) { - eprintln!("debug: {:?} -> {:?}", - record, fields); - } -``` \ No newline at end of file diff --git a/src/practice/observability.md b/src/practice/observability.md deleted file mode 100644 index 3b225569..00000000 --- a/src/practice/observability.md +++ /dev/null @@ -1 +0,0 @@ -# 可观测性监控 todo diff --git a/src/practice/third-party-libs.md b/src/practice/third-party-libs.md index 9b187fae..c137fe6b 100644 --- a/src/practice/third-party-libs.md +++ b/src/practice/third-party-libs.md @@ -4,7 +4,7 @@ 本文就分门别类的精心挑选了一些非常适合日常开发使用的三方库,同时针对优缺点、社区活跃等进行了评价,同一个类别的库,按照**推荐度优先级降序排列**,希望大家能喜欢。 -> 本文节选自[Fancy Rust](https://fancy.rs), 一个Rust酷库推荐项目, 里面精选了各个领域的好项目,无论是学习还是工作使用,都能助你一臂之力。 +> 本文节选自[Cook Rust](https://cook.rs) ## 目录 - 日常开发常用的Rust库: diff --git a/src/profiling/memory/intro.md b/src/profiling/memory/intro.md index 76dbeb65..55d04b69 100644 --- a/src/profiling/memory/intro.md +++ b/src/profiling/memory/intro.md @@ -1,3 +1,6 @@ # 深入内存 -部分内容借鉴了Rust in action和Rust高级编程 \ No newline at end of file +部分内容借鉴了Rust in action和Rust高级编程 + + +https://www.youtube.com/watch?v=rDoqT-a6UFg \ No newline at end of file diff --git a/src/rust-weekly.md b/src/rust-weekly.md new file mode 100644 index 00000000..9e5c9cc9 --- /dev/null +++ b/src/rust-weekly.md @@ -0,0 +1,83 @@ +# Rust 语言周刊 + +精选过去一周的文章、新闻、开源项目和 Rust 语言动态( 中文内容用 🇨🇳 进行标识 ),欢迎大家[订阅及查看往期回顾](https://github.com/studyrs/rust-weekly)。 + + +## 「Rust 语言周刊」 第 7 期 · 2022-04-08 +Rust 语言周刊精选过去一周的优秀文章、新闻、开源项目和 Rust 语言动态。 + +本周刊由 StudyRust 社区倾情打造,其中的 [Zh] 中文资料由 Rustt 进行翻译,原始 Markdown 文档已全部开源,欢迎大家阅读和订阅。 + +> StudyRust 官网:https://studyrust.org , 公众号 studyrust + + +
题图: 一本生锈的书
+ +#### Rust新闻 + +1、[Zh] [Rust 1.60 发布](https://course.rs/appendix/rust-versions/1.60.html) + +在新版中,我们可以查看 Cargo 构建时的详细耗时了,有助于分析和改善编译时间,还有就是条件编译和依赖引入了新的期待已久的功能。 + +1、[Zh] [Rust 2024 官方路线图公布](https://www.163.com/dy/article/H4CMGAF50511CUMI.html) +这篇文章从比较宏观的角度讲解了 Rust 2024 的路线图。 + +2、[Zh] [Rust 2024:敢于要求更多](https://github.com/studyrs/Rustt/blob/main/Articles/%5B2022-03-28%5D%20Rust%202024:敢于要求更多.md) + +本文是从更细节的角度出发讲解 Rust 2024 的路线图,喜欢技术细节的同学不容错过。 + +3、[Rust 基金会激励计划](https://foundation.rust-lang.org/news/2022-03-31-cgp-is-open-announcement/) + +基金会筹划已久的开源项目激励计划终于开始实施了,里面包含了基金会合作伙伴、开源项目等一系列举措,大家快去申请了! + +#### 开源项目 + +1、[一本生锈的书](https://github.com/studyrs/rusty-book) + +这本书主要关于如何打造一个 “有锈” 的 Rust 项目。 + +2、[StarfishQL](https://www.sea-ql.org/SeaORM/blog/2022-04-04-introducing-starfish-ql/) + +一个图数据库和查询引擎,目前主要的目的是绘制和探索 crates.io 上的包依赖网络。 + +3、[Coppers](https://github.com/ThijsRay/coppers) + +一套测试工具,用于测量 Rust 项目的能耗情况。 + +#### 精选文章 + +1、[虚弱之塔: 每个人都应该懂的内存模型](https://gankra.github.io/blah/tower-of-weakenings/) + +干货作者又出手了,这次为我们带来了内存模型的分析和改进。他甚至基于这种改进修改了 Rust 代码,并且应用在自己的部分项目上,crazy! + +2、[Rust 的 Mutex 为何这样设计?](https://cliffle.com/blog/rust-mutexes/) + +已经有不少人抱怨为何 Rust 的 Mutex 跟别的语言不一样,例如它可以持有数据。作者针对这些疑问给出了自己的分析,总之他站队 Rust 的设计。 + +3、[Zh] [在 Rust 中使用 epoll 实现非阻塞 IO](https://github.com/studyrs/Rustt/blob/main/Articles/%5B2022-03-29%5D%20在%20Rust%20中使用%20epoll%20实现基本的非阻塞%20IO.md) + +本文试图解释清楚 epoll 和非阻塞 IO 背后的原理 + +4、[Zh] [用 Rust 写 Devops 工具](https://github.com/studyrs/Rustt/blob/main/Articles/%5B2022-04-02%5D%20用%20Rust%20写%20DevOps%20工具.md) + +文章中会介绍几个 Rust 用在 DevOps 领域的案例,以及为什么使用 Rust。其中我们还会介绍一些在 AWS 上基于 Rust 的 DevOps 工具常用的库。 + +5、[Zh] [Rust 背后不是公司](https://github.com/studyrs/Rustt/blob/main/Articles/%5B2022-04-01%5D%20Rust%20背后并不是公司.md) +Rust 大佬带来的对 Rust 组织架构的分析。 + +6、[使用 Rust 改善 Python S3 客户端的性能](https://joshua-robinson.medium.com/improving-python-s3-client-performance-with-rust-e9639359072f) + +Python 是数据科学的主力军语言,但是性能有的时候会成为平静下来。例如现在亚马逊 S3 存储非常火热,如果大家使用 S3 作为数据集的存储,那么 Pyhton 去读取这些数据可能就是一个很大的性能瓶颈。 + +7、[Qiskit 使用 Rust 来获取更好的性能](https://medium.com/qiskit/new-weve-started-using-rust-in-qiskit-for-better-performance-a3676433ca8c) + +Qiskit 是一家从事量子计算的公司,最近他们 在 Python 之外还引入了 Rust 语言,事实证明,这个举措带来了显著的性能提升。 + +8、[ScyllaDB 将数据库驱动使用异步 Rust 重新实现](https://thenewstack.io/why-were-porting-our-database-drivers-to-async-rust/) + +ScyllaDB 是这几年很火的开源分布式 KV 数据库,兼容 Cassandra 的 CQL 协议,性能非常非常高。这不,为了性能和安全性,他们又出手了,这次是使用 Rust 将客户端的驱动进行了重写( 使用 tokio )。 + +9、[在 2022 年使用 axum 和 yew 打造一个全栈 Rust web 服务](https://robert.kra.hn/posts/2022-04-03_rust-web-wasm/) + +在过去两年,WebAssembly 在 Rust 这里发展的非常快,而且构建和打包也变得更加简单。因此,是时候使用 Rust 写一套前后端服务了。 + diff --git a/src/rustt.md b/src/rustt.md new file mode 100644 index 00000000..a5df3788 --- /dev/null +++ b/src/rustt.md @@ -0,0 +1,13 @@ +# Rustt 翻译计划 + +🥇Rustt 翻译计划,这里有国内最优质、最实时的 Rust 技术文章、学习资料和新闻资讯,欢迎大家[前往阅读和订阅](https://github.com/studyrs/Rustt)。 + +## 最近优秀作品展 + +| 中文名 | 翻译时间 | 作者 | +| ------- | -------- | ----- | +| [series][Rust 六边形架构](https://github.com/studyrs/Rustt/tree/main/Articles/%5B2022-04-03%5D%20Rust%20六边形架构) | 2022-04-04 | [trdthg](https://github.com/trdthg) | +| [用 Rust 写 Devops 工具](https://github.com/studyrs/Rustt/blob/main/Articles/%5B2022-04-02%5D%20用%20Rust%20写%20DevOps%20工具.md) | 2022-04-03 | [Xiaobin.Liu](https://github.com/lxbwolf) | +| [Rust 大佬给初学者的学习建议](https://github.com/studyrs/Rustt/blob/main/Articles/%5B2022-04-02%5D%20Rust%20大佬给初学者的学习建议.md) | 2022-04-02 | [Asura](https://github.com/asur4s) | +| [Rust 背后并不是公司](https://github.com/studyrs/Rustt/blob/main/Articles/%5B2022-04-01%5D%20Rust%20背后并不是公司.md) | 2022-04-01 | [子殊](https://github.com/allenli178) | +| [在 Rust 中使用 epoll 实现非阻塞 IO](https://github.com/studyrs/Rustt/blob/main/Articles/%5B2022-03-29%5D%20在%20Rust%20中使用%20epoll%20实现基本的非阻塞%20IO.md) | 2022-03-29 | [BK0717](https://github.com/hyuuko) | diff --git a/src/rusty-book.md b/src/rusty-book.md new file mode 100644 index 00000000..9f769bbe --- /dev/null +++ b/src/rusty-book.md @@ -0,0 +1,23 @@ +

Rusty Book( 锈书 )

+ +
+ +
+ +
+ +
+ +在 Rust 元宇宙,最优秀的项目可以称之为 `rusty`,用咱中国话来说,就是够锈( 秀 )。 + +如果你有以下需求,可以来看看锈书,它绝对不会让你失望: + +- 想要知道现在优秀的、关注度高的 Rust 项目有哪些 + +- 发现一些好玩、有趣、酷炫的开源库 + +- 需要寻找某个类型的库,例如,一个 HTTP 客户端或 ProtoBuffer 编码库,要求是好用、更新活跃、高质量 + +- 想要寻找常用操作的代码片段,用于熟悉 Rust 或者直接复制粘贴到自己的项目中,例如文件操作、数据库操作、HTTP 请求、排序算法、正则等 + +在线阅读锈书:[Github地址](https://github.com/studyrs/rusty-book) diff --git a/src/studyrust.md b/src/studyrust.md new file mode 100644 index 00000000..cbd30ff1 --- /dev/null +++ b/src/studyrust.md @@ -0,0 +1,24 @@ +## StudyRust 社区 + + + +

跟我来吧,学完 Rust,你的前面就是星辰大海!

+ +--- +这个社区与其它 Rust 社区不一样,从名称上就能看得出来:我们聚焦于 Rust 语言的学习研究和实战应用上,不搞花活! + +此外,我们还提供了一个优质的公众号: `studyrust`,里面的文章是由 [Rustt](https://rustt.org) 翻译组提供,搬运自国外优秀的 Rust 技术文章、学习资料、新闻资讯等。 + +- 社区官网:[https://studyrust.org](https://studyrust.org),正在建设中,暂时跳转到 GitHub 组织首页 +- QQ交流群: 1009730433 +- 微信公众号:`studyrust` + +以下是社区的部分 Rust 项目: + +- [Rust语言圣经](https://course.rs) +- [Rust By Practice](https://github.com/sunface/rust-by-practice) +- [锈书](https://github.com/studyrs/rusty-book) +- [Rustt 翻译计划](https://rustt.org) +- [Rust 语言周刊](https://weekly.rs) + + \ No newline at end of file diff --git a/src/test/assertion.md b/src/test/assertion.md index e0051ee7..95505391 100644 --- a/src/test/assertion.md +++ b/src/test/assertion.md @@ -46,7 +46,7 @@ note: run with `RUST_BACKTRACE=1` environment variable to display a backtrace 因为涉及到相等比较( `==` )和错误信息打印,因此两个表达式的值必须实现 `PartialEq` 和 `Debug` 特征,其中所有的原生类型和大多数标准库类型都实现了这些特征,而对于你自己定义的结构体、枚举,如果想要对其进行 `assert_eq!` 断言,则需要实现 `PartialEq` 和 `Debug` 特征: - 若希望实现个性化相等比较和错误打印,则需手动实现 -- 否则可以为自定义的结构体、枚举添加 `#[derive(PartialEq, Debug)]` 注解,来[自动派生](../appendix/derive.md)对应的特征 +- 否则可以为自定义的结构体、枚举添加 `#[derive(PartialEq, Debug)]` 注解,来[自动派生](https://course.rs/appendix/derive.html)对应的特征 **以上特征限制对于下面即将讲解的 `assert_ne!` 一样有效,** 就不再重复讲述。 diff --git a/src/test/ci.md b/src/test/ci.md index 82871132..738af6fe 100644 --- a/src/test/ci.md +++ b/src/test/ci.md @@ -1,6 +1,6 @@ -# 用 Github Actions 进行持续集成 +# 用 GitHub Actions 进行持续集成 -[Github Actions](https://github.com/features/actions) 是官方于 2018 年推出的持续集成服务,它非常强大,本文将手把手带领大家学习如何使用 `Github Actions` 对 Rust 项目进行持续集成。 +[GitHub Actions](https://github.com/features/actions) 是官方于 2018 年推出的持续集成服务,它非常强大,本文将手把手带领大家学习如何使用 `GitHub Actions` 对 Rust 项目进行持续集成。 持续集成是软件开发中异常重要的一环,大家应该都听说过 `Jenkins`,它就是一个拥有悠久历史的持续集成工具。简单来说,持续集成会定期拉取同一个项目中所有成员的相关代码,对其进行自动化构建。 @@ -8,11 +8,11 @@ 在有了持续集成后,只要编写好相应的编译、测试、发布配置文件,那持续集成平台会自动帮助我们完成整个相关的流程,期间无需任何人介入,高效且可靠。 -## Github Actions +## GitHub Actions -而本文的主角正是这样的持续集成平台,它由 Github 官方提供,并且跟 github 进行了深度的整合,其中 `actions` 代表了代码拉取、测试运行、登陆远程服务器、发布到第三方服务等操作行为。 +而本文的主角正是这样的持续集成平台,它由 GitHub 官方提供,并且跟 GitHub 进行了深度的整合,其中 `actions` 代表了代码拉取、测试运行、登陆远程服务器、发布到第三方服务等操作行为。 -最妙的是 Github 发现这些 `actions` 其实在很多项目中都是类似的,意味着 `actions` 完全可以被多个项目共享使用,而不是每个项目都从零开发自己的 `actions`。 +最妙的是 GitHub 发现这些 `actions` 其实在很多项目中都是类似的,意味着 `actions` 完全可以被多个项目共享使用,而不是每个项目都从零开发自己的 `actions`。 若你需要某个 `action`,不必自己写复杂的脚本,直接引用他人写好的 `action` 即可,整个持续集成过程,就变成了多个 `action` 的组合,这就是` GitHub Actions` 最厉害的地方。 @@ -20,8 +20,8 @@ 既然 `action` 这么强大,我们就可以将自己的 `action` 分享给他人,也可以引用他人分享的 `action`,有以下几种方式: -1. 将你的 `action` 放在 github 上的公共仓库中,这样其它开发者就可以引用,例如 [github-profile-summary-cards](https://github.com/vn7n24fzkq/github-profile-summary-cards) 就提供了相应的 `action`,可以生成 github 用户统计信息,然后嵌入到你的个人主页中,具体效果[见这里](https://github.com/sunface) -2. Github 提供了一个[官方市场](https://github.com/marketplace?type=actions),里面收集了许多质量不错的 `actions`,并支持在线搜索 +1. 将你的 `action` 放在 GitHub 上的公共仓库中,这样其它开发者就可以引用,例如 [github-profile-summary-cards](https://github.com/vn7n24fzkq/github-profile-summary-cards) 就提供了相应的 `action`,可以生成 GitHub 用户统计信息,然后嵌入到你的个人主页中,具体效果[见这里](https://github.com/sunface) +2. GitHub 提供了一个[官方市场](https://github.com/marketplace?type=actions),里面收集了许多质量不错的 `actions`,并支持在线搜索 3. [awesome-actions](https://github.com/sdras/awesome-actions),由三方开发者收集并整理的 actions 4. [starter workflows](https://github.com/actions/starter-workflows),由官方提供的工作流( workflow )模版 @@ -39,18 +39,18 @@ actions/setup-node@f099707 # 指向一个 commit ## Actions 基础 -在了解了何为 Github Actions 后,再来通过一个基本的例子来学习下它的基本概念,注意,由于篇幅有限,我们只会讲解最常用的部分,如果想要完整的学习,请移步[这里](https://docs.github.com/en/actions)。 +在了解了何为 GitHub Actions 后,再来通过一个基本的例子来学习下它的基本概念,注意,由于篇幅有限,我们只会讲解最常用的部分,如果想要完整的学习,请移步[这里](https://docs.github.com/en/actions)。 #### 创建 action demo -首先,为了演示,我们需要创建一个公开的 github 仓库 `rust-action`,然后在仓库主页的导航栏中点击 `Actions` ,你会看到如下页面 : +首先,为了演示,我们需要创建一个公开的 GitHub 仓库 `rust-action`,然后在仓库主页的导航栏中点击 `Actions` ,你会看到如下页面 : 接着点击 `set up a workflow yourself ->` ,你将看到系统为你自动创建的一个工作流 workflow ,在 `rust-action/.github/workflows/main.yml` 文件中包含以下内容: ```yml -# 下面是一个基础的工作流,你可以基于它来编写自己的 Github Actions +# 下面是一个基础的工作流,你可以基于它来编写自己的 GitHub Actions name: CI # 控制工作流何时运行 @@ -113,23 +113,23 @@ jobs: -至此,我们已经初步掌握 `Github Actions` 的用法,现在来看看一些基本的概念。 +至此,我们已经初步掌握 `GitHub Actions` 的用法,现在来看看一些基本的概念。 #### 基本概念 -- **Github Actions**,每个项目都拥有一个 `Actions` ,可以包含多个工作流 +- **GitHub Actions**,每个项目都拥有一个 `Actions` ,可以包含多个工作流 - **workflow 工作流**,描述了一次持续集成的过程 - **job 作业**,一个工作流可以包含多个作业,因为一次持续集成本身就由多个不同的部分组成 - **step 步骤**,每个作业由多个步骤组成,按照顺序一步一步完成 - **action 动作**,每个步骤可以包含多个动作,例如上例中的 `Run a multi-line script` 步骤就包含了两个动作 -可以看出,每一个概念都是相互包含的关系,前者包含了后者,层层相扣,正因为这些精心设计的对象才有了强大的 `Github Actions`。 +可以看出,每一个概念都是相互包含的关系,前者包含了后者,层层相扣,正因为这些精心设计的对象才有了强大的 `GitHub Actions`。 #### on `on` 可以设定事件用于触发工作流的运行: -1. 一个或多个 Github 事件,例如 `push` 一个 `commit`、创建一个 `issue`、提交一次 `pr` 等等,详细的事件列表参见[这里](https://docs.github.com/en/actions/using-workflows/events-that-trigger-workflows) +1. 一个或多个 GitHub 事件,例如 `push` 一个 `commit`、创建一个 `issue`、提交一次 `pr` 等等,详细的事件列表参见[这里](https://docs.github.com/en/actions/using-workflows/events-that-trigger-workflows) 2. 预定的时间,例如每天零点零分触发,详情见[这里](https://docs.github.com/en/actions/using-workflows/events-that-trigger-workflows#schedule) @@ -138,11 +138,11 @@ on: schedule: -cron:'0 0 * * *' ``` -3. 外部事件触发,例如你可以通过 `REST API` 向 Github 发送请求去触发,具体请查阅[官方文档](https://docs.github.com/en/actions/using-workflows/events-that-trigger-workflows#repository_dispatch) +3. 外部事件触发,例如你可以通过 `REST API` 向 GitHub 发送请求去触发,具体请查阅[官方文档](https://docs.github.com/en/actions/using-workflows/events-that-trigger-workflows#repository_dispatch) #### jobs -工作流由一个或多个作业( job )组成,这些作业可以顺序运行也可以并行运行,同时我们还能使用 `needs` 来指定作业之间的依赖关系: +工作流由一个或多个作业 `job` 组成,这些作业可以顺序运行也可以并行运行,同时我们还能使用 `needs` 来指定作业之间的依赖关系: ```yml jobs: @@ -159,9 +159,9 @@ jobs: #### runs-on -指定作业的运行环境,运行器 `runner` 分为两种:`GitHub-hosted runner` 和 `self-hosted runner`,后者是使用自己的机器来运行作业,但是需要 Github 能进行访问并给予相应的机器权限,感兴趣的同学可以看看[这里](https://docs.github.com/en/actions/using-jobs/choosing-the-runner-for-a-job#choosing-self-hosted-runners)。 +指定作业的运行环境,运行器 `runner` 分为两种:`GitHub-hosted runner` 和 `self-hosted runner`,后者是使用自己的机器来运行作业,但是需要 GitHub 能进行访问并给予相应的机器权限,感兴趣的同学可以看看[这里](https://docs.github.com/en/actions/using-jobs/choosing-the-runner-for-a-job#choosing-self-hosted-runners)。 -而对于前者,Github 提供了以下的运行环境: +而对于前者,GitHub 提供了以下的运行环境: @@ -221,18 +221,18 @@ jobs: 如果有多个 `env` 存在,会使用就近那个。 -至此,`Github Actions` 的常用内容大家已经基本了解,下面来看一个实用的示例。 +至此,`GitHub Actions` 的常用内容大家已经基本了解,下面来看一个实用的示例。 -## 真实示例:生成 Github 统计卡片 +## 真实示例:生成 GitHub 统计卡片 -相信大家看过不少用户都定制了自己的个性化 Github 首页,这个是通过在个人名下创建一个同名的仓库来实现的,该仓库中的 `Readme.md` 的内容会自动展示在你的个人首页中,例如 `Sunface` 的[个人首页](https://github.com/sunface) 和内容所在的[仓库](https://github.com/sunface/sunface)。 +相信大家看过不少用户都定制了自己的个性化 GitHub 首页,这个是通过在个人名下创建一个同名的仓库来实现的,该仓库中的 `Readme.md` 的内容会自动展示在你的个人首页中,例如 `Sunface` 的[个人首页](https://github.com/sunface) 和内容所在的[仓库](https://github.com/sunface/sunface)。 -大家可能会好奇上面链接中的 Github 统计卡片如何生成,其实有两种办法: +大家可能会好奇上面链接中的 GitHub 统计卡片如何生成,其实有两种办法: - 使用 [github-readme-stats](https://github.com/anuraghazra/github-readme-stats) -- 使用 `Github Actions` 来引用其它人提供的 `action` 生成对应的卡片,再嵌入进来, `Sunface` 的个人首页就是这么做的 +- 使用 `GitHub Actions` 来引用其它人提供的 `action` 生成对应的卡片,再嵌入进来, `Sunface` 的个人首页就是这么做的 -第一种的优点就是非常简单,缺点是样式不太容易统一,不能对齐对于强迫症来说实在难受 :( 而后者的优点是规规整整的卡片,缺点就是使用起来更加复杂,而我们正好借此来看看真实的 `Github Actions` 长什么样。 +第一种的优点就是非常简单,缺点是样式不太容易统一,不能对齐对于强迫症来说实在难受 :( 而后者的优点是规规整整的卡片,缺点就是使用起来更加复杂,而我们正好借此来看看真实的 `GitHub Actions` 长什么样。 首先,在你的同名项目下创建 `.github/workflows/profile-summary-cards.yml` 文件,然后填入以下内容: diff --git a/src/test/unit-integration-test.md b/src/test/unit-integration-test.md index 3d7e6636..b526de88 100644 --- a/src/test/unit-integration-test.md +++ b/src/test/unit-integration-test.md @@ -198,4 +198,4 @@ Rust 提供了单元测试和集成测试两种方式来帮助我们组织测试 - 单元测试的模块和待测试的代码在同一个文件中,且可以很方便地对私有函数进行测试 - 集成测试文件放在项目根目录下的 `tests` 目录中,由于该目录下每个文件都是一个包,我们必须要引入待测试的代码到当前包的作用域中,才能进行测试,正因为此,集成测试只能对声明为 `pub` 的 API 进行测试 -下个章节,我们再来看看该如何使用 `Github Actions` 对 Rust 项目进行持续集成。 +下个章节,我们再来看看该如何使用 `GitHub Actions` 对 Rust 项目进行持续集成。 diff --git a/src/too-many-lists/advanced-lists/double-singly.md b/src/too-many-lists/advanced-lists/double-singly.md new file mode 100644 index 00000000..45638ccf --- /dev/null +++ b/src/too-many-lists/advanced-lists/double-singly.md @@ -0,0 +1,220 @@ +# 双单向链表 +在之前的双向链表章节中,我们一度非常纠结,原因来自同样纠结成一团的所有权依赖。还有一个重要原因就是:先入为主的链表定义。 + +谁说所有的链接一定要一个方向呢?这里一起来尝试下新的东东:链表的其中一半朝左,另一半朝右。 + +新规矩( 老规矩是创建文件 ),创建一个新的模块: +```rust +// lib.rs +// ... +pub mod silly1; // NEW! +``` + +```rust +// silly1.rs +use crate::second::List as Stack; + +struct List { + left: Stack, + right: Stack, +} +``` + +这里将之前的 `List` 引入进来,并重命名为 `Stack`,接着,创建一个新的链表。现在既可以向左增长又可以向右增长。 + +```rust +pub struct Stack { + head: Link, +} + +type Link = Option>>; + +struct Node { + elem: T, + next: Link, +} + +impl Stack { + pub fn new() -> Self { + Stack { head: None } + } + + pub fn push(&mut self, elem: T) { + let new_node = Box::new(Node { + elem: elem, + next: self.head.take(), + }); + + self.head = Some(new_node); + } + + pub fn pop(&mut self) -> Option { + self.head.take().map(|node| { + let node = *node; + self.head = node.next; + node.elem + }) + } + + pub fn peek(&self) -> Option<&T> { + self.head.as_ref().map(|node| { + &node.elem + }) + } + + pub fn peek_mut(&mut self) -> Option<&mut T> { + self.head.as_mut().map(|node| { + &mut node.elem + }) + } +} + +impl Drop for Stack { + fn drop(&mut self) { + let mut cur_link = self.head.take(); + while let Some(mut boxed_node) = cur_link { + cur_link = boxed_node.next.take(); + } + } +} +``` + +稍微修改下 `push` 和 `pop`: +```rust +pub fn push(&mut self, elem: T) { + let new_node = Box::new(Node { + elem: elem, + next: None, + }); + + self.push_node(new_node); +} + +fn push_node(&mut self, mut node: Box>) { + node.next = self.head.take(); + self.head = Some(node); +} + +pub fn pop(&mut self) -> Option { + self.pop_node().map(|node| { + node.elem + }) +} + +fn pop_node(&mut self) -> Option>> { + self.head.take().map(|mut node| { + self.head = node.next.take(); + node + }) +} +``` + +现在可以开始构造新的链表: +```rust +pub struct List { + left: Stack, + right: Stack, +} + +impl List { + fn new() -> Self { + List { left: Stack::new(), right: Stack::new() } + } +} +``` + +当然,还有一大堆左左右右类型的操作: +```rust +pub fn push_left(&mut self, elem: T) { self.left.push(elem) } +pub fn push_right(&mut self, elem: T) { self.right.push(elem) } +pub fn pop_left(&mut self) -> Option { self.left.pop() } +pub fn pop_right(&mut self) -> Option { self.right.pop() } +pub fn peek_left(&self) -> Option<&T> { self.left.peek() } +pub fn peek_right(&self) -> Option<&T> { self.right.peek() } +pub fn peek_left_mut(&mut self) -> Option<&mut T> { self.left.peek_mut() } +pub fn peek_right_mut(&mut self) -> Option<&mut T> { self.right.peek_mut() } +``` + +其中最有趣的是:还可以来回闲逛了。 +```rust +pub fn go_left(&mut self) -> bool { + self.left.pop_node().map(|node| { + self.right.push_node(node); + }).is_some() +} + +pub fn go_right(&mut self) -> bool { + self.right.pop_node().map(|node| { + self.left.push_node(node); + }).is_some() +} +``` + +这里返回 `bool` 是为了告诉调用者我们是否成功的移动。最后,再来测试下: +```rust +#[cfg(test)] +mod test { + use super::List; + + #[test] + fn walk_aboot() { + let mut list = List::new(); // [_] + + list.push_left(0); // [0,_] + list.push_right(1); // [0, _, 1] + assert_eq!(list.peek_left(), Some(&0)); + assert_eq!(list.peek_right(), Some(&1)); + + list.push_left(2); // [0, 2, _, 1] + list.push_left(3); // [0, 2, 3, _, 1] + list.push_right(4); // [0, 2, 3, _, 4, 1] + + while list.go_left() {} // [_, 0, 2, 3, 4, 1] + + assert_eq!(list.pop_left(), None); + assert_eq!(list.pop_right(), Some(0)); // [_, 2, 3, 4, 1] + assert_eq!(list.pop_right(), Some(2)); // [_, 3, 4, 1] + + list.push_left(5); // [5, _, 3, 4, 1] + assert_eq!(list.pop_right(), Some(3)); // [5, _, 4, 1] + assert_eq!(list.pop_left(), Some(5)); // [_, 4, 1] + assert_eq!(list.pop_right(), Some(4)); // [_, 1] + assert_eq!(list.pop_right(), Some(1)); // [_] + + assert_eq!(list.pop_right(), None); + assert_eq!(list.pop_left(), None); + + } +} +``` + +```shell +> cargo test + + Running target/debug/lists-5c71138492ad4b4a + +running 16 tests +test fifth::test::into_iter ... ok +test fifth::test::basics ... ok +test fifth::test::iter ... ok +test fifth::test::iter_mut ... ok +test fourth::test::into_iter ... ok +test fourth::test::basics ... ok +test fourth::test::peek ... ok +test first::test::basics ... ok +test second::test::into_iter ... ok +test second::test::basics ... ok +test second::test::iter ... ok +test second::test::iter_mut ... ok +test third::test::basics ... ok +test third::test::iter ... ok +test second::test::peek ... ok +test silly1::test::walk_aboot ... ok + +test result: ok. 16 passed; 0 failed; 0 ignored; 0 measured +``` + +上上下下,左左右右,BABA,哦耶,这个链表无敌了! + +以上是一个非常典型的手指型数据结构finger data structure,在其中维护一个手指,然后操作所需的时间与手指的距离成正比。 + diff --git a/src/too-many-lists/advanced-lists/intro.md b/src/too-many-lists/advanced-lists/intro.md new file mode 100644 index 00000000..acab42d1 --- /dev/null +++ b/src/too-many-lists/advanced-lists/intro.md @@ -0,0 +1,10 @@ +# 使用高级技巧实现链表 +说句实话,我们之前实现的链表都达不到生产级可用的程度,而且也没有用到一些比较时髦的技巧。 + +本章我们一起来看一些更时髦的链表实现: + +1. 生产级可用的双向链表 +2. 双重单向链表 +3. 栈分配的链表 +4. 自引用和Arena分配器实现( 原文作者还未实现,所以... Todo ) +5. GhostCell 实现( 同上 ) \ No newline at end of file diff --git a/src/too-many-lists/advanced-lists/stack-allocated.md b/src/too-many-lists/advanced-lists/stack-allocated.md new file mode 100644 index 00000000..8c502669 --- /dev/null +++ b/src/too-many-lists/advanced-lists/stack-allocated.md @@ -0,0 +1,325 @@ +# 栈上的链表 +在之前的章节中,无一例外,我们创建的都是数据存储在堆上的链表,这种链表最常见也最实用:堆内存在动态分配的场景非常好用。 + +但是,既然是高级技巧章节,那栈链表也应该拥有一席之地。但与堆内存的简单分配相比,栈内存就没那么友好了,你们猜大名鼎鼎的 C 语言的 `alloca` 是因为什么而出名的 :) + +限于章节篇幅,这里我们使用一个简单的栈分配方法:调用一个函数,获取一个新的、拥有更多空间的栈帧。说实话,该解决方法要多愚蠢有多愚蠢,但是它确实相当实用,甚至...有用。 + +任何时候,当我们在做一些递归的任务时,都可以将当前步骤状态的指针传递给下一个步骤。如果指针本身就是状态的一部分,那恭喜你:你在创建一个栈上分配的链表! + +新的链表类型本身就是一个 Node,并且包含一个引用指向另一个 Node: +```rust +pub struct List<'a, T> { + pub data: T, + pub prev: Option<&'a List<'a, T>>, +} +``` + +该链表只有一个操作 `push`,需要注意的是,跟其它链表不同,这里的 `push` 是通过回调的方式来完成新元素推入,并将回调返回的值直接返回给 `push` 的调用者: +```rust +impl<'a, T> List<'a, T> { + pub fn push( + prev: Option<&'a List<'a, T>>, + data: T, + callback: impl FnOnce(&List<'a, T>) -> U, + ) -> U { + let list = List { data, prev }; + callback(&list) + } +} +``` + +搞定,提前问一句:你见过回调地狱吗? +```rust +List::push(None, 3, |list| { + println!("{}", list.data); + List::push(Some(list), 5, |list| { + println!("{}", list.data); + List::push(Some(list), 13, |list| { + println!("{}", list.data); + }) + }) +}) +``` + +不禁让人感叹,这段回调代码多么的美丽动人😿。 + +用户还可以简单地使用 `while-let` 的方式来编译遍历链表,但是为了增加一些趣味,咱们还是继续使用迭代器: +```rust +impl<'a, T> List<'a, T> { + pub fn iter(&'a self) -> Iter<'a, T> { + Iter { next: Some(self) } + } +} + +impl<'a, T> Iterator for Iter<'a, T> { + type Item = &'a T; + + fn next(&mut self) -> Option { + self.next.map(|node| { + self.next = node.prev; + &node.data + }) + } +} +``` + +测试下: +```rust +#[cfg(test)] +mod test { + use super::List; + + #[test] + fn elegance() { + List::push(None, 3, |list| { + assert_eq!(list.iter().copied().sum::(), 3); + List::push(Some(list), 5, |list| { + assert_eq!(list.iter().copied().sum::(), 5 + 3); + List::push(Some(list), 13, |list| { + assert_eq!(list.iter().copied().sum::(), 13 + 5 + 3); + }) + }) + }) + } +} +``` +```shell +> cargo test + +running 18 tests +test fifth::test::into_iter ... ok +test fifth::test::iter ... ok +test fifth::test::iter_mut ... ok +test fifth::test::basics ... ok +test fifth::test::miri_food ... ok +test first::test::basics ... ok +test second::test::into_iter ... ok +test fourth::test::peek ... ok +test fourth::test::into_iter ... ok +test second::test::iter_mut ... ok +test fourth::test::basics ... ok +test second::test::basics ... ok +test second::test::iter ... ok +test third::test::basics ... ok +test silly1::test::walk_aboot ... ok +test silly2::test::elegance ... ok +test second::test::peek ... ok +test third::test::iter ... ok + +test result: ok. 18 passed; 0 failed; 0 ignored; 0 measured; 0 filtered out; +``` + +部分读者此时可能会有一些大胆的想法:咦?我能否修改 Node 中的值?大胆但貌似可行,不妨来试试。 +```rust +pub struct List<'a, T> { + pub data: T, + pub prev: Option<&'a mut List<'a, T>>, +} + +pub struct Iter<'a, T> { + next: Option<&'a List<'a, T>>, +} + +impl<'a, T> List<'a, T> { + pub fn push( + prev: Option<&'a mut List<'a, T>>, + data: T, + callback: impl FnOnce(&mut List<'a, T>) -> U, + ) -> U { + let mut list = List { data, prev }; + callback(&mut list) + } + + pub fn iter(&'a self) -> Iter<'a, T> { + Iter { next: Some(self) } + } +} + +impl<'a, T> Iterator for Iter<'a, T> { + type Item = &'a T; + + fn next(&mut self) -> Option { + self.next.map(|node| { + self.next = node.prev.as_ref().map(|prev| &**prev); + &node.data + }) + } +} +``` + +```shell +> cargo test + +error[E0521]: borrowed data escapes outside of closure + --> src\silly2.rs:47:32 + | +46 | List::push(Some(list), 13, |list| { + | ---- + | | + | `list` declared here, outside of the closure body + | `list` is a reference that is only valid in the closure body +47 | assert_eq!(list.iter().copied().sum::(), 13 + 5 + 3); + | ^^^^^^^^^^^ `list` escapes the closure body here + +error[E0521]: borrowed data escapes outside of closure + --> src\silly2.rs:45:28 + | +44 | List::push(Some(list), 5, |list| { + | ---- + | | + | `list` declared here, outside of the closure body + | `list` is a reference that is only valid in the closure body +45 | assert_eq!(list.iter().copied().sum::(), 5 + 3); + | ^^^^^^^^^^^ `list` escapes the closure body here + + + +``` + +嗯,没想到是浓眉大眼的迭代器背叛了我们,为了验证到底是哪里出了问题,我们来修改下测试: +```rust +#[test] +fn elegance() { + List::push(None, 3, |list| { + assert_eq!(list.data, 3); + List::push(Some(list), 5, |list| { + assert_eq!(list.data, 5); + List::push(Some(list), 13, |list| { + assert_eq!(list.data, 13); + }) + }) + }) +} +``` + +```shell +> cargo test + +error[E0521]: borrowed data escapes outside of closure + --> src\silly2.rs:46:17 + | +44 | List::push(Some(list), 5, |list| { + | ---- + | | + | `list` declared here, outside of the closure body + | `list` is a reference that is only valid in the closure body +45 | assert_eq!(list.data, 5); +46 | / List::push(Some(list), 13, |list| { +47 | | assert_eq!(list.data, 13); +48 | | }) + | |______^ `list` escapes the closure body here + +error[E0521]: borrowed data escapes outside of closure + --> src\silly2.rs:44:13 + | +42 | List::push(None, 3, |list| { + | ---- + | | + | `list` declared here, outside of the closure body + | `list` is a reference that is only valid in the closure body +43 | assert_eq!(list.data, 3); +44 | / List::push(Some(list), 5, |list| { +45 | | assert_eq!(list.data, 5); +46 | | List::push(Some(list), 13, |list| { +47 | | assert_eq!(list.data, 13); +48 | | }) +49 | | }) + | |______________^ `list` escapes the closure body here +``` + +原因在于我们的链表不小心依赖了型变variance。型变是一个[相当复杂的概念](https://doc.rust-lang.org/nomicon/subtyping.html),下面来简单了解下。 + +每一个节点( Node )都包含一个引用,该引用指向另一个节点, 且这两个节点是同一个类型。如果从最里面的节点角度来看,那所有外部的节点都在使用和它一样的生命周期,但这个显然是不对的:链表中的每一个节点都会比它指向的节点活得更久,因为它们的作用域是嵌套存在的。 + +那之前的不可变引用版本为何可以正常工作呢?原因是在大多数时候,编译器都能自己判断:虽然某些东东活得太久了,但是这是安全的。当我们把一个 List 塞入另一个时,编译器会迅速将生命周期进行收缩以满足新的 List 的需求,**这种生命周期收缩就是一种型变**。 + +如果大家还是觉得不太理解,我们来考虑下其它拥有继承特性的编程语言。在该语言中,当你将一个 `Cat` 传递给需要 `Animal` 的地方时( `Animal` 是 `Cat` 的父类型),型变就发生了。从字面来说,将一只猫传给需要动物的地方,也是合适的,毕竟猫确实是动物的一种。 + +总之,可以看出无论是从大的生命周期收缩为小的生命周期,还是从 `Cat` 到 `Animal`,型变的典型特征就是:范围在减小,毕竟子类型的功能肯定是比父类型多的。 + +既然有型变,为何可变引用的版本会报错呢?其实在于型变不总是安全的,假如之前的代码可以编译,那我们可以写出释放后再使用use-after-free 的代码: +```rust +List::push(None, 3, |list| { + List::push(Some(list), 5, |list| { + List::push(Some(list), 13, |list| { + // 哈哈,好爽,由于所有的生命周期都是相同的,因此编译器允许我重写父节点,并让它持有一个可变指针指向我自己。 + // 我将创建所有的 use-after-free ! + *list.prev.as_mut().unwrap().prev = Some(list); + }) + }) +}) +``` + +一旦引入可变性,型变就会造成这样的隐患:意外修改了不该被修改的代码,但这些代码的调用者还在期待着和往常一样的结果!例如以下例子: +```rust +let mut my_kitty = Cat; // Make a Cat (long lifetime) +let animal: &mut Animal = &mut my_kitty; // Forget it's a Cat (shorten lifetime) +*animal = Dog; // Write a Dog (short lifetime) +my_kitty.meow(); // Meowing Dog! (Use After Free) +``` + +我们将长生命周期的猫转换成短生命周期的动物,可变的!然后通过短生命周期的动物将指针重新指向一只狗。此时我们想去撸软萌猫的时候,就听到:`旺旺...呜嗷嗷嗷`,对,你没听错,不仅没有了猫叫,甚至于狗还没叫完,就可能在某个地方又被修改成狼了。 + +因此,**虽然你可以修改可变引用的生命周期,但是一旦开始嵌套,它们就将失去型变,变成`不变( invariant )`**。此时,就再也无法对生命周期进行收缩了。 + +具体来说: `&mut &'big mut T` 无法被转换成 `&mut &'small mut T`,这里 `'big` 代表比 `'small` 更大的生命周期。或者用更正式的说法:`&'a mut T` 对于 `'a` 来说是协变( `covariant` )的,但是对于 `T` 是不变的( `invariant` )。 + +--- + +说了这么多高深的理论,那么该如何改变链表的数据呢?答案就是:使用老本行 - 内部可变性。 + +下面让我们回滚到之前的不可变版本,然后使用 `Cell` 来替代 `&mut`。 +```rust +#[test] +fn cell() { + use std::cell::Cell; + + List::push(None, Cell::new(3), |list| { + List::push(Some(list), Cell::new(5), |list| { + List::push(Some(list), Cell::new(13), |list| { + // Multiply every value in the list by 10 + for val in list.iter() { + val.set(val.get() * 10) + } + + let mut vals = list.iter(); + assert_eq!(vals.next().unwrap().get(), 130); + assert_eq!(vals.next().unwrap().get(), 50); + assert_eq!(vals.next().unwrap().get(), 30); + assert_eq!(vals.next(), None); + assert_eq!(vals.next(), None); + }) + }) + }) +} +``` + +```shell +> cargo test + +running 19 tests +test fifth::test::into_iter ... ok +test fifth::test::basics ... ok +test fifth::test::iter_mut ... ok +test fifth::test::iter ... ok +test fourth::test::basics ... ok +test fourth::test::into_iter ... ok +test second::test::into_iter ... ok +test first::test::basics ... ok +test fourth::test::peek ... ok +test second::test::basics ... ok +test fifth::test::miri_food ... ok +test silly2::test::cell ... ok +test third::test::iter ... ok +test second::test::iter_mut ... ok +test second::test::peek ... ok +test silly1::test::walk_aboot ... ok +test silly2::test::elegance ... ok +test third::test::basics ... ok +test second::test::iter ... ok + +test result: ok. 19 passed; 0 failed; 0 ignored; 0 measured; 0 filtered out; +``` + +简简单单搞定,虽然之前我们嫌弃内部可变性,但是在这里:真香! \ No newline at end of file diff --git a/src/too-many-lists/advanced-lists/unsafe-deque.md b/src/too-many-lists/advanced-lists/unsafe-deque.md new file mode 100644 index 00000000..5bcfa2ae --- /dev/null +++ b/src/too-many-lists/advanced-lists/unsafe-deque.md @@ -0,0 +1,6 @@ +# 生产级可用的双向链表 +打开[原文](https://rust-unofficial.github.io/too-many-lists/sixth.html),发现这一篇只有两行,我以为自己看花了眼,揉了揉眼,定睛一看,还是两行。 + +没错,貌似作者想要偷懒,而且为了掩饰,他还提供了标准库的实现:) 如果大家想要学习,看[标准库](https://github.com/rust-lang/rust/blob/master/library/alloc/src/collections/linked_list.rs)吧 :D + +> 为了能更好的看懂标准库实现,你可能还需要这本书的辅助: [Rustonomicon](https://doc.rust-lang.org/nightly/nomicon/) \ No newline at end of file diff --git a/src/too-many-lists/deque/final-code.md b/src/too-many-lists/deque/final-code.md new file mode 100644 index 00000000..3547589d --- /dev/null +++ b/src/too-many-lists/deque/final-code.md @@ -0,0 +1,247 @@ +# 最终代码 +这一章真不好写( 也很难翻译... ),最终我们实现了一个 100% 安全但是功能残缺的双向链表。 + +同时在实现中,还有大量 `Rc` 和 `RefCell` 引起的运行时检查,最终会影响链表的性能。整个双向链表实现史就是一部别名和所有权的奋斗史。 + +总之,不管爱与不爱,它就这样了,特别是如果我们不在意内部的细节暴露给外面用户时。 + +而从下一章开始,我们将实现一个真正能够全盘掌控的链表,当然...通过 unsafe 代码实现! + + +```rust + +#![allow(unused)] +fn main() { +use std::rc::Rc; +use std::cell::{Ref, RefMut, RefCell}; + +pub struct List { + head: Link, + tail: Link, +} + +type Link = Option>>>; + +struct Node { + elem: T, + next: Link, + prev: Link, +} + + +impl Node { + fn new(elem: T) -> Rc> { + Rc::new(RefCell::new(Node { + elem: elem, + prev: None, + next: None, + })) + } +} + +impl List { + pub fn new() -> Self { + List { head: None, tail: None } + } + + pub fn push_front(&mut self, elem: T) { + let new_head = Node::new(elem); + match self.head.take() { + Some(old_head) => { + old_head.borrow_mut().prev = Some(new_head.clone()); + new_head.borrow_mut().next = Some(old_head); + self.head = Some(new_head); + } + None => { + self.tail = Some(new_head.clone()); + self.head = Some(new_head); + } + } + } + + pub fn push_back(&mut self, elem: T) { + let new_tail = Node::new(elem); + match self.tail.take() { + Some(old_tail) => { + old_tail.borrow_mut().next = Some(new_tail.clone()); + new_tail.borrow_mut().prev = Some(old_tail); + self.tail = Some(new_tail); + } + None => { + self.head = Some(new_tail.clone()); + self.tail = Some(new_tail); + } + } + } + + pub fn pop_back(&mut self) -> Option { + self.tail.take().map(|old_tail| { + match old_tail.borrow_mut().prev.take() { + Some(new_tail) => { + new_tail.borrow_mut().next.take(); + self.tail = Some(new_tail); + } + None => { + self.head.take(); + } + } + Rc::try_unwrap(old_tail).ok().unwrap().into_inner().elem + }) + } + + pub fn pop_front(&mut self) -> Option { + self.head.take().map(|old_head| { + match old_head.borrow_mut().next.take() { + Some(new_head) => { + new_head.borrow_mut().prev.take(); + self.head = Some(new_head); + } + None => { + self.tail.take(); + } + } + Rc::try_unwrap(old_head).ok().unwrap().into_inner().elem + }) + } + + pub fn peek_front(&self) -> Option> { + self.head.as_ref().map(|node| { + Ref::map(node.borrow(), |node| &node.elem) + }) + } + + pub fn peek_back(&self) -> Option> { + self.tail.as_ref().map(|node| { + Ref::map(node.borrow(), |node| &node.elem) + }) + } + + pub fn peek_back_mut(&mut self) -> Option> { + self.tail.as_ref().map(|node| { + RefMut::map(node.borrow_mut(), |node| &mut node.elem) + }) + } + + pub fn peek_front_mut(&mut self) -> Option> { + self.head.as_ref().map(|node| { + RefMut::map(node.borrow_mut(), |node| &mut node.elem) + }) + } + + pub fn into_iter(self) -> IntoIter { + IntoIter(self) + } +} + +impl Drop for List { + fn drop(&mut self) { + while self.pop_front().is_some() {} + } +} + +pub struct IntoIter(List); + +impl Iterator for IntoIter { + type Item = T; + + fn next(&mut self) -> Option { + self.0.pop_front() + } +} + +impl DoubleEndedIterator for IntoIter { + fn next_back(&mut self) -> Option { + self.0.pop_back() + } +} + +#[cfg(test)] +mod test { + use super::List; + + #[test] + fn basics() { + let mut list = List::new(); + + // Check empty list behaves right + assert_eq!(list.pop_front(), None); + + // Populate list + list.push_front(1); + list.push_front(2); + list.push_front(3); + + // Check normal removal + assert_eq!(list.pop_front(), Some(3)); + assert_eq!(list.pop_front(), Some(2)); + + // Push some more just to make sure nothing's corrupted + list.push_front(4); + list.push_front(5); + + // Check normal removal + assert_eq!(list.pop_front(), Some(5)); + assert_eq!(list.pop_front(), Some(4)); + + // Check exhaustion + assert_eq!(list.pop_front(), Some(1)); + assert_eq!(list.pop_front(), None); + + // ---- back ----- + + // Check empty list behaves right + assert_eq!(list.pop_back(), None); + + // Populate list + list.push_back(1); + list.push_back(2); + list.push_back(3); + + // Check normal removal + assert_eq!(list.pop_back(), Some(3)); + assert_eq!(list.pop_back(), Some(2)); + + // Push some more just to make sure nothing's corrupted + list.push_back(4); + list.push_back(5); + + // Check normal removal + assert_eq!(list.pop_back(), Some(5)); + assert_eq!(list.pop_back(), Some(4)); + + // Check exhaustion + assert_eq!(list.pop_back(), Some(1)); + assert_eq!(list.pop_back(), None); + } + + #[test] + fn peek() { + let mut list = List::new(); + assert!(list.peek_front().is_none()); + assert!(list.peek_back().is_none()); + assert!(list.peek_front_mut().is_none()); + assert!(list.peek_back_mut().is_none()); + + list.push_front(1); list.push_front(2); list.push_front(3); + + assert_eq!(&*list.peek_front().unwrap(), &3); + assert_eq!(&mut *list.peek_front_mut().unwrap(), &mut 3); + assert_eq!(&*list.peek_back().unwrap(), &1); + assert_eq!(&mut *list.peek_back_mut().unwrap(), &mut 1); + } + + #[test] + fn into_iter() { + let mut list = List::new(); + list.push_front(1); list.push_front(2); list.push_front(3); + + let mut iter = list.into_iter(); + assert_eq!(iter.next(), Some(3)); + assert_eq!(iter.next_back(), Some(1)); + assert_eq!(iter.next(), Some(2)); + assert_eq!(iter.next_back(), None); + assert_eq!(iter.next(), None); + } +} +} +``` \ No newline at end of file diff --git a/src/too-many-lists/deque/intro.md b/src/too-many-lists/deque/intro.md new file mode 100644 index 00000000..44e05eef --- /dev/null +++ b/src/too-many-lists/deque/intro.md @@ -0,0 +1,16 @@ +# 不太优秀的双端队列 +在实现了之前的队列后,我们不禁浮想联翩,如果 `Rc` 是可变的,那是不是可以实现一个双向链表? + +心动不如行动,先来创建新的链表文件 `fourth.rs`,并在 `src/lib.rs` 中添加以下内容: +```rust +// in lib.rs + +pub mod first; +pub mod second; +pub mod third; +pub mod fourth; +``` + +依然是熟悉的从零开始,当然,也依然会用到熟悉的 CV 配方。 + +> 声明:大家看到目录名时,心里就应该在嘀咕了吧?其实你的嘀咕是对的,是的,本章的目的是为了证明之前的想法是糟糕的! \ No newline at end of file diff --git a/src/too-many-lists/deque/iterator.md b/src/too-many-lists/deque/iterator.md new file mode 100644 index 00000000..23be7d6f --- /dev/null +++ b/src/too-many-lists/deque/iterator.md @@ -0,0 +1,238 @@ +# 迭代器 +坏男孩最令人头疼,而链表实现中,迭代器就是这样的坏男孩,所以我们放在最后来处理。 + +## IntoIter +由于是转移所有权,因此 `IntoIter` 一直都是最好实现的: +```rust +pub struct IntoIter(List); + +impl List { + pub fn into_iter(self) -> IntoIter { + IntoIter(self) + } +} + +impl Iterator for IntoIter { + type Item = T; + fn next(&mut self) -> Option { + self.0.pop_front() + } +} +``` + +但是关于双向链表,有一个有趣的事实,它不仅可以从前向后迭代,还能反过来。前面实现的是传统的从前到后,那问题来了,反过来该如何实现呢? + +答案是: `DoubleEndedIterator`,它继承自 `Iterator`( 通过 [`supertrait`](https://course.rs/basic/trait/advance-trait.html?highlight=supertrait#特征定义中的特征约束) ),因此意味着要实现该特征,首先需要实现 `Iterator`。 + +这样只要为 `DoubleEndedIterator` 实现 `next_back` 方法,就可以支持双向迭代了: `Iterator` 的 `next` 方法从前往后,而 `next_back` 从后向前。 + +```rust +impl DoubleEndedIterator for IntoIter { + fn next_back(&mut self) -> Option { + self.0.pop_back() + } +} +``` + +测试下: +```rust +#[test] +fn into_iter() { + let mut list = List::new(); + list.push_front(1); list.push_front(2); list.push_front(3); + + let mut iter = list.into_iter(); + assert_eq!(iter.next(), Some(3)); + assert_eq!(iter.next_back(), Some(1)); + assert_eq!(iter.next(), Some(2)); + assert_eq!(iter.next_back(), None); + assert_eq!(iter.next(), None); +} +``` + +```shell +cargo test + + Running target/debug/lists-5c71138492ad4b4a + +running 11 tests +test fourth::test::basics ... ok +test fourth::test::peek ... ok +test fourth::test::into_iter ... ok +test first::test::basics ... ok +test second::test::basics ... ok +test second::test::iter ... ok +test second::test::iter_mut ... ok +test third::test::iter ... ok +test third::test::basics ... ok +test second::test::into_iter ... ok +test second::test::peek ... ok + +test result: ok. 11 passed; 0 failed; 0 ignored; 0 measured +``` + +## Iter +这里又要用到糟糕的 `Ref`: +```rust +pub struct Iter<'a, T>(Option>>); + +impl List { + pub fn iter(&self) -> Iter { + Iter(self.head.as_ref().map(|head| head.borrow())) + } +} +``` + +```shell +> cargo build +``` + +迄今为止一切运行正常,接下来的 `next` 实现起来会有些麻烦: +```rust +impl<'a, T> Iterator for Iter<'a, T> { + type Item = Ref<'a, T>; + fn next(&mut self) -> Option { + self.0.take().map(|node_ref| { + self.0 = node_ref.next.as_ref().map(|head| head.borrow()); + Ref::map(node_ref, |node| &node.elem) + }) + } +} +``` + +```shell +cargo build + +error[E0521]: borrowed data escapes outside of closure + --> src/fourth.rs:155:13 + | +153 | fn next(&mut self) -> Option { + | --------- `self` is declared here, outside of the closure body +154 | self.0.take().map(|node_ref| { +155 | self.0 = node_ref.next.as_ref().map(|head| head.borrow()); + | ^^^^^^ -------- borrow is only valid in the closure body + | | + | reference to `node_ref` escapes the closure body here + +error[E0505]: cannot move out of `node_ref` because it is borrowed + --> src/fourth.rs:156:22 + | +153 | fn next(&mut self) -> Option { + | --------- lifetime `'1` appears in the type of `self` +154 | self.0.take().map(|node_ref| { +155 | self.0 = node_ref.next.as_ref().map(|head| head.borrow()); + | ------ -------- borrow of `node_ref` occurs here + | | + | assignment requires that `node_ref` is borrowed for `'1` +156 | Ref::map(node_ref, |node| &node.elem) + | ^^^^^^^^ move out of `node_ref` occurs here +``` + +果然,膝盖又中了一箭。 + +`node_ref` 活得不够久,跟一般的引用不同,Rust 不允许我们这样分割 `Ref`,从 `head.borrow()` 中取出的 `Ref` 只允许跟 `node_ref` 活得一样久。 + + +而我们想要的函数是存在的: +```rust +pub fn map_split(orig: Ref<'b, T>, f: F) -> (Ref<'b, U>, Ref<'b, V>) where + F: FnOnce(&T) -> (&U, &V), + U: ?Sized, + V: ?Sized, +``` + +喔,这个函数定义的泛型直接晃瞎了我的眼睛。。 +```rust +fn next(&mut self) -> Option { + self.0.take().map(|node_ref| { + let (next, elem) = Ref::map_split(node_ref, |node| { + (&node.next, &node.elem) + }); + + self.0 = next.as_ref().map(|head| head.borrow()); + + elem + }) +} +``` + +```shell +cargo build + Compiling lists v0.1.0 (/Users/ABeingessner/dev/temp/lists) +error[E0521]: borrowed data escapes outside of closure + --> src/fourth.rs:159:13 + | +153 | fn next(&mut self) -> Option { + | --------- `self` is declared here, outside of the closure body +... +159 | self.0 = next.as_ref().map(|head| head.borrow()); + | ^^^^^^ ---- borrow is only valid in the closure body + | | + | reference to `next` escapes the closure body here +``` + +额,借用的内容只允许在闭包体中使用,看起来我们还是得用 `Ref::map` 来解决问题: +```rust +fn next(&mut self) -> Option { + self.0.take().map(|node_ref| { + let (next, elem) = Ref::map_split(node_ref, |node| { + (&node.next, &node.elem) + }); + + self.0 = if next.is_some() { + Some(Ref::map(next, |next| &**next.as_ref().unwrap())) + } else { + None + }; + + elem + }) +} +``` + +```shell +error[E0308]: mismatched types + --> src/fourth.rs:162:22 + | +162 | Some(Ref::map(next, |next| &**next.as_ref().unwrap())) + | ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ expected struct `fourth::Node`, found struct `std::cell::RefCell` + | + = note: expected type `std::cell::Ref<'_, fourth::Node<_>>` + found type `std::cell::Ref<'_, std::cell::RefCell>>` +``` + +晕, 多了一个 `RefCell` ,随着我们的对链表的逐步深入,`RefCell` 的代码嵌套变成了不可忽视的问题。 + +看起来我们已经无能为力了,只能试着去摆脱 `RefCell` 了。`Rc` 怎么样?我们完全可以对 `Rc` 进行完整的克隆: +```rust +pub struct Iter(Option>>); + +impl List { + pub fn iter(&self) -> Iter { + Iter(self.head.as_ref().map(|head| head.clone())) + } +} + +impl Iterator for Iter { + type Item = +``` + +等等,那现在返回的是什么?`&T` 还是 `Ref` ? + +两者都不是,现在我们的 `Iter` 已经没有生命周期了:无论是 `&T` 还是 `Ref` 都需要我们在 `next` 之前声明好生命周期。但是我们试图从 `Rc` 中取出来的值其实是迭代器的引用。 + +也可以通过对 `Rc` 进行 map 获取到 `Rc`?但是标准库并没有给我们提供相应的功能,第三方倒是有[一个](https://crates.io/crates/owning_ref)。 + +但是,即使这么做了,还有一个更大的坑在等着:一个会造成迭代器不合法的可怕幽灵。事实上,之前我们对于迭代器不合法是免疫的,但是一旦迭代器产生 `Rc`,那它们就不再会借用链表。这意味着人们可以在持有指向链表内部的指针时,还可以进行 `push` 和 `pop` 操作。 + +严格来说,`push` 问题不大,因为链表两端的增长不会对我们正在关注的某个子链表造成影响。 + +但是 `pop` 就是另一个故事了,如果在我们关注的子链表之外 `pop`, 那问题不大。但是如果是 `pop` 一个正在引用的子链表中的节点呢?那一切就完了,特别是,如果大家还试图去 unwrap `try_unwrap` 返回的 `Result` ,会直接造成整个程序的 `panic`。 + +仔细想一想,好像也不错,程序一切正常,除非去 `pop` 我们正在引用的节点,最美的是,就算遇到这种情况,程序也会直接崩溃,提示我们错误的发生。 + +其实我们大部分的努力都是为了实现隐藏的细节和优雅的 API,典型的二八原则,八成时间花在二成的细节上。但是如果不关心这些细节,可以接受自己的平凡的话,那把节点简单的到处传递就行。 + +总之,可以看出,内部可变性非常适合写一个安全性的应用程序,但是如果是安全性高的库,那内部可变性就有些捉襟见肘了。 + +最终,我选择了放弃,不再实现 `Iter` 和 `IterMut`,也许努力下,可以实现,但是。。。不愉快,算了。 \ No newline at end of file diff --git a/src/too-many-lists/deque/layout.md b/src/too-many-lists/deque/layout.md new file mode 100644 index 00000000..b58edc99 --- /dev/null +++ b/src/too-many-lists/deque/layout.md @@ -0,0 +1,316 @@ +# 数据布局和构建 +聪明的读者应该已经想到了:让 `Rc` 可变,就需要使用 `RefCell` 的配合。关于 `RefCell` 的一切,在之前的章节都有介绍,还不熟悉的同学请移步[这里](https://course.rs/advance/smart-pointer/cell-refcell.html)。 + +好了,绝世神兵在手,接下来...我们将见识一个绝世啰嗦的数据结构...如果你来自 GC 语言,那很可能就没有见识过这种阵仗。 + +## 数据布局 + +双向链表意味着每一个节点将同时指向前一个和下一个节点,因此我们的数据结构可能会变成这样: +```rust +use std::rc::Rc; +use std::cell::RefCell; + +pub struct List { + head: Link, + tail: Link, +} + +type Link = Option>>>; + +struct Node { + elem: T, + next: Link, + prev: Link, +} +``` + +耳听忐忑,心怀忐忑,尝试编译下,竟然顺利通过了,thanks god! 接下来再来看看该如何使用它。 + +## 构建 +如果按照之前的构建方式来构建新的数据结构,会有点笨拙,因此我们先尝试将其拆分: +```rust +impl Node { + fn new(elem: T) -> Rc> { + Rc::new(RefCell::new(Node { + elem: elem, + prev: None, + next: None, + })) + } +} + +impl List { + pub fn new() -> Self { + List { head: None, tail: None } + } +} +``` + +```rust +> cargo build + +**一大堆 DEAD CODE 警告,但是好歹可以成功编译** +``` + +## Push +很好,再来向链表的头部推入一个元素。由于双向链表的数据结构和操作逻辑明显更加复杂,因此相比单向链表的单行实现,双向链表的 `push` 操作也要复杂的多。 + +除此之外,我们还需要处理一些关于空链表的边界问题:对于绝大部分操作而言,可能只需要使用 `head` 或 `tail` 指针,但是对于空链表,则需要同时使用它们。 + +一个验证方法 `methods` 是否有效的办法就是看它是否能保持不变性, 每个节点都应该有两个指针指向它: 中间的节点被它前后的节点所指向,而头部的端节点除了被它后面的节点所指向外,还会被链表本身所指向,尾部的端节点亦是如此。 + +```rust +pub fn push_front(&mut self, elem: T) { + let new_head = Node::new(elem); + match self.head.take() { + Some(old_head) => { + // 非空链表,将新的节点跟老的头部相链接 + old_head.prev = Some(new_head.clone()); + new_head.next = Some(old_head); + self.head = Some(new_head); + } + None => { + // 空链表,需要设置 tail 和 head + self.tail = Some(new_head.clone()); + self.head = Some(new_head); + } + } +} +``` + +```rust +cargo build + +error[E0609]: no field `prev` on type `std::rc::Rc>>` + --> src/fourth.rs:39:26 + | +39 | old_head.prev = Some(new_head.clone()); // +1 new_head + | ^^^^ unknown field + +error[E0609]: no field `next` on type `std::rc::Rc>>` + --> src/fourth.rs:40:26 + | +40 | new_head.next = Some(old_head); // +1 old_head + | ^^^^ unknown field +``` + +虽然有报错,但是一切尽在掌握,今天真是万事顺利啊! + +从报错来看,我们无法直接去访问 `prev` 和 `next`,回想一下 `RefCell` 的使用方式,修改代码如下: +```rust +pub fn push_front(&mut self, elem: T) { + let new_head = Node::new(elem); + match self.head.take() { + Some(old_head) => { + old_head.borrow_mut().prev = Some(new_head.clone()); + new_head.borrow_mut().next = Some(old_head); + self.head = Some(new_head); + } + None => { + self.tail = Some(new_head.clone()); + self.head = Some(new_head); + } + } +} +``` + +```shell +> cargo build + +warning: field is never used: `elem` + --> src/fourth.rs:12:5 + | +12 | elem: T, + | ^^^^^^^ + | + = note: #[warn(dead_code)] on by default +``` + +嘿,我又可以了!既然状态神勇,那就趁热打铁,再来看看 `pop`。 + +## Pop +如果说 `new` 和 `push` 是在构建链表,那 `pop` 显然就是一个破坏者。 + +何为完美的破坏?按照构建的过程逆着来一遍就是完美的! +```rust +pub fn pop_front(&mut self) -> Option { + self.head.take().map(|old_head| { + match old_head.borrow_mut().next.take() { + Some(new_head) => { + // 非空链表 + new_head.borrow_mut().prev.take(); + self.head = Some(new_head); + } + None => { + // 空链表 + self.tail.take(); + } + } + old_head.elem + }) +} +``` + +```shell +> cargo build + +error[E0609]: no field `elem` on type `std::rc::Rc>>` + --> src/fourth.rs:64:22 + | +64 | old_head.elem + | ^^^^ unknown field +``` + +哎,怎么就不长记性呢,又是 `RefCell` 惹的祸: +```rust +pub fn pop_front(&mut self) -> Option { + self.head.take().map(|old_head| { + match old_head.borrow_mut().next.take() { + Some(new_head) => { + new_head.borrow_mut().prev.take(); + self.head = Some(new_head); + } + None => { + self.tail.take(); + } + } + old_head.borrow_mut().elem + }) +} +``` + +```shell +cargo build + +error[E0507]: cannot move out of borrowed content + --> src/fourth.rs:64:13 + | +64 | old_head.borrow_mut().elem + | ^^^^^^^^^^^^^^^^^^^^^^^^^^ cannot move out of borrowed content +``` + +额... 我凌乱了,看上去 `Box` 是罪魁祸首,`borrow_mut` 只能返回一个 `&mut Node`,因此无法拿走其所有权。 + +我们需要一个方法来拿走 `RefCell` 的所有权,然后返回给我们一个 `T`, 翻一翻[文档](https://doc.rust-lang.org/std/cell/struct.RefCell.html),可以发现下面这段内容: + +> `fn into_inner(self) -> T` + +> 消费掉 RefCell 并返回内部的值 + +喔,看上去好有安全感的方法: +```rust +old_head.into_inner().elem +``` + +```shell +> cargo build + +error[E0507]: cannot move out of an `Rc` + --> src/fourth.rs:64:13 + | +64 | old_head.into_inner().elem + | ^^^^^^^^ cannot move out of an `Rc` +``` + +...看走眼了,没想到你浓眉大眼也会耍花枪。 `into_inner` 想要拿走 `RecCell` 的所有权,但是还有一个 `Rc` 不愿意,因为 `Rc` 只能让我们获取内部值的不可变引用。 + +大家还记得我们之前实现 `Drop` 时用过的方法吗?在这里一样适用: +```rust +Rc::try_unwrap(old_head).unwrap().into_inner().elem +``` + +`Rc::try_unwrap` 返回一个 `Result`,由于我们不关心 `Err` 的情况( 如果代码合理,这里不会是 `Err` ),直接使用 `unwrap` 即可。 + +```shell +> cargo build + +error[E0599]: no method named `unwrap` found for type `std::result::Result>, std::rc::Rc>>>` in the current scope + --> src/fourth.rs:64:38 + | +64 | Rc::try_unwrap(old_head).unwrap().into_inner().elem + | ^^^^^^ + | + = note: the method `unwrap` exists but the following trait bounds were not satisfied: + `std::rc::Rc>> : std::fmt::Debug` +``` + +额,`unwrap` 要求目标类型是实现了 `Debug` 的,这样才能在报错时提供 `debug` 输出,而 `RefCell` 要实现 `Debug` 需要它内部的 `T` 实现 `Debug`,而我们的 `Node` 并没有实现。 + +当然,我们可以选择为 `Node` 实现,也可以这么做: +```rust +Rc::try_unwrap(old_head).ok().unwrap().into_inner().elem +``` + +```shell +cargo build +``` + +终于成功的运行了,下面依然是惯例 - 写几个测试用例 : +```rust +#[cfg(test)] +mod test { + use super::List; + + #[test] + fn basics() { + let mut list = List::new(); + + // Check empty list behaves right + assert_eq!(list.pop_front(), None); + + // Populate list + list.push_front(1); + list.push_front(2); + list.push_front(3); + + // Check normal removal + assert_eq!(list.pop_front(), Some(3)); + assert_eq!(list.pop_front(), Some(2)); + + // Push some more just to make sure nothing's corrupted + list.push_front(4); + list.push_front(5); + + // Check normal removal + assert_eq!(list.pop_front(), Some(5)); + assert_eq!(list.pop_front(), Some(4)); + + // Check exhaustion + assert_eq!(list.pop_front(), Some(1)); + assert_eq!(list.pop_front(), None); + } +} +``` + +```shell +cargo test + + Running target/debug/lists-5c71138492ad4b4a + +running 9 tests +test first::test::basics ... ok +test fourth::test::basics ... ok +test second::test::iter_mut ... ok +test second::test::basics ... ok +test fifth::test::iter_mut ... ok +test third::test::basics ... ok +test second::test::iter ... ok +test third::test::iter ... ok +test second::test::into_iter ... ok + +test result: ok. 9 passed; 0 failed; 0 ignored; 0 measured +``` + +## Drop +在[循环引用章节](),我们介绍过 `Rc` 最怕的就是引用形成循环,而双向链表恰恰如此。因此,当使用默认的实现来 `drop` 我们的链表时,两个端节点会将各自的引用计数减少到 1, 然后就不会继续减少,最终造成内存泄漏。 + +所以,这里最好的实现就是将每个节点 `pop` 出去,直到获得 `None`: +```rust +impl Drop for List { + fn drop(&mut self) { + while self.pop_front().is_some() {} + } +} +``` + +细心的读者可能已经注意到,我们还未实现在链表尾部 `push` 和 `pop` 的操作,但由于所需的实现跟之前差别不大,因此我们会在后面直接给出,下面先来看看更有趣的。 diff --git a/src/too-many-lists/deque/peek.md b/src/too-many-lists/deque/peek.md new file mode 100644 index 00000000..f9fda431 --- /dev/null +++ b/src/too-many-lists/deque/peek.md @@ -0,0 +1,136 @@ +# Peek +`push` 和 `pop` 的防不胜防的编译报错着实让人出了些冷汗,下面来看看轻松的,至少在之前的链表中是很轻松的 :) + +```rust +pub fn peek_front(&self) -> Option<&T> { + self.head.as_ref().map(|node| { + &node.elem + }) +} +``` + +额...好像被人发现我是复制黏贴的了,赶紧换一个: +```rust +pub fn peek_front(&self) -> Option<&T> { + self.head.as_ref().map(|node| { + // BORROW!!!! + &node.borrow().elem + }) +} +``` + +```shell +cargo build + +error[E0515]: cannot return value referencing temporary value + --> src/fourth.rs:66:13 + | +66 | &node.borrow().elem + | ^ ----------^^^^^ + | | | + | | temporary value created here + | | + | returns a value referencing data owned by the current function +``` + +从报错可以看出,原因是我们引用了局部的变量并试图在函数中返回。为了解释这个问题,先来看看 `borrow` 的定义: +```rust +fn borrow<'a>(&'a self) -> Ref<'a, T> +fn borrow_mut<'a>(&'a self) -> RefMut<'a, T> +``` + +这里返回的并不是 `&T` 或 `&mut T`,而是一个 [`Ref`](https://doc.rust-lang.org/std/cell/struct.Ref.html) 和 [`RefMut`](https://doc.rust-lang.org/std/cell/struct.RefMut.html),那么它们是什么?说白了,它们就是在借用到的引用外包裹了一层。而且 `Ref` 和 `RefMut` 分别实现了 `Deref` 和 `DerefMut`,在绝大多数场景中,我们都可以像使用 `&T` 一样去使用它们。 + + +只能说是成是败都赖萧何,恰恰就因为这一层包裹,导致生命周期改变了,也就是 `Ref` 和内部引用的生命周期不再和 `RefCell` 相同,而 `Ref` 的生命周期是什么,相信大家都能看得出来,因此就造成了局部引用的问题。 + +事实上,这是必须的,如果内部的引用和外部的 `Ref` 生命周期不一致,那该如何管理?当 `Ref` 因超出作用域被 `drop` 时,内部的引用怎么办? + +现在该怎么办?我们只想要一个引用,现在却多了一个 `Ref` 拦路虎。等等,如果我们不返回 `&T` 而是返回 `Ref` 呢? +```rust +use std::cell::{Ref, RefCell}; + +pub fn peek_front(&self) -> Option> { + self.head.as_ref().map(|node| { + node.borrow() + }) +} +``` + +```shell +> cargo build + +error[E0308]: mismatched types + --> src/fourth.rs:64:9 + | +64 | / self.head.as_ref().map(|node| { +65 | | node.borrow() +66 | | }) + | |__________^ expected type parameter, found struct `fourth::Node` + | + = note: expected type `std::option::Option>` + found type `std::option::Option>>` +``` + +嗯,类型不匹配了,要返回的是 `Ref` 但是获取的却是 `Ref>`,那么现在看上去有两个选择: + +- 抛弃这条路,换一条重新开始 +- 一条路走到死,最终通过更复杂的实现来解决 + +但是,仔细想想,这两个选择都不是我们想要的,那没办法了,只能继续深挖,看看有没有其它解决办法。啊哦,还真发现了一只野兽: +```rust +map(orig: Ref<'b, T>, f: F) -> Ref<'b, U> + where F: FnOnce(&T) -> &U, + U: ?Sized +``` + +就像在 `Result` 和 `Option` 上使用 `map` 一样,我们还能在 `Ref` 上使用 `map`: +```rust +pub fn peek_front(&self) -> Option> { + self.head.as_ref().map(|node| { + Ref::map(node.borrow(), |node| &node.elem) + }) +} +``` + +```shell +> cargo build +``` + +Gooood! 本章节的编译错误可以说是多个链表中最难解决的之一,依然被我们成功搞定了! + + +下面来写下测试用例,需要注意的是 `Ref` 不能被直接比较,因此我们需要先利用 `Deref` 解引用出其中的值,再进行比较。 + +```rust +#[test] +fn peek() { + let mut list = List::new(); + assert!(list.peek_front().is_none()); + list.push_front(1); list.push_front(2); list.push_front(3); + + assert_eq!(&*list.peek_front().unwrap(), &3); +} +``` + +```shell +> cargo test + + Running target/debug/lists-5c71138492ad4b4a + +running 10 tests +test first::test::basics ... ok +test fourth::test::basics ... ok +test second::test::basics ... ok +test fourth::test::peek ... ok +test second::test::iter_mut ... ok +test second::test::into_iter ... ok +test third::test::basics ... ok +test second::test::peek ... ok +test second::test::iter ... ok +test third::test::iter ... ok + +test result: ok. 10 passed; 0 failed; 0 ignored; 0 measured +``` + +终于可以把文章开头的冷汗擦拭干净了,忘掉这个章节吧,让我来养你...哦不对,让我们开始一段真正轻松的章节。 \ No newline at end of file diff --git a/src/too-many-lists/deque/symmetric.md b/src/too-many-lists/deque/symmetric.md new file mode 100644 index 00000000..c97584c7 --- /dev/null +++ b/src/too-many-lists/deque/symmetric.md @@ -0,0 +1,161 @@ +# 基本操作的对称镜像 +之前我们仅实现了头部的 `push`、`pop` ,现在来补全一下,大自然的对称之美咱的双向链表也不能少了。 + +```rust +tail <-> head +next <-> prev +front -> back +``` + +需要注意的是,这里还新增了 `mut` 类型的 peek: +```rust +use std::cell::{Ref, RefCell, RefMut}; + +//.. + +pub fn push_back(&mut self, elem: T) { + let new_tail = Node::new(elem); + match self.tail.take() { + Some(old_tail) => { + old_tail.borrow_mut().next = Some(new_tail.clone()); + new_tail.borrow_mut().prev = Some(old_tail); + self.tail = Some(new_tail); + } + None => { + self.head = Some(new_tail.clone()); + self.tail = Some(new_tail); + } + } +} + +pub fn pop_back(&mut self) -> Option { + self.tail.take().map(|old_tail| { + match old_tail.borrow_mut().prev.take() { + Some(new_tail) => { + new_tail.borrow_mut().next.take(); + self.tail = Some(new_tail); + } + None => { + self.head.take(); + } + } + Rc::try_unwrap(old_tail).ok().unwrap().into_inner().elem + }) +} + +pub fn peek_back(&self) -> Option> { + self.tail.as_ref().map(|node| { + Ref::map(node.borrow(), |node| &node.elem) + }) +} + +pub fn peek_back_mut(&mut self) -> Option> { + self.tail.as_ref().map(|node| { + RefMut::map(node.borrow_mut(), |node| &mut node.elem) + }) +} + +pub fn peek_front_mut(&mut self) -> Option> { + self.head.as_ref().map(|node| { + RefMut::map(node.borrow_mut(), |node| &mut node.elem) + }) +} +``` + +再更新测试用例: +```rust +#[test] +fn basics() { + let mut list = List::new(); + + // Check empty list behaves right + assert_eq!(list.pop_front(), None); + + // Populate list + list.push_front(1); + list.push_front(2); + list.push_front(3); + + // Check normal removal + assert_eq!(list.pop_front(), Some(3)); + assert_eq!(list.pop_front(), Some(2)); + + // Push some more just to make sure nothing's corrupted + list.push_front(4); + list.push_front(5); + + // Check normal removal + assert_eq!(list.pop_front(), Some(5)); + assert_eq!(list.pop_front(), Some(4)); + + // Check exhaustion + assert_eq!(list.pop_front(), Some(1)); + assert_eq!(list.pop_front(), None); + + // ---- back ----- + + // Check empty list behaves right + assert_eq!(list.pop_back(), None); + + // Populate list + list.push_back(1); + list.push_back(2); + list.push_back(3); + + // Check normal removal + assert_eq!(list.pop_back(), Some(3)); + assert_eq!(list.pop_back(), Some(2)); + + // Push some more just to make sure nothing's corrupted + list.push_back(4); + list.push_back(5); + + // Check normal removal + assert_eq!(list.pop_back(), Some(5)); + assert_eq!(list.pop_back(), Some(4)); + + // Check exhaustion + assert_eq!(list.pop_back(), Some(1)); + assert_eq!(list.pop_back(), None); +} + +#[test] +fn peek() { + let mut list = List::new(); + assert!(list.peek_front().is_none()); + assert!(list.peek_back().is_none()); + assert!(list.peek_front_mut().is_none()); + assert!(list.peek_back_mut().is_none()); + + list.push_front(1); list.push_front(2); list.push_front(3); + + assert_eq!(&*list.peek_front().unwrap(), &3); + assert_eq!(&mut *list.peek_front_mut().unwrap(), &mut 3); + assert_eq!(&*list.peek_back().unwrap(), &1); + assert_eq!(&mut *list.peek_back_mut().unwrap(), &mut 1); +} +``` + +什么?你问我这里的测试用例全吗?只能说如果测试全部的组合情况,这一章节会被撑爆。至于现在,能不出错就谢天谢地了 :( + +```shell +> cargo test + + Running target/debug/lists-5c71138492ad4b4a + +running 10 tests +test first::test::basics ... ok +test fourth::test::basics ... ok +test second::test::basics ... ok +test fourth::test::peek ... ok +test second::test::iter ... ok +test third::test::iter ... ok +test second::test::into_iter ... ok +test second::test::iter_mut ... ok +test second::test::peek ... ok +test third::test::basics ... ok + +test result: ok. 10 passed; 0 failed; 0 ignored; 0 measured +``` + +我想说:Ctrl CV 是最好的编程工具,大家同意吗? \ No newline at end of file diff --git a/src/too-many-lists/do-we-need-it.md b/src/too-many-lists/do-we-need-it.md index d9d5ba54..965613e9 100644 --- a/src/too-many-lists/do-we-need-it.md +++ b/src/too-many-lists/do-we-need-it.md @@ -54,7 +54,7 @@ 对于前者,那性能如何自然无关紧要。而对于后者,我们只需要使用 `Vec::with_capacity` 提前分配足够的空间即可,同时,Rust 中所有的迭代器还提供了 `size_hint` 也可以解决这种问题。 -当然,如果这段代码在热点路径,且你无法提前预测所需的容量,那么链表确实会更节省性能。 +当然,如果这段代码在热点路径,且你无法提前预测所需的容量,那么链表确实会更提升性能。 #### 链表更节省内存空间 首先,这个问题较为复杂。一个标准的数组调整策略是:增加或减少数组的长度使数组最多有一半为空,例如 capacity 增长是翻倍的策略。这确实会导致内存空间的浪费,特别是在 Rust 中,我们不会自动收缩集合类型。 diff --git a/src/too-many-lists/ok-stack/iter.md b/src/too-many-lists/ok-stack/iter.md new file mode 100644 index 00000000..d8a8101e --- /dev/null +++ b/src/too-many-lists/ok-stack/iter.md @@ -0,0 +1,443 @@ +## 迭代器 +集合类型可以通过 `Iterator` 特征进行迭代,该特征看起来比 `Drop` 要复杂点: +```rust +pub trait Iterator { + type Item; + fn next(&mut self) -> Option; +} +``` + +这里的 `Item` 是[关联类型](https://course.rs/basic/trait/advance-trait.html#关联类型),用来指代迭代器中具体的元素类型,`next` 方法返回的也是该类型。 + +其实上面的说法有点不够准确,原因是 `next` 方法返回的是 `Option`,使用 `Option` 枚举的原因是为了方便用户,不然用户需要 `has_next` 和 `get_next` 才能满足使用需求。有值时返回 `Some(T)`,无值时返回 `None`,这种 API 设计工程性更好,也更加安全,完美! + +有点悲剧的是, Rust 截至目前还没有 `yield` 语句,因此我们需要自己来实现相关的逻辑。还有点需要注意,每个集合类型应该实现 3 种迭代器类型: + +- `IntoIter` - `T` +- `IterMut` - `&mut T` +- `Iter` - `&T` + +也许大家不认识它们,但是其实很好理解,`IntoIter` 类型迭代器的 `next` 方法会拿走被迭代值的所有权,`IterMut` 是可变借用, `Iter` 是不可变借用。事实上,类似的[命名规则](https://course.rs/practice/naming.html#一个集合上的方法如果返回迭代器需遵循命名规则iteriter_mutinto_iter-c-iter)在 Rust 中随处可见,当熟悉后,以后见到类似的命名大家就可以迅速的理解其对值的运用方式。 + +## IntoIter +先来看看 `IntoIter` 该怎么实现: +```rust +pub struct IntoIter(List); + +impl List { + pub fn into_iter(self) -> IntoIter { + IntoIter(self) + } +} + +impl Iterator for IntoIter { + type Item = T; + fn next(&mut self) -> Option { + // access fields of a tuple struct numerically + self.0.pop() + } +} +``` + +这里我们通过[元组结构体](https://course.rs/basic/compound-type/struct.html#元组结构体tuple-struct)的方式定义了 `IntoIter`,下面来测试下: +```rust +#[test] +fn into_iter() { + let mut list = List::new(); + list.push(1); list.push(2); list.push(3); + + let mut iter = list.into_iter(); + assert_eq!(iter.next(), Some(3)); + assert_eq!(iter.next(), Some(2)); + assert_eq!(iter.next(), Some(1)); + assert_eq!(iter.next(), None); +} +``` + +```shell +> cargo test + + Running target/debug/lists-5c71138492ad4b4a + +running 4 tests +test first::test::basics ... ok +test second::test::basics ... ok +test second::test::into_iter ... ok +test second::test::peek ... ok + +test result: ok. 4 passed; 0 failed; 0 ignored; 0 measured +``` + +## Iter +相对来说,`IntoIter` 是最好实现的,因为它只是简单的拿走值,不涉及到引用,也不涉及到生命周期,而 `Iter` 就有所不同了。 + +这里的基本逻辑是我们持有一个当前节点的指针,当生成一个值后,该指针将指向下一个节点。 + +```rust +pub struct Iter { + next: Option<&Node>, +} + +impl List { + pub fn iter(&self) -> Iter { + Iter { next: self.head.map(|node| &node) } + } +} + +impl Iterator for Iter { + type Item = &T; + + fn next(&mut self) -> Option { + self.next.map(|node| { + self.next = node.next.map(|node| &node); + &node.elem + }) + } +} +``` + +```shell +> cargo build + +error[E0106]: missing lifetime specifier + --> src/second.rs:72:18 + | +72 | next: Option<&Node>, + | ^ expected lifetime parameter + +error[E0106]: missing lifetime specifier + --> src/second.rs:82:17 + | +82 | type Item = &T; + | ^ expected lifetime parameter +``` + +许久不见的错误又冒了出来,而且这次直指 Rust 中最难的点之一:生命周期。关于生命周期的讲解,这里就不再展开,如果大家还不熟悉,强烈建议看看[此章节](https://course.rs/advance/lifetime/intro.html),然后再继续。 + +首先,先加一个生命周期试试: +```rust +pub struct Iter<'a, T> { + next: Option<&'a Node>, +} +``` + +```shell +> cargo build + +error[E0106]: missing lifetime specifier + --> src/second.rs:83:22 + | +83 | impl Iterator for Iter { + | ^^^^^^^ expected lifetime parameter + +error[E0106]: missing lifetime specifier + --> src/second.rs:84:17 + | +84 | type Item = &T; + | ^ expected lifetime parameter + +error: aborting due to 2 previous errors +``` + +好的,现在有了更多的提示,来按照提示修改下代码: +```rust +pub struct Iter<'a, T> { + next: Option<&'a Node>, +} + +impl<'a, T> List { + pub fn iter(&'a self) -> Iter<'a, T> { + Iter { next: self.head.map(|node| &'a node) } + } +} + +impl<'a, T> Iterator for Iter<'a, T> { + type Item = &'a T; + fn next(&'a mut self) -> Option { + self.next.map(|node| { + self.next = node.next.map(|node| &'a node); + &'a node.elem + }) + } +} +``` + +```shell +> cargo build + +error: expected `:`, found `node` + --> src/second.rs:77:47 + | +77 | Iter { next: self.head.map(|node| &'a node) } + | ---- while parsing this struct ^^^^ expected `:` + +error: expected `:`, found `node` + --> src/second.rs:85:50 + | +85 | self.next = node.next.map(|node| &'a node); + | ^^^^ expected `:` + +error[E0063]: missing field `next` in initializer of `second::Iter<'_, _>` + --> src/second.rs:77:9 + | +77 | Iter { next: self.head.map(|node| &'a node) } + | ^^^^ missing `next` +``` + +怎么回事。。感觉错误犹如雨后春笋般冒了出来,Rust 是不是被我们搞坏了 :( + +现在看来,我们的生命周期是用错了,聪明的同学可能已经看出了端倪,那么再修改下试试; +```rust +pub struct Iter<'a, T> { + next: Option<&'a Node>, +} + +// 这里无需生命周期,因为 List 没有使用生命周期的关联项 +impl List { + // 这里我们为 `iter` 生命一个生命周期 'a , 此时 `&self` 需要至少和 `Iter` 活得一样久 + pub fn iter<'a>(&'a self) -> Iter<'a, T> { + Iter { next: self.head.map(|node| &node) } + } +} + +// 这里声明生命周期是因为下面的关联类型 Item 需要 +impl<'a, T> Iterator for Iter<'a, T> { + type Item = &'a T; + + // 这里无需更改,因为上面已经处理了. + // Self 依然是这么棒 + fn next(&mut self) -> Option { + self.next.map(|node| { + self.next = node.next.map(|node| &node); + &node.elem + }) + } +} +``` + +现在,我们也许可以自信的编译下试试了: +```shell +cargo build + +error[E0308]: mismatched types + --> src/second.rs:77:22 + | +77 | Iter { next: self.head.map(|node| &node) } + | ^^^^^^^^^^^^^^^^^^^^^^^^^^^ expected struct `second::Node`, found struct `std::boxed::Box` + | + = note: expected type `std::option::Option<&second::Node>` + found type `std::option::Option<&std::boxed::Box>>` + +error[E0308]: mismatched types + --> src/second.rs:85:25 + | +85 | self.next = node.next.map(|node| &node); + | ^^^^^^^^^^^^^^^^^^^^^^^^^^^ expected struct `second::Node`, found struct `std::boxed::Box` + | + = note: expected type `std::option::Option<&'a second::Node>` + found type `std::option::Option<&std::boxed::Box>>` +``` + +(╯°□°)╯︵ ┻━┻ + +这么看,生命周期的问题解决了,但是又引入了新的错误。原因在于,我们希望存储 `&Node` 但是获取的却是 `&Box`。嗯,小问题,解引用搞定: +```rust +impl List { + pub fn iter<'a>(&'a self) -> Iter<'a, T> { + Iter { next: self.head.map(|node| &*node) } + } +} + +impl<'a, T> Iterator for Iter<'a, T> { + type Item = &'a T; + fn next(&mut self) -> Option { + self.next.map(|node| { + self.next = node.next.map(|node| &*node); + &node.elem + }) + } +} +``` + +```shell +cargo build + Compiling lists v0.1.0 (/Users/ABeingessner/dev/temp/lists) +error[E0515]: cannot return reference to local data `*node` + --> src/second.rs:77:43 + | +77 | Iter { next: self.head.map(|node| &*node) } + | ^^^^^^ returns a reference to data owned by the current function + +error[E0507]: cannot move out of borrowed content + --> src/second.rs:77:22 + | +77 | Iter { next: self.head.map(|node| &*node) } + | ^^^^^^^^^ cannot move out of borrowed content + +error[E0515]: cannot return reference to local data `*node` + --> src/second.rs:85:46 + | +85 | self.next = node.next.map(|node| &*node); + | ^^^^^^ returns a reference to data owned by the current function + +error[E0507]: cannot move out of borrowed content + --> src/second.rs:85:25 + | +85 | self.next = node.next.map(|node| &*node); + | ^^^^^^^^^ cannot move out of borrowed content +``` + +又怎么了! (ノಥ益ಥ)ノ ┻━┻ + +大家还记得之前章节的内容吗?原因是这里我们忘记了 `as_ref` ,然后值的所有权被转移到了 `map` 中,结果我们在内部引用了一个局部值,造成一个垂悬引用: +```rust +pub struct Iter<'a, T> { + next: Option<&'a Node>, +} + +impl List { + pub fn iter<'a>(&'a self) -> Iter<'a, T> { + Iter { next: self.head.as_ref().map(|node| &*node) } + } +} + +impl<'a, T> Iterator for Iter<'a, T> { + type Item = &'a T; + + fn next(&mut self) -> Option { + self.next.map(|node| { + self.next = node.next.as_ref().map(|node| &*node); + &node.elem + }) + } +} +``` + +```shell +cargo build + Compiling lists v0.1.0 (/Users/ABeingessner/dev/temp/lists) +error[E0308]: mismatched types + --> src/second.rs:77:22 + | +77 | Iter { next: self.head.as_ref().map(|node| &*node) } + | ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ expected struct `second::Node`, found struct `std::boxed::Box` + | + = note: expected type `std::option::Option<&second::Node>` + found type `std::option::Option<&std::boxed::Box>>` + +error[E0308]: mismatched types + --> src/second.rs:85:25 + | +85 | self.next = node.next.as_ref().map(|node| &*node); + | ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ expected struct `second::Node`, found struct `std::boxed::Box` + | + = note: expected type `std::option::Option<&'a second::Node>` + found type `std::option::Option<&std::boxed::Box>>` +``` + +😭 + +错误的原因是,`as_ref` 增加了一层间接引用,需要被移除,这里使用另外一种方式来实现: +```rust +pub struct Iter<'a, T> { + next: Option<&'a Node>, +} + +impl List { + pub fn iter<'a>(&'a self) -> Iter<'a, T> { + Iter { next: self.head.as_deref() } + } +} + +impl<'a, T> Iterator for Iter<'a, T> { + type Item = &'a T; + + fn next(&mut self) -> Option { + self.next.map(|node| { + self.next = node.next.as_deref(); + &node.elem + }) + } +} +``` + +```shell +cargo build +``` + +🎉 🎉 🎉 + +`as_deref` 和 `as_deref_mut` 函数在 Rust 1.40 版本中正式稳定下来。在那之前,你只能在 `stable` 版本中使用 `map(|node| &**node)` 和 `map(|node| &mut**node)` 的方式来替代。 + +大家可能会觉得 `&**` 的形式看上去有些烂,没错,确实如此。但是就像一瓶好酒一样,Rust 也随着时间的推进变得越来越好,因此现在我们已经无需再这么做了。事实上,Rust 很擅长隐式地做类似的转换,或者可以称之为 [`Deref`](https://course.rs/advance/smart-pointer/deref.html)。 + +但是 `Deref` 在这里并不能很好的完成自己的任务,原因是在闭包中使用 `Option<&T>` 而不是 `&T` 对于它来说有些过于复杂了,因此我们需要显式地去帮助它完成任务。好在根据我的经验来看,这种情况还是相当少见的。 + +事实上,还可以使用另一种方式来实现: +```rust +self.next = node.next.as_ref().map::<&Node, _>(|node| &node); +``` + +这种类型暗示的方式可以使用的原因在于 `map` 是一个泛型函数: +```rust +pub fn map(self, f: F) -> Option +``` + +turbofish 形式的符号 `::<>` 可以告诉编译器我们希望用哪个具体的类型来替代泛型类型,在这种情况里,`::<&Node, _>` 意味着: 它应该返回一个 `&Node`。这种方式可以让编译器知道它需要对 `&node` 应用 `deref`,这样我们就不用手动的添加 `**` 来进行解引用。 + +好了,既然编译通过,那就写个测试来看看运行结果: +```rust +#[test] +fn iter() { + let mut list = List::new(); + list.push(1); list.push(2); list.push(3); + + let mut iter = list.iter(); + assert_eq!(iter.next(), Some(&3)); + assert_eq!(iter.next(), Some(&2)); + assert_eq!(iter.next(), Some(&1)); +} +``` + +```shell +> cargo test + + Running target/debug/lists-5c71138492ad4b4a + +running 5 tests +test first::test::basics ... ok +test second::test::basics ... ok +test second::test::into_iter ... ok +test second::test::iter ... ok +test second::test::peek ... ok + +test result: ok. 4 passed; 0 failed; 0 ignored; 0 measured +``` + +最后,还有一点值得注意,之前的代码事实上可以应用[生命周期消除原则](https://course.rs/advance/lifetime/basic.html#生命周期消除): +```rust +impl List { + pub fn iter<'a>(&'a self) -> Iter<'a, T> { + Iter { next: self.head.as_deref() } + } +} +``` + +这段代码跟以下代码是等价的: +```rust +impl List { + pub fn iter(&self) -> Iter { + Iter { next: self.head.as_deref() } + } +} +``` + +当然,如果你就喜欢生命周期那种自由、飘逸的 feeling,还可以使用 Rust 2018 引入的“显式生命周期消除"语法 `'_`: +```rust +impl List { + pub fn iter(&self) -> Iter<'_, T> { + Iter { next: self.head.as_deref() } + } +} +``` + diff --git a/src/too-many-lists/ok-stack/itermut.md b/src/too-many-lists/ok-stack/itermut.md new file mode 100644 index 00000000..b1dc4706 --- /dev/null +++ b/src/too-many-lists/ok-stack/itermut.md @@ -0,0 +1,326 @@ +# IterMut以及完整代码 +上一章节中我们讲到了要为 `List` 实现三种类型的迭代器并实现了其中两种: `IntoIter` 和 `Iter`。下面再来看看最后一种 `IterMut`。 + +再来回顾下 `Iter` 的实现: +```rust +impl<'a, T> Iterator for Iter<'a, T> { + type Item = &'a T; + + fn next(&mut self) -> Option { /* stuff */ } +} +``` + +这段代码可以进行下脱糖( desugar ): +```rust +impl<'a, T> Iterator for Iter<'a, T> { + type Item = &'a T; + + fn next<'b>(&'b mut self) -> Option<&'a T> { /* stuff */ } +} +``` + +可以看出 `next` 方法的输入和输出之间的生命周期并没有关联,这样我们就可以无条件的一遍又一遍地调用 `next`: +```rust +let mut list = List::new(); +list.push(1); list.push(2); list.push(3); + +let mut iter = list.iter(); +let x = iter.next().unwrap(); +let y = iter.next().unwrap(); +let z = iter.next().unwrap(); +``` + +对于不可变借用而言,这种方式没有任何问题,因为不可变借用可以同时存在多个,但是如果是可变引用呢?因此,大家可能会以为使用安全代码来写 `IterMut` 是一件相当困难的事。但是令人诧异的是,事实上,我们可以使用安全的代码来为很多数据结构实现 `IterMut`。 + +先将之前的代码修改成可变的: +```rust +pub struct IterMut<'a, T> { + next: Option<&'a mut Node>, +} + +impl List { + pub fn iter_mut(&self) -> IterMut<'_, T> { + IterMut { next: self.head.as_deref_mut() } + } +} + +impl<'a, T> Iterator for IterMut<'a, T> { + type Item = &'a mut T; + + fn next(&mut self) -> Option { + self.next.map(|node| { + self.next = node.next.as_deref_mut(); + &mut node.elem + }) + } +} +``` + +```shell +> cargo build +error[E0596]: cannot borrow `self.head` as mutable, as it is behind a `&` reference + --> src/second.rs:95:25 + | +94 | pub fn iter_mut(&self) -> IterMut<'_, T> { + | ----- help: consider changing this to be a mutable reference: `&mut self` +95 | IterMut { next: self.head.as_deref_mut() } + | ^^^^^^^^^ `self` is a `&` reference, so the data it refers to cannot be borrowed as mutable + +error[E0507]: cannot move out of borrowed content + --> src/second.rs:103:9 + | +103 | self.next.map(|node| { + | ^^^^^^^^^ cannot move out of borrowed content +``` + +果不其然,两个错误发生了。第一错误看上去很清晰,甚至告诉了我们该如何解决: +```rust +pub fn iter_mut(&mut self) -> IterMut<'_, T> { + IterMut { next: self.head.as_deref_mut() } +} +``` + +但是另一个好像就没那么容易了。但是之前的代码就可以工作啊,为何这里就不行了? + +原因在于有些类型可以 [Copy](https://course.rs/basic/ownership/ownership.html#拷贝浅拷贝),有些不行。而`Option` 和不可变引用 `&T` 恰恰是可以 Copy 的,但尴尬的是,可变引用 `&mut T` 不可以,因此这里报错了。 + +因此我们需要使用 `take` 方法来处理这种情况: +```rust +fn next(&mut self) -> Option { + self.next.take().map(|node| { + self.next = node.next.as_deref_mut(); + &mut node.elem + }) +} +``` + +```shell +> cargo build +``` + +老规矩,来测试下: +```rust +#[test] +fn iter_mut() { + let mut list = List::new(); + list.push(1); list.push(2); list.push(3); + + let mut iter = list.iter_mut(); + assert_eq!(iter.next(), Some(&mut 3)); + assert_eq!(iter.next(), Some(&mut 2)); + assert_eq!(iter.next(), Some(&mut 1)); +} +``` + +```shell +> cargo test + + Running target/debug/lists-5c71138492ad4b4a + +running 6 tests +test first::test::basics ... ok +test second::test::basics ... ok +test second::test::iter_mut ... ok +test second::test::into_iter ... ok +test second::test::iter ... ok +test second::test::peek ... ok + +test result: ok. 7 passed; 0 failed; 0 ignored; 0 measured +``` + +最终,我们完成了迭代器的功能,下面是完整的代码。 + +## 完整代码 + +```rust +pub struct List { + head: Link, +} + +type Link = Option>>; + +struct Node { + elem: T, + next: Link, +} + +impl List { + pub fn new() -> Self { + List { head: None } + } + + pub fn push(&mut self, elem: T) { + let new_node = Box::new(Node { + elem: elem, + next: self.head.take(), + }); + + self.head = Some(new_node); + } + + pub fn pop(&mut self) -> Option { + self.head.take().map(|node| { + self.head = node.next; + node.elem + }) + } + + pub fn peek(&self) -> Option<&T> { + self.head.as_ref().map(|node| { + &node.elem + }) + } + + pub fn peek_mut(&mut self) -> Option<&mut T> { + self.head.as_mut().map(|node| { + &mut node.elem + }) + } + + pub fn into_iter(self) -> IntoIter { + IntoIter(self) + } + + pub fn iter(&self) -> Iter<'_, T> { + Iter { next: self.head.as_deref() } + } + + pub fn iter_mut(&mut self) -> IterMut<'_, T> { + IterMut { next: self.head.as_deref_mut() } + } +} + +impl Drop for List { + fn drop(&mut self) { + let mut cur_link = self.head.take(); + while let Some(mut boxed_node) = cur_link { + cur_link = boxed_node.next.take(); + } + } +} + +pub struct IntoIter(List); + +impl Iterator for IntoIter { + type Item = T; + fn next(&mut self) -> Option { + // access fields of a tuple struct numerically + self.0.pop() + } +} + +pub struct Iter<'a, T> { + next: Option<&'a Node>, +} + +impl<'a, T> Iterator for Iter<'a, T> { + type Item = &'a T; + fn next(&mut self) -> Option { + self.next.map(|node| { + self.next = node.next.as_deref(); + &node.elem + }) + } +} + +pub struct IterMut<'a, T> { + next: Option<&'a mut Node>, +} + +impl<'a, T> Iterator for IterMut<'a, T> { + type Item = &'a mut T; + + fn next(&mut self) -> Option { + self.next.take().map(|node| { + self.next = node.next.as_deref_mut(); + &mut node.elem + }) + } +} + +#[cfg(test)] +mod test { + use super::List; + + #[test] + fn basics() { + let mut list = List::new(); + + // Check empty list behaves right + assert_eq!(list.pop(), None); + + // Populate list + list.push(1); + list.push(2); + list.push(3); + + // Check normal removal + assert_eq!(list.pop(), Some(3)); + assert_eq!(list.pop(), Some(2)); + + // Push some more just to make sure nothing's corrupted + list.push(4); + list.push(5); + + // Check normal removal + assert_eq!(list.pop(), Some(5)); + assert_eq!(list.pop(), Some(4)); + + // Check exhaustion + assert_eq!(list.pop(), Some(1)); + assert_eq!(list.pop(), None); + } + + #[test] + fn peek() { + let mut list = List::new(); + assert_eq!(list.peek(), None); + assert_eq!(list.peek_mut(), None); + list.push(1); list.push(2); list.push(3); + + assert_eq!(list.peek(), Some(&3)); + assert_eq!(list.peek_mut(), Some(&mut 3)); + + list.peek_mut().map(|value| { + *value = 42 + }); + + assert_eq!(list.peek(), Some(&42)); + assert_eq!(list.pop(), Some(42)); + } + + #[test] + fn into_iter() { + let mut list = List::new(); + list.push(1); list.push(2); list.push(3); + + let mut iter = list.into_iter(); + assert_eq!(iter.next(), Some(3)); + assert_eq!(iter.next(), Some(2)); + assert_eq!(iter.next(), Some(1)); + assert_eq!(iter.next(), None); + } + + #[test] + fn iter() { + let mut list = List::new(); + list.push(1); list.push(2); list.push(3); + + let mut iter = list.iter(); + assert_eq!(iter.next(), Some(&3)); + assert_eq!(iter.next(), Some(&2)); + assert_eq!(iter.next(), Some(&1)); + } + + #[test] + fn iter_mut() { + let mut list = List::new(); + list.push(1); list.push(2); list.push(3); + + let mut iter = list.iter_mut(); + assert_eq!(iter.next(), Some(&mut 3)); + assert_eq!(iter.next(), Some(&mut 2)); + assert_eq!(iter.next(), Some(&mut 1)); + } +} +``` \ No newline at end of file diff --git a/src/too-many-lists/persistent-stack/drop-arc.md b/src/too-many-lists/persistent-stack/drop-arc.md new file mode 100644 index 00000000..75ce23f9 --- /dev/null +++ b/src/too-many-lists/persistent-stack/drop-arc.md @@ -0,0 +1,189 @@ +# Drop、Arc 及完整代码 + +## Drop +与之前链表存在的问题相似,新的链表也有递归的问题。下面是之前的解决方法: +```rust +impl Drop for List { + fn drop(&mut self) { + let mut cur_link = self.head.take(); + while let Some(mut boxed_node) = cur_link { + cur_link = boxed_node.next.take(); + } + } +} +``` + +但是 `boxed_node.next.take()` 的方式在新的链表中无法使用,因为我们没办法去修改 `Rc` 持有的值。 + +考虑一下相关的逻辑,可以发现,如果当前的节点仅被当前链表所引用(Rc 的引用计数为 1),那该节点是可以安全 `drop` 的: +```rust +impl Drop for List { + fn drop(&mut self) { + let mut head = self.head.take(); + while let Some(node) = head { + if let Ok(mut node) = Rc::try_unwrap(node) { + head = node.next.take(); + } else { + break; + } + } + } +} +``` + +这里有一个没见过的方法 `Rc::Try_unwrap` ,该方法会判断当前的 `Rc` 是否只有一个强引用,若是,则返回 `Rc` 持有的值,否则返回一个错误。 + +可以看出,我们会一直 drop 到第一个被其它链表所引用的节点: +```shell +list1 -> A ---+ + | + v +list2 ------> B -> C -> D + ^ + | +list3 -> X ---+ +``` + +例如如果要 drop `List2`,那会从头节点开始一直 drop 到 `B` 节点时停止,剩余的 `B -> C -> D` 三个节点由于引用计数不为 1 (同时被多个链表引用) ,因此不会被 drop。 + + +测试下新的代码: +```shell +cargo test + Compiling lists v0.1.0 (/Users/ABeingessner/dev/too-many-lists/lists) + Finished dev [unoptimized + debuginfo] target(s) in 1.10s + Running /Users/ABeingessner/dev/too-many-lists/lists/target/debug/deps/lists-86544f1d97438f1f + +running 8 tests +test first::test::basics ... ok +test second::test::basics ... ok +test second::test::into_iter ... ok +test second::test::iter ... ok +test second::test::iter_mut ... ok +test second::test::peek ... ok +test third::test::basics ... ok +test third::test::iter ... ok + +test result: ok. 8 passed; 0 failed; 0 ignored; 0 measured; 0 filtered out +``` + +完美通过,下面再来考虑一个问题,如果我们的链表要在多线程环境使用该怎么办? + +## Arc +不可变链表的一个很大的好处就在于多线程访问时自带安全性,毕竟共享可变性是多线程危险的源泉,最好也是最简单的解决办法就是直接干掉可变性。 + +但是 `Rc` 本身并不是线程安全的,原因在之前的章节也有讲:它内部的引用计数器并不是线程安全的,通俗来讲,计数器没有加锁也没有实现原子性。 + +再结合之前章节学过的内容,绝大部分同学应该都能想到, `Arc` 就是我们的最终答案。 + +那么还有一个问题,我们怎么知道一个类型是不是类型安全?会不会在多线程误用了非线程安全的类型呢?这就是 Rust 安全性的另一个强大之处:Rust 通过提供 `Send` 和 `Sync` 两个特征来保证线程安全。 + +> 关于 `Send` 和 `Sync` 的详细介绍,请参见[此章节](https://course.rs/advance/concurrency-with-threads/send-sync.html) + +## 完整代码 +又到了喜闻乐见的环节,新链表的代码相比之前反而还更简单了,不可变就是香! + +```rust +use std::rc::Rc; + +pub struct List { + head: Link, +} + +type Link = Option>>; + +struct Node { + elem: T, + next: Link, +} + +impl List { + pub fn new() -> Self { + List { head: None } + } + + pub fn prepend(&self, elem: T) -> List { + List { head: Some(Rc::new(Node { + elem: elem, + next: self.head.clone(), + }))} + } + + pub fn tail(&self) -> List { + List { head: self.head.as_ref().and_then(|node| node.next.clone()) } + } + + pub fn head(&self) -> Option<&T> { + self.head.as_ref().map(|node| &node.elem) + } + + pub fn iter(&self) -> Iter<'_, T> { + Iter { next: self.head.as_deref() } + } +} + +impl Drop for List { + fn drop(&mut self) { + let mut head = self.head.take(); + while let Some(node) = head { + if let Ok(mut node) = Rc::try_unwrap(node) { + head = node.next.take(); + } else { + break; + } + } + } +} + +pub struct Iter<'a, T> { + next: Option<&'a Node>, +} + +impl<'a, T> Iterator for Iter<'a, T> { + type Item = &'a T; + + fn next(&mut self) -> Option { + self.next.map(|node| { + self.next = node.next.as_deref(); + &node.elem + }) + } +} + +#[cfg(test)] +mod test { + use super::List; + + #[test] + fn basics() { + let list = List::new(); + assert_eq!(list.head(), None); + + let list = list.prepend(1).prepend(2).prepend(3); + assert_eq!(list.head(), Some(&3)); + + let list = list.tail(); + assert_eq!(list.head(), Some(&2)); + + let list = list.tail(); + assert_eq!(list.head(), Some(&1)); + + let list = list.tail(); + assert_eq!(list.head(), None); + + // Make sure empty tail works + let list = list.tail(); + assert_eq!(list.head(), None); + } + + #[test] + fn iter() { + let list = List::new().prepend(1).prepend(2).prepend(3); + + let mut iter = list.iter(); + assert_eq!(iter.next(), Some(&3)); + assert_eq!(iter.next(), Some(&2)); + assert_eq!(iter.next(), Some(&1)); + } +} +``` diff --git a/src/too-many-lists/persistent-stack/intro.md b/src/too-many-lists/persistent-stack/intro.md new file mode 100644 index 00000000..087931f6 --- /dev/null +++ b/src/too-many-lists/persistent-stack/intro.md @@ -0,0 +1,15 @@ +# 持久化单向链表 +迄今为止,我们已经掌握了如何实现一个可变的单向链表。但是之前的链表都是单所有权的,在实际使用中,共享所有权才是更实用的方式,下面一起来看看该如何实现一个不可变的、共享所有权的持久化链表( persistent )。 + +开始之前,还需要创建一个新文件 `third.rs` ,并在 `lib.rs` 中添加以下内容: +```rust +// in lib.rs + +pub mod first; +pub mod second; +pub mod third; +``` + +与上一个链表有所不同,这次我们无需拷贝之前的代码,而是从零开始构建一个新的链表。 + + diff --git a/src/too-many-lists/persistent-stack/layout.md b/src/too-many-lists/persistent-stack/layout.md new file mode 100644 index 00000000..72cdd308 --- /dev/null +++ b/src/too-many-lists/persistent-stack/layout.md @@ -0,0 +1,232 @@ +# 数据布局和基本操作 +对于新的链表来说,最重要的就是我们可以免费的操控列表的尾部( tail )。 + +## 数据布局 +例如以下是一个不太常见的持久化列表布局: +```shell +list1 = A -> B -> C -> D +list2 = tail(list1) = B -> C -> D +list3 = push(list2, X) = X -> B -> C -> D +``` + +如果上面的不够清晰,我们还可以从内存角度来看: +```shell +list1 -> A ---+ + | + v +list2 ------> B -> C -> D + ^ + | +list3 -> X ---+ +``` + +这里大家可能会看出一些端倪:节点 `B` 被多个链表所共享,这造成了我们无法通过 `Box` 的方式来实现,因为如果使用 `Box`,还存在一个问题,谁来负责清理释放?如果 drop `list2`,那 `B` 节点会被清理释放吗? + +函数式语言或者说其它绝大多数语言,并不存在这个问题,因为 GC 垃圾回收解千愁,但是 Rust 并没有。 + +好在标准库为我们提供了引用计数的数据结构: `Rc / Arc`,引用计数可以被认为是一种简单的 GC,对于很多场景来说,引用计数的数据吞吐量要远小于垃圾回收,而且引用计数还存在循环引用的风险!但... 我们有其它选择吗? :( + +不过使用 Rc 意味着我们的数据将无法被改变,因为它不具备内部可变性,关于 Rc/Arc 的详细介绍请看[这里](https://course.rs/advance/smart-pointer/rc-arc.html)。 + +下面,简单的将我们的数据结构通过 `Rc` 来实现: +```rust +// in third.rs +use std::rc::Rc; + +pub struct List { + head: Link, +} + +type Link = Option>>; + +struct Node { + elem: T, + next: Link, +} +``` + +需要注意的是, `Rc` 在 Rust 中并不是一等公民,它没有被包含在 `std::prelude` 中,因此我们必须手动引入 `use std::rc::Rc` (混得好失败 - , -) + +## 基本操作 +首先,对于 List 的构造器,可以直接复制粘贴: +```rust +impl List { + pub fn new() -> Self { + List { head: None } + } +} +``` + +而之前的 `push` 和 `pop` 已无任何意义,因为新链表是不可变的,但我们可以使用功能相似的 `prepend` 和 `tail` 来返回新的链表。 + +```rust +pub fn prepend(&self, elem: T) -> List { + List { head: Some(Rc::new(Node { + elem: elem, + next: self.head.clone(), + }))} +} +``` + +大家可能会大惊失色,什么,你竟然用了 `clone`,不是号称高性能链表实现吗?别急,这里其实只是 `Rc::clone`,对于该方法而言,`clone` 仅仅是增加引用计数,并不是复制底层的数据。虽然 `Rc` 的性能要比 `Box` 的引用方式低一点,但是它依然是多所有权前提下最好的解决方式或者说之一。 + +还有一点值得注意, `head` 是 `Option>>` 类型,那么为何不先匹配出内部的 `Rc>`,然后再 clone 呢?原因是 `Option` 也提供了相应的 API,它的功能跟我们的需求是一致的。 + +运行下试试: +```shell +> cargo build + +warning: field is never used: `elem` + --> src/third.rs:10:5 + | +10 | elem: T, + | ^^^^^^^ + | + = note: #[warn(dead_code)] on by default + +warning: field is never used: `next` + --> src/third.rs:11:5 + | +11 | next: Link, + | ^^^^^^^^^^^^^ +``` + +胆战心惊的编译通过(胆战心惊? 日常基本操作,请坐下!)。 + +继续来实现 `tail`,该方法会将现有链表的首个元素移除,并返回剩余的链表: +```rust +pub fn tail(&self) -> List { + List { head: self.head.as_ref().map(|node| node.next.clone()) } +} +``` + +```shell +cargo build + +error[E0308]: mismatched types + --> src/third.rs:27:22 + | +27 | List { head: self.head.as_ref().map(|node| node.next.clone()) } + | ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ expected struct `std::rc::Rc`, found enum `std::option::Option` + | + = note: expected type `std::option::Option>` + found type `std::option::Option>>` +``` + +看起来这里的 `map` 多套了一层 `Option`,可以用 `and_then` 替代: +```rust +pub fn tail(&self) -> List { + List { head: self.head.as_ref().and_then(|node| node.next.clone()) } +} +``` + +顺利通过编译,很棒!最后就是实现 `head` 方法,它返回首个元素的引用,跟之前链表的 `peek` 方法一样: +```rust +pub fn head(&self) -> Option<&T> { + self.head.as_ref().map(|node| &node.elem ) +} +``` + +好了,至此,新链表的基本操作都已经实现,最后让我们写几个测试用例来看看它们是骡子还是马: +```rust +#[cfg(test)] +mod test { + use super::List; + + #[test] + fn basics() { + let list = List::new(); + assert_eq!(list.head(), None); + + let list = list.prepend(1).prepend(2).prepend(3); + assert_eq!(list.head(), Some(&3)); + + let list = list.tail(); + assert_eq!(list.head(), Some(&2)); + + let list = list.tail(); + assert_eq!(list.head(), Some(&1)); + + let list = list.tail(); + assert_eq!(list.head(), None); + + // Make sure empty tail works + let list = list.tail(); + assert_eq!(list.head(), None); + + } +} +``` + +```shell +> cargo test + + Running target/debug/lists-5c71138492ad4b4a + +running 5 tests +test first::test::basics ... ok +test second::test::into_iter ... ok +test second::test::basics ... ok +test second::test::iter ... ok +test third::test::basics ... ok + +test result: ok. 5 passed; 0 failed; 0 ignored; 0 measured +``` + +哦对了... 我们好像忘了一个重要特性:对链表的迭代。 + +```rust +pub struct Iter<'a, T> { + next: Option<&'a Node>, +} + +impl List { + pub fn iter(&self) -> Iter<'_, T> { + Iter { next: self.head.as_deref() } + } +} + +impl<'a, T> Iterator for Iter<'a, T> { + type Item = &'a T; + + fn next(&mut self) -> Option { + self.next.map(|node| { + self.next = node.next.as_deref(); + &node.elem + }) + } +} +``` + +```rust +#[test] +fn iter() { + let list = List::new().prepend(1).prepend(2).prepend(3); + + let mut iter = list.iter(); + assert_eq!(iter.next(), Some(&3)); + assert_eq!(iter.next(), Some(&2)); + assert_eq!(iter.next(), Some(&1)); +} +``` + +```shell +cargo test + + Running target/debug/lists-5c71138492ad4b4a + +running 7 tests +test first::test::basics ... ok +test second::test::basics ... ok +test second::test::iter ... ok +test second::test::into_iter ... ok +test second::test::peek ... ok +test third::test::basics ... ok +test third::test::iter ... ok + +test result: ok. 6 passed; 0 failed; 0 ignored; 0 measured +``` + +细心的同学可能会觉得我在凑字数,这不跟之前的链表迭代实现一样一样的嘛?恭喜你答对了 :) + +最后,给大家留个作业,你可以尝试下看能不能实现 `IntoIter` 和 `IterMut`,如果实现不了请不要打我,冤有头债有主,都是 `Rc` 惹的祸 :( \ No newline at end of file diff --git a/src/too-many-lists/unsafe-queue/basics.md b/src/too-many-lists/unsafe-queue/basics.md new file mode 100644 index 00000000..3a3c17a4 --- /dev/null +++ b/src/too-many-lists/unsafe-queue/basics.md @@ -0,0 +1,246 @@ +# 基本操作 + +> 本章节的代码中有一个隐藏的 bug,因为它藏身于 unsafe 中,因此不会导致报错,我们会在后续章节解决这个问题,所以,请不要在生产环境使用此处的代码 + +在开始之前,大家需要先了解 unsafe 的[相关知识](https://course.rs/advance/unsafe/intro.html)。那么,言归正传,该如何构建一个链表?在之前我们是这么做的: +```rust +impl List { + pub fn new() -> Self { + List { head: None, tail: None } + } +} +``` + +但是我们不再在 `tail` 中使用 `Option`: +```shell +> cargo build + +error[E0308]: mismatched types + --> src/fifth.rs:15:34 + | +15 | List { head: None, tail: None } + | ^^^^ expected *-ptr, found + | enum `std::option::Option` + | + = note: expected type `*mut fifth::Node` + found type `std::option::Option<_>` +``` + +我们是可以使用 `Option` 包裹一层,但是 `*mut` 裸指针之所以裸,是因为它狂,它可以是 `null` ! 因此 `Option` 就变得没有意义: +```rust +use std::ptr; + +// defns... + +impl List { + pub fn new() -> Self { + List { head: None, tail: ptr::null_mut() } + } +} +``` + +如上所示,通过 `std::ptr::null_mut` 函数可以获取一个 `null`,当然,还可以使用 `0 as *mut _`,但是...已经这么不安全了,好歹我们要留一点代码可读性上的尊严吧 = , = + +好了,现在是时候去重新实现 `push` ,之前获取的是 `Option<&mut Node>` 成为我们的拦路虎,这次来看看如果是获取 `*mut Node` 还会不会有类似的问题。 + +首先,该如何将一个普通的引用变成裸指针?答案是:强制转换 Coercions。 + +```rust +let raw_tail: *mut _ = &mut *new_tail; +``` + +来看看 `push` 的实现: +```rust +pub fn push(&mut self, elem: T) { + let mut new_tail = Box::new(Node { + elem: elem, + next: None, + }); + + let raw_tail: *mut _ = &mut *new_tail; + + // .is_null 会检查是否为 null, 在功能上等价于 `None` 的检查 + if !self.tail.is_null() { + // 如果 old tail 存在,那将其指向新的 tail + self.tail.next = Some(new_tail); + } else { + // 否则让 head 指向新的 tail + self.head = Some(new_tail); + } + + self.tail = raw_tail; +} +``` + +```shell +> cargo build + +error[E0609]: no field `next` on type `*mut fifth::Node` + --> src/fifth.rs:31:23 + | +31 | self.tail.next = Some(new_tail); + | ----------^^^^ + | | + | help: `self.tail` is a raw pointer; + | try dereferencing it: `(*self.tail).next` +``` + +当使用裸指针时,一些 Rust 提供的便利条件也将不复存在,例如由于不安全性的存在,裸指针需要我们手动去解引用( deref ): +```rust +*self.tail.next = Some(new_tail); +``` + +```shell +> cargo build + +error[E0609]: no field `next` on type `*mut fifth::Node` + --> src/fifth.rs:31:23 + | +31 | *self.tail.next = Some(new_tail); + | -----------^^^^ + | | + | help: `self.tail` is a raw pointer; + | try dereferencing it: `(*self.tail).next` +``` + +哦哦,运算符的优先级问题: +```rust +(*self.tail).next = Some(new_tail); +``` + +```shell +> cargo build + +error[E0133]: dereference of raw pointer is unsafe and requires + unsafe function or block + + --> src/fifth.rs:31:13 + | +31 | (*self.tail).next = Some(new_tail); + | ^^^^^^^^^^^^^^^^^ dereference of raw pointer + | + = note: raw pointers may be NULL, dangling or unaligned; + they can violate aliasing rules and cause data races: + all of these are undefined behavior +``` + +哎...太难了,错误一个连一个,好在编译器给出了提示:由于我们在进行不安全的操作,因此需要使用 `unsafe` 语句块。那么问题来了,是将某几行代码包在 `unsafe` 中还是将整个函数包在 `unsafe` 中呢?如果大家不知道哪个是正确答案的话,证明[之前的章节](https://course.rs/advance/unsafe/intro.html#控制-unsafe-的使用边界)还是没有仔细学,请回去再看一下,巩固巩固:) + +```rust +pub fn push(&mut self, elem: T) { + let mut new_tail = Box::new(Node { + elem: elem, + next: None, + }); + + let raw_tail: *mut _ = &mut *new_tail; + + if !self.tail.is_null() { + // 你好编译器,我知道我在做危险的事情,我向你保证:就算犯错了,也和你没有关系,都是我这个不优秀的程序员的责任 + unsafe { + (*self.tail).next = Some(new_tail); + } + } else { + self.head = Some(new_tail); + } + + self.tail = raw_tail; +} +``` + +```shell +> cargo build +warning: field is never used: `elem` + --> src/fifth.rs:11:5 + | +11 | elem: T, + | ^^^^^^^ + | + = note: #[warn(dead_code)] on by default +``` + +细心的同学可能会发现:不是所有的裸指针代码都有 unsafe 的身影。原因在于:**创建原生指针是安全的行为,而解引用原生指针才是不安全的行为** + +呼,长出了一口气,终于成功实现了 `push` ,下面来看看 `pop`: +```rust +pub fn pop(&mut self) -> Option { + self.head.take().map(|head| { + let head = *head; + self.head = head.next; + + if self.head.is_none() { + self.tail = ptr::null_mut(); + } + + head.elem + }) +} +``` + +测试下: +```rust +#[cfg(test)] +mod test { + use super::List; + #[test] + fn basics() { + let mut list = List::new(); + + // Check empty list behaves right + assert_eq!(list.pop(), None); + + // Populate list + list.push(1); + list.push(2); + list.push(3); + + // Check normal removal + assert_eq!(list.pop(), Some(1)); + assert_eq!(list.pop(), Some(2)); + + // Push some more just to make sure nothing's corrupted + list.push(4); + list.push(5); + + // Check normal removal + assert_eq!(list.pop(), Some(3)); + assert_eq!(list.pop(), Some(4)); + + // Check exhaustion + assert_eq!(list.pop(), Some(5)); + assert_eq!(list.pop(), None); + + // Check the exhaustion case fixed the pointer right + list.push(6); + list.push(7); + + // Check normal removal + assert_eq!(list.pop(), Some(6)); + assert_eq!(list.pop(), Some(7)); + assert_eq!(list.pop(), None); + } +} +``` + +摊牌了,我们偷懒了,这些测试就是从之前的栈链表赋值过来的,但是依然做了些改变,例如在末尾增加了几个步骤以确保在 `pop` 中不会发生尾指针损坏( tail-pointer corruption )的情况。 + +```shell +cargo test + +running 12 tests +test fifth::test::basics ... ok +test first::test::basics ... ok +test fourth::test::basics ... ok +test fourth::test::peek ... ok +test second::test::basics ... ok +test fourth::test::into_iter ... ok +test second::test::into_iter ... ok +test second::test::iter ... ok +test second::test::iter_mut ... ok +test second::test::peek ... ok +test third::test::basics ... ok +test third::test::iter ... ok + +test result: ok. 12 passed; 0 failed; 0 ignored; 0 measured +``` + diff --git a/src/too-many-lists/unsafe-queue/extra-junk.md b/src/too-many-lists/unsafe-queue/extra-junk.md new file mode 100644 index 00000000..62dadac2 --- /dev/null +++ b/src/too-many-lists/unsafe-queue/extra-junk.md @@ -0,0 +1,351 @@ +# 额外的操作 +在搞定 `push`、`pop` 后,剩下的基本跟栈链表的实现没有啥区别。只有会改变链表长度的操作才会使用tail指针。 + +当然,现在一切都是裸指针,因此我们要重写代码来使用它们,在此过程中必须要确保没有遗漏地修改所有地方。 + +首先,先从栈链表实现中拷贝以下代码: +```rust +// ... + +pub struct IntoIter(List); + +pub struct Iter<'a, T> { + next: Option<&'a Node>, +} + +pub struct IterMut<'a, T> { + next: Option<&'a mut Node>, +} +``` + +这里的 `Iter` 和 `IterMut` 并没有实现裸指针,先来修改下: +```rust +pub struct IntoIter(List); + +pub struct Iter<'a, T> { + next: *mut Node, +} + +pub struct IterMut<'a, T> { + next: *mut Node, +} + +impl List { + pub fn into_iter(self) -> IntoIter { + IntoIter(self) + } + + pub fn iter(&self) -> Iter<'_, T> { + Iter { next: self.head } + } + + pub fn iter_mut(&mut self) -> IterMut<'_, T> { + IterMut { next: self.head } + } +} +``` + +看起来不错! +```text +error[E0392]: parameter `'a` is never used + --> src\fifth.rs:17:17 + | +17 | pub struct Iter<'a, T> { + | ^^ unused parameter + | + = help: consider removing `'a`, referring to it in a field, + or using a marker such as `PhantomData` + +error[E0392]: parameter `'a` is never used + --> src\fifth.rs:21:20 + | +21 | pub struct IterMut<'a, T> { + | ^^ unused parameter + | + = help: consider removing `'a`, referring to it in a field, + or using a marker such as `PhantomData` +``` + +咦?这里的 [PhantomData](https://doc.rust-lang.org/std/marker/struct.PhantomData.html) 是什么? + +> PhantomData 是零大小zero sized的类型 +> +> 在你的类型中添加一个 `PhantomData` 字段,可以告诉编译器你的类型对 `T` 进行了使用,虽然并没有。说白了,就是让编译器不再给出 `T` 未被使用的警告或者错误。 +> +> 如果想要更深入的了解,可以看下 [Nomicon](https://doc.rust-lang.org/nightly/nomicon/) + +大概最适用于 PhantomData 的场景就是一个结构体拥有未使用的生命周期,典型的就是在 unsafe 中使用。 + +总之,之前的错误是可以通过 PhantomData 来解决的,但是我想将这个秘密武器留到下一章中的双向链表,它才是真正的需要。 + +那现在只能破坏我们之前的豪言壮语了,灰溜溜的继续使用引用貌似也是不错的选择。能使用引用的原因是:我们可以创建一个迭代器,在其中使用安全引用,然后再丢弃迭代器。一旦迭代器被丢弃后,就可以继续使用 `push` 和 `pop` 了。 + +事实上,在迭代期间,我们还是需要解引用大量的裸指针,但是可以把引用看作裸指针的再借用。 + +偷偷的说一句:对于这个方法,我不敢保证一定能成功,先来试试吧.. +```rust +pub struct IntoIter(List); + +pub struct Iter<'a, T> { + next: Option<&'a Node>, +} + +pub struct IterMut<'a, T> { + next: Option<&'a mut Node>, +} + +impl List { + pub fn into_iter(self) -> IntoIter { + IntoIter(self) + } + + pub fn iter(&self) -> Iter<'_, T> { + unsafe { + Iter { next: self.head.as_ref() } + } + } + + pub fn iter_mut(&mut self) -> IterMut<'_, T> { + unsafe { + IterMut { next: self.head.as_mut() } + } + } +} +``` + +为了存储引用,这里使用 `Option` 来包裹,并通过 [`ptr::as_ref`](https://doc.rust-lang.org/std/primitive.pointer.html#method.as_ref-1) 和 [`ptr::as_mut`](https://doc.rust-lang.org/std/primitive.pointer.html#method.as_mut) 来将裸指针转换成引用。 + +通常,我会尽量避免使用 `as_ref` 这类方法,因为它们在做一些不可思议的转换!但是上面却是极少数可以使用的场景之一。 + +这两个方法的使用往往会伴随很多警告,其中最有趣的是: + +> 你必须要遵循混叠(Aliasing)的规则,原因是返回的生命周期 `'a` 只是任意选择的,并不能代表数据真实的生命周期。特别的,在这段生命周期的过程中,指针指向的内存区域绝不能被其它指针所访问。 + +好消息是,我们貌似不存在这个问题,因为混叠是我们一直在讨论和避免的问题。除此之外,还有一个恶魔: +```rust +pub unsafe fn as_mut<'a>(self) -> Option<&'a mut T> +``` + +大家注意到这个凭空出现的 `'a` 吗?这里 `self` 是一个值类型,按照生命周期的规则,`'a` 无根之木,它就是[无界生命周期](https://course.rs/advance/lifetime/advance.html#无界生命周期)。 + +兄弟们,我很紧张,但是该继续的还是得继续,让我们从栈链表中再复制一些代码过来: +```rust +impl Iterator for IntoIter { + type Item = T; + fn next(&mut self) -> Option { + self.0.pop() + } +} + +impl<'a, T> Iterator for Iter<'a, T> { + type Item = &'a T; + + fn next(&mut self) -> Option { + self.next.map(|node| { + self.next = node.next.as_deref(); + &node.elem + }) + } +} + +impl<'a, T> Iterator for IterMut<'a, T> { + type Item = &'a mut T; + + fn next(&mut self) -> Option { + self.next.take().map(|node| { + self.next = node.next.as_deref_mut(); + &mut node.elem + }) + } +} +``` + +验证下测试用例: +```rust +cargo test + +running 15 tests +test fifth::test::basics ... ok +test fifth::test::into_iter ... ok +test fifth::test::iter ... ok +test fifth::test::iter_mut ... ok +test first::test::basics ... ok +test fourth::test::basics ... ok +test fourth::test::into_iter ... ok +test fourth::test::peek ... ok +test second::test::basics ... ok +test second::test::into_iter ... ok +test second::test::iter ... ok +test second::test::iter_mut ... ok +test second::test::peek ... ok +test third::test::iter ... ok +test third::test::basics ... ok + +test result: ok. 15 passed; 0 failed; 0 ignored; 0 measured; 0 filtered out; +``` + +还有 miri: +```text +MIRIFLAGS="-Zmiri-tag-raw-pointers" cargo +nightly-2022-01-21 miri test + +running 15 tests +test fifth::test::basics ... ok +test fifth::test::into_iter ... ok +test fifth::test::iter ... ok +test fifth::test::iter_mut ... ok +test first::test::basics ... ok +test fourth::test::basics ... ok +test fourth::test::into_iter ... ok +test fourth::test::peek ... ok +test second::test::basics ... ok +test second::test::into_iter ... ok +test second::test::iter ... ok +test second::test::iter_mut ... ok +test second::test::peek ... ok +test third::test::basics ... ok +test third::test::iter ... ok + +test result: ok. 15 passed; 0 failed; 0 ignored; 0 measured; 0 filtered out +``` + +嗯,还有 `peek` 和 `peek_mut` 的实现: +```rust +pub fn peek(&self) -> Option<&T> { + unsafe { + self.head.as_ref() + } +} + +pub fn peek_mut(&mut self) -> Option<&mut T> { + unsafe { + self.head.as_mut() + } +} +``` + +实现这么简单,运行起来肯定没问题: +```text +$ cargo build +error[E0308]: mismatched types + --> src\fifth.rs:66:13 + | +25 | impl List { + | - this type parameter +... +64 | pub fn peek(&self) -> Option<&T> { + | ---------- expected `Option<&T>` + | because of return type +65 | unsafe { +66 | self.head.as_ref() + | ^^^^^^^^^^^^^^^^^^ expected type parameter `T`, + | found struct `fifth::Node` + | + = note: expected enum `Option<&T>` + found enum `Option<&fifth::Node>` +``` + +哦,这个简单,map 以下就可以了: +```rust +pub fn peek(&self) -> Option<&T> { + unsafe { + self.head.as_ref().map(|node| &node.elem) + } +} + +pub fn peek_mut(&mut self) -> Option<&mut T> { + unsafe { + self.head.as_mut().map(|node| &mut node.elem) + } +} +``` + +我感觉有很多错误正在赶来的路上,因此大家需要提高警惕,要么先写一个测试吧:把我们的 API 都混合在一起,让 miri 来享用 - miri food! +```rust +#[test] +fn miri_food() { + let mut list = List::new(); + + list.push(1); + list.push(2); + list.push(3); + + assert!(list.pop() == Some(1)); + list.push(4); + assert!(list.pop() == Some(2)); + list.push(5); + + assert!(list.peek() == Some(&3)); + list.push(6); + list.peek_mut().map(|x| *x *= 10); + assert!(list.peek() == Some(&30)); + assert!(list.pop() == Some(30)); + + for elem in list.iter_mut() { + *elem *= 100; + } + + let mut iter = list.iter(); + assert_eq!(iter.next(), Some(&400)); + assert_eq!(iter.next(), Some(&500)); + assert_eq!(iter.next(), Some(&600)); + assert_eq!(iter.next(), None); + assert_eq!(iter.next(), None); + + assert!(list.pop() == Some(400)); + list.peek_mut().map(|x| *x *= 10); + assert!(list.peek() == Some(&5000)); + list.push(7); + + // Drop it on the ground and let the dtor exercise itself +} +``` + +```text +cargo test + +running 16 tests +test fifth::test::basics ... ok +test fifth::test::into_iter ... ok +test fifth::test::iter ... ok +test fifth::test::iter_mut ... ok +test fifth::test::miri_food ... ok +test first::test::basics ... ok +test fourth::test::basics ... ok +test fourth::test::into_iter ... ok +test fourth::test::peek ... ok +test second::test::into_iter ... ok +test second::test::basics ... ok +test second::test::iter_mut ... ok +test second::test::peek ... ok +test third::test::iter ... ok +test second::test::iter ... ok +test third::test::basics ... ok + +test result: ok. 16 passed; 0 failed; 0 ignored; 0 measured; 0 filtered out + + + +MIRIFLAGS="-Zmiri-tag-raw-pointers" cargo +nightly-2022-01-21 miri test + +running 16 tests +test fifth::test::basics ... ok +test fifth::test::into_iter ... ok +test fifth::test::iter ... ok +test fifth::test::iter_mut ... ok +test fifth::test::miri_food ... ok +test first::test::basics ... ok +test fourth::test::basics ... ok +test fourth::test::into_iter ... ok +test fourth::test::peek ... ok +test second::test::into_iter ... ok +test second::test::basics ... ok +test second::test::iter_mut ... ok +test second::test::peek ... ok +test third::test::iter ... ok +test second::test::iter ... ok +test third::test::basics ... ok + +test result: ok. 16 passed; 0 failed; 0 ignored; 0 measured; 0 filtered out +``` + +完美。 \ No newline at end of file diff --git a/src/too-many-lists/unsafe-queue/final-code.md b/src/too-many-lists/unsafe-queue/final-code.md new file mode 100644 index 00000000..282517c0 --- /dev/null +++ b/src/too-many-lists/unsafe-queue/final-code.md @@ -0,0 +1,253 @@ +# 最终代码 +得益于不安全代码的引入,新的实现可以获得线性的性能提升,同时我们还设法复用了栈链表的很多代码。 + +当然,这个过程中,我们还引入了新的概念,例如借用栈,相信直到现在有些同学还晕乎乎的。不管如何,我们不用再去写一大堆嵌套来嵌套去的 `Rc` 和 `RefCell`。 + +下面来看看咱们这个不安全链表的全貌吧。 + +```rust +use std::ptr; + +pub struct List { + head: Link, + tail: *mut Node, +} + +type Link = *mut Node; + +struct Node { + elem: T, + next: Link, +} + +pub struct IntoIter(List); + +pub struct Iter<'a, T> { + next: Option<&'a Node>, +} + +pub struct IterMut<'a, T> { + next: Option<&'a mut Node>, +} + +impl List { + pub fn new() -> Self { + List { head: ptr::null_mut(), tail: ptr::null_mut() } + } + pub fn push(&mut self, elem: T) { + unsafe { + let new_tail = Box::into_raw(Box::new(Node { + elem: elem, + next: ptr::null_mut(), + })); + + if !self.tail.is_null() { + (*self.tail).next = new_tail; + } else { + self.head = new_tail; + } + + self.tail = new_tail; + } + } + pub fn pop(&mut self) -> Option { + unsafe { + if self.head.is_null() { + None + } else { + let head = Box::from_raw(self.head); + self.head = head.next; + + if self.head.is_null() { + self.tail = ptr::null_mut(); + } + + Some(head.elem) + } + } + } + + pub fn peek(&self) -> Option<&T> { + unsafe { + self.head.as_ref().map(|node| &node.elem) + } + } + + pub fn peek_mut(&mut self) -> Option<&mut T> { + unsafe { + self.head.as_mut().map(|node| &mut node.elem) + } + } + + pub fn into_iter(self) -> IntoIter { + IntoIter(self) + } + + pub fn iter(&self) -> Iter<'_, T> { + unsafe { + Iter { next: self.head.as_ref() } + } + } + + pub fn iter_mut(&mut self) -> IterMut<'_, T> { + unsafe { + IterMut { next: self.head.as_mut() } + } + } +} + +impl Drop for List { + fn drop(&mut self) { + while let Some(_) = self.pop() { } + } +} + +impl Iterator for IntoIter { + type Item = T; + fn next(&mut self) -> Option { + self.0.pop() + } +} + +impl<'a, T> Iterator for Iter<'a, T> { + type Item = &'a T; + + fn next(&mut self) -> Option { + unsafe { + self.next.map(|node| { + self.next = node.next.as_ref(); + &node.elem + }) + } + } +} + +impl<'a, T> Iterator for IterMut<'a, T> { + type Item = &'a mut T; + + fn next(&mut self) -> Option { + unsafe { + self.next.take().map(|node| { + self.next = node.next.as_mut(); + &mut node.elem + }) + } + } +} + +#[cfg(test)] +mod test { + use super::List; + #[test] + fn basics() { + let mut list = List::new(); + + // Check empty list behaves right + assert_eq!(list.pop(), None); + + // Populate list + list.push(1); + list.push(2); + list.push(3); + + // Check normal removal + assert_eq!(list.pop(), Some(1)); + assert_eq!(list.pop(), Some(2)); + + // Push some more just to make sure nothing's corrupted + list.push(4); + list.push(5); + + // Check normal removal + assert_eq!(list.pop(), Some(3)); + assert_eq!(list.pop(), Some(4)); + + // Check exhaustion + assert_eq!(list.pop(), Some(5)); + assert_eq!(list.pop(), None); + + // Check the exhaustion case fixed the pointer right + list.push(6); + list.push(7); + + // Check normal removal + assert_eq!(list.pop(), Some(6)); + assert_eq!(list.pop(), Some(7)); + assert_eq!(list.pop(), None); + } + + #[test] + fn into_iter() { + let mut list = List::new(); + list.push(1); list.push(2); list.push(3); + + let mut iter = list.into_iter(); + assert_eq!(iter.next(), Some(1)); + assert_eq!(iter.next(), Some(2)); + assert_eq!(iter.next(), Some(3)); + assert_eq!(iter.next(), None); + } + + #[test] + fn iter() { + let mut list = List::new(); + list.push(1); list.push(2); list.push(3); + + let mut iter = list.iter(); + assert_eq!(iter.next(), Some(&1)); + assert_eq!(iter.next(), Some(&2)); + assert_eq!(iter.next(), Some(&3)); + assert_eq!(iter.next(), None); + } + + #[test] + fn iter_mut() { + let mut list = List::new(); + list.push(1); list.push(2); list.push(3); + + let mut iter = list.iter_mut(); + assert_eq!(iter.next(), Some(&mut 1)); + assert_eq!(iter.next(), Some(&mut 2)); + assert_eq!(iter.next(), Some(&mut 3)); + assert_eq!(iter.next(), None); + } + + #[test] + fn miri_food() { + let mut list = List::new(); + + list.push(1); + list.push(2); + list.push(3); + + assert!(list.pop() == Some(1)); + list.push(4); + assert!(list.pop() == Some(2)); + list.push(5); + + assert!(list.peek() == Some(&3)); + list.push(6); + list.peek_mut().map(|x| *x *= 10); + assert!(list.peek() == Some(&30)); + assert!(list.pop() == Some(30)); + + for elem in list.iter_mut() { + *elem *= 100; + } + + let mut iter = list.iter(); + assert_eq!(iter.next(), Some(&400)); + assert_eq!(iter.next(), Some(&500)); + assert_eq!(iter.next(), Some(&600)); + assert_eq!(iter.next(), None); + assert_eq!(iter.next(), None); + + assert!(list.pop() == Some(400)); + list.peek_mut().map(|x| *x *= 10); + assert!(list.peek() == Some(&5000)); + list.push(7); + + // Drop it on the ground and let the dtor exercise itself + } +} +``` \ No newline at end of file diff --git a/src/too-many-lists/unsafe-queue/intro.md b/src/too-many-lists/unsafe-queue/intro.md new file mode 100644 index 00000000..71d84046 --- /dev/null +++ b/src/too-many-lists/unsafe-queue/intro.md @@ -0,0 +1,20 @@ +# 不错的unsafe队列 +在之前章节中,基于内部可变性和引用计数的双向链表有些失控了,原因在于 `Rc` 和 `RefCell` 对于简单的任务而言,它们是非常称职的,但是对于复杂的任务,它们可能会变得相当笨拙,特别是当我们试图隐藏一些细节时。 + +总之,一定有更好的办法!下面来看看该如何使用裸指针和 unsafe 代码实现一个单向链表。 + +> 大家可能想等着看我犯错误,unsafe 嘛,不犯错误不可能的,但是呢,俺偏就不犯错误:) + +国际惯例,添加第五个链表所需的文件 `fifth.rs`: +```rust +// in lib.rs + +pub mod first; +pub mod second; +pub mod third; +pub mod fourth; +pub mod fifth; +``` + +虽然我们依然会从零开始撸代码,但是 `fifth.rs` 的代码会跟 `second.rs` 存在一定的重叠,因为对于链表而言,队列其实就是栈的增强。 + diff --git a/src/too-many-lists/unsafe-queue/layout.md b/src/too-many-lists/unsafe-queue/layout.md new file mode 100644 index 00000000..6ed601e6 --- /dev/null +++ b/src/too-many-lists/unsafe-queue/layout.md @@ -0,0 +1,374 @@ +# 数据布局 +那么单向链表的队列长什么样?对于栈来说,我们向一端推入( push )元素,然后再从同一端弹出( pop )。对于栈和队列而言,唯一的区别在于队列从末端弹出。 + +栈的实现类似于下图: +```shell +input list: +[Some(ptr)] -> (A, Some(ptr)) -> (B, None) + +stack push X: +[Some(ptr)] -> (X, Some(ptr)) -> (A, Some(ptr)) -> (B, None) + +stack pop: +[Some(ptr)] -> (A, Some(ptr)) -> (B, None) +``` + +由于队列是首端进,末端出,因此我们需要决定将 `push` 和 `pop` 中的哪个放到末端去操作,如果将 `push` 放在末端操作: +```shell +input list: +[Some(ptr)] -> (A, Some(ptr)) -> (B, None) + +flipped push X: +[Some(ptr)] -> (A, Some(ptr)) -> (B, Some(ptr)) -> (X, None) +``` + +而如果将 `pop` 放在末端: +```shell +input list: +[Some(ptr)] -> (A, Some(ptr)) -> (B, Some(ptr)) -> (X, None) + +flipped pop: +[Some(ptr)] -> (A, Some(ptr)) -> (B, None) +``` + +但是这样实现有一个很糟糕的地方:两个操作都需要遍历整个链表后才能完成。队列要求 `push` 和 `pop` 操作需要高效,但是遍历整个链表才能完成的操作怎么看都谈不上高效! + +其中一个解决办法就是保存一个指针指向末端: +```rust +use std::mem; + +pub struct List { + head: Link, + tail: Link, // NEW! +} + +type Link = Option>>; + +struct Node { + elem: T, + next: Link, +} + +impl List { + pub fn new() -> Self { + List { head: None, tail: None } + } + + pub fn push(&mut self, elem: T) { + let new_tail = Box::new(Node { + elem: elem, + // 在尾端推入一个新节点时,新节点的下一个节点永远是 None + next: None, + }); + + // 让 tail 指向新的节点,并返回之前的 old tail + let old_tail = mem::replace(&mut self.tail, Some(new_tail)); + + match old_tail { + Some(mut old_tail) => { + // 若 old tail 存在,则让该节点指向新的节点 + old_tail.next = Some(new_tail); + } + None => { + // 否则,将 head 指向新的节点 + self.head = Some(new_tail); + } + } + } +} +``` + +在之前的各种链表锤炼下,我们对于相关代码应该相当熟悉了,因此可以适当提提速 - 在写的过程中,事实上我碰到了很多错误,这些错误就不再一一列举。 + +但是如果你担心不再能看到错误,那就纯属多余了: +```shell +> cargo build + +error[E0382]: use of moved value: `new_tail` + --> src/fifth.rs:38:38 + | +26 | let new_tail = Box::new(Node { + | -------- move occurs because `new_tail` has type `std::boxed::Box>`, which does not implement the `Copy` trait +... +33 | let old_tail = mem::replace(&mut self.tail, Some(new_tail)); + | -------- value moved here +... +38 | old_tail.next = Some(new_tail); + | ^^^^^^^^ value used here after move +``` + +新鲜出炉的错误,接好!`Box` 并没有实现 `Copy` 特征,因此我们不能在两个地方进行赋值。好在,可以使用没有所有权的引用类型: +```rust +pub struct List { + head: Link, + tail: Option<&mut Node>, // NEW! +} + +type Link = Option>>; + +struct Node { + elem: T, + next: Link, +} + +impl List { + pub fn new() -> Self { + List { head: None, tail: None } + } + + pub fn push(&mut self, elem: T) { + let new_tail = Box::new(Node { + elem: elem, + next: None, + }); + + let new_tail = match self.tail.take() { + Some(old_tail) => { + old_tail.next = Some(new_tail); + old_tail.next.as_deref_mut() + } + None => { + self.head = Some(new_tail); + self.head.as_deref_mut() + } + }; + + self.tail = new_tail; + } +} +``` + +```shell +> cargo build + +error[E0106]: missing lifetime specifier + --> src/fifth.rs:3:18 + | +3 | tail: Option<&mut Node>, // NEW! + | ^ expected lifetime parameter +``` + +好吧,结构体中的引用类型需要显式的标注生命周期,先加一个 `'a` 吧: +```rust +pub struct List<'a, T> { + head: Link, + tail: Option<&'a mut Node>, // NEW! +} + +type Link = Option>>; + +struct Node { + elem: T, + next: Link, +} + +impl<'a, T> List<'a, T> { + pub fn new() -> Self { + List { head: None, tail: None } + } + + pub fn push(&mut self, elem: T) { + let new_tail = Box::new(Node { + elem: elem, + next: None, + }); + + let new_tail = match self.tail.take() { + Some(old_tail) => { + old_tail.next = Some(new_tail); + old_tail.next.as_deref_mut() + } + None => { + self.head = Some(new_tail); + self.head.as_deref_mut() + } + }; + + self.tail = new_tail; + } +} +``` + +```shell +cargo build + +error[E0495]: cannot infer an appropriate lifetime for autoref due to conflicting requirements + --> src/fifth.rs:35:27 + | +35 | self.head.as_deref_mut() + | ^^^^^^^^^^^^ + | +note: first, the lifetime cannot outlive the anonymous lifetime #1 defined on the method body at 18:5... + --> src/fifth.rs:18:5 + | +18 | / pub fn push(&mut self, elem: T) { +19 | | let new_tail = Box::new(Node { +20 | | elem: elem, +21 | | // When you push onto the tail, your next is always None +... | +39 | | self.tail = new_tail; +40 | | } + | |_____^ +note: ...so that reference does not outlive borrowed content + --> src/fifth.rs:35:17 + | +35 | self.head.as_deref_mut() + | ^^^^^^^^^ +note: but, the lifetime must be valid for the lifetime 'a as defined on the impl at 13:6... + --> src/fifth.rs:13:6 + | +13 | impl<'a, T> List<'a, T> { + | ^^ + = note: ...so that the expression is assignable: + expected std::option::Option<&'a mut fifth::Node> + found std::option::Option<&mut fifth::Node> +``` + +好长... Rust 为啥这么难... 但是,这里有一句重点: + +> the lifetime must be valid for the lifetime 'a as defined on the impl + +意思是说生命周期至少要和 `'a` 一样长,是不是因为编译器为 `self` 推导的生命周期不够长呢?我们试着来手动标注下: +```rust +pub fn push(&'a mut self, elem: T) { +``` + +当当当当,成功通过编译: +```shell +cargo build + +warning: field is never used: `elem` + --> src/fifth.rs:9:5 + | +9 | elem: T, + | ^^^^^^^ + | + = note: #[warn(dead_code)] on by default +``` + +这个错误可以称之为错误之王,但是我们依然成功的解决了它,太棒了!再来实现下 `pop`: +```rust +pub fn pop(&'a mut self) -> Option { + self.head.take().map(|head| { + let head = *head; + self.head = head.next; + + if self.head.is_none() { + self.tail = None; + } + + head.elem + }) +} +``` + +看起来不错,写几个测试用例溜一溜: +```rust +mod test { + use super::List; + #[test] + fn basics() { + let mut list = List::new(); + + // Check empty list behaves right + assert_eq!(list.pop(), None); + + // Populate list + list.push(1); + list.push(2); + list.push(3); + + // Check normal removal + assert_eq!(list.pop(), Some(1)); + assert_eq!(list.pop(), Some(2)); + + // Push some more just to make sure nothing's corrupted + list.push(4); + list.push(5); + + // Check normal removal + assert_eq!(list.pop(), Some(3)); + assert_eq!(list.pop(), Some(4)); + + // Check exhaustion + assert_eq!(list.pop(), Some(5)); + assert_eq!(list.pop(), None); + } +} +``` +```shell +cargo test + +error[E0499]: cannot borrow `list` as mutable more than once at a time + --> src/fifth.rs:68:9 + | +65 | assert_eq!(list.pop(), None); + | ---- first mutable borrow occurs here +... +68 | list.push(1); + | ^^^^ + | | + | second mutable borrow occurs here + | first borrow later used here + +error[E0499]: cannot borrow `list` as mutable more than once at a time + --> src/fifth.rs:69:9 + | +65 | assert_eq!(list.pop(), None); + | ---- first mutable borrow occurs here +... +69 | list.push(2); + | ^^^^ + | | + | second mutable borrow occurs here + | first borrow later used here + +error[E0499]: cannot borrow `list` as mutable more than once at a time + --> src/fifth.rs:70:9 + | +65 | assert_eq!(list.pop(), None); + | ---- first mutable borrow occurs here +... +70 | list.push(3); + | ^^^^ + | | + | second mutable borrow occurs here + | first borrow later used here + + +.... + +** WAY MORE LINES OF ERRORS ** + +.... + +error: aborting due to 11 previous errors +``` + +🙀🙀🙀,震惊!但编译器真的没错,因为都是我们刚才那个标记惹的祸。 + +我们为 `self` 标记了 `'a`,意味着在 `'a` 结束前,无法再去使用 `self`,大家可以自己推断下 `'a` 的生命周期是多长。 + +那么该怎么办?回到老路 `RefCell` 上?显然不可能,那只能祭出大杀器:裸指针。 + +> 事实上,上文的问题主要是自引用引起的,感兴趣的同学可以查看[这里](https://course.rs/advance/circle-self-ref/intro.html)深入阅读。 + +```rust +pub struct List { + head: Link, + tail: *mut Node, // DANGER DANGER +} + +type Link = Option>>; + +struct Node { + elem: T, + next: Link, +} +``` + +如上所示,当使用裸指针后, `head` 和 `tail` 就不会形成自引用的问题,也不再违反 Rust 严苛的借用规则。 + +> 注意!当前的实现依然是有严重问题的,在后面我们会修复 + +果然,编程的最高境界就是回归本质:使用 C 语言的东东。 \ No newline at end of file diff --git a/src/too-many-lists/unsafe-queue/layout2.md b/src/too-many-lists/unsafe-queue/layout2.md new file mode 100644 index 00000000..51ebbc87 --- /dev/null +++ b/src/too-many-lists/unsafe-queue/layout2.md @@ -0,0 +1,239 @@ +# 数据布局2: 再裸一些吧 + +> TL;DR 在之前部分中,将安全的指针 `&` 、`&mut` 和 `Box` 跟不安全的裸指针 `*mut` 和 `*const` 混用是 UB 的根源之一,原因是安全指针会引入额外的约束,但是裸指针并不会遵守这些约束。 + +一个好消息,一个坏消息。坏消息是我们又要开始写链表了,悲剧 = , = 好消息呢是之前我们已经讨论过该如何设计了,之前做的工作基本都是正确的,除了混用安全指针和不安全指针的部分。 + +## 布局 +在新的布局中我们将只使用裸指针,然后大家就等着好消息吧! + +下面是之前的"破代码" : +```rust +pub struct List { + head: Link, + tail: *mut Node, // 好人一枚 +} + +type Link = Option>>; // 恶魔一只 + +struct Node { + elem: T, + next: Link, +} +``` + +现在删除恶魔: +```rust +pub struct List { + head: Link, + tail: *mut Node, +} + +type Link = *mut Node; // 嘀,新的好人卡,请查收 + +struct Node { + elem: T, + next: Link, +} +``` + +请大家牢记:当使用裸指针时,`Option` 对我们是相当不友好的,所以这里不再使用。在后面还将引入 `NonNull` 类型,但是现在还无需操心。 + +## 基本操作 +`List::new` 与之前几乎没有区别: +```rust +use ptr; + +impl List { + pub fn new() -> Self { + List { head: ptr::null_mut(), tail: ptr::null_mut() } + } +} +``` + +`Push` 也几乎没区... +```rust +pub fn push(&mut self, elem: T) { + let mut new_tail = Box::new( +``` + +等等,我们不再使用 `Box` 了,既然如此,该怎么分配内存呢? + +也许我们可以使用 `std::alloc::alloc`,但是大家想象一下拿着武士刀进厨房切菜的场景,所以,还是算了吧。 + +我们想要 `Box` 又不想要,这里有一个也许很野但是管用的方法: +```rust +struct Node { + elem: T, + real_next: Option>>, + next: *mut Node, +} +``` + +先创建一个 `Box` ,并使用一个裸指针指向 `Box` 中的 `Node`,然后就一直使用该裸指针直到我们处理完 `Node` 且可以销毁它之时。最后,可以将 `Box` 从 `real_next` 中 `take` 出来,并 `drop` 掉。 + +从上面来看,这个非常符合我们之前的简化版借用栈模型?借用 `Box`,再借用一个裸指针,然后先弹出该裸指针,再弹出 `Box`,嗯,果然很符合。 + +但是问题来了,这样做看上去有趣,但是你能保证这个简化版借用栈顺利的工作吗?所以,我们还是使用 [Box::into_raw](https://doc.rust-lang.org/std/boxed/struct.Box.html#method.into_raw) 函数吧! + +> `pub fn into_raw(b: Box) -> *mut T` +> +> 消费掉 `Box` (拿走所有权),返回一个裸指针。该指针会被正确的对齐且不为 null +> +> 在调用该函数后,调用者需要对之前被 Box 所管理的内存负责,特别地,调用者需要正确的清理 `T` 并释放相应的内存。最简单的方式是通过 `Box::from_raw` 函数将裸指针再转回到 `Box`,然后 `Box` 的析构器就可以自动执行清理了。 +> +> 注意:这是一个关联函数,因此 `b.into_raw()` 是不正确的,我们得使用 `Box::into_raw(b)`。因此该函数不会跟内部类型的同名方法冲突。 +> +> ### 示例 +> +> 将裸指针转换成 `Box` 以实现自动的清理: +> +> ```rust +> +> let x = Box::new(String::from("Hello")); +> let ptr = Box::into_raw(x); +> let x = unsafe { Box::from_raw(ptr) }; + +太棒了,简直为我们量身定制。而且它还很符合我们试图遵循的规则: 从安全的东东开始,将其转换成裸指针,最后再将裸指针转回安全的东东以实现安全的 drop。 + +现在,我们就可以到处使用裸指针,也无需再注意 unsafe 的范围,反正现在都是 unsafe 了,无所谓。 +```rust +pub fn push(&mut self, elem: T) { + unsafe { + // 一开始就将 Box 转换成裸指针 + let new_tail = Box::into_raw(Box::new(Node { + elem: elem, + next: ptr::null_mut(), + })); + + if !self.tail.is_null() { + (*self.tail).next = new_tail; + } else { + self.head = new_tail; + } + + self.tail = new_tail; + } +} +``` + +嘿,都说 unsafe 不应该使用,但没想到 unsafe 真的是好!现在代码整体看起来简洁多了。 + +继续实现 `pop`,它跟之前区别不大,但是我们不要忘了使用 `Box::from_raw` 来清理内存: +```rust +pub fn pop(&mut self) -> Option { + unsafe { + if self.head.is_null() { + None + } else { + let head = Box::from_raw(self.head); + self.head = head.next; + + if self.head.is_null() { + self.tail = ptr::null_mut(); + } + + Some(head.elem) + } + } +} +``` + +纪念下死去的 `take` 和 `map`,现在我们得手动检查和设置 `null` 了。 + +然后再实现下析构器,直接循环 `pop` 即可,怎么说,简单可爱,谁不爱呢? +```rust +impl Drop for List { + fn drop(&mut self) { + while let Some(_) = self.pop() { } + } +} +``` + +现在到了检验正确性的时候: +```rust +#[cfg(test)] +mod test { + use super::List; + #[test] + fn basics() { + let mut list = List::new(); + + // Check empty list behaves right + assert_eq!(list.pop(), None); + + // Populate list + list.push(1); + list.push(2); + list.push(3); + + // Check normal removal + assert_eq!(list.pop(), Some(1)); + assert_eq!(list.pop(), Some(2)); + + // Push some more just to make sure nothing's corrupted + list.push(4); + list.push(5); + + // Check normal removal + assert_eq!(list.pop(), Some(3)); + assert_eq!(list.pop(), Some(4)); + + // Check exhaustion + assert_eq!(list.pop(), Some(5)); + assert_eq!(list.pop(), None); + + // Check the exhaustion case fixed the pointer right + list.push(6); + list.push(7); + + // Check normal removal + assert_eq!(list.pop(), Some(6)); + assert_eq!(list.pop(), Some(7)); + assert_eq!(list.pop(), None); + } +} +``` + +```shell +cargo test + +running 12 tests +test fifth::test::basics ... ok +test first::test::basics ... ok +test fourth::test::basics ... ok +test fourth::test::peek ... ok +test second::test::basics ... ok +test fourth::test::into_iter ... ok +test second::test::into_iter ... ok +test second::test::iter ... ok +test second::test::iter_mut ... ok +test second::test::peek ... ok +test third::test::basics ... ok +test third::test::iter ... ok + +test result: ok. 12 passed; 0 failed; 0 ignored; 0 measured +``` + +测试没问题,还有一个拦路虎 `miri` 呢。 +```rust +MIRIFLAGS="-Zmiri-tag-raw-pointers" cargo +nightly-2022-01-21 miri test + +running 12 tests +test fifth::test::basics ... ok +test first::test::basics ... ok +test fourth::test::basics ... ok +test fourth::test::peek ... ok +test second::test::basics ... ok +test fourth::test::into_iter ... ok +test second::test::into_iter ... ok +test second::test::iter ... ok +test second::test::iter_mut ... ok +test second::test::peek ... ok +test third::test::basics ... ok +test third::test::iter ... ok + +test result: ok. 12 passed; 0 failed; 0 ignored; 0 measured +``` + +苦尽甘来,苦尽甘来啊!我们这些章节的努力没有白费,它终于成功的工作了。 \ No newline at end of file diff --git a/src/too-many-lists/unsafe-queue/miri.md b/src/too-many-lists/unsafe-queue/miri.md new file mode 100644 index 00000000..0cb65bf5 --- /dev/null +++ b/src/too-many-lists/unsafe-queue/miri.md @@ -0,0 +1,175 @@ +# Miri +看到这里,大家是不是暗中松了口气?unsafe 不过如此嘛,不知道为何其它人都谈之色变。 + +怎么说呢?你以为的编译器已经不是以前的编译器了,它不报错不代表没有错误。包括测试用例也是,正常地运行不能意味着代码没有任何错误。 + +在周星驰电影功夫中,还有一个奇怪大叔 10 元一本主动上门卖如来神掌,那么有没有 10 元一本的 Rust 秘笈呢?( 喂,Rust语言圣经都免费让你读了,有了摩托车,还要什么拖拉机... 哈哈,开个玩笑 ) + +有的,奇怪大叔正在赶来,他告诉我们先来安装一个命令: +```shell +rustup +nightly-2022-01-21 component add miri +info: syncing channel updates for 'nightly-2022-01-21-x86_64-pc-windows-msvc' +info: latest update on 2022-01-21, rust version 1.60.0-nightly (777bb86bc 2022-01-20) +info: downloading component 'cargo' +info: downloading component 'clippy' +info: downloading component 'rust-docs' +info: downloading component 'rust-std' +info: downloading component 'rustc' +info: downloading component 'rustfmt' +info: installing component 'cargo' +info: installing component 'clippy' +info: installing component 'rust-docs' +info: installing component 'rust-std' +info: installing component 'rustc' +info: installing component 'rustfmt' +info: downloading component 'miri' +info: installing component 'miri' +``` + +等等,你在我电脑上装了什么奇怪的东西?! "好东西" + + +> miri 目前只能在 nightly Rust 上安装,`+nightly-2022-01-21` 告诉 `rustup` 我们想要安装的 `nightly` 版本,事实上,你可以直接通过 `rustup +nightly component add miri` 安装,这里指定版本主要因为 `miri` 有时候会因为某些版本而出错。 +> +> 2022-01-21 是我所知的 miri 可以成功运行的版本,你可以检查[这个网址](https://rust-lang.github.io/rustup-components-history/)获取更多信息 +> +> + 是一种临时性的规则运用,如果你不想每次都使用 `+nightly-2022-01-21`,可以使用 [`rustup override set`](https://course.rs/appendix/rust-version.html#rustup-和-rust-nightly-的职责) 命令对当前项目的 Rust 版本进行覆盖 + +```shell +> cargo +nightly-2022-01-21 miri test + +I will run `"cargo.exe" "install" "xargo"` to install +a recent enough xargo. Proceed? [Y/n] +``` + +额,`xargo` 是什么东东?"不要担心,选择 y 就行,我像是会坑你的人吗?" + +```shell +> y + + Updating crates.io index + Installing xargo v0.3.24 +... + Finished release [optimized] target(s) in 10.65s + Installing C:\Users\ninte\.cargo\bin\xargo-check.exe + Installing C:\Users\ninte\.cargo\bin\xargo.exe + Installed package `xargo v0.3.24` (executables `xargo-check.exe`, `xargo.exe`) + +I will run `"rustup" "component" "add" "rust-src"` to install +the `rust-src` component for the selected toolchain. Proceed? [Y/n] +``` + +额? "不要怕,多给你一份 Rust 源代码,不开心嘛?" + +```shell +> y + +info: downloading component 'rust-src' +info: installing component 'rust-src' +``` + +"看吧,我就说我不会骗你的,不相信我,等着错误砸脸吧!" 真是一个奇怪的大叔... +```shell + Compiling lists v0.1.0 (C:\Users\ninte\dev\tmp\lists) + Finished test [unoptimized + debuginfo] target(s) in 0.25s + Running unittests (lists-5cc11d9ee5c3e924.exe) + +error: Undefined Behavior: trying to reborrow for Unique at alloc84055, + but parent tag <209678> does not have an appropriate item in + the borrow stack + + --> \lib\rustlib\src\rust\library\core\src\option.rs:846:18 + | +846 | Some(x) => Some(f(x)), + | ^ trying to reborrow for Unique at alloc84055, + | but parent tag <209678> does not have an + | appropriate item in the borrow stack + | + = help: this indicates a potential bug in the program: + it performed an invalid operation, but the rules it + violated are still experimental + = help: see https://github.com/rust-lang/unsafe-code-guidelines/blob/master/wip/stacked-borrows.md + for further information + + = note: inside `std::option::Option::>>::map::` at \lib\rustlib\src\rust\library\core\src\option.rs:846:18 + +note: inside `fifth::List::::pop` at src\fifth.rs:31:9 + --> src\fifth.rs:31:9 + | +31 | / self.head.take().map(|head| { +32 | | let head = *head; +33 | | self.head = head.next; +34 | | +... | +39 | | head.elem +40 | | }) + | |__________^ +note: inside `fifth::test::basics` at src\fifth.rs:74:20 + --> src\fifth.rs:74:20 + | +74 | assert_eq!(list.pop(), Some(1)); + | ^^^^^^^^^^ +note: inside closure at src\fifth.rs:62:5 + --> src\fifth.rs:62:5 + | +61 | #[test] + | ------- in this procedural macro expansion +62 | / fn basics() { +63 | | let mut list = List::new(); +64 | | +65 | | // Check empty list behaves right +... | +96 | | assert_eq!(list.pop(), None); +97 | | } + | |_____^ + ... +error: aborting due to previous error +``` + +咦还真有错误,大叔,这是什么错误?大叔?...奇怪的大叔默默离开了,留下我在风中凌乱。 + +果然不靠谱...还是得靠自己,首先得了解下何为 `miri`。 + + +[`miri`](https://github.com/rust-lang/miri) 可以生成 Rust 的中间层表示 MIR,对于编译器来说,我们的 Rust 代码首先会被编译为 MIR ,然后再提交给 LLVM 进行处理。 + +可以通过 `rustup component add miri` 来安装它,并通过 `cargo miri` 来使用,同时还可以使用 `cargo miri test` 来运行测试代码。 + +`miri` 可以帮助我们检查常见的未定义行为(UB = Undefined Behavior),以下列出了一部分: + +- 内存越界检查和内存释放后再使用(use-after-free) +- 使用未初始化的数据 +- 数据竞争 +- 内存对齐问题 + +UB 检测是必须的,因为它发生在运行时,因此很难发现,如果 `miri` 能在编译期检测出来,那自然是最好不过的。 + +总之,`miri` 的使用很简单: +```shell +> cargo +nightly-2022-01-21 miri test +``` + +下面来看看具体的错误: +```shell +error: Undefined Behavior: trying to reborrow for Unique at alloc84055, but parent tag <209678> does not have an appropriate item in the borrow stack + + --> \lib\rustlib\src\rust\library\core\src\option.rs:846:18 + | +846 | Some(x) => Some(f(x)), + | ^ trying to reborrow for Unique at alloc84055, + | but parent tag <209678> does not have an + | appropriate item in the borrow stack + | + + = help: this indicates a potential bug in the program: it + performed an invalid operation, but the rules it + violated are still experimental + + = help: see + https://github.com/rust-lang/unsafe-code-guidelines/blob/master/wip/stacked-borrows.md + for further information +``` + +嗯,只能看出是一个错误,其它完全看不懂了,例如什么是 `borrow stack`? + + diff --git a/src/too-many-lists/unsafe-queue/stacked-borrow.md b/src/too-many-lists/unsafe-queue/stacked-borrow.md new file mode 100644 index 00000000..94f8c7f4 --- /dev/null +++ b/src/too-many-lists/unsafe-queue/stacked-borrow.md @@ -0,0 +1,111 @@ +# 栈借用( Stacked Borrorw) +上一章节中我们运行 miri 时遇到了一个栈借用错误,还给了文档链接,但这些文档主要是给编译器开发者和 Rust 研究者看的,因此就不进行讲解了。 + +而这里,我们将从一个更高层次的角度来看看何为栈借用。 + +> 目前栈借用在 Rust 语义模型中还是试验阶段,因此破坏这些规则不一定说明你的程序错了。但是除非你在做编译器开发,否则最好还是修复这些错误。事前的麻烦总比事后的不安全要好,特别是当涉及到 UB 未定义行为时 + +## 指针混叠( Pointer Aliasing ) +在开始了解我们破坏的规则之前,首先应该了解为何会有这些规则的存在。这里有多个动机,但是我认为最重要的动机是: 指针混叠. + +当两个指针指向的内存区域存在重叠时,就说这两个指针发生了混叠,这种情况会造成一些问题。例如,编译器使用指针混叠的信息来优化内存的访问,当这些信息出错时,那程序就会被不正确地编译,然后产生一些奇怪的结果。 + +> 实际上,混叠更多关心的是内存访问而不是指针本身,而且只有在其中一个访问是可变的时,才可能出问题。之所以说指针,是因为指针这个概念更方便跟一些规则进行关联。 + +再比如,编译器需要获取一个值时,是该去缓存中查询还是每次都去内存中加载呢?关于这个选择,编译器需要清晰地知道是否有一个指针在背后修改内存,如果内存值被修改了,那缓存显然就失效了。 + +## 安全地栈借用 +有了之前的铺垫,大家肯定希望编译器能对指针混叠的信息了若指掌,但是可以吗?对于 Rust 正常代码而言,这种情况是可以避免的,因为严格的借用规则是我们的后盾:要么同时存在一个可变引用,要么同时存在多个不可变引用,这种规则简直完美避免了:两个指针指向同一块儿重叠内存区域,而其中一个是可变指针。 + +然而实际使用中,有一些情况会较为复杂,例如以下代码中发生了可变引用的再借用( reborrow ): +```rust +let mut data = 10; +let ref1 = &mut data; +let ref2 = &mut *ref1; + +*ref2 += 2; +*ref1 += 1; + +println!("{}", data); +``` + +看上去像是违反了借用规则,但是这段代码确实可以正常编译运行,如果交换下引用使用的顺序呢? +```rust +let mut data = 10; +let ref1 = &mut data; +let ref2 = &mut *ref1; + +// ORDER SWAPPED! +*ref1 += 1; +*ref2 += 2; + +println!("{}", data); +``` + +```shell +error[E0503]: cannot use `*ref1` because it was mutably borrowed + --> src/main.rs:6:5 + | +4 | let ref2 = &mut *ref1; + | ---------- borrow of `*ref1` occurs here +5 | +6 | *ref1 += 1; + | ^^^^^^^^^^ use of borrowed `*ref1` +7 | *ref2 += 2; + | ---------- borrow later used here + +For more information about this error, try `rustc --explain E0503`. +error: could not compile `playground` due to previous error +``` + +果不其然,编译器抛出了错误,当我们再借用了一个可变引用时,那原始的引用就不能再被使用,直到借用者完成了任务:借用者的借用有效范围并不是看作用域,而是看最后一次使用的位置,正因为如此,第一段代码可以编译通过,而第二段不行,这是著名的生命周期 [NLL 规则](https://course.rs/advance/lifetime/advance.html#nll-non-lexical-lifetime)。 + +以上就是我们拥有再借用但是还拥有混叠信息的原因:所有的再借用都在清晰地进行嵌套,因此每个再借用都不会与其它的冲突。那大家知道什么方法可以很好的展现嵌套的事物吗?答案就是使用栈来存放这些嵌套的借用。 + +嘿,这不就是栈借用吗? + +这个栈的顶部借用就是当前正在使用( live )的借用,而它清晰的知道在它使用的期间不会发生混叠。当对一个指针进行再借用时,新的借用会被插入到栈的顶部,并变成 live 状态。如果要将一个旧的指针变成 live,就需要将借用栈上在它之前的借用全部弹出( pop )。 + +通过栈借用的方式,我们保证了尽管存在多个再借用,但是在同一个时间,只会有一个可变引用访问目标内存,再也不用担心指针混叠的问题了。只要不去访问一个已经被弹出借用栈的指针,就会非常安全! + +从表述方式来说,与其说使用 `ref1` 会让 `ref2` 不合法,不如说 `ref2` 必须要在所有使用情况下合法,`ref1` 恰恰是其中一种情况,会破坏 `ref2` 的合法性。而编译器的报错也是选择了第二种表述方式:无法使用 `*ref1`,原因是它已经被可变借用了,可以看出,第二种表述方式比第一种要更加符合直觉。 + +**但是,当使用 `unsafe` 指针时,借用检查器就无法再帮助我们了!** + +## 不安全地栈借用 +所以,我们现在需要一个方式让 unsafe 指针也可以参与到栈借用系统中来,即使编译器无法正确地跟踪它们。同时我们也希望这个系统能宽松一些,不要很容易就产生 UB。 + +这是一个困难的问题,我也不知道该如何解决,但是目前在编写栈借用系统的开发者显然是有想法的,例如 miri 就是其中一个产物。 + +从一个高抽象层次来看,当我们将一个引用转换成裸指针时,就是一种再借用。那么随后,裸指针就可以对目标内存进行操作,当再借用结束时,发生的事情跟正常的再借用结束也没有区别。 + +但是问题是,你还可以将一个裸指针转变成引用,最重要的是,还可以对裸指针进行拷贝!如果发生了以下转换 `&mut -> *mut -> &mut -> *mut`,然后去访问第一个 `*mut`,这种见鬼的情况下,栈借用该如何发挥作用? + +反正我不知道,只能求助于 miri 了。事实上,正因为这种情况,miri 还提供了试验性的模式: `-Zmiri-tag-raw-pointers`。可以通过环境的方式来开启该模式: +```shell +MIRIFLAGS="-Zmiri-tag-raw-pointers" cargo +nightly-2022-01-21 miri test +``` + +如果是 Windows,你需要设置全局变量: +```shell +$env:MIRIFLAGS="-Zmiri-tag-raw-pointers" +cargo +nightly-2022-01-21 miri test +``` + +## 管理栈借用 +因为之前的问题,使用裸指针,应该遵守一个原则:**一旦开始使用裸指针,就要尝试着只使用它**。 + +现在,我们依然希望在接口中使用安全的引用去构建一个安全的抽象,例如在函数参数中使用引用而不是裸指针,这样我们的用户就无需操心 unsafe 的问题。 + +为此,我们需要做以下事情: + +1. 在开始时,将输入参数中的引用转换成裸指针 +2. 在函数体中只使用裸指针 +3. 返回之前,将裸指针转换成安全的指针 + +但是由于数据结构中的字段都是私有的,无需暴露给用户,因此无需这么麻烦,直接使用裸指针即可。 + +事实上,一个依然存在的问题就是还在继续使用 `Box`, 它会告诉编译器:hey,这个看上去很像是 `&mut` ,因为它唯一的持有那个指针。 + +但是我们在链表中一直使用的裸指针是指向 Box 的内部,所以无论何时我们通过正常的方式访问 Box,我们都有可能让该裸指针的再借用变得不合法。 + diff --git a/src/too-many-lists/unsafe-queue/testing-stacked-borrow.md b/src/too-many-lists/unsafe-queue/testing-stacked-borrow.md new file mode 100644 index 00000000..f8fcaa92 --- /dev/null +++ b/src/too-many-lists/unsafe-queue/testing-stacked-borrow.md @@ -0,0 +1,740 @@ +# 测试栈借用 +> 关于上一章节的简单总结: +> +> - Rust 通过借用栈来处理再借用 +> - 只有栈顶的元素是处于 `live` 状态的( 被借用 ) +> - 当访问栈顶下面的元素时,该元素会变为 `live`,而栈顶元素会被弹出( `pop` ) +> - 从借用栈中弹出的元素无法再被借用 +> - 借用检查器会保证我们的安全代码遵守以上规则 +> - Miri 可以在一定程度上保证裸指针在运行时也遵循以上规则 + +作为作者同时也是读者,我想说上一章节的内容相当不好理解,下面来看一些例子,通过它们可以帮助大家更好的理解栈借用模型。 + +在实际项目中捕获 UB 是一件相当不容易的事,毕竟你是在编译器的盲区之外摸索和行动。 + +如果我们足够幸运的话,写出来的代码是可以"正常运行的“,但是一旦编译器聪明一点或者你修改了某处代码,那这些代码可能会立刻化身为一颗安静的定时炸弹。当然,如果你还是足够幸运,那程序会发生崩溃,你也就可以捕获和处理相应的错误。但是如果你不幸运呢? + +那代码就算出问题了,也只是会发生一些奇怪的现象,面对这些现象你将束手无策,甚至不知道该如何处理! + +Miri 为何可以一定程度上提前发现这些 UB 问题?因为它会去获取 rustc 对我们的程序最原生、且没有任何优化的视角,然后对看到的内容进行解释和跟踪。只要这个过程能够开始,那这个解决方法就相当有效,但是问题来了,该如何让这个过程开始?要知道 Miri 和 rustc 是不可能去逐行分析代码中的所有行为的,这样做的结果就是编译时间大大增加! + +因此我们需要使用测试用例来让程序中可能包含 UB 的代码路径被真正执行到,当然,就算你这么做了,也不能完全依赖 Miri。既然是分析,就有可能遗漏,也可能误杀友军。 + +## 基本借用 +在上一章节中,借用检查器似乎不喜欢以下代码: +```rust +let mut data = 10; +let ref1 = &mut data; +let ref2 = &mut *ref1; + +*ref1 += 1; +*ref2 += 2; + +println!("{}", data); +``` + +它违背了再借用的原则,大家可以用借用栈的分析方式去验证下上一章节所学的知识。 + +下面来看看,如果使用裸指针会怎么样: +```rust +unsafe { + let mut data = 10; + let ref1 = &mut data; + let ptr2 = ref1 as *mut _; + + *ref1 += 1; + *ptr2 += 2; + + println!("{}", data); +} +``` + +```shell +cargo run + Compiling miri-sandbox v0.1.0 + Finished dev [unoptimized + debuginfo] target(s) in 0.71s + Running `target\debug\miri-sandbox.exe` +13 +``` + +嗯,编译器看起来很满意:不仅获取了预期的结果,还没有任何警告。那么再来征求下 Miri 的意见: +```shell +MIRIFLAGS="-Zmiri-tag-raw-pointers" cargo +nightly-2022-01-21 miri run + + Finished dev [unoptimized + debuginfo] target(s) in 0.00s + Running cargo-miri.exe target\miri + +error: Undefined Behavior: no item granting read access +to tag at alloc748 found in borrow stack. + + --> src\main.rs:9:9 + | +9 | *ptr2 += 2; + | ^^^^^^^^^^ no item granting read access to tag + | at alloc748 found in borrow stack. + | + = help: this indicates a potential bug in the program: + it performed an invalid operation, but the rules it + violated are still experimental +``` + +喔,果然出问题了。下面再来试试更复杂的 `&mut -> *mut -> &mut -> *mut` : +```rust +unsafe { + let mut data = 10; + let ref1 = &mut data; + let ptr2 = ref1 as *mut _; + let ref3 = &mut *ptr2; + let ptr4 = ref3 as *mut _; + + // 首先访问第一个裸指针 + *ptr2 += 2; + + // 接着按照借用栈的顺序来访问 + *ptr4 += 4; + *ref3 += 3; + *ptr2 += 2; + *ref1 += 1; + + println!("{}", data); +} +``` + +```shell +cargo run +22 +``` + +```shell +MIRIFLAGS="-Zmiri-tag-raw-pointers" cargo +nightly-2022-01-21 miri run + +error: Undefined Behavior: no item granting read access +to tag <1621> at alloc748 found in borrow stack. + + --> src\main.rs:13:5 + | +13 | *ptr4 += 4; + | ^^^^^^^^^^ no item granting read access to tag <1621> + | at alloc748 found in borrow stack. + | +``` + +不错,可以看出 miri 有能力分辨两个裸指针的使用限制:当使用第二个时,需要先让之前的失效。 + +再来移除乱入的那一行,让借用栈可以真正顺利的工作: +```rust +unsafe { + let mut data = 10; + let ref1 = &mut data; + let ptr2 = ref1 as *mut _; + let ref3 = &mut *ptr2; + let ptr4 = ref3 as *mut _; + + // Access things in "borrow stack" order + *ptr4 += 4; + *ref3 += 3; + *ptr2 += 2; + *ref1 += 1; + + println!("{}", data); +} +``` + +```shell +cargo run +20 + +MIRIFLAGS="-Zmiri-tag-raw-pointers" cargo +nightly-2022-01-21 miri run +20 +``` + +我现在可以负责任的说:在座的各位,都是...可以获取编程语言内存模型设计博士学位的存在,编译器?那是什么东东!简单的很。 + +> 旁白:那个..关于博士的一切,请不要当真,但是我依然为你们骄傲 + +## 测试数组 +下面来干一票大的:使用指针偏移来搞乱一个数组。 + +```rust +unsafe { + let mut data = [0; 10]; + let ref1_at_0 = &mut data[0]; // 获取第 1 个元素的引用 + let ptr2_at_0 = ref1_at_0 as *mut i32; // 裸指针 ptr 指向第 1 个元素 + let ptr3_at_1 = ptr2_at_0.add(1); // 对裸指针进行运算,指向第 2 个元素 + + *ptr3_at_1 += 3; + *ptr2_at_0 += 2; + *ref1_at_0 += 1; + + // Should be [3, 3, 0, ...] + println!("{:?}", &data[..]); +} +``` + +```shell +cargo run +[3, 3, 0, 0, 0, 0, 0, 0, 0, 0] +``` + +```shell +MIRIFLAGS="-Zmiri-tag-raw-pointers" cargo +nightly-2022-01-21 miri run + +error: Undefined Behavior: no item granting read access +to tag <1619> at alloc748+0x4 found in borrow stack. + --> src\main.rs:8:5 + | +8 | *ptr3_at_1 += 3; + | ^^^^^^^^^^^^^^^ no item granting read access to tag <1619> + | at alloc748+0x4 found in borrow stack. +``` + +咦?我们命名按照借用栈的方式来完美使用了,为何 miri 还是提示了 UB 风险?难道是因为 `ptr -> ptr` 的过程中发生了什么奇怪的事情?如果我们只是拷贝指针,让它们都指向同一个位置呢? +```rust +unsafe { + let mut data = [0; 10]; + let ref1_at_0 = &mut data[0]; + let ptr2_at_0 = ref1_at_0 as *mut i32; + let ptr3_at_0 = ptr2_at_0; + + *ptr3_at_0 += 3; + *ptr2_at_0 += 2; + *ref1_at_0 += 1; + + // Should be [6, 0, 0, ...] + println!("{:?}", &data[..]); +} +``` + +```shell +cargo run +[6, 0, 0, 0, 0, 0, 0, 0, 0, 0] + +MIRIFLAGS="-Zmiri-tag-raw-pointers" cargo +nightly-2022-01-21 miri run +[6, 0, 0, 0, 0, 0, 0, 0, 0, 0] +``` + +果然,顺利通过,下面我们还是让它们指向同一个位置,但是来首名为混乱的 BGM: +```rust +unsafe { + let mut data = [0; 10]; + let ref1_at_0 = &mut data[0]; // Reference to 0th element + let ptr2_at_0 = ref1_at_0 as *mut i32; // Ptr to 0th element + let ptr3_at_0 = ptr2_at_0; // Ptr to 0th element + let ptr4_at_0 = ptr2_at_0.add(0); // Ptr to 0th element + let ptr5_at_0 = ptr3_at_0.add(1).sub(1); // Ptr to 0th element + + + *ptr3_at_0 += 3; + *ptr2_at_0 += 2; + *ptr4_at_0 += 4; + *ptr5_at_0 += 5; + *ptr3_at_0 += 3; + *ptr2_at_0 += 2; + *ref1_at_0 += 1; + + // Should be [20, 0, 0, ...] + println!("{:?}", &data[..]); +} +``` + +```shell +cargo run +[20, 0, 0, 0, 0, 0, 0, 0, 0, 0] + +MIRIFLAGS="-Zmiri-tag-raw-pointers" cargo +nightly-2022-01-21 miri run +[20, 0, 0, 0, 0, 0, 0, 0, 0, 0] +``` + +可以看出,`miri` 对于这种裸指针派生是相当纵容的:当它们都共享同一个借用时(borrowing, 也可以用 miri 的称呼: tag)。 + +> 当代码足够简单时,编译器是有可能介入跟踪所有派生的裸指针,并尽可能去优化它们的。但是这套规则比引用的那套脆弱得多! + +那么问题来了:真正的问题到底是什么? + +对于部分数据结构,Rust 允许对其中的字段进行独立借用,例如一个结构体,它的多个字段可以被分开借用,来试试这里的数组可不可以。 + +```rust +unsafe { + let mut data = [0; 10]; + let ref1_at_0 = &mut data[0]; // Reference to 0th element + let ref2_at_1 = &mut data[1]; // Reference to 1th element + let ptr3_at_0 = ref1_at_0 as *mut i32; // Ptr to 0th element + let ptr4_at_1 = ref2_at_1 as *mut i32; // Ptr to 1th element + + *ptr4_at_1 += 4; + *ptr3_at_0 += 3; + *ref2_at_1 += 2; + *ref1_at_0 += 1; + + // Should be [3, 3, 0, ...] + println!("{:?}", &data[..]); +} +``` + +```shell +error[E0499]: cannot borrow `data[_]` as mutable more than once at a time + --> src\main.rs:5:21 + | +4 | let ref1_at_0 = &mut data[0]; // Reference to 0th element + | ------------ first mutable borrow occurs here +5 | let ref2_at_1 = &mut data[1]; // Reference to 1th element + | ^^^^^^^^^^^^ second mutable borrow occurs here +6 | let ptr3_at_0 = ref1_at_0 as *mut i32; // Ptr to 0th element + | --------- first borrow later used here + | + = help: consider using `.split_at_mut(position)` or similar method + to obtain two mutable non-overlapping sub-slices +``` + +显然..不行,Rust 不允许我们对数组的不同元素进行单独的借用,注意到提示了吗?可以使用 `.split_at_mut(position)` 来将一个数组分成多个部分: +```rust +unsafe { + let mut data = [0; 10]; + + let slice1 = &mut data[..]; + let (slice2_at_0, slice3_at_1) = slice1.split_at_mut(1); + + let ref4_at_0 = &mut slice2_at_0[0]; // Reference to 0th element + let ref5_at_1 = &mut slice3_at_1[0]; // Reference to 1th element + let ptr6_at_0 = ref4_at_0 as *mut i32; // Ptr to 0th element + let ptr7_at_1 = ref5_at_1 as *mut i32; // Ptr to 1th element + + *ptr7_at_1 += 7; + *ptr6_at_0 += 6; + *ref5_at_1 += 5; + *ref4_at_0 += 4; + + // Should be [10, 12, 0, ...] + println!("{:?}", &data[..]); +} +``` + +```shell +cargo run +[10, 12, 0, 0, 0, 0, 0, 0, 0, 0] + +MIRIFLAGS="-Zmiri-tag-raw-pointers" cargo +nightly-2022-01-21 miri run +[10, 12, 0, 0, 0, 0, 0, 0, 0, 0] +``` + +将数组切分成两个部分后,代码就成功了,如果我们将一个切片转换成指针呢?那指针是否还拥有访问整个切片的权限? + +```rust +unsafe { + let mut data = [0; 10]; + + let slice1_all = &mut data[..]; // Slice for the entire array + let ptr2_all = slice1_all.as_mut_ptr(); // Pointer for the entire array + + let ptr3_at_0 = ptr2_all; // Pointer to 0th elem (the same) + let ptr4_at_1 = ptr2_all.add(1); // Pointer to 1th elem + let ref5_at_0 = &mut *ptr3_at_0; // Reference to 0th elem + let ref6_at_1 = &mut *ptr4_at_1; // Reference to 1th elem + + *ref6_at_1 += 6; + *ref5_at_0 += 5; + *ptr4_at_1 += 4; + *ptr3_at_0 += 3; + + // 在循环中修改所有元素( 仅仅为了有趣 ) + // (可以使用任何裸指针,它们共享同一个借用!) + for idx in 0..10 { + *ptr2_all.add(idx) += idx; + } + + // 同样为了有趣,再实现下安全版本的循环 + for (idx, elem_ref) in slice1_all.iter_mut().enumerate() { + *elem_ref += idx; + } + + // Should be [8, 12, 4, 6, 8, 10, 12, 14, 16, 18] + println!("{:?}", &data[..]); +} +``` + +```shell +cargo run +[8, 12, 4, 6, 8, 10, 12, 14, 16, 18] + +MIRIFLAGS="-Zmiri-tag-raw-pointers" cargo +nightly-2022-01-21 miri run +[8, 12, 4, 6, 8, 10, 12, 14, 16, 18] +``` + +## 测试不可变引用 +在之前的例子中,我们使用的都是可变引用,而 Rust 中还有不可变引用。那么它将如何工作呢? + +我们已经见过裸指针可以被简单的拷贝只要它们共享同一个借用,那不可变引用是不是也可以这么做? + +注意,下面的 `println` 会自动对待打印的目标值进行 `ref/deref` 等操作,因此为了保证测试的正确性,我们将其放入一个函数中。 + +```rust +fn opaque_read(val: &i32) { + println!("{}", val); +} + +unsafe { + let mut data = 10; + let mref1 = &mut data; + let sref2 = &mref1; + let sref3 = sref2; + let sref4 = &*sref2; + + // Random hash of shared reference reads + opaque_read(sref3); + opaque_read(sref2); + opaque_read(sref4); + opaque_read(sref2); + opaque_read(sref3); + + *mref1 += 1; + + opaque_read(&data); +} +``` + +```shell +cargo run + +warning: unnecessary `unsafe` block + --> src\main.rs:6:1 + | +6 | unsafe { + | ^^^^^^ unnecessary `unsafe` block + | + = note: `#[warn(unused_unsafe)]` on by default + +warning: `miri-sandbox` (bin "miri-sandbox") generated 1 warning + +10 +10 +10 +10 +10 +11 +``` + +虽然这里没有使用裸指针,但是可以看到对于不可变引用而言,上面的使用方式不存在任何问题。下面来增加一些裸指针: +```rust +fn opaque_read(val: &i32) { + println!("{}", val); +} + +unsafe { + let mut data = 10; + let mref1 = &mut data; + let ptr2 = mref1 as *mut i32; + let sref3 = &*mref1; + let ptr4 = sref3 as *mut i32; + + *ptr4 += 4; + opaque_read(sref3); + *ptr2 += 2; + *mref1 += 1; + + opaque_read(&data); +} +``` + +```shell +cargo run + +error[E0606]: casting `&i32` as `*mut i32` is invalid + --> src/main.rs:11:20 + | +11 | let ptr4 = sref3 as *mut i32; + | ^^^^^^^^^^^^^^^^^ ^^^^^^^^^^^^^^^^^ +``` + + +可以看出,我们无法将一个不可变的引用转换成可变的裸指针,只能曲线救国了: +```rust +let ptr4 = sref3 as *const i32 as *mut i32; +``` + +如上,先将不可变引用转换成不可变的裸指针,然后再转换成可变的裸指针。 + +```shell +cargo run + +14 +17 +``` + +编译器又一次满意了,再来看看 miri : +```shell +MIRIFLAGS="-Zmiri-tag-raw-pointers" cargo +nightly-2022-01-21 miri run + +error: Undefined Behavior: no item granting write access to +tag <1621> at alloc742 found in borrow stack. + --> src\main.rs:13:5 + | +13 | *ptr4 += 4; + | ^^^^^^^^^^ no item granting write access to tag <1621> + | at alloc742 found in borrow stack. +``` + +果然,miri 提示了,原因是当我们使用不可变引用时,就相当于承诺不会去修改其中的值,那 miri 发现了这种修改行为,自然会给予相应的提示。 + +对此,可以用一句话来简单总结:**在借用栈中,一个不可变引用,它上面的所有引用( 在它之后被推入借用栈的引用 )都只能拥有只读的权限。** + +但是我们可以这样做: +```rust +fn opaque_read(val: &i32) { + println!("{}", val); +} + +unsafe { + let mut data = 10; + let mref1 = &mut data; + let ptr2 = mref1 as *mut i32; + let sref3 = &*mref1; + let ptr4 = sref3 as *const i32 as *mut i32; + + opaque_read(&*ptr4); + opaque_read(sref3); + *ptr2 += 2; + *mref1 += 1; + + opaque_read(&data); +} +``` + +可以看到,我们其实可以创建一个可变的裸指针,只要不去使用写操作,而是只使用读操作。 + +```shell +cargo run +10 +10 +13 + +MIRIFLAGS="-Zmiri-tag-raw-pointers" cargo +nightly-2022-01-21 miri run +10 +10 +13 +``` + +再来检查下不可变的引用是否可以像平时一样正常弹出: +```rust +fn opaque_read(val: &i32) { + println!("{}", val); +} + +unsafe { + let mut data = 10; + let mref1 = &mut data; + let ptr2 = mref1 as *mut i32; + let sref3 = &*mref1; + + *ptr2 += 2; + opaque_read(sref3); // Read in the wrong order? + *mref1 += 1; + + opaque_read(&data); +} +``` + +```shell +cargo run +12 +13 + +MIRIFLAGS="-Zmiri-tag-raw-pointers" cargo +nightly-2022-01-21 miri run + +error: Undefined Behavior: trying to reborrow for SharedReadOnly +at alloc742, but parent tag <1620> does not have an appropriate +item in the borrow stack + + --> src\main.rs:13:17 + | +13 | opaque_read(sref3); // Read in the wrong order? + | ^^^^^ trying to reborrow for SharedReadOnly + | at alloc742, but parent tag <1620> + | does not have an appropriate item + | in the borrow stack + | +``` + +细心的同学可能会发现,我们这次获得了一个相当具体的 miri 提示,而不是之前的某个 tag 。真是令人感动...毕竟这种错误信息会更有帮助。 + +## 测试内部可变性 +还记得之前我们试图用 `RefCell` + `Rc` 去实现的那个糟糕的链表吗?这两个组合在一起就可以实现内部可变性。与 `RefCell` 类似的还有 [`Cell`](https://course.rs/advance/smart-pointer/cell-refcell.html#cell): +```rust +use std::cell::Cell; + +unsafe { + let mut data = Cell::new(10); + let mref1 = &mut data; + let ptr2 = mref1 as *mut Cell; + let sref3 = &*mref1; + + sref3.set(sref3.get() + 3); + (*ptr2).set((*ptr2).get() + 2); + mref1.set(mref1.get() + 1); + + println!("{}", data.get()); +} +``` + +地狱一般的代码,就等着 miri 来优化你吧。 + +```shell +cargo run +16 + +MIRIFLAGS="-Zmiri-tag-raw-pointers" cargo +nightly-2022-01-21 miri run +16 +``` + +等等,竟然没有任何问题,我们需要深入调查下原因: +```rust +pub struct Cell { + value: UnsafeCell, +} +``` + +以上是标准库中的 `Cell` 源码,可以看到里面有一个 `UnsafeCell`,通过名字都能猜到,这个数据结构相当的不安全,在[标准库](https://doc.rust-lang.org/std/cell/struct.UnsafeCell.html)中有以下描述: + +> Rust 中用于内部可变性的核心原语( primitive )。 +> +> 如果你拥有一个引用 `&T`,那一般情况下, Rust编译器会基于 `&T` 指向不可变的数据这一事实来进行相关的优化。通过别名或者将 `&T` 强制转换成 `&mut T` 是一种 UB 行为。 +> +> 而 `UnsafeCell` 移除了 `&T` 的不可变保证:一个不可变引用 `&UnsafeCell` 指向一个可以改变的数据。,这就是内部可变性。 + +感觉像是魔法,那下面就用该魔法让 miri happy 下: +```rust +use std::cell::UnsafeCell; + +fn opaque_read(val: &i32) { + println!("{}", val); +} + +unsafe { + let mut data = UnsafeCell::new(10); + let mref1 = &mut data; // Mutable ref to the *outside* + let ptr2 = mref1.get(); // Get a raw pointer to the insides + let sref3 = &*mref1; // Get a shared ref to the *outside* + + *ptr2 += 2; // Mutate with the raw pointer + opaque_read(&*sref3.get()); // Read from the shared ref + *sref3.get() += 3; // Write through the shared ref + *mref1.get() += 1; // Mutate with the mutable ref + + println!("{}", *data.get()); +} +``` + +```shell +cargo run +12 +16 + +MIRIFLAGS="-Zmiri-tag-raw-pointers" cargo +nightly-2022-01-21 miri run +12 +16 +``` + +这段代码非常成功!但是等等..这里的代码顺序有问题:我们首先获取了内部的裸指针 `ptr2`,然后获取了一个不可变引用 `sref3`,接着我们使用了裸指针,然后是 `sref3`,这不就是标准的借用栈错误典范吗?既然如此,为何 miri 没有给出提示? + +现在有两个解释: + +- Miri 并不完美,它依然会有所遗漏,也会误判 +- 我们的简化模型貌似过于简化了 + +大家选择哪个?..我不管,反正我选择第二个。不过,虽然我们的借用栈过于简单,但是依然是亲孩子嘛,最后再基于它来实现一个真正正确的版本: +```rust +use std::cell::UnsafeCell; + +fn opaque_read(val: &i32) { + println!("{}", val); +} + +unsafe { + let mut data = UnsafeCell::new(10); + let mref1 = &mut data; + // These two are swapped so the borrows are *definitely* totally stacked + let sref2 = &*mref1; + // Derive the ptr from the shared ref to be super safe! + let ptr3 = sref2.get(); + + *ptr3 += 3; + opaque_read(&*sref2.get()); + *sref2.get() += 2; + *mref1.get() += 1; + + println!("{}", *data.get()); +} +``` + +```shell +cargo run +13 +16 + +MIRIFLAGS="-Zmiri-tag-raw-pointers" cargo +nightly-2022-01-21 miri run +13 +16 +``` + +## 测试 Box +大家还记得为何我们讲了这么长的两章借用栈吗?原因就在于 `Box` 和裸指针混合使用时出了问题。 + +`Box` 在某种程度上类似 `&mut`,因为对于它指向的内存区域,它拥有唯一的所有权。 + +```rust +unsafe { + let mut data = Box::new(10); + let ptr1 = (&mut *data) as *mut i32; + + *data += 10; + *ptr1 += 1; + + // Should be 21 + println!("{}", data); +} +``` + +```shell +cargo run +21 + +MIRIFLAGS="-Zmiri-tag-raw-pointers" cargo +nightly-2022-01-21 miri run + +error: Undefined Behavior: no item granting read access + to tag <1707> at alloc763 found in borrow stack. + + --> src\main.rs:7:5 + | +7 | *ptr1 += 1; + | ^^^^^^^^^^ no item granting read access to tag <1707> + | at alloc763 found in borrow stack. + | +``` + +现在到现在为止,大家一眼就能看出来这种代码不符合借用栈的规则。当然, miri 也讨厌这一点,因此我们来改正下。 + +```rust +unsafe { + let mut data = Box::new(10); + let ptr1 = (&mut *data) as *mut i32; + + *ptr1 += 1; + *data += 10; + + // Should be 21 + println!("{}", data); +} +``` + +```shell +cargo run +21 + +MIRIFLAGS="-Zmiri-tag-raw-pointers" cargo +nightly-2022-01-21 miri run +21 +``` + +在经过这么长的旅程后,我们终于完成了借用栈的学习,兄弟们我已经累趴了,你们呢? + +但是,话说回来,该如何使用 `Box` 来解决栈借用的问题?当然,我们可以像之前的测试例子一样写一些玩具代码,但是在实际链表中中,将 `Box` 存储在某个地方,然后长时间持有一个裸指针才是经常遇到的。 + +等等,你说链表?天呐,我都忘记了我们还在学习链表,那接下来,继续实现之前未完成的链表吧。 diff --git a/src/usecases/aws-rust.md b/src/usecases/aws-rust.md index 89d454af..76318b89 100644 --- a/src/usecases/aws-rust.md +++ b/src/usecases/aws-rust.md @@ -34,11 +34,11 @@ Rust 是一门完全开源的语言,在 2015 年发布了 1.0 版本,但是 ## 编程语言的能源效率 对于开发者来说,估计没几个人能搞清楚自己服务的能源效率,那么该如何对比编程语言之间的能源效率呢?好在国外有专家做了相关的[学术研究](https://greenlab.di.uminho.pt/wp-content/uploads/2017/10/sleFinal.pdf)。 -他精心设计了 10 个测试场景,然后衡量了 27 种不同的语言的执行时间、能源消耗、最大内存使用,最终得出了一个结论:C 和 Rust 在能源效率方面无可争议的击败了其它语言,事实上,它们比 Java 的能源效率高 50% , 比 python 高 98%。 +他精心设计了 10 个测试场景,然后衡量了 27 种不同的语言的执行时间、能源消耗、最大内存使用,最终得出了一个结论:C 和 Rust 在能源效率方面无可争议地击败了其它语言——比 Java 高出 98%, 是 Python 的近 76 倍。 -其实,C 和 Rust 能效高很正常,但是比其它语言高出这么多就相当出乎意料了:根据上图的数据,采用 C 和 Rust,你将减少大概 50% 的能耗,这还是保守估计。 +其实,C 和 Rust 的能效高很正常,但比其它语言高出这么多就相当出乎意料了:根据上图的数据,采用这两门语言后,程序的能耗将降低至少一倍。这还是与榜单中靠前的 Java 语言对比的结果。 那么问题来了,既然这两个都可以,为何不选择历史更悠久的 C 语言呢?它的生态和社区都比 Rust 要更好。 好在,linux 创始人 Linus Torvalds 在 2021 年度的开源峰会上给出了答案:他承认,[使用 C 语言就像是拿着一把链锯在玩耍](https://thenewstack.io/linus-torvalds-on-community-rust-and-linuxs-longevity/),同时还说道:"C 语言的类型互动并不总是合乎逻辑的,以至于对于绝大多数人来说,这种互动都可能存在陷阱"。 @@ -90,5 +90,3 @@ Discord 最初使用 Python、Go、Elixir 来实现,但是随即他们发现 在重写后,由于性能的大幅提升,还帮助 Discord 降低了服务器资源的需求,变相节省了大笔金钱。 从上面两个例子中,我们看到两个公司都是为了性能才去使用 Rust ,但是在性能之外他们还收获了能效上的提升和硬件成本上的降低,这不得不说是一种意外之喜了。 - - diff --git a/theme/index.hbs b/theme/index.hbs new file mode 100644 index 00000000..d09161f5 --- /dev/null +++ b/theme/index.hbs @@ -0,0 +1,315 @@ + + + + + + {{ title }} + {{#if is_print }} + + {{/if}} + {{#if base_url}} + + {{/if}} + + + + {{> head}} + + + + + + + {{#if favicon_svg}} + + {{/if}} + {{#if favicon_png}} + + {{/if}} + + + + {{#if print_enable}} + + {{/if}} + + + + {{#if copy_fonts}} + + {{/if}} + + + + + + + + {{#each additional_css}} + + {{/each}} + + {{#if mathjax_support}} + + + {{/if}} + + + + + + + + + + + + + + + + + +
+ +
+ {{> header}} + + + + {{#if search_enabled}} + + {{/if}} + + + + +
+ +
+
+ {{{ content }}} +
+
+ + +
+
+ + + +
+ + {{#if livereload}} + + + {{/if}} + + {{#if google_analytics}} + + + {{/if}} + + {{#if playground_line_numbers}} + + {{/if}} + + {{#if playground_copyable}} + + {{/if}} + + {{#if playground_js}} + + + + + + {{/if}} + + {{#if search_js}} + + + + {{/if}} + + + + + + + + + {{#each additional_js}} + + {{/each}} + + {{#if is_print}} + {{#if mathjax_support}} + + {{else}} + + {{/if}} + {{/if}} + + + \ No newline at end of file diff --git a/theme/style3.css b/theme/style3.css new file mode 100644 index 00000000..b05d5a73 --- /dev/null +++ b/theme/style3.css @@ -0,0 +1,115 @@ +@media only screen and (max-width:1080px) { + .sidetoc { + display: none !important; + } +} + +@media only screen and (min-width:1080px) { + main { + position: relative; + padding-right: 170px; + } + .sidetoc { + margin-left: auto; + margin-right: auto; + /*left: calc(100% + (var(--content-max-width))/4 - 180px);*/ + left: calc(100% - 200px); + position: absolute; + } + .pagetoc { + position: fixed; + width: 200px; + height: calc(100vh - var(--menu-bar-height) - 10rem); + overflow: auto; + z-index: 1000; + } + .pagetoc a { + border-left: 1px solid var(--sidebar-bg); + color: var(--fg) !important; + display: block; + padding-bottom: 5px; + padding-top: 5px; + padding-left: 10px; + text-align: left; + text-decoration: none; + font-size: 1.2rem; + } + .pagetoc a:hover, + .pagetoc a.active { + background: var(--sidebar-bg); + color: var(--sidebar-fg) !important; + } + .pagetoc .active { + background: var(--sidebar-bg); + color: var(--sidebar-fg); + } +} + +.page-footer { + margin-top: 50px; + border-top: 1px solid #ccc; + overflow: hidden; + padding: 10px 0; + color: gray; +} + +/* 修改章节目录的间距 */ +.chapter li.chapter-item { + /* 没有文件时的文字颜色 */ + color: #939da3; + margin-top: 1rem; +} + +/* 修改滚动条宽度 */ +::-webkit-scrollbar { + width: 5px; + height: 5px; +} + +/* 表格靠左对齐 */ +table { + margin-left: 0 !important; +} + +/* 只使用底部的页面跳转,因为左右两边的宽跳转会被 page-toc 遮盖 */ +@media only screen and (max-width: 2560px) { + .nav-wide-wrapper { display: none; } + .nav-wrapper { display: block; } +} +@media only screen and (max-width: 2560px) { + .sidebar-visible .nav-wide-wrapper { display: none; } + .sidebar-visible .nav-wrapper { display: block; } +} + + +/* 修改顶部图标大小 */ +/* #menu-bar { + font-size: 17px; +} */ +/* 修改 github 样式 */ +.fa-github { + font-weight: 550; +} +.fa-github:after{ + content: "繁星点点尽在你的指尖 🌟"; + margin-left: 4px; +} + +/* Fix on mobile device */ +code { + word-break: break-word; +} + +/* 修复可编辑代码框顶部过窄的问题 */ +code.editable, .ace_scroller { + top: 10px; +} + +/* 修改书侧边目录的区域分隔行样式 */ + +.chapter .spacer { + background-color: #99CCFF; + height: 2px; + margin-top: 8px; +} + diff --git a/内容变更记录.md b/内容变更记录.md index 1b0fbf1f..d02646eb 100644 --- a/内容变更记录.md +++ b/内容变更记录.md @@ -1,6 +1,120 @@ # ChangeLog 记录一些值得注意的变更。 +## 2022-04-12 + +- [优化字符串章节,增加字符串转义](https://course.rs/basic/compound-type/string-slice.html#字符串转义) + +## 2022-04-11 + +- 增加 [OnceCell](https://course.rs/advance/global-variable.html#标准库中的-oncecell), 感谢 [Rustln](https://github.com/rustln) 提交的 PR + + +## 2022-04-08 + +- 新增章节: [日志 - tracing 包](https://course.rs/logs/tracing.html) +- 变量章节新增下划线的说明 + +## 2022-04-08 + +- 新增章节: [Rust 1.60 发布解读](https://course.rs/appendix/rust-versions/1.60.html) +- 新增章节: [日志 - 门面库 log](https://course.rs/practice/logs/log.html) + +## 2022-04-07 + +- 新增章节: [小试牛刀 - 下载太慢了?](https://course.rs/first-try/slowly-downloading.html) +- 新增章节: [日志与监控 - 日志详解](https://course.rs/practice/logs/about-log.html) +- 新增章节: [日志与监控 - 使用 tracing 输出自定义日志](https://course.rs/practice/logs/tracing-logger.html) + +## 2022-04-05 + +- 新增章节:[Cookbook - 字符编码](https://cookbook.rs/encoding/strings.html) +- 新增章节:[Cookbook - CSV处理](https://cookbook.rs/encoding/csv.html) + +## 2022-04-04 + +- 新增章节: [Cookbook - 使用 rayon 并行处理数据](https://course.rs/cookbook/cocurrency/parallel.html) +- 新增章节: [Cookbook - 加密](https://course.rs/cookbook/cryptography/encryption.html) +- 新增章节: [Cookbook - 哈希](https://course.rs/cookbook/cryptography/hashing.html) +- 新增章节: [Cookbook - 位字段](https://course.rs/cookbook/datastructures/bitfield.html) +- 新增章节: [Cookbook - 数据库](https://course.rs/cookbook/database/sqlite.html) +- 新增章节: [Cookbook - 开发者工具](https://course.rs/cookbook/devtools/log.html) + +## 2022-04-03 + +- 新增章节:[Cookbook - 线程](http://course.rs/cookbook/cocurrency/threads.html) + +## 2022-04-01 + +- 新增章节: [Cookbook - 生成随机值](https://course.rs/cookbook/algos/randomness.html) +- 新增章节: [Cookbook - Vec排序](https://course.rs/cookbook/algos/sorting.html) +- 新增章节: [Cookbook - 命令行参数解析](https://course.rs/cookbook/cmd/parsing.html) +- 新增章节:[Cookbook - 终端输出格式化](https://course.rs/cookbook/cmd/ansi.html) +- 新增章节:[Cookbook - 压缩 tar 包](https://course.rs/cookbook/compression/tar.html) + + +## 2022-03-29 + +- 新增章节: [栈上的链表](https://course.rs/too-many-lists/advanced-lists/stack-allocated.html) +- 重新修订章节: [&'static 与 T: 'static](https://course.rs/advance/lifetime/static.html) + +## 2022-03-28 + +- 新增章节:[双单向链表](https://course.rs/too-many-lists/advanced-lists/double-singly.html) +- 优化样式:增加目录中的区域性标题、修改 GitHub 图标和说明,通过 js 增加访问者统计 +- 新增创作感悟 + +## 2022-03-27 + +- 新增章节: [不错的unsafe队列 - 额外的操作](https://course.rs/too-many-lists/unsafe-queue/extra-junk.html) +- 新增章节: [不错的unsafe队列 - 最终代码](https://course.rs/too-many-lists/unsafe-queue/final-code.html) + + +## 2022-03-25 + +- 将 gitalk 更换成 giscuz 评论系统,同时优化了样式展现和默认语言 + +## 2022-03-24 + +- 新增章节: [不错的unsafe队列 - 数据布局2](https://course.rs/too-many-lists/unsafe-queue/layout2.html) +- 优化在线书籍样式:增加章节目录行间距、调整滚动条的宽度、优化无内容章节字体颜色等 + +## 2022-03-22 + +- 新增章节: [不错的unsafe队列-测试栈借用](https://course.rs/too-many-lists/unsafe-queue/testing-stacked-borrow.html) + +## 2022-03-18 + +- 新增章节内目录、评论系统,支持屏幕大小自适 +- 新增章节: [不错的unsafe队列-栈借用](https://course.rs/too-many-lists/unsafe-queue/stacked-borrow.html) +- 新增章节: [不错的unsafe队列-基本操作](http://localhost:3000/too-many-lists/unsafe-queue/basics.html) +- 新增章节: [不错的unsafe队列-使用miri](http://localhost:3000/too-many-lists/unsafe-queue/miri.html) + +## 2022-03-17 + +- 将`原生指针`更名为`裸指针` +- 新增章节: [不错的unsafe队列-数据布局](https://course.rs/too-many-lists/unsafe-queue/layout.html) +- 新增章节: [deque-迭代器](https://course.rs/too-many-lists/deque/iterator.html) +- 新增章节: [deque-最终代码](https://course.rs/too-many-lists/deque/final-code.html) + +## 2022-03-16 + +- 新增章节: [deque-基本操作的对称镜像](https://course.rs/too-many-lists/deque/symmetric.html) +- 新增章节: [deque-Peek](https://course.rs/too-many-lists/deque/peek.html) +- 新增章节: [deque-数据布局和基本操作](https://course.rs/too-many-lists/deque/layout.html) + +## 2022-03-14 + +- 新增章节: [Rust 陷阱 - UTF-8 引发的性能隐患](https://course.rs/pitfalls/utf8-performance.html) +- 新增章节:[持久化链表 - 数据布局和基本操作](https://course.rs/too-many-lists/persistent-stack/layout.html) +- 新增章节:[持久化链表 - Drop、Arc 及完整代码](https://course.rs/too-many-lists/persistent-stack/drop-arc.html) + +## 2022-03-13 + +- 新增章节: [还 OK 的单向链表 - IterMut](https://course.rs/too-many-lists/ok-stack/itermut.html) +- 新增章节: [还 OK 的单向链表 - IntoIter 和 Iter](https://course.rs/too-many-lists/iter.html) +- 优化[进一步深入特赠 - 关联类型](https://course.rs/basic/trait/advance-trait.html#关联类型)中的部分内容,感谢 AllenYu0018 的[提示](https://github.com/sunface/rust-course/discussions/392). + ## 2022-03-11 - 新增章节: [还 OK 的单向链表 - Peek 函数](https://course.rs/too-many-lists/ok-stack/peek.html)