From 8e41754cf34b2f97e0699281980bef75b06a17e8 Mon Sep 17 00:00:00 2001 From: Allan Downey Date: Fri, 4 Mar 2022 10:55:05 +0800 Subject: [PATCH] Update(confonding): unified format 7 --- src/confonding/intro.md | 2 +- src/confonding/slice.md | 24 +++++++++++++++++------- src/confonding/string.md | 7 ++++--- 3 files changed, 22 insertions(+), 11 deletions(-) diff --git a/src/confonding/intro.md b/src/confonding/intro.md index 83ce2926..ce80dc3e 100644 --- a/src/confonding/intro.md +++ b/src/confonding/intro.md @@ -1,5 +1,5 @@ # 易混淆概念解析 + Rust 之所以难,有部分原因在于一些概念对于刚入门的同学来说不仅难以理解,还容易混淆。 对于难以理解这一点,我们在之前的章节已经讲解的差不多。本章就来看看,那些容易混淆的概念该如何进行区分,例如 `String`、`str` 和 `&str`。 - diff --git a/src/confonding/slice.md b/src/confonding/slice.md index ca08af67..1abd097f 100644 --- a/src/confonding/slice.md +++ b/src/confonding/slice.md @@ -1,4 +1,5 @@ # 切片和切片引用 + 关于 `str` / `&str`,`[u8]` / `&[u8]` 区别,你能清晰的说出来嘛?如果答案是 No ,那就跟随我一起来看看切片和切片引用到底有何区别吧。 > 在继续之前,查看[这里](https://course.rs/basic/compound-type/string-slice.html#切片slice)了解何为切片 @@ -6,12 +7,15 @@ 切片允许我们引用集合中部分连续的元素序列,而不是引用整个集合。例如,字符串切片就是一个子字符串,数组切片就是一个子数组。 ## 无法被直接使用的切片类型 -Rust 语言特性内置的 `str` 和 `[u8]` 类型都是切片,前者是字符串切片,后者是数组切片,下面我们来尝试下使用 `str` : + +Rust 语言特性内置的 `str` 和 `[u8]` 类型都是切片,前者是字符串切片,后者是数组切片,下面我们来尝试下使用 `str` : + ```rust let string: str = "banana"; ``` 上面代码创建一个 `str` 类型的字符串,看起来很正常,但是编译就会报错: + ```shell error[E0277]: the size for values of type `str` cannot be known at compilation time --> src/main.rs:4:9 @@ -27,24 +31,29 @@ error[E0277]: the size for values of type `str` cannot be known at compilation t 总之,我们可以总结出一个结论:**在 Rust 中,所有的切片都是动态大小类型,它们都无法直接被使用**。 #### 为何切片是动态大小类型 + 原因在于底层的切片长度是可以动态变化的,而编译器无法在编译期得知它的具体的长度,因此该类型无法被分配在栈上,只能分配在堆上。 #### 为何切片只能通过引用来使用 + 既然切片只能分配到堆上,我们就无法直接使用它,大家可以想想,所有分配在堆上的数据,是不是都是通过一个在栈上的引用来访问的?切片也不例外。 #### 为何切片引用可以存储在栈上 + 切片引用是一个宽指针,存储在栈上,指向了堆上的切片数据,该引用包含了切片的起始位置和长度,而且最重要的是,类似于指针,引用的大小是固定的(起始位置和长度都是整形),因此它才可以存储在栈上。 #### 有没有可以存储在栈上的 -有,使用固定长度的数组: `let a: [i8;4] = [1,2,3,4];`,注意看,数组的类型与切片是不同的,前者的类型带有长度:`[i8;4]`,而后者仅仅是 `[i8]`。 +有,使用固定长度的数组: `let a: [i8;4] = [1,2,3,4];`,注意看,数组的类型与切片是不同的,前者的类型带有长度:`[i8;4]`,而后者仅仅是 `[i8]`。 ## 切片引用 + 那么问题来了,该如何使用切片呢? 何以解忧,唯有引用。由于引用类型的大小在编译期是已知的,因此在 Rust 中,如果要使用切片,就必须要使用它的引用。 `str` 切片的引用类型是 `&str`,而 `[i32]` 的引用类型是 `&[i32]`,相信聪明的读者已经看出来了,`&str` 和 `&[i32]` 都是我们非常常用的类型,例如: + ```rust let s1: &str = "banana"; let s2: &str = &String::from("banana"); @@ -57,14 +66,15 @@ let s3: &[i32] = &arr[1..3]; 这段代码就可以正常通过,原因在于这些切片引用的大小在编译器都是已知的。 ## 总结 + 我们常常说使用切片,实际上我们在用的是切片的引用,我们也在频繁说使用字符串,实际上我们在使用的也是字符串切片的引用。 总之,切片在 Rust 中是动态类型 DST,是无法被我们直接使用的,而我们在使用的都是切片的引用。 -| 切片 | 切片引用| -| --- | --- | -| str 字符串切片 | &str 字符串切片的引用 | -| [u8] 数组切片| &[u8] 数组切片的引用 | +| 切片 | 切片引用 | +| -------------- | --------------------- | +| str 字符串切片 | &str 字符串切片的引用 | +| [u8] 数组切片 | &[u8] 数组切片的引用 | +**但是出于方便,我们往往不会说使用切片引用,而是直接说使用字符串切片或数组切片,实际上,这时指代的都是切片的引用!** -**但是出于方便,我们往往不会说使用切片引用,而是直接说使用字符串切片或数组切片,实际上,这时指代的都是切片的引用!** \ No newline at end of file diff --git a/src/confonding/string.md b/src/confonding/string.md index 09b0578d..88d32e6e 100644 --- a/src/confonding/string.md +++ b/src/confonding/string.md @@ -1,4 +1,5 @@ # 疯狂字符串 + 字符串让人疯狂,这句话用在 Rust 中一点都不夸张,不信?那你能否清晰的说出 `String`、`str`、`&str`、`&String`、`Box` 或 `Box<&str>` 的区别? Rust 语言的类型可以大致分为两种:基本类型和标准库类型,前者是由语言特性直接提供的,而后者是在标准库中定义。即将登场的 `str` 类型就是唯一定义在语言特性中的字符串。 @@ -6,6 +7,7 @@ Rust 语言的类型可以大致分为两种:基本类型和标准库类型, > 在继续之前,大家需要先了解字符串的[基本知识](https://course.rs/basic/compound-type/string-slice.html),本文主要在于概念对比,而不是字符串讲解 ## str + 如上所述,`str` 是唯一定义在 Rust 语言特性中的字符串,但是也是我们几乎不会用到的字符串类型,为何? 原因在于 `str` 字符串它是 [`DST` 动态大小类型](https://course.rs/advance/custom-type.html#动态大小类型),这意味着编译器无法在编译期知道 `str` 类型的大小,只有到了运行期才能动态获知,这对于强类型、强安全的 Rust 语言来说是不可接受的。 @@ -15,6 +17,7 @@ let string: str = "banana"; ``` 上面代码创建一个 `str` 类型的字符串,看起来很正常,但是编译就会报错: + ```shell error[E0277]: the size for values of type `str` cannot be known at compilation time --> src/main.rs:4:9 @@ -25,16 +28,14 @@ error[E0277]: the size for values of type `str` cannot be known at compilation t 如果追求更深层的原因,我们可以总结如下:**所有的切片都是动态类型,它们都无法直接被使用,而 `str` 就是字符串切片,`[u8]` 是数组切片。** - 同时还是 String 和 &str 的底层数据类型。 由于 str 是动态 `str` 类型是硬编码进可执行文件,也无法被修改,但是 `String` 则是一个可增长、可改变且具有所有权的 UTF8 编码字符串,**当 Rust 用户提到字符串时,往往指的就是 `String` 类型和 `&str` 字符串切片类型,这两个类型都是 UTF8 编码**。 除了 `String` 类型的字符串,Rust 的标准库还提供了其他类型的字符串,例如 `OsString`, `OsStr`, `CsString` 和` CsStr` 等,注意到这些名字都以 `String` 或者 `Str` 结尾了吗?它们分别对应的是具有所有权和被借用的变量。 - https://pic1.zhimg.com/80/v2-177bce575bfaf289ae12d677689a26f4_1440w.png https://pic2.zhimg.com/80/v2-697ad53cb502ccec4b2e98c40975344f_1440w.png +https://medium.com/@alisomay/strings-in-rust-28c08a2d3130 -https://medium.com/@alisomay/strings-in-rust-28c08a2d3130 \ No newline at end of file