Merge pull request #245 from xiaohulu/master

update ch03-02-data-types.md
pull/257/head
KaiserY 6 years ago committed by GitHub
commit 87af6785f9
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23

@ -2,17 +2,17 @@
> [ch03-02-data-types.md](https://github.com/rust-lang/book/blob/master/second-edition/src/ch03-02-data-types.md)
> <br>
> commit ec65990849230388e4ce4db5b7a0cb8a0f0d60e2
> commit f949ff883628db8ed2f2f5f19e146ebf19ed6a6f
在 Rust 中,任何值都属于一种明确的 **类型***type*),这告诉了 Rust 它被指定为何种数据,以便明确其处理方式。本部分我们将看到一系列内建于语言中的类型。我们将其分为两类标量scalar和复合compound
在 Rust 中,每一个值都属于某一个 **数据类型***data type*),这告诉 Rust 它被指定为何种数据,以便明确数据处理方式。我们将看到两类数据类型标量scalar和复合compound
Rust 是 **静态类型***statically typed*)语言,也就是说在编译时就必须知道所有变量的类型,这一点将贯穿整个章节。通过值的形式及其使用方式,编译器通常可以推断出我们想要用的类型。多种类型均有可能时,比如第二章中使用 `parse``String` 转换为数字时,必须增加类型注解,像这样:
记住,Rust 是 **静态类型***statically typed*)语言,也就是说在编译时就必须知道所有变量的类型。根据值及其使用方式,编译器通常可以推断出我们想要用的类型。当多种类型均有可能时,比如第二章的 “比较猜测的数字和秘密数字” 使用 `parse``String` 转换为数字时,必须增加类型注解,像这样:
```rust
let guess: u32 = "42".parse().expect("Not a number!");
```
这里如果不添加类型注解Rust 会显示如下错误,这说明编译器需要更多信息,来了解我们想要的类型:
这里如果不添加类型注解Rust 会显示如下错误,这说明编译器需要我们提供更多信息,来了解我们想要的类型:
```text
error[E0282]: type annotations needed
@ -25,33 +25,33 @@ error[E0282]: type annotations needed
| consider giving `guess` a type
```
在我们讨论各种数据类型时,你会看到不同的类型注解。
你会看到其它数据类型的各种类型注解。
### 标量类型
**标量***scalar*类型代表一个单独的值。Rust 有四种基本的标量类型:整型、浮点型、布尔类型和字符类型。你可能在其他语言中见过它们,不过让我们深入了解它们在 Rust 中是如何工作的。
**标量***scalar*类型代表一个单独的值。Rust 有四种基本的标量类型:整型、浮点型、布尔类型和字符类型。你可能在其他语言中见过它们让我们深入了解它们在 Rust 中是如何工作的。
#### 整型
**整数** 是一个没有小数部分的数字。我们在这一章的前面使用过 `u32` 类型。该类型声明表明u32 关联的值应该是一个占据 32 比特位的无符号整数(有符号整型类型以 `i` 开头而不是 `u`)。表格 3-1 展示了 Rust 内建的整数类型。每一种变体都有符号和无符号列(例如,*i8*)可以用来声明对应的整数值
**整数** 是一个没有小数部分的数字。我们在第二章使用过 `u32` 整数类型。该类型声明表明,它关联的值应该是一个占据 32 比特位的无符号整数(有符号整数类型以 `i` 开头而不是 `u`)。表格 3-1 展示了 Rust 内建的整数类型。在有符号列和无符号列中的每一个变体(例如,`i16`)都可以用来声明整数值的类型
<span class="caption">表格 3-1: Rust 中的整型</span>
| 长度 | 有符号 | 无符号 |
|--------|--------|----------|
| 8-bit | i8 | u8 |
| 16-bit | i16 | u16 |
| 32-bit | i32 | u32 |
| 64-bit | i64 | u64 |
| arch | isize | usize |
|--------|---------|----------|
| 8-bit | `i8` | `u8` |
| 16-bit | `i16` | `u16` |
| 32-bit | `i32` | `u32` |
| 64-bit | `i64` | `u64` |
| arch | `isize` | `usize` |
每一种变体都可以是有符号或无符号的,并有一个明确的大小。有符号和无符号代表数字能否为负值;换句话说,数字是否需要有一个符号(有符号数),或者永远为正而不需要符号(无符号数)。这有点像在纸上书写数字:当需要考虑符号的时候,数字以加号或减号作为前缀;然而,可以安全地假设为正数时,加号前缀通常省略。有符号数以二进制补码形式twos complement representation存储如果你不清楚这是什么可以在网上搜索对其的解释超出了本书的范畴
每一个变体都可以是有符号或无符号的,并有一个明确的大小。**有符号** 和 **无符号** 代表数字能否为负值,换句话说数字是否需要有一个符号有符号数或者永远为正而不需要符号无符号数。这有点像在纸上书写数字当需要考虑符号的时候数字以加号或减号作为前缀然而可以安全地假设为正数时加号前缀通常省略。有符号数以补码形式twos complement representation存储如果你不清楚这是什么可以在网上搜索对其的解释超出了本书的范畴
每一个有符号的变体可以储存包含从 -(2<sup>n - 1</sup>) 到 2<sup>n - 1</sup> - 1 在内的数字,这里 `n` 是变体使用的位数。所以 `i8` 可以储存从 -(2<sup>7</sup>) 到 2<sup>7</sup> - 1 在内的数字,也就是从 -128 到 127。无符号的变体可以储存从 0 到 2<sup>n</sup> - 1 的数字,所以 `u8` 可以储存从 0 到 2<sup>8</sup> - 1 的数字,也就是从 0 到 255。
每一个有符号的变体可以储存包含从 -(2<sup>n - 1</sup>) 到 2<sup>n - 1</sup> - 1 在内的数字,这里 *n* 是变体使用的位数。所以 `i8` 可以储存从 -(2<sup>7</sup>) 到 2<sup>7</sup> - 1 在内的数字,也就是从 -128 到 127。无符号的变体可以储存从 0 到 2<sup>n</sup> - 1 的数字,所以 `u8` 可以储存从 0 到 2<sup>8</sup> - 1 的数字,也就是从 0 到 255。
另外,`isize` 和 `usize` 类型依赖运行程序的计算机架构64 位架构上它们是 64 位的, 32 位架构上它们是 32 位的。
可以使用表格 3-2 中的任何一种形式编写数字字面值。注意除 byte 以外的其它字面值允许使用类型后缀,例如 `57u8`,同时也允许使用 `_` 做为分隔符以方便读数,例如`1_000`。
可以使用表格 3-2 中的任何一种形式编写数字字面值。注意除 byte 以外的所有数字字面值允许使用类型后缀,例如 `57u8`,同时也允许使用 `_` 做为分隔符以方便读数,例如`1_000`。
<span class="caption">表格 3-2: Rust 中的整型字面值</span>
@ -67,7 +67,7 @@ error[E0282]: type annotations needed
#### 浮点型
Rust 同样有两个主要**浮点数***floating-point numbers*)类型,`f32` 和 `f64`它们是带小数点的数字,分别占 32 位和 64 位比特。默认类型是 `f64`,因为在现代 CPU 中它与 `f32` 速度几乎一样,不过精度更高。
Rust 也有两个原生**浮点数***floating-point numbers*)类型,它们是带小数点的数字。Rust 的浮点数类型是 `f32``f64`,分别占 32 位和 64 位。默认类型是 `f64`,因为在现代 CPU 中它与 `f32` 速度几乎一样,不过精度更高。
这是一个展示浮点数的实例:
@ -83,32 +83,32 @@ fn main() {
浮点数采用 IEEE-754 标准表示。`f32` 是单精度浮点数,`f64` 是双精度浮点数。
#### 数字运算符
#### 数值运算
Rust 支持所有数字类型常见的基本数学运算操作:加法、减法、乘法、除法以及取余。下面的代码展示了如何在一个 `let` 语句中使用它们:
Rust 中的所有数字类型都支持基本数学运算:加法、减法、乘法、除法和取余。下面的代码展示了如何在 `let` 语句中使用它们:
<span class="filename">文件名: src/main.rs</span>
```rust
fn main() {
// addition
// 加法
let sum = 5 + 10;
// subtraction
// 减法
let difference = 95.5 - 4.3;
// multiplication
// 乘法
let product = 4 * 30;
// division
// 除法
let quotient = 56.7 / 32.2;
// remainder
// 取余
let remainder = 43 % 5;
}
```
这些语句中的每个表达式使用了一个数学运算符并计算出了一个值,它们绑定到了一个变量。附录 B 包含了一个 Rust 提供的所有运算符的列表。
这些语句中的每个表达式使用了一个数学运算符并计算出了一个值,然后绑定给一个变量。附录 B 包含 Rust 提供的所有运算符的列表。
#### 布尔型
@ -120,15 +120,15 @@ fn main() {
fn main() {
let t = true;
let f: bool = false; // with explicit type annotation
let f: bool = false; // 显式指定类型注解
}
```
使用布尔值的主要场景是条件表达式,例如 `if` 表达式。在 “控制流”“Control Flow”部分将讲到 `if` 表达式在 Rust 中如何工作。
使用布尔值的主要场景是条件表达式,例如 `if` 表达式。在 “控制流”“Control Flow”部分将介绍 `if` 表达式在 Rust 中如何工作。
#### 字符类型
目前为止只使用到了数字,不过 Rust 也支持字符。Rust 的 `char` 类型是大部分语言中基本字母字符类型,如下代码展示了如何使用它。注意 `char` 由单引号指定,不同于字符串使用双引号:
目前为止只使用到了数字,不过 Rust 也支持字母。Rust 的 `char` 类型是语言中最原生的字母类型,如下代码展示了如何使用它。(注意 `char` 由单引号指定,不同于字符串使用双引号。)
<span class="filename">文件名: src/main.rs</span>
@ -140,17 +140,17 @@ fn main() {
}
```
Rust 的 `char` 类型代表了一个 Unicode 标量值Unicode Scalar Value这意味着它可以比 ASCII 表示更多内容。拼音字母Accented letters中文/日文/韩文等象形文字emoji絵文字以及零长度的空白字符对于 Rust `char` 类型都是有效的。Unicode 标量值包含从 `U+0000``U+D7FF``U+E000``U+10FFFF` 在内的值。不过,“字符” 并不是一个 Unicode 中的概念,所以人直觉上的 “字符” 可能与 Rust 中的 `char` 并不符合。第八章的 “字符串” 部分将详细讨论这个主题。
Rust 的 `char` 类型代表了一个 Unicode 标量值Unicode Scalar Value这意味着它可以比 ASCII 表示更多内容。在 Rust 中拼音字母Accented letters中文、日文、韩文等字符emoji绘文字以及零长度的空白字符都是有效的 `char`。Unicode 标量值包含从 `U+0000``U+D7FF``U+E000``U+10FFFF` 在内的值。不过,“字符” 并不是一个 Unicode 中的概念,所以人直觉上的 “字符” 可能与 Rust 中的 `char` 并不符合。第八章的 “字符串” 将详细讨论这个主题。
### 复合类型
**复合类型***Compound types*)可以将多个其他类型的值组合成一个类型。Rust 有两个原生的复合类型元组tuple和数组array
**复合类型***Compound types*可以将多个值组合成一个类型。Rust 有两个原生的复合类型元组tuple和数组array
#### 将值组合进元组
#### 元组类型
元组是一个将多个其他类型的值组合进一个复合类型的主要方式。
我们使用一个括号中的逗号分隔的值列表来创建一个元组。元组中的每一个位置都有一个类型,而且这些不同值的类型也不必是相同的。这个例子中使用了额外的可选类型注解:
我们使用包含在圆括号中的逗号分隔的值列表来创建一个元组。元组中的每一个位置都有一个类型,而且这些不同值的类型也不必是相同的。这个例子中使用了可选类型注解:
<span class="filename">文件名: src/main.rs</span>
@ -160,7 +160,7 @@ fn main() {
}
```
`tup` 变量绑定了整个元组,因为元组被认为是一个单独的复合元素。为了从元组中获取单个可以使用模式匹配pattern matching来解构destructure元组像这样
`tup` 变量绑定到整个元组上,因为元组是一个单独的复合元素。为了从元组中获取单个值可以使用模式匹配pattern matching来解构destructure元组,像这样:
<span class="filename">文件名: src/main.rs</span>
@ -176,7 +176,7 @@ fn main() {
程序首先创建了一个元组并绑定到 `tup` 变量上。接着使用了 `let` 和一个模式将 `tup` 分成了三个不同的变量,`x`、`y` 和 `z`。这叫做 **解构***destructuring*),因为它将一个元组拆成了三个部分。最后,程序打印出了 `y` 的值,也就是 `6.4`
除了使用模式匹配解构外,也可以使用点号(`.`)后跟值的索引来直接访问它们。例如:
除了使用模式匹配解构外,也可以使用点号(`.`)后跟值的索引来直接访问它们。例如:
<span class="filename">文件名: src/main.rs</span>
@ -194,11 +194,11 @@ fn main() {
这个程序创建了一个元组,`x`,并接着使用索引为每个元素创建新变量。跟大多数编程语言一样,元组的第一个索引值是 0。
#### 数组
#### 数组类型
另一个获取一个多个值集合的方式是 **数组***array*。与元组不同数组中的每个元素的类型必须相同。Rust 中的数组与一些其他语言中的数组不同,因为 Rust 中的数组是固定长度的:一旦声明,它们的长度不能增长或缩小。
另一个包含多个值的方式是 **数组***array*。与元组不同数组中的每个元素的类型必须相同。Rust 中的数组与一些其他语言中的数组不同,因为 Rust 中的数组是固定长度的:一旦声明,它们的长度不能增长或缩小。
Rust 中数组的值位于中括号中的逗号分隔的列表中:
Rust 中,数组中的值位于中括号内的逗号分隔的列表中:
<span class="filename">文件名: src/main.rs</span>
@ -208,9 +208,9 @@ fn main() {
}
```
当你想要在栈stack而不是在堆heap上为数据分配空间第四章将讨论栈与堆的更多内容或者是想要确保总是有固定数量的元素时数组非常有用,虽然它并不如 vector 类型那么灵活。vector 类型是标准库提供的一个 **允许** 增长和缩小长度的类似数组的集合类型。当不确定是应该使用数组还是 vector 的时候,你可能应该使用 vector。第八章会详细讨论 vector。
当你想要在栈stack而不是在堆heap上为数据分配空间第四章将讨论栈与堆的更多内容或者是想要确保总是有固定数量的元素时数组非常有用。但是数组并不如 vector 类型灵活。vector 类型是标准库提供的一个 **允许** 增长和缩小长度的类似数组的集合类型。当不确定是应该使用数组还是 vector 的时候,你可能应该使用 vector。第八章会详细讨论 vector。
一个你可能想要使用数组而不是 vector 的例子是,当程序需要知道一年中月份的名字时程序不大可能会去增加或减少月份。这时你可以使用数组,因为我们知道它总是含 12 个元素:
一个你可能想要使用数组而不是 vector 的例子是,当程序需要知道一年中月份的名字时程序不大可能会去增加或减少月份。这时你可以使用数组,因为我们知道它总是含 12 个元素:
```rust
let months = ["January", "February", "March", "April", "May", "June", "July",
@ -236,7 +236,7 @@ fn main() {
##### 无效的数组元素访问
如果我们访问数组结尾之后的元素会发生什么呢?比如我们将上面的例子改成下面这样,这可以编译不过在运行时会因错误而退出:
如果我们访问数组结尾之后的元素会发生什么呢?比如将上面的例子改成下面这样,这可以编译不过在运行时会因错误而退出:
<span class="filename">文件名: src/main.rs</span>
@ -263,6 +263,6 @@ thread '<main>' panicked at 'index out of bounds: the len is 5 but the index is
note: Run with `RUST_BACKTRACE=1` for a backtrace.
```
编译并没有产生任何错误,不过程序会导致一个 **运行时***runtime*错误并且不会成功退出。当尝试用索引访问一个元素时Rust 会检查指定的索引是否小于数组的长度。如果索引超出了数组长度Rust 会 *panic*,这是 Rust 中的术语,它用于程序因为错误而退出的情况。
编译并没有产生任何错误,不过程序会出现一个 **运行时***runtime*错误并且不会成功退出。当尝试用索引访问一个元素时Rust 会检查指定的索引是否小于数组的长度。如果索引超出了数组长度Rust 会 *panic*,这是 Rust 术语,它用于程序因为错误而退出的情况。
这是第一个在实战中遇到的 Rust 安全原则的例子。在很多底层语言中,并没有进行这类检查,这样当提供了一个不正确的索引时,就会访问无效的内存。Rust 通过立即退出而不是允许内存访问并继续执行来使你免受这类错误困扰。第九章会讨论更多 Rust 的错误处理。
这是第一个在实战中遇到的 Rust 安全原则的例子。在很多底层语言中,并没有进行这类检查,这样当提供了一个不正确的索引时,就会访问无效的内存。通过立即退出而不是允许内存访问并继续执行Rust 让你避开此类错误。第九章会讨论更多 Rust 的错误处理。

Loading…
Cancel
Save