|
|
<!DOCTYPE HTML>
|
|
|
<html lang="en">
|
|
|
<head>
|
|
|
<meta charset="UTF-8">
|
|
|
<title>Rust 程序设计语言 中文版</title>
|
|
|
<meta content="text/html; charset=utf-8" http-equiv="Content-Type">
|
|
|
<meta name="description" content="Rust 程序设计语言 中文版">
|
|
|
<meta name="viewport" content="width=device-width, initial-scale=1">
|
|
|
|
|
|
<base href="">
|
|
|
|
|
|
<link rel="stylesheet" href="book.css">
|
|
|
<link href='https://fonts.googleapis.com/css?family=Open+Sans:300italic,400italic,600italic,700italic,800italic,400,300,600,700,800' rel='stylesheet' type='text/css'>
|
|
|
|
|
|
<link rel="shortcut icon" href="favicon.png">
|
|
|
|
|
|
<!-- Font Awesome -->
|
|
|
<link rel="stylesheet" href="https://maxcdn.bootstrapcdn.com/font-awesome/4.3.0/css/font-awesome.min.css">
|
|
|
|
|
|
<link rel="stylesheet" href="highlight.css">
|
|
|
<link rel="stylesheet" href="tomorrow-night.css">
|
|
|
|
|
|
<!-- MathJax -->
|
|
|
<script type="text/javascript" src="https://cdn.mathjax.org/mathjax/latest/MathJax.js?config=TeX-AMS-MML_HTMLorMML"></script>
|
|
|
|
|
|
<!-- Fetch JQuery from CDN but have a local fallback -->
|
|
|
<script src="https://code.jquery.com/jquery-2.1.4.min.js"></script>
|
|
|
<script>
|
|
|
if (typeof jQuery == 'undefined') {
|
|
|
document.write(unescape("%3Cscript src='jquery.js'%3E%3C/script%3E"));
|
|
|
}
|
|
|
</script>
|
|
|
</head>
|
|
|
<body class="light">
|
|
|
<!-- Set the theme before any content is loaded, prevents flash -->
|
|
|
<script type="text/javascript">
|
|
|
var theme = localStorage.getItem('theme');
|
|
|
if (theme == null) { theme = 'light'; }
|
|
|
$('body').removeClass().addClass(theme);
|
|
|
</script>
|
|
|
|
|
|
<!-- Hide / unhide sidebar before it is displayed -->
|
|
|
<script type="text/javascript">
|
|
|
var sidebar = localStorage.getItem('sidebar');
|
|
|
if (sidebar === "hidden") { $("html").addClass("sidebar-hidden") }
|
|
|
else if (sidebar === "visible") { $("html").addClass("sidebar-visible") }
|
|
|
</script>
|
|
|
|
|
|
<div id="sidebar" class="sidebar">
|
|
|
<ul class="chapter"><li><a href="ch01-00-introduction.html"><strong>1.</strong> 介绍</a></li><li><ul class="section"><li><a href="ch01-01-installation.html"><strong>1.1.</strong> 安装</a></li><li><a href="ch01-02-hello-world.html"><strong>1.2.</strong> Hello, World!</a></li></ul></li><li><a href="ch02-00-guessing-game-tutorial.html"><strong>2.</strong> 猜猜看教程</a></li><li><a href="ch03-00-common-programming-concepts.html"><strong>3.</strong> 通用编程概念</a></li><li><ul class="section"><li><a href="ch03-01-variables-and-mutability.html"><strong>3.1.</strong> 变量和可变性</a></li><li><a href="ch03-02-data-types.html"><strong>3.2.</strong> 数据类型</a></li><li><a href="ch03-03-how-functions-work.html"><strong>3.3.</strong> 函数如何工作</a></li><li><a href="ch03-04-comments.html"><strong>3.4.</strong> 注释</a></li><li><a href="ch03-05-control-flow.html"><strong>3.5.</strong> 控制流</a></li></ul></li><li><a href="ch04-00-understanding-ownership.html"><strong>4.</strong> 认识所有权</a></li><li><ul class="section"><li><a href="ch04-01-what-is-ownership.html"><strong>4.1.</strong> 什么是所有权</a></li><li><a href="ch04-02-references-and-borrowing.html"><strong>4.2.</strong> 引用 & 借用</a></li><li><a href="ch04-03-slices.html"><strong>4.3.</strong> Slices</a></li></ul></li><li><a href="ch05-00-structs.html"><strong>5.</strong> 结构体</a></li><li><ul class="section"><li><a href="ch05-01-method-syntax.html"><strong>5.1.</strong> 方法语法</a></li></ul></li><li><a href="ch06-00-enums.html"><strong>6.</strong> 枚举和模式匹配</a></li><li><ul class="section"><li><a href="ch06-01-defining-an-enum.html"><strong>6.1.</strong> 定义枚举</a></li><li><a href="ch06-02-match.html"><strong>6.2.</strong> <code>match</code>控制流运算符</a></li><li><a href="ch06-03-if-let.html"><strong>6.3.</strong> <code>if let</code>简单控制流</a></li></ul></li><li><a href="ch07-00-modules.html"><strong>7.</strong> 模块</a></li><li><ul class="section"><li><a href="ch07-01-mod-and-the-filesystem.html"><strong>7.1.</strong> <code>mod</code>和文件系统</a></li><li><a href="ch07-02-controlling-visibility-with-pub.html"><strong>7.2.</strong> 使用<code>pub</code>控制可见性</a></li><li><a href="ch07-03-importing-names-with-use.html"><strong>7.3.</strong> 使用<code>use</code>导入命名</a></li></ul></li><li><a href="ch08-00-common-collections.html"><strong>8.</strong> 通用集合类型</a></li><li><ul class="section"><li><a href="ch08-01-vectors.html"><strong>8.1.</strong> vector</a></li><li><a href="ch08-02-strings.html"><strong>8.2.</strong> 字符串</a></li><li><a href="ch08-03-hash-maps.html" class="active"><strong>8.3.</strong> 哈希 map</a></li></ul></li></ul>
|
|
|
</div>
|
|
|
|
|
|
<div id="page-wrapper" class="page-wrapper">
|
|
|
|
|
|
<div class="page">
|
|
|
<div id="menu-bar" class="menu-bar">
|
|
|
<div class="left-buttons">
|
|
|
<i id="sidebar-toggle" class="fa fa-bars"></i>
|
|
|
<i id="theme-toggle" class="fa fa-paint-brush"></i>
|
|
|
</div>
|
|
|
|
|
|
<h1 class="menu-title">Rust 程序设计语言 中文版</h1>
|
|
|
|
|
|
<div class="right-buttons">
|
|
|
<i id="print-button" class="fa fa-print" title="Print this book"></i>
|
|
|
</div>
|
|
|
</div>
|
|
|
|
|
|
<div id="content" class="content">
|
|
|
<h2>哈希 map</h2>
|
|
|
<blockquote>
|
|
|
<p><a href="https://github.com/rust-lang/book/blob/master/src/ch08-03-hash-maps.md">ch08-03-hash-maps.md</a>
|
|
|
<br>
|
|
|
commit 0d229cc5a3da341196e15a6761735b2952281569</p>
|
|
|
</blockquote>
|
|
|
<p>最后要介绍的常用集合类型是<strong>哈希 map</strong>(<em>hash map</em>)。<code>HashMap<K, V></code>类型储存了一个键类型<code>K</code>对应一个值类型<code>V</code>的映射。它通过一个<strong>哈希函数</strong>(<em>hashing function</em>)来实现映射,它决定了如何将键和值放入内存中。很多编程语言支持这种数据结构,不过通常有不同的名字:哈希、map、对象、哈希表或者关联数组,仅举几例。</p>
|
|
|
<p>哈希 map 可以用于需要任何类型作为键来寻找数据的情况,而不是像 vector 那样通过索引。例如,在一个游戏中,你可以将每个团队的分数记录到哈希 map 中,其中键是队伍的名字而值是每个队伍的分数。给出一个队名,就能得到他们的得分。</p>
|
|
|
<p>本章我们会介绍哈希 map 的基本 API,不过还有更多吸引人的功能隐藏于标准库中的<code>HashMap</code>定义的函数中。请一如既往地查看标准库文档来了解更多信息。</p>
|
|
|
<h3>新建一个哈希 map</h3>
|
|
|
<p>可以使用<code>new</code>创建一个空的<code>HashMap</code>,并使用<code>insert</code>来增加元素。这里我们记录两支队伍的分数,分别是蓝队和黄队。蓝队开始有 10 分而黄队开始有 50 分:</p>
|
|
|
<pre><code class="language-rust">use std::collections::HashMap;
|
|
|
|
|
|
let mut scores = HashMap::new();
|
|
|
|
|
|
scores.insert(String::from("Blue"), 10);
|
|
|
scores.insert(String::from("Yellow"), 50);
|
|
|
</code></pre>
|
|
|
<p>注意必须首先<code>use</code>标准库中集合部分的<code>HashMap</code>。在这三个常用集合中,这个是最不常用的,所以并不包含在被 prelude 自动引用的功能中。标准库中对哈希 map 的支持也相对较少;例如,并没有内建的用于构建的宏。</p>
|
|
|
<p>就像 vector 一样,哈希 map 将他们的数据储存在堆上。这个<code>HashMap</code>的键类型是<code>String</code>而值类型是<code>i32</code>。同样类似于 vector,哈希 map 是同质的:所有的键必须是相同类型,值也必须都是相同类型。</p>
|
|
|
<p>另一个构建哈希 map 的方法是使用一个元组的 vector 的<code>collect</code>方法,其中每个元组包含一个键值对。<code>collect</code>方法可以将数据收集进一系列的集合类型,包括<code>HashMap</code>。例如,如果队伍的名字和初始分数分别在两个 vector 中,可以使用<code>zip</code>方法来创建一个元组的 vector,其中“Blue”与 10 是一对,依此类推。接着就可以使用<code>collect</code>方法将这个元组 vector 转换成一个<code>HashMap</code>:</p>
|
|
|
<pre><code class="language-rust">use std::collections::HashMap;
|
|
|
|
|
|
let teams = vec![String::from("Blue"), String::from("Yellow")];
|
|
|
let initial_scores = vec![10, 50];
|
|
|
|
|
|
let scores: HashMap<_, _> = teams.iter().zip(initial_scores.iter()).collect();
|
|
|
</code></pre>
|
|
|
<p>这里<code>HashMap<_, _></code>类型注解是必要的,因为可能<code>collect</code>进很多不同的数据结构,而除非显式指定 Rust 无从得知你需要的类型。但是对于键和值的参数来说,可以使用下划线而 Rust 可以根据 vector 中数据的类型推断出哈希 map 所包含的类型。</p>
|
|
|
<h3>哈希 map 和所有权</h3>
|
|
|
<p>对于像<code>i32</code>这样的实现了<code>Copy</code> trait 的类型,其值可以拷贝进哈希 map。对于像<code>String</code>这样拥有所有权的值,其值将被移动而哈希 map 会成为这些值的所有者:</p>
|
|
|
<pre><code class="language-rust">use std::collections::HashMap;
|
|
|
|
|
|
let field_name = String::from("Favorite color");
|
|
|
let field_value = String::from("Blue");
|
|
|
|
|
|
let mut map = HashMap::new();
|
|
|
map.insert(field_name, field_value);
|
|
|
// field_name and field_value are invalid at this point
|
|
|
</code></pre>
|
|
|
<p>当<code>insert</code>调用将<code>field_name</code>和<code>field_value</code>移动到哈希 map 中后,将不能使用这两个绑定。</p>
|
|
|
<p>如果将值的引用插入哈希 map,这些值本身将不会被移动进哈希 map。但是这些引用指向的值必须至少在哈希 map 有效时也是有效的。第十章生命周期部分将会更多的讨论这个问题。</p>
|
|
|
<h3>访问哈希 map 中的值</h3>
|
|
|
<p>可以通过<code>get</code>方法并提供对应的键来从哈希 map 中获取值:</p>
|
|
|
<pre><code class="language-rust">use std::collections::HashMap;
|
|
|
|
|
|
let mut scores = HashMap::new();
|
|
|
|
|
|
scores.insert(String::from("Blue"), 10);
|
|
|
scores.insert(String::from("Yellow"), 50);
|
|
|
|
|
|
let team_name = String::from("Blue");
|
|
|
let score = scores.get(&team_name);
|
|
|
</code></pre>
|
|
|
<p>这里,<code>score</code>将会是与蓝队分数相关的值,而这个值将是<code>Some(10)</code>。因为<code>get</code>返回<code>Option<V></code>所以结果被封装进<code>Some</code>;如果某个键在哈希 map 中没有对应的值,<code>get</code>会返回<code>None</code>。程序将需要采用第六章提到的方法中之一来处理<code>Option</code>。</p>
|
|
|
<p>可以使用与 vector 类似的方式来遍历哈希 map 中的每一个键值对,也就是<code>for</code>循环:</p>
|
|
|
<pre><code class="language-rust">use std::collections::HashMap;
|
|
|
|
|
|
let mut scores = HashMap::new();
|
|
|
|
|
|
scores.insert(String::from("Blue"), 10);
|
|
|
scores.insert(String::from("Yellow"), 50);
|
|
|
|
|
|
for (key, value) in &scores {
|
|
|
println!("{}: {}", key, value);
|
|
|
}
|
|
|
</code></pre>
|
|
|
<p>这会以任意顺序打印出每一个键值对:</p>
|
|
|
<pre><code>Yellow: 50
|
|
|
Blue: 10
|
|
|
</code></pre>
|
|
|
<h3>更新哈希 map</h3>
|
|
|
<p>虽然键值对的数量是可以增长的,不过每个单独的键同时只能关联一个值。当你想要改变哈希 map 中的数据时,必须选择是用新值替代旧值,还是完全无视旧值。我们也可以选择保留旧值而忽略新值,并只在键<strong>没有</strong>对应一个值时增加新值。或者可以结合新值和旧值。让我们看看着每一种方式是如何工作的!</p>
|
|
|
<h4>覆盖一个值</h4>
|
|
|
<p>如果我们插入了一个键值对,接着用相同的键插入一个不同的值,与这个键相关联的旧值将被替换。即便下面的代码调用了两次<code>insert</code>,哈希 map 也只会包含一个键值对,因为两次都是对蓝队的键插入的值:</p>
|
|
|
<pre><code class="language-rust">use std::collections::HashMap;
|
|
|
|
|
|
let mut scores = HashMap::new();
|
|
|
|
|
|
scores.insert(String::from("Blue"), 10);
|
|
|
scores.insert(String::from("Blue"), 25);
|
|
|
|
|
|
println!("{:?}", scores);
|
|
|
</code></pre>
|
|
|
<p>这会打印出<code>{"Blue": 25}</code>。原始的值 10 将被覆盖。</p>
|
|
|
<h4>只在键没有对应值时插入</h4>
|
|
|
<p>我们经常会检查某个特定的键是否有值,如果没有就插入一个值。为此哈希 map 有一个特有的 API,叫做<code>entry</code>,它获取我们想要检查的键作为参数。<code>entry</code>函数的返回值是一个枚举,<code>Entry</code>,它代表了可能存在也可能不存在的值。比如说我们想要检查黄队的键是否关联了一个值。如果没有,就插入值 50,对于蓝队也是如此。使用 entry API 的代码看起来像这样:</p>
|
|
|
<pre><code class="language-rust">use std::collections::HashMap;
|
|
|
|
|
|
let mut scores = HashMap::new();
|
|
|
scores.insert(String::from("Blue"), 10);
|
|
|
|
|
|
scores.entry(String::from("Yellow")).or_insert(50);
|
|
|
scores.entry(String::from("Blue")).or_insert(50);
|
|
|
|
|
|
println!("{:?}", scores);
|
|
|
</code></pre>
|
|
|
<p><code>Entry</code>的<code>or_insert</code>方法在键对应的值存在时就返回这个值的<code>Entry</code>,如果不存在则将参数作为新值插入并返回修改过的<code>Entry</code>。这比编写自己的逻辑要简明的多,另外也与借用检查器结合得更好。</p>
|
|
|
<p>这段代码会打印出<code>{"Yellow": 50, "Blue": 10}</code>。第一个<code>entry</code>调用会插入黄队的键和值 50,因为黄队并没有一个值。第二个<code>entry</code>调用不会改变哈希 map 因为蓝队已经有了值 10。</p>
|
|
|
<h4>根据旧值更新一个值</h4>
|
|
|
<p>另一个常见的哈希 map 的应用场景是找到一个键对应的值并根据旧的值更新它。例如,如果我们想要计数一些文本中每一个单词分别出现了多少次,就可以使用哈希 map,以单词作为键并递增其值来记录我们遇到过几次这个单词。如果是第一次看到某个单词,就插入值<code>0</code>。</p>
|
|
|
<pre><code class="language-rust">use std::collections::HashMap;
|
|
|
|
|
|
let text = "hello world wonderful world";
|
|
|
|
|
|
let mut map = HashMap::new();
|
|
|
|
|
|
for word in text.split_whitespace() {
|
|
|
let count = map.entry(word).or_insert(0);
|
|
|
*count += 1;
|
|
|
}
|
|
|
|
|
|
println!("{:?}", map);
|
|
|
</code></pre>
|
|
|
<p>这会打印出<code>{"world": 2, "hello": 1, "wonderful": 1}</code>,<code>or_insert</code>方法事实上会返回这个键的值的一个可变引用(<code>&mut V</code>)。这里我们将这个可变引用储存在<code>count</code>变量中,所以为了赋值必须首先使用星号(<code>*</code>)解引用<code>count</code>。这个可变引用在<code>for</code>循环的结尾离开作用域,这样所有这些改变都是安全的并被借用规则所允许。</p>
|
|
|
<h3>哈希函数</h3>
|
|
|
<p><code>HashMap</code>默认使用一个密码学上是安全的哈希函数,它可以提供抵抗拒绝服务(Denial of Service, DoS)攻击的能力。这并不是现有最快的哈希函数,不过为了更好的安全性带来一些性能下降也是值得的。如果你监控你的代码并发现默认哈希函数对你来说非常慢,可以通过指定一个不同的 <em>hasher</em> 来切换为另一个函数。hasher 是一个实现了<code>BuildHasher</code> trait 的类型。第十章会讨论 trait 和如何实现他们。你并不需要从头开始实现你自己的 hasher;crates.io 有其他人分享的实现了许多常用哈希算法的 hasher 的库。</p>
|
|
|
<h2>总结</h2>
|
|
|
<p>vector、字符串和哈希 map 会在你的程序需要储存、访问和修改数据时帮助你。这里有一些你应该能够解决的练习问题:</p>
|
|
|
<ul>
|
|
|
<li>给定一系列数字,使用 vector 并返回这个列表的平均数(mean, average)、中位数(排列数组后位于中间的值)和众数(mode,出现次数最多的值;这里哈希函数会很有帮助)。</li>
|
|
|
<li>将字符串转换为 Pig Latin,也就是每一个单词的第一个辅音字母被移动到单词的结尾并增加“ay”,所以“first”会变成“irst-fay”。元音字母开头的单词则在结尾增加 “hay”(“apple”会变成“apple-hay”)。牢记 UTF-8 编码!</li>
|
|
|
<li>使用哈希 map 和 vector,创建一个文本接口来允许用户向公司的部门中增加员工的名字。例如,“Add Sally to Engineering”或“Add Amir to Sales”。接着让用户获取一个部门的所有员工的列表,或者公司每个部门的所有员工按照字母顺排序的列表。</li>
|
|
|
</ul>
|
|
|
<p>标准库 API 文档中描述的这些类型的方法将有助于你进行这些练习!</p>
|
|
|
<p>我们已经开始解除可能会有失败操作的复杂程序了,这也意味着接下来是一个了解错误处理的绝佳时机!</p>
|
|
|
|
|
|
</div>
|
|
|
|
|
|
<!-- Mobile navigation buttons -->
|
|
|
|
|
|
<a href="ch08-02-strings.html" class="mobile-nav-chapters previous">
|
|
|
<i class="fa fa-angle-left"></i>
|
|
|
</a>
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
</div>
|
|
|
|
|
|
|
|
|
<a href="ch08-02-strings.html" class="nav-chapters previous" title="You can navigate through the chapters using the arrow keys">
|
|
|
<i class="fa fa-angle-left"></i>
|
|
|
</a>
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
</div>
|
|
|
|
|
|
|
|
|
<!-- Local fallback for Font Awesome -->
|
|
|
<script>
|
|
|
if ($(".fa").css("font-family") !== "FontAwesome") {
|
|
|
$('<link rel="stylesheet" type="text/css" href="_FontAwesome/css/font-awesome.css">').prependTo('head');
|
|
|
}
|
|
|
</script>
|
|
|
|
|
|
<!-- Livereload script (if served using the cli tool) -->
|
|
|
|
|
|
|
|
|
<script src="highlight.js"></script>
|
|
|
<script src="book.js"></script>
|
|
|
</body>
|
|
|
</html>
|