From 1205cba666c0db9c0c8b54fdea76083db88d0d77 Mon Sep 17 00:00:00 2001 From: sunface Date: Sat, 22 Jan 2022 21:37:55 +0800 Subject: [PATCH] =?UTF-8?q?add=20=E5=B9=B6=E5=8F=91=E5=AE=9E=E8=B7=B5?= =?UTF-8?q?=EF=BC=9AWeb=E6=9C=8D=E5=8A=A1=E5=99=A8?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- book/contents/SUMMARY.md | 15 +- .../concurrency-with-threads/web-server.md | 1 + book/contents/async/future/workarounds.md | 1 - book/contents/async/http.md | 1 - book/contents/async/web-server.md | 314 ++++++++++++++++++ book/contents/rustjs/deno.md | 1 - book/contents/rustjs/intro.md | 7 - book/contents/rustjs/wasm/intro.md | 6 - 8 files changed, 317 insertions(+), 29 deletions(-) create mode 100644 book/contents/advance/concurrency-with-threads/web-server.md delete mode 100644 book/contents/async/future/workarounds.md delete mode 100644 book/contents/async/http.md create mode 100644 book/contents/async/web-server.md delete mode 100644 book/contents/rustjs/deno.md delete mode 100644 book/contents/rustjs/intro.md delete mode 100644 book/contents/rustjs/wasm/intro.md diff --git a/book/contents/SUMMARY.md b/book/contents/SUMMARY.md index a1f6b02a..9d65e075 100644 --- a/book/contents/SUMMARY.md +++ b/book/contents/SUMMARY.md @@ -79,6 +79,7 @@ - [线程同步:锁、Condvar和信号量](advance/concurrency-with-threads/sync1.md) - [线程同步:Atomic原子操作与内存顺序](advance/concurrency-with-threads/sync2.md) - [基于Send和Sync的线程安全](advance/concurrency-with-threads/send-sync.md) + - [实践应用:多线程Web服务器 todo](advance/concurrency-with-threads/web-server.md) - [Unsafe Rust todo](advance/unsafe/intro.md) - [原生指针 todo](advance/unsafe/raw-pointer.md) - [FFI外部语言用 todo](advance/unsafe/ffi.md) @@ -98,7 +99,7 @@ - [async、await和Stream流处理](async/async-await.md) - [同时运行多个Future](async/multi-futures-simultaneous.md) - [一些疑难问题的解决办法](async/pain-points-and-workarounds.md) - - [HTTP Client/Server todo](async/http.md) + - [实践应用:Async Web服务器](async/web-server.md) - [tokio todo](async/tokio/intro.md) - [基本用法](async/tokio/basic.md) - [异步消息流](async/tokio/stream.md)) @@ -142,11 +143,6 @@ - [进阶类型转换](converse/intro.md) - [枚举和整数](converse/enum-int.md) -- [用Rust增强Javascript todo](rustjs/intro.md) - - [deno todo](rustjs/deno.md) - - [wasm tod](rustjs/wasm/intro.md) - - - [复杂错误索引 todo](errorindex/intro.md) - [所有权和借用 todo](errorindex/borrowing/intro.md) - [生命周期 todo](errorindex/lifetime/intro.md) @@ -227,13 +223,6 @@ - [HashMap todo](std/hashmap.md) - [Iterator常用方法 todo](std/iterator.md) -- [常用三方库 todo](libraries/intro.md) - - [JSON](libraries/json/intro.md) - - [serde(todo)](libraries/json/serde.md) - - [HTTP](libraries/http/intro.md) - - [reqwest(todo)](libraries/http/reqwest.md) - - [命令行解析](libraries/command/intro.md) - - [structopt(todo)](libraries/command/structopt.md) ## 附录 - [附录](appendix/intro.md) diff --git a/book/contents/advance/concurrency-with-threads/web-server.md b/book/contents/advance/concurrency-with-threads/web-server.md new file mode 100644 index 00000000..6d684f09 --- /dev/null +++ b/book/contents/advance/concurrency-with-threads/web-server.md @@ -0,0 +1 @@ +# 实践应用:多线程Web服务器 todo diff --git a/book/contents/async/future/workarounds.md b/book/contents/async/future/workarounds.md deleted file mode 100644 index 92515146..00000000 --- a/book/contents/async/future/workarounds.md +++ /dev/null @@ -1 +0,0 @@ -# 遇到不支持的异步特性? todo diff --git a/book/contents/async/http.md b/book/contents/async/http.md deleted file mode 100644 index 087b4c31..00000000 --- a/book/contents/async/http.md +++ /dev/null @@ -1 +0,0 @@ -# HTTP Client/Server diff --git a/book/contents/async/web-server.md b/book/contents/async/web-server.md new file mode 100644 index 00000000..8baf6133 --- /dev/null +++ b/book/contents/async/web-server.md @@ -0,0 +1,314 @@ +# 一个实践项目: Web服务器 +知识学得再多,不实际应用也是纸上谈兵,不是忘掉就是废掉,对于技术学习尤为如此。在之前章节中,我们已经学习了 `Async Rust` 的方方面面,现在来将这些知识融会贯通,最终实现一个并发Web服务器。 + +## 多线程版本的Web服务器 +在正式开始前,先来看一个单线程版本的 `Web` 服务器,该例子来源于 [`Rust Book`](https://doc.rust-lang.org/book/ch20-01-single-threaded.html) 一书。 + +`src/main.rs`: +```rust +use std::fs; +use std::io::prelude::*; +use std::net::TcpListener; +use std::net::TcpStream; + +fn main() { + // 监听本地端口 7878 ,等待 TCP 连接的建立 + let listener = TcpListener::bind("127.0.0.1:7878").unwrap(); + + // 阻塞等待请求的进入 + for stream in listener.incoming() { + let stream = stream.unwrap(); + + handle_connection(stream); + } +} + +fn handle_connection(mut stream: TcpStream) { + // 从连接中顺序读取 1024 字节数据 + let mut buffer = [0; 1024]; + stream.read(&mut buffer).unwrap(); + + let get = b"GET / HTTP/1.1\r\n"; + + + // 处理HTTP协议头,若不符合则返回404和对应的`html`文件 + let (status_line, filename) = if buffer.starts_with(get) { + ("HTTP/1.1 200 OK\r\n\r\n", "hello.html") + } else { + ("HTTP/1.1 404 NOT FOUND\r\n\r\n", "404.html") + }; + let contents = fs::read_to_string(filename).unwrap(); + + // 将回复内容写入连接缓存中 + let response = format!("{status_line}{contents}"); + stream.write_all(response.as_bytes()).unwrap(); + // 使用flush将缓存中的内容发送到客户端 + stream.flush().unwrap(); +} +``` + +`hello.html`: +```rust + + + + + Hello! + + +

Hello!

+

Hi from Rust

+ + +``` + +`404.html`: +```rust + + + + + Hello! + + +

Oops!

+

Sorry, I don't know what you're asking for.

+ + +``` + +运行以上代码,并从浏览器访问 `127.0.0.1:7878` 你将看到一条来自 `Ferris` 的问候。 + +在回忆了单线程版本该如何实现后,我们也将进入正题,一起来实现一个基于 `ascyn` 的异步Web服务器。 + +## 运行异步代码 +一个 Web 服务器必须要能并发的处理大量来自用户的请求,也就是我们不能在处理上一个用户的请求后,再处理下一个用户的请求。上面的单线程版本可以修改为多线程甚至于线程池来实现并发处理,但是线程还是太重了,使用 `async` 实现 `Web` 服务器才是最适合的。 + +首先将 `handle_connection` 修改为 `async` 实现: +```rust +async fn handle_connection(mut stream: TcpStream) { + //<-- snip --> +} +``` + +该修改会将函数的返回值从 `()` 变成 `Future` ,因此直接运行将不再有任何效果,只用通过`.await`或执行器的`poll`调用后才能获取 `Future` 的结果。 + +在之前的代码中,我们使用了自己实现的简单的执行器来进行`.await` 或 `poll` ,实际上这只是为了学习原理,**在实际项目中,需要选择一个三方的 `async` 运行时来实现相关的功能**。 具体的选择我们将在下一章节进行讲解,现在先选择 `async-std` ,该包的最大优点就是跟标准库的 API 类似,相对来说更简单易用。 + +#### 使用 async-std 作为异步运行时 +下面的例子将演示如何使用一个异步运行时`async-std`来让之前的 `async fn` 函数运行起来,该运行时允许使用属性 `#[async_std::main]` 将我们的 `fn main` 函数变成 `async fn main` ,这样就可以在 `main` 函数中直接调用其它 `async` 函数,否则你得用之前章节的 `block_on` 方法来让 `main` 去阻塞等待异步函数的完成,但是这种简单粗暴的阻塞等待方式并不灵活。 + +修改 `Cargo.toml` 添加 `async-std` 包并开启相应的属性: +```toml +[dependencies] +futures = "0.3" + +[dependencies.async-std] +version = "1.6" +features = ["attributes"] +``` + +下面将 `main` 函数修改为异步的,并在其中调用前面修改的异步版本 `handle_connection` : +```rust +#[async_std::main] +async fn main() { + let listener = TcpListener::bind("127.0.0.1:7878").unwrap(); + for stream in listener.incoming() { + let stream = stream.unwrap(); + // 警告,这里无法并发 + handle_connection(stream).await; + } +} +``` + +**上面的代码虽然已经是异步的,实际上它还无法并发**,原因我们后面会解释,先来模拟一下慢请求: +```rust +use async_std::task; + +async fn handle_connection(mut stream: TcpStream) { + let mut buffer = [0; 1024]; + stream.read(&mut buffer).unwrap(); + + let get = b"GET / HTTP/1.1\r\n"; + let sleep = b"GET /sleep HTTP/1.1\r\n"; + + let (status_line, filename) = if buffer.starts_with(get) { + ("HTTP/1.1 200 OK\r\n\r\n", "hello.html") + } else if buffer.starts_with(sleep) { + task::sleep(Duration::from_secs(5)).await; + ("HTTP/1.1 200 OK\r\n\r\n", "hello.html") + } else { + ("HTTP/1.1 404 NOT FOUND\r\n\r\n", "404.html") + }; + let contents = fs::read_to_string(filename).unwrap(); + + let response = format!("{status_line}{contents}"); + stream.write(response.as_bytes()).unwrap(); + stream.flush().unwrap(); +} +``` + +上面是全新实现的 `handle_connection` ,它会在内部睡眠5秒,模拟一次用户慢请求,需要注意的是,我们并没有使用 `std::thread::sleep` 进行睡眠, 原因是该函数并不适用于并发代码,它会让当前线程陷入睡眠中,导致其它任务无法继续运行!因此我们需要一个睡眠函数 `async_std::task::sleep`,它仅会让当前的任务陷入睡眠,然后该任务会让出线程的控制权,这样线程就可以继续运行其它任务。 + +因此,光把函数变成 `async` 往往是不够的,还需要将它内部的代码也都变成异步兼容的,阻塞线程绝对是不可行的。 + +现在运行服务器,并访问 `127.0.0.1:7878/sleep`, 你会发现只有在完成第一个用户请求(5秒后),才能开始处理第二个用户请求。现在再来看看该如何解决这个问题,让请求并发起来。 + +## 并发地处理连接 +上面代码最大的问题是 `listener.incoming()` 是阻塞的迭代器。当 `listener` 在等待连接时,执行器是无法执行其它`Future`的,而且只有在我们处理完已有的连接后,才能接收新的连接。 + +解决方法是将 `listener.incoming()` 从一个阻塞的迭代器变成一个非阻塞的 `Stream`, 后者在前面章节有过专门介绍: +```rust +use async_std::net::TcpListener; +use async_std::net::TcpStream; +use futures::stream::StreamExt; + +#[async_std::main] +async fn main() { + let listener = TcpListener::bind("127.0.0.1:7878").await.unwrap(); + listener + .incoming() + .for_each_concurrent(/* limit */ None, |tcpstream| async move { + let tcpstream = tcpstream.unwrap(); + handle_connection(tcpstream).await; + }) + .await; +} +``` + +异步版本的 `TcpListener` 为 `listener.incoming()` 实现了 `Stream` 特征,以上修改有两个好处: + +- `listener.incoming()` 不再阻塞 +- 使用 `for_each_concurrent` 并发地处理从 `Stream` 获取的元素 + +现在上面的实现的关键在于 `handle_connection` 不能再阻塞: +```rust +use async_std::prelude::*; + +async fn handle_connection(mut stream: TcpStream) { + let mut buffer = [0; 1024]; + stream.read(&mut buffer).await.unwrap(); + + //<-- snip --> + stream.write(response.as_bytes()).await.unwrap(); + stream.flush().await.unwrap(); +} +``` + +在将数据读写改造成异步后,现在该函数也彻底变成了异步的版本,因此一次慢请求不再会阻止其它请求的运行。 + +## 使用多线程并行处理请求 +聪明的读者不知道有没有发现,之前的例子有一个致命的缺陷:只能使用一个线程并发的处理用户请求。是的,这样也可以实现并发,一秒处理几千次请求问题不大,但是这毕竟没有利用上 CPU 的多核并行能力,无法实现性能最大化。 + +`async` 并发和多线程其实并不冲突,而 `async-std` 包也允许我们使用多个线程去处理,由于 `handle_connection` 实现了 `Send` 特征且不会阻塞,因此使用 `async_std::task::spawn` 是非常安全的: +```rust +use async_std::task::spawn; + +#[async_std::main] +async fn main() { + let listener = TcpListener::bind("127.0.0.1:7878").await.unwrap(); + listener + .incoming() + .for_each_concurrent(/* limit */ None, |stream| async move { + let stream = stream.unwrap(); + spawn(handle_connection(stream)); + }) + .await; +} +``` + +至此,我们实现了同时使用并行(多线程)和并发( `async` )来同时处理多个请求! + +## 测试 handle_connection 函数 +对于测试 Web 服务器,使用集成测试往往是最简单的,但是在本例子中,将使用单元测试来测试连接处理函数的正确性。 + +为了保证单元测试的隔离性和确定性,我们使用 `Mock` 来替代 `TcpStream` 。首先,修改 `handle_connection` 的函数签名让测试更简单,之所以可以修改签名,原因在于 `async_std::net::TcpStream` 实际上并不是必须的,只要任何结构体实现了 `async_std::io::Read`, `async_std::io::Write` 和 `marker::Unpin` 就可以替代它: +```rust +use std::marker::Unpin; +use async_std::io::{Read, Write}; + +async fn handle_connection(mut stream: impl Read + Write + Unpin) { +``` + +下面,来构建一个mock的 `TcpStream` 并实现了上面这些特征,它包含一些数据,这些数据将被拷贝到 `read` 缓存中, 然后返回 `Poll::Ready` 说明 `read` 已经结束: +```rust +use super::*; +use futures::io::Error; +use futures::task::{Context, Poll}; + +use std::cmp::min; +use std::pin::Pin; + +struct MockTcpStream { + read_data: Vec, + write_data: Vec, +} + +impl Read for MockTcpStream { + fn poll_read( + self: Pin<&mut Self>, + _: &mut Context, + buf: &mut [u8], + ) -> Poll> { + let size: usize = min(self.read_data.len(), buf.len()); + buf[..size].copy_from_slice(&self.read_data[..size]); + Poll::Ready(Ok(size)) + } +} +``` + +`Write`的实现也类似,需要实现三个方法 : `poll_write`, `poll_flush`, and `poll_close`。 `poll_write` 会拷贝输入数据到mock的 `TcpStream` 中,当完成后返回 `Poll::Ready`。由于 `TcpStream` 无需 `flush` 和 `close`,因此另两个方法直接返回 `Poll::Ready` 即可. + +```rust +impl Write for MockTcpStream { + fn poll_write( + mut self: Pin<&mut Self>, + _: &mut Context, + buf: &[u8], + ) -> Poll> { + self.write_data = Vec::from(buf); + + Poll::Ready(Ok(buf.len())) + } + + fn poll_flush(self: Pin<&mut Self>, _: &mut Context) -> Poll> { + Poll::Ready(Ok(())) + } + + fn poll_close(self: Pin<&mut Self>, _: &mut Context) -> Poll> { + Poll::Ready(Ok(())) + } +} +``` + +最后,我们的mock需要实现 `Unpin` 特征,表示它可以在内存中安全的移动,具体内容在[前面章节](./pin-unpin.md)有讲。 + +```rust +use std::marker::Unpin; +impl Unpin for MockTcpStream {} +``` + +现在可以准备开始测试了,在使用初始化数据设置好 `MockTcpStream` 后,我们可以使用 `#[async_std::test]` 来运行 `handle_connection` 函数,该函数跟 `#[async_std::main]` 的作用类似。为了确保 `handle_connection` 函数正确工作,需要根据初始化数据检查正确的数据被写入到 `MockTcpStream` 中。 + +```rust +use std::fs; + +#[async_std::test] +async fn test_handle_connection() { + let input_bytes = b"GET / HTTP/1.1\r\n"; + let mut contents = vec![0u8; 1024]; + contents[..input_bytes.len()].clone_from_slice(input_bytes); + let mut stream = MockTcpStream { + read_data: contents, + write_data: Vec::new(), + }; + + handle_connection(&mut stream).await; + let mut buf = [0u8; 1024]; + stream.read(&mut buf).await.unwrap(); + + let expected_contents = fs::read_to_string("hello.html").unwrap(); + let expected_response = format!("HTTP/1.1 200 OK\r\n\r\n{}", expected_contents); + assert!(stream.write_data.starts_with(expected_response.as_bytes())); +} +``` \ No newline at end of file diff --git a/book/contents/rustjs/deno.md b/book/contents/rustjs/deno.md deleted file mode 100644 index fdc92f97..00000000 --- a/book/contents/rustjs/deno.md +++ /dev/null @@ -1 +0,0 @@ -# deno todo diff --git a/book/contents/rustjs/intro.md b/book/contents/rustjs/intro.md deleted file mode 100644 index 822a020e..00000000 --- a/book/contents/rustjs/intro.md +++ /dev/null @@ -1,7 +0,0 @@ -# Rust和Javascript todo - -https://zhuanlan.zhihu.com/p/433300816 - - -## web框架性能 -https://www.reddit.com/r/rust/comments/s4pw6n/frontend_rust_framework_performance_prognosis/ \ No newline at end of file diff --git a/book/contents/rustjs/wasm/intro.md b/book/contents/rustjs/wasm/intro.md deleted file mode 100644 index 07e5dc2e..00000000 --- a/book/contents/rustjs/wasm/intro.md +++ /dev/null @@ -1,6 +0,0 @@ -# wasm tod - -https://github.com/iantheearl/rust-typescript-template - -## 使用wasm作为脚本语言 -https://www.reddit.com/r/rust/comments/s63j6n/which_scripting_languages_work_well_embedded_with/ \ No newline at end of file