这是一份不错的rust教程,目前包括4个block和4个project。全部完成后可以用rust实现一个简单的key-value存储引擎。
注意:Windows下rust貌似会遇到一些bug,强烈建议使用Linux来开发
Building Block1
一开始就是Hello World啦......通过实现一个简单的命令行程序来体验一下rust
比如我们希望程序能获得命令行参数
use std::env; fn main() { let args: Vec<String> = env::args().collect(); println!("{:?}", args); }
运行结果:
F:My Drive19fall alent-plan ustuilding-blocksb1src>main.exe 11 22
["main.exe", "11", "22"]
这一段看起来和c++差不多......(其实感觉rust比go好理解多了...)
- println!结尾的叹号!表示调用了一个Rust宏。如果是调用函数,应该输入println
但是一个复杂的cli程序(比如Linux中的ls),命令行参数是很复杂的。比如我们想给写个help(比如ls -h)供用户参考,该怎么办呢?我们可以使用rust的clap库来实现。
首先需要定义一个yml,里面定义命令行参数的格式,保存为/src/cli.yml
name: myapp version: "1.0" author: Kevin K. <kbknapp@gmail.com> about: Does awesome things args: - config: short: c long: config value_name: configval help: Sets a custom config file takes_value: true - INPUT: help: Sets the input file to use required: true index: 1 - verbose: short: v multiple: true help: Sets the level of verbosity subcommands: - test: about: controls testing features version: "1.3" author: Someone E. <someone_else@other.com> args: - debug: short: d help: print debug information
然后编写rust程序,保存为/src/main.rs:
1 #[macro_use] 2 extern crate clap; 3 use clap::App; 4 5 fn main() { 6 println!("Hello, world"); 7 let yaml = load_yaml!("cli.yml"); 8 let m = App::from_yaml(yaml).get_matches(); 9 10 if let Some(configval) = m.value_of("config"){ 11 match configval{ 12 "c1" => println!("config 1111"), 13 "c2" => println!("config 2222"), 14 "c3" => println!("config 3333"), 15 _ => println!("what did you config?") 16 } 17 } else { 18 println!("--config is not assigned"); 19 } 20 21 if let Some(inputval) = m.value_of("INPUT"){ 22 println!("{:?}", inputval); 23 } else { 24 println!("INPUT is not assigned"); 25 } 26 }
- 这里crate是一个二进制或库项目
- match相当于C语言中的switch语句
- if let xx=yy {} else {} 是一个常用的可以处理异常(比如用户没有提供这个参数)的写法
但是如果直接用rustc来运行上面的程序会报错噢:
F:My Drive19fall alent-plan ustuilding-blocksb1src>rustc main.rs error[E0463]: can't find crate for `clap` --> clapusage.rs:2:1 | 2 | extern crate clap; | ^^^^^^^^^^^^^^^^^^ can't find crate error: aborting due to previous error For more information about this error, try `rustc --explain E0463`.
这是因为本地默认还没有安装clap这个库,需要手动告诉rust来安装这个库(类似pip install一下)。这一点和C++不一样哦。
为了方便起见我们改用cargo来编译运行rust。cargo是rust的构建系统和包管理器,可以帮我们自动完成下载安装依赖库的工作。为了使用cargo,我们需要一开始就用 cargo new newproj 来新建项目。新建好的项目文件夹中会有cargo.toml文件,我们打开该文件,加入以下语句来声明使用了clap中的yaml库:
[dependencies.clap] features = ["yaml"]
然后使用cargo build来编译项目,使用cargo run来编译+运行,使用cargo clean来清除上次编译的结果(有点像Makefile的作用)。这里我们cargo build,然后进入/target/debug/文件夹,就可以看到编译好的可执行文件啦。
运行结果如下,可以看到既可以打印help,也可以处理命令行输入:
tidb@pcserver:/mnt/toshiba/talent-plan/rust/building-blocks/bb1$ ./target/debug/bb1 -c c1 fff Hello, world config 1111 "fff" tidb@pcserver:/mnt/toshiba/talent-plan/rust/building-blocks/bb1$ ./target/debug/bb1 --help Hello, world myapp 1.0 Kevin K. <kbknapp@gmail.com> Does awesome things USAGE: bb1 [FLAGS] [OPTIONS] <INPUT> [SUBCOMMAND] FLAGS: -h, --help Prints help information -V, --version Prints version information -v Sets the level of verbosity OPTIONS: -c, --config <configval> Sets a custom config file ARGS: <INPUT> Sets the input file to use SUBCOMMANDS: help Prints this message or the help of the given subcommand(s) test controls testing features
处理好了命令行,可能某一天PM想让程序猿再加个读取环境变量的功能。还好系统还是提供了库函数(所以还是调包大法好?)
1 fn main() { 2 println!("Hello, world!"); 3 use std::env; 4 5 let key = "HOME"; 6 match env::var_os(key) { 7 Some(val) => println!("{}: {:?}", key, val), 8 None => println!("{} is not defined in the environment.", key) 9 } 10 } 11 12 运行结果: 13 tidb@pcserver:/mnt/toshiba/talent-plan/rust/building-blocks/bb1env$ cargo run 14 Finished dev [unoptimized + debuginfo] target(s) in 0.00s 15 Running `target/debug/bb1env` 16 Hello, world! 17 HOME: "/home/tidb"
- 注意6-9行里,Some(T)和None来自于一种枚举类型Option<T>。对于env::var_os(key)的返回值,Some(val)表示结果是某个存在的值,并把它存到val变量中;而None表示返回结果是空的(相当于c语言中的NULL)。这样做的好处是,比如我们在函数返回的时候得到一个Option<i8>类型(可能是Some(i8),也可能是None),在把它转换回i8类型时就已经解决了值为空的情况(比如用6-9行的match),之后的i8类型就一定不为空了。这样就避免了c语言里空指针可能带来的问题。
错误处理
用户有的时候是很皮的(程序猿也是),所以程序不可避免会遇到一些异常情况。在java和c++里我们可以用 try...catch... / throw 来处理异常,rust也提供了类似的机制。比如上次改TiKV config的时候就用到了。原教程给的例子不大好...这里我们自己写一个:
1 use std::env; 2 3 enum ErrTypes{ 4 Err111, 5 // Err222, 6 } 7 8 fn getargs(args: Vec<String>) -> Result<String, ErrTypes>{ 9 match args.get(1) { 10 Some(_v) => Ok(_v.to_string()), 11 None => Err(ErrTypes::Err111) 12 } 13 } 14 15 fn main() { 16 println!("Hello, world!"); 17 let args: Vec<String> = env::args().collect(); 18 19 let val=getargs(args); 20 match val{ 21 Ok(_v) => println!("OK, val == {:?}", _v), 22 Err(_e) => println!("Error!!!!!") 23 } 24 }
这段代码的含义还是很易懂的(虽然写的时候可是debug了半天qwq),就是检测第二个命令行参数是否存在(第一个默认是调用该程序的cmd,即类似于"C:command.com"这种)。
这里我们用Result进行了异常处理。Result也是一种枚举类型,定义如下:
enum Result<T, E> {
Ok(T),
Err(E),
}
这里T和E都是泛型类型参数。比如在上面的代码中,getargs函数的返回值是Result<String, ErrTypes>类型,表示函数执行成功的时候应该返回一个String,而失败的时候返回ErrTypes(我们自己定义的一个错误类型)。[Ref]
我们运行一下看看:
tidb@pcserver:/mnt/toshiba/talent-plan/rust/building-blocks/bb1err$ ./target/debug/bb1err www Hello, world! OK, val == "www" tidb@pcserver:/mnt/toshiba/talent-plan/rust/building-blocks/bb1err$ ./target/debug/bb1err Hello, world! Error!!!!!
另外block1里还有几个文档,虽然暂时用不着但可以以后留着参考:
- cargo manifest format:介绍 Cargo.toml 的结构。前面clap那个例子里我们就修改了这个文件来支持外部的库
- cargo environment variables:介绍cargo会用到的一些环境变量。
- rust documentation:介绍如何编写rust代码的文档(以代码注释的形式)
Project1
第一个project是一个简单的key-value store ,其实就是调用HashMap+处理一下命令行输入输出。那我们就开始叭
Part1 rust中的HashMap
打开空白的kv.rs,可以看到里面已经有了一个半成品,我们直接往里面填空就可以啦。这个文件里定义了一个KvStore结构体,pub struct{}里面可以定义结构体成员变量(这里没有成员变量),impl KvStore{}里面可以定义结构体成员方法。
单纯操作hashmap还是很容易的...但是在这里面我们可以学习一个rust函数的操作
在这个文件里可以看到很多函数都会有一些奇怪的参数,有的是&self,有的是&mut self。另外像get和new函数还要有返回值。
- &表示引用,它允许你使用值但不获取其所有权,意义类似于c++中的传参数指针。但rust中,函数引用来的变量在该函数中是不可被修改的。
- mut表示该变量是可更改的。可以用& mut varname创建一个可变引用。但对于同一个变量,同一时间只能有一个可变引用,或者多个普通的不可变引用。
- 在《rust程序设计语言》的“认识所有权”一节中,详细说明了所有权和引用的概念。
- ::是运算符,表示指定namespace下的特定函数,也和c++一样
- kv.rs中可以理解为定义了KvStore这个结构体的成员函数和方法。
- impl中定义了一个new()函数,作用是初始化并返回一个KvStore结构体。它有点像c++中的构造函数,但rust中必须自行定义,因为rust中其实没有类的概念。
- impl中定义了KvStore结构体的三个方法set、get、remove。方法的第一个参数总是self,它代表调用该方法的结构体实例(这里就是一个KvStore了,因为这三个方法都是作用在KvStore类型的结构体上的)。&self表示不可变的引用,而&mut self表示可变的引用。 同样因为rust中没有类的概念,所以需要搞一个self来接收调用该方法的结构体实例。
- 函数如果需要返回一个值,直接写这个值即可,不需要return关键字。返回的这个值末尾也不加分号
- .cloned()我也不知道啥意思...就先这么着吧 QAQ
- set中的key和value不需要引用,是函数就这样要求的,不然编译会报错...
Part2 处理命令行输入
这部分是在kvs.rs中进行的。首先我们要use相关的库:clap(用于解析命令行参数)和exit(用于退出时命令行返回值)
根据题目要求,这个程序需要实现以下参数:
- kvs set <KEY> <VALUE> Set the value of a string key to a string
- kvs get <KEY> Get the string value of a given string key
- kvs rm <KEY> Remove a given key
- kvs -V Print the version
为了让代码更加整洁,我们像上面的例子一样,把命令的定义写在yml里,然后load_yaml!()来读取这些命令。set、get、rm作为subcommand,而Version作为args。
鉴于纯内存的hashmap反正退出程序之后东西都是会丢失的...就不implement命令行啦
Part3 组装起来吧!
现在我们的文件结构长这样:
✉ project-1 |--✉ src | |--✉ bin | | |-- cli.yml | | |-- kvs.rs | | | |--lib.rs | |--kv.rs | |--✉ tests | |-- tests.rs | |-- Cargo.toml |-- project.md
前面写好了kv.rs来定义KvStore结构体,kvs.rs定义了main函数来处理命令行输入
lib.rs很短...就两行,用于把KvStore包含进来,相当于c++中.h的作用。(详细可参考《rust程序设计语言》的“模块系统”一节)
pub use kv::KvStore;
mod kv;
全部组装好之后就可以啦!可以cargo test来测试一下结果
test result: ok. 13 passed; 0 failed; 0 ignored; 0 measured; 0 filtered out