2019独角兽企业重金招聘Python工程师标准>>>
目前仅看了第二版的官方文档,记录一下初步印象,应该还有更深刻一致的解释,水平有限,仅供参考。
实验环境:ubuntu17.10,rust1.18,vscode1.14 + 扩展rust(rls)。
BTW,环境搭建顺利得令人意外,Rust工具链打造的简洁精美,原生支持git,安装只需一条命令:curl https://sh.rustup.rs -sSf | sh
。
初步印象
数据竞争主要有三个条件:
- 两个或更多指针同时访问同⼀数据。
- ⾄少有⼀个指针被写⼊。
- 没有同步数据访问的机制。
Rust非常重视并发,根据官方介绍:Rust 是一门着眼于安全、速度和并发的编程语言。而并发需要解决的就是数据竞争问题,自然会非常重视数据的使用过程,说是小心翼翼不为过。因为数据要关联到有名变量才能使用,所以rust在语言层面上针对变量的使用引入了解决方法,主要涉及的语法有:
- 变量定义时,不可变(immutable,默认)、可变(mutable)
- 变量赋值时,所有权转移(move)、借用(borrow)
需要注意的是,所有权仅针对复杂类型变量(在语法上,是没有copy trait的类型),例如String、vect等在堆上存储数据的类型,而简单类型并不用考虑,如int、tuple、array等,原因就在于赋值时数据是如何拷贝的(虽然都是浅拷贝)。
如果熟悉浅拷贝、深拷贝的概念,自然了解,对于在堆上分配空间的复杂类型,浅拷贝会导致两个或更多变量/指针同时指向同⼀数据,若有变量/指针作写入操作,就会引起数据竞争问题。
所以,Rust用可变/不可变、所有权、生命期等来破坏数据竞争的条件,而这些解决方案全部在编译期搞定!
当然,代价是难以快速验证想法,毕竟使用变量时要仔细了,否则编都编不过,期待最佳实践和IDE的支持。
基本概念
1. 不可变、可变
let x = 3; // x 默认不可变
x = 4; // 错误!
let x = 4; // 正确!遮盖了原有的同名变量
let mut y = 3; // y可变
y = 4; // 正确!
2. 所有权转移(move)
fn test(v: String) { println!("fn: {}", v); } // 函数
let x = String::from("hello"); // 所有者x(String类型)
let y = x; // 数据的所有权转移给y!
let z = x; // 错误!x已不可用
test(y); // 所有权转移,新的所有者是形参v!当函数执行完毕,v离开作用域时值被丢弃(drop)!
println!("var: {}", y); // 错误!y已不可用
这难免有令人抓狂的感觉,还能不能愉快地玩耍了?这数据跑得跟兔子一样,想用的时候都不知道去哪了!还可能无意中跑到函数里直接躺尸!
3. 借用/引用(borrow)
那么,一个变量想多次使用怎么办?答案是可以借用**:使⽤其值但不获取其所有权**。
fn test1(v: String) { println!("fn: {}", v); }
fn test2(v: &String) { println!("fn: {}", v); } // 参数为引用类型
let s = String::from("hello"); // 所有者s(String类型)
let s1 = &s; // 不可变借用(borrow)!
let s2 = &s; // 借用
let s3 = s1; // 借用
test2(s1); // 借用
test1(*s1); // 错误!借用者s1没有所有权,无法通过s1转移(cannot move out of borrowed content)。
println!("var: {}", s); // 正确
**小结:**个人感觉,所有权转移主要为并发服务,本身并不常用,毕竟数据经常要复用,没人乐意要一直提防着数据跑哪去了,尤其在函数调用时。既然如此,一般把所有者保持不变,多使用引用,主要体现在复杂数据结构和函数上。
进一步
但是,实际使用的情况会比较复杂,即是否可变与转移、借用三者相互影响(混用)的情况。
从数据竞争的角度:读读不冲突,但读写、写写会冲突(读即不可变,写即可变);从实现的角度:引用是基于所有权的。
因此,可以看看哪些对象会冲突:(所有者,引用) × (不可变,可变)
- 首先,是否可变和所有权没有关系。
let x = String::from("hello");
let mut z = x; // 转移后变量x不可用
z.push_str(" z"); //正确
// 可变引用要用星号来获得引用的内容,不可变引用不需要。
let mut x = 5;
let y = &mut x;
*y += 1;
- 虽然不可变引用(&T)没有所有权,不会导致值被误转移,但借用之时要求值不能变,这意味着此时:所有权不能转移、所有者不能改值、不能同时有可变引用!
let mut x = String::from("hello");
let y = &x; // 不可变引用
let z = x; // 错误
x.push_str(" x"); // 错误
let z = &mut x; // 错误:可变引用
可变引用(&mut T)
可变引用使用上略复杂,概念上也没有太统一的理解,这里单独考查。
“可变权”即可变引用对数据的读写权,具有唯一性(只有一个可用的可变引用)和独占性(其它读、写统统无效),所以对编译影响相当大。可变引用的可变权和所有者对数据的所有权有相似性,因为可变权也有move行为。
**注:**官方文档里没有可变权的概念,但个人感觉,用这个概念比较好理解可变引用的使用,也许还有更本质的解释,仅供参考。
- 可变权move的两种方式
let mut x = String::from("hello"); // 所有者x有可变权
// 1. 直接转移
let y = &mut x; // 1. y为可变引用,可变权move自x
let z = y; // 直接转移。z为可变引用
y.push_str(" y"); // 错误!y的可变权已move给z
z.push_str(" z"); // 正确
// 2. 间接转移
let mut y = &mut x; // 2. y为可变引用,可变权move自x
let w = &mut y; // 要求y可变。w为可变引用
w.push_str(" w"); // 正确
// 转移(函数)
fn test(i: &mut String) {
i.push_str(" i"); // 正确
}
let mut x = String::from("hello"); // 所有者x有可变权
test(&mut x);
x.push_str(" x"); // 正确!可变权已归还
- 可变引用若有写入操作则要求所有者可变。
let x = String::from("hello"); // x不可变
let mut z = &x; // z为不可变引用
z.push_str(" z"); // 错误!
let w = &mut z; // w为可变引用
w.push_str(" w"); // 错误!
let mut y = x; // 所有权转移,y可变
let z = &mut y; // z为可变引用,要求y可变
z.push_str(" z"); // 正确!
let w = &z; // w 为不可变引用
w.push_str(" w"); // 错误!
总结:
因为都涉及到值的修改,可变引用的行为和所有者相似,而且可变权和所有权都是面向数据且唯一的。
所有者
- 有所有权,move后不再可用,当所有者生命期结束,值被丢弃。
- 读的时候类似不可变引用,写的时候类似可变引用。
可变引用(&mut T)
- 有可变权,move自被引用者,当可变引用生命期结束,可变权自动归还。
- 可变权的源头应该来自所有者,否则意义不大。
参考
- Rust 环境配置事项一览
- 官方文档:Rust 程序设计语言(第二版)
- Rust教程11之所有权
- 你在开发过程中都遇到过 Rust 的哪些坑?