之前学习过 Rust 只有几种基础的数据类型,但是没有常用的字符串也就是String,今天来学习一下 String;
Rust 中 String 是标准库的一部分,也就是 std::String , 但是这个 String 与其他语言中的 String 稍有不同,比如:
可以看到,当我想要以一种为指定字符串类型的方式定义了一字符串变量时,编译器自动显示出的类型是 &srr 而非 String, 而我指定了 String 类型后仍然有错;而从编译器给出的提示不难看出,“hello” 这样定义得到的是一个 “&str” 类型的值而非是个字符串,那么我们先假定这是一种未知的类型,后续再处理它,先去想办法定义出我们的字符串,打开官方文档: https://doc.rust-lang.org/std/string/struct.String.html
但是官方没说为什么要这样定义,幸好 Rust 的源码是可以点进去的, 从 String::from 向里一步步执行:
from 执行的操作只有一个就是调用 to_owned 函数,但是需要注意,这里传进来的参数类型仍然是"&str"; 然后 to_owned 下一步是调用 as_bytes().to_owned() ,最后这个 to_owned() 则是调用了 to_vec ;
那么至此也就明白了,对于这一行代码:
let hello = String::from("Hello, ");
我们传入的 “Hello,” 这会被编译器认为是一个字符数组,也就是一个字符串常量,即无法对其造成改变的一个对象;但是我们需要的是一个可变的字符串而非一组固定的字符,因此编译器将这个字符数组扩展为了一个 vector , 也就变成了一个可变的字符数组,也就是我最终想要的字符串;
其实这和C++差不多,只不过C++string底层应该直接是个指针而不是个vector
这样一来 “&str” 也就理解了,就是一个常量字符数组,所以是不可变的。在官方文档搜一下,果然也有,并且还有个好听的名字,字符串切片(string slice),具体参考: https://doc.rust-lang.org/std/primitive.str.html
剩下的使用就是这两种类型自带的一些接口了,具体请参阅官方文档,这里不再细述;
很多小伙伴开始学习 Rust 是因为听说这是一种比C++更安全的语言,所以来了解一下,那么它安全在哪里?就安全在所有权机制,不再需要开发者像C++一样的去人工管理内存。
首先,所有程序都必须管理其运行时使用计算机内存的方式。一些语言中具有垃圾回收机制,在程序运行时有规律地寻找不再使用的内存,比如Java;另一些语言中,程序员必须亲自分配和释放内存,比如C/C++。Rust 则选择了第三种方式:通过所有权系统管理内存,编译器在编译时会根据一系列的规则进行检查。如果违反了任何这些规则,程序都不能编译。在运行时,所有权系统的任何功能都不会减慢程序。所有权有以下规则:
* Rust 中的每一个值都有一个 所有者(owner)。
* 值在任一时刻有且只有一个所有者。
* 当所有者(变量)离开作用域,这个值将被丢弃。
举个例子,有以下一段代码:
fn main() {
let s1 = "hello";
{
let s = "hello s";
}
let s2 = "hello";
}
在上面的代码中, s 被一个括号圈住了,那么在这个括号里"hello s" 的所有者就是 s,而 s 的生命周期也只在括号范围内,也就是 s1 出现时 s 未出现, s2 出现时 s 已经死去。
有过C++ 经验的小伙伴看到这肯定很熟悉,这不就是 RAII 吗,或者说 Rust 中的每个变量都是个智能指针。
刚刚说到这种所有权机制与C++的 RAII 很像,变量也和智能指针很像,那么是不是就和智能指针一样呢,测试一下:
图上可以看到,先定义了 s1 ,然后定义 s2 ,然后将 s1 传递给 s2 ,此时再使用 s1 会报错,提醒你s1 的值已经被转移出去了, 这时 s1 就已经被清空了。因为 Rust 变量离开作用域时会回收,所以如果这里不清空,在程序结束时s1 s2都会被回收,那么一块内存就会回收了两次,因此 Rust 的机制中 = 操作是转移而非拷贝。
看到这里,还是觉得是智能指针,只不过是unique_ptr,QAQ
= 是转移而不是拷贝,那么想要使用拷贝该怎么写呢?比如字符串这样:
调用 clone 函数就行了。
i32 类型变量不需要使用 clone 之类的函数,= 居然就是拷贝而不是转移;
官方给出的解释是 “像整型这样的在编译时已知大小的类型被整个存储在栈上,所以拷贝其实际的值是快速的。这意味着没有理由在创建变量 y 后使 x 无效。” 恕我直言,这不就是Rust中所有用到堆的变量就用的是智能指针吗。。。。。当然也可能是我理解不够深,反正我目前为止的感受就是这样。。。。
之前提到过 “值在任一时刻有且只有一个所有者” ,那么如果将值传递给函数会怎么样呢:
很明显,作为参数传递给函数之后就失去了所有权;
但这样会带来一个问题,这个值如果不只一个函数再用后续怎么办?用函数返回值返回!
但是如果参数不只有一个呢?为每个函数的返回值都定一个结构体?
这样太麻烦了,万幸的是 Rust 提供了 引用。
官方说明中“引用(reference)像一个指针,因为它是一个地址,我们可以由此访问储存于该地址的属于其他变量的数据。 与指针不同,引用确保指向某个特定类型的有效值。”
很好理解,改一下刚才的代码:
可以用了,修改就是函数声明参数时加了一个&,传参时也加了一个&;
变量 str 有效的作用域与函数参数的作用域一样,不过当 str 停止使用时并不丢弃引用指向的数据,因为 str 并没有所有权。当函数使用引用而不是实际值作为参数,无需返回值来交还所有权,因为就不曾拥有所有权。
Rust 将创建一个引用的行为称为 借用(borrowing)。正如现实生活中,如果一个人拥有某样东西,你可以从他那里借来。当你使用完毕,必须还回去,并不拥有它,因此借用的值无法修改。
正如不可变变量与可变变量一样,引用也可以变为可变引用,加个 mut 关键试试:
当然,像这段代码所写的,想要成为可变引用的前提是自身就是可变的。
另外,由于 Rust 的三条基础规则之“值在任一时刻有且只有一个所有者”,那么对于一个可变变量在同一个时刻也就不可以有多个引用;换个角度理解比如用一个 s1 作为 s 的可变引用后,那么 s 将不再可用,也自然不能再对一个无法使用的变量创建引用,如果这样使用编译器就会报错: