通用集合类型
- vector 允许我们一个挨着一个的存储一系列数量可变的值。
- 字符串是一个字符的集合
- **哈希 map **允许我们将值与一个特定的key相关联
vector 用来存储一些列的值
新建 vector
let v: Vec = Vec::new();
或者使用宏
let v = vec![1, 2, 3];
更新vector
let mut v = Vec::new();
v.push(5);
v.push(6);
丢弃vector时也会丢弃所有其他元素
{
let v = vec![1, 2, 3, 4];
// 处理变量 v
}// 这里 v 离开作用域并被丢弃
读取 vector 的元素
let v = vec![1, 2, 3, 4, 5];
let third: &i32 = &v[2];
println!("{}", third);
match v.get(2) {
Some(x) => println!("{}", x),
None => println!("none"),
}
遍历 vector 中的元素
let mut v = vec![1, 2, 3];
for i in &v {
println!("{}", i);
}
// 为每个元素加50
for i in &mut v {
*i += 50;
}
使用枚举来存储多种类型
enum SpreadsheetCell {
Int(i32),
Float(f64),
Text(String),
}
let row = vec![
SpreadsheetCell::Int(3),
SpreadsheetCell::Float(2.1),
SpreadsheetCell::Text(String::from("zhang")),
]
更多vector使用方式可参考标准库文档。
使用字符串存储 UTF-8 编码的文本
什么是字符串
rust 的核心语言中只有一种字符类型 str
, 字符串 slice,它通常以被借用的形式出现,&str
。
新建字符串
let mut s = String::new();
let data = "initial contents";
let s = data.to_string();
let s = "initial contents".to_string();
更新字符串
String
的大小可以增长其内容也可以改变,就像可以放入更多数据来改变Vec
的内容一样。
使用push_str
和push
附加字符串
let mut s = String::from("foo");
s.push_str("bar");
s.push('a');
使用+
运算符或format!
宏拼接字符串
let s1 = String::from("hello ");
let s2 = String::from("world!");
let s3 = s1 + &s2;// 注意 s1 被移动了,不能继续使用
索引字符串
let s1 = String::from("hello");
let h = s1[0];// 这里将报错
为什么Rust不支持字符索引,我们来聊一聊Rust是如何在内存中储存字符串的。
内部表现 String
是一个Vec
的封装。让我们看看之前一些正确编码的字符串例子:
let len = String::from("hello").len();
这里,len
的值是5,这意味者字符串 hello 的 Vec
的长度是5个字节:这里每一个字母的 UTF-8 编码都占用一个字节。下面这个例子呢?
let len = String::from("你好").len();
这里的长度是 6,这里是用的是 UTF-8编码 你好
所需要的字节数。
字符串 slice
let hello = "你好";
let s = &hello[..3]; // 你
你应该小心这个操作,如果获取&hell0[..1]
会发生什么呢?答案是:在运行时会 panic,就跟访问 vector 中的无效索引时一样。
遍历字符串的方法
for c in "你好".chars() {
println!("{}", c);
}
字符串并不简单
总而言之,字符串还是很复杂的。不同语言选着了不同的向程序员展示其复杂性的方式。Rust 选择了以准确的方式处理String
数据作为所有Rust程序的默认行为,这意味者程序员们必须更多的思考如何预先处理UTF-8 数据。
哈希 map
哈希map储存键值对
最后介绍的常用集合类型是哈希 map (hash map)。HashMap
类型储存了一个键类型K
和对应一个值类型V
的映射。它通过哈希函数来实现映射,决定如何将键和值放入内存中。
新建一个哈希 map
use std::collections::HashMap;
let mut scores = HashMap::new();
scores.insert(String::from("blue"), 50);
scores.insert(String::from("yellow"), 20);
必须注意首先 use
标准库中集合部分的HashMap
。在这三个常用集合中,HashMap
是最不常用的,所以没有被 prelude 自动引用。
哈希 map 和所有权
use std::collections::HashMap;
let field_name = String::from("Favorite color");
let field_value = String::from("Blue");
let mut map = HasshMap::new();
map.insert(field_name, field_value);
// 这里 field_name 和 field_value 不再有效
但 insert
调用将 field_name
和field_value
移动到哈希 map 中后,将不能再使用这两个绑定。如果将值的引用插入哈希map,这些值本身不会将被移动到哈希map。但是这些引用指向的值必须在哈希 map有效时也是有效的。
访问哈希 map 中的值
use std::collections::HashMap;
let mut scores = HashMap::new();
scores.insert(String::from("Blue"), 10);
scores.insert(String::from("Yellow"), 50);
let team_name = String::from("Blue");
let score = scores.get(&team_name);
这里,score
是与蓝队分数相关的值,应为Some(10)
。因为get
返回Option
,所以结果被装进Some
;如果某个键在哈希 map 中没有对应的值,get
会返回 None
。
可以使用与 vector 类是的方式来遍历哈希 map 中的每一个键值对,也就是for
循环:
use std::collections::HashMap;
let mut scores = HashMap::new();
socres.insert(String::from("Blue"), 10);
socres.insert(String::from("Yellow"), 50);
for (key, value) in &scores {
println!("{}: {}", key, value);
}
跟新哈希map
尽管键值对的数量是可增长的,不过任何时候,每个键只能关联一个值。当我们想要改变哈希 map 中的数据时,必须决定如何处理一个键已经有值了的情况。
覆盖一个值
use std::collections::HashMap;
let mut scores = HashMap::new();
scores.insert(String;:from("Blue"), 10);
scores.insert(String::from("Blue"), 25);
pritnln!("{:?}", scores);
这里会打印出{"Blue": 25}
。原始的值`10被覆盖了。
只在键没有对应的值时插入
use std::collections::HashMap;
let mut scores = HashMap::new();
scores.insert(String::from("Blue"), 10);
scores.entry(String::from("Yellow")).or_insert(50);
scores.entry(String::from("Blue")).or_insert(50);
pritnln!("{:?}", scores);
这里将打印{"Yellow": 50, "Blue": 10}
。第一个entry
调用会插入50
因为Yellow
并没有值。第二个entry
调用不会改变哈希 map 因为Blue
已经有了值 10
。
根据旧值更新一个值
use std::collections::HashMap;
let text = "hello world hi hello world";
let mut map = HashMap::new();
for word in text.split_witespace() {
let count = map.entrt(word).or_insert(0);
*count += 1;
}
这里会打印出{"hello": 2, "world": 2, "hi": 1}
, or_insert
方事实上回返回这个键的值的一个可变引用(&mut v
)。这里我们将这个可变引用储存在count
变量中,所以为了赋值必须用星号(*
)解引用count
。
哈希函数
HashMap
默认使用一种密码学安全的(cryptographically strong)哈希函数,它可以抵抗拒绝服务攻击。
总结
vector, 字符串和哈希 map 会在你的程序需要储存、访问和修改数据时帮助你。