Rust 基础知识12 - String 字符串

简介

  • 接上回
  • 了解Rust 字符串首先要区分两个概念,一个是字符串字面值,另外一个是字符串本身,这个在参数传递时是有用的防止弄错。
  • Rust 选择将正确处理String 数据作为所有Rust 程序的默认行为,可以防止在开发后期粗粒涉及非ASCII字符的错误。

字符串是什么

  • Rust 的核心语言层面只有一个字符串类型,也就是字符串切片 str (或者 &str)
  • 字符串切片,对存储在其他地方、UTF-8编码的字符串的引用,字符串字面值,存储在二进制文件中,也是字符串切片。
  • String 类型来自标准库,它不是Rust 的核心语言,它是可增长、可修改、可拥有所有权的同样使用UTF-8编码。
  • String 实际上是对Vec的包装。
  • 其他字符串类型,Rust 的标准库中还包含其他很多字符串类型,例如:OsString、OsStr、CString、CStr。
  • 创建一个新的字符串(String)举例:
fn main() { 
    let data1 = String::from("Hello");
    let data2 = "world.".to_string();
    println!("Say: {} {}", data1,data2);
}
运行结果

String 的常用函数

  • push_str()把一个字符串切片,附加到String 注意这个是字符串切片的方法
  • push()把,单个字符附加到String (例子)
fn main() { 
    // 注意使用 push 或者 push_str 的时候需要将变量声明为 mut
    let mut data = String::from("LinHai");
    data.push_str(" is stronger");
    data.push('!');
    // Output: Word: LinHai is stronger!
    println!("Word: {}", data);
}
  • +运算符,链接字符串,需要注意的是,+ 运算符左侧是字符串的所有权,右侧是字符串切片。
  • 看如下的代码测试,及测试结果:
fn main() { 
    let data1 = String::from("Hello");
    let data2 = "world.".to_string();
    let data3 = data1 + " " + &data2;
    // 需要注意,因为data1被借用了,所以被注释的行编译时会报错。
    // println!("data2 value is : {}", data1); // value borrowed here after move
    println!("data3 value is : {}", data3);
}
  • String 实际上是对 Vec 的包装,所以可以通过 len() 方法测量长度,但是注意Len() 获取方式不是按字符的,所以中文的“林海很强壮!”返回的长度是16,为什么是16,因为一个中文占3个字符,最后的!占一个字符,所以:16=5*3+1
fn main() { 
    // 注意使用 push 或者 push_str 的时候需要将变量声明为 mut
    let mut data = String::from("林海");
    data.push_str("很强壮");
    data.push('!');
    // Output ~ Word: 林海很强壮! Len: 16
    println!("Word: {} Len: {}", data, data.len());
}

按索引方式访问

  • Rust 是不支持索引类型表示字符串的,主要的原因是为了字符串边界安全,

切割String

  • 切割是允许的,但是必须沿着字符的边界进行切割,可以使用[]和一个范围来创建字符串的切片,使用时需要谨慎,因为切割如果跨越了字符边界程序就会 panic
  • 另外需要切割需要对字符串的字面值做操作,不是所有权。
  • 看看这个例子,必须沿着边界,每个中文站3个字符所以,切割 [0..6],切[0..4][0..5]肯定会报错,可以自己试试,当然!是英文叹号,占一个字符,要切这个值可以 &data[15..16] ,或者 let selstr = &data[data.len()-1..data.len()];
fn main() { 
    // 注意使用 push 或者 push_str 的时候需要将变量声明为 mut
    let mut data = String::from("林海");
    data.push_str("很强壮");
    data.push('!');

    let selstr = &data[0..6];

    // Output ~ Select cut word: 林海, Len: 6
    println!("Select cut word: {}, Len: {}", selstr, selstr.len());
}
image.png

遍历String

  • 首先需要了解Rust 看待字符串有三种方式,字节、标量值、字形簇(最接近字母)

  • 所有对于字符串的遍历也就存在对字节bytes()、对标量值chars()、对字形簇三种方式进行遍历。

  • 字节方式遍历字符串举例:

fn main() { 
    // 注意使用 push 或者 push_str 的时候需要将变量声明为 mut
    let mut data = String::from("林海");
    data.push_str("很强壮");
    data.push('!');

    for i in data.bytes() {
        println!("byte : {}", i);
    }
}
image.png
  • Unicode 标量值方式遍历举例,输出的时候我故意输出了字符的字节占用数,这样可以看到len() 方法是如何计算字符串长度的:

fn main() { 
    // 注意使用 push 或者 push_str 的时候需要将变量声明为 mut
    let mut data = String::from("林海");
    data.push_str("很强壮");
    data.push('!');

    for i in data.chars() {
        // 输出是故意输出字符的占用字节数len_utf8
        println!("byte : {}, Len : {}", i, i.len_utf8());
    }
}
image.png
  • 字形簇,看了一会觉得还是比较恶心的,比较复杂,稍后举例
# 举例空缺中

结束

  • 通过字符串的学习可以了解Rust 语言设计的特点,效率+安全。
  • 感谢阅读。

你可能感兴趣的:(Rust 基础知识12 - String 字符串)