数据结构 | JQiue's notes

Rust 提供了一些数据结构

元组

元组是一个将多个其他类型的值组合进一个复合类型的主要方式，元组长度是固定的

let tup: (i32, f64, u8) = (500, 6.4, 1);

通过.访问

let x: (i32, f64, u8) = (500, 6.4, 1);
let five_hundred = x.0;
let six_point_four = x.1;
let one = x.2;

可以被解构

let tup = (500, 6.4, 1);
let (x, y, z) = tup;

没有任何值的元组有个特殊的名称，叫做**单元（unit）**元组。这种值以及对应的类型都写作()，表示空值或空的返回类型。如果表达式不返回任何其他值，则会隐式返回单元值

字符串

字符串本身是基于字符的集合，并通过方法将字节解析为文本。Rust 中有两种类型：String和&str，它们都是标准库的部分

str

Rust 内置的字符串类型是 str，它通常以引用的形式 &str 出现。字符串字面量 &str 是字符的集合，代表的是不可变的 UTF-8 编码的字符串的引用，创建后无法再为其追加内容或更改内容

// 字面量
let s1 = "Hello";

// as_str 将字符串对象转换为 str
let str = String::from("Hello");
let s2 = str.as_str();

raw string

raw string 不处理任意转移字符，以 r 开头，紧跟着 0～n 个 # 字符，中间是任何的 Unicode character 序列，然后以同样数量的 # 结束

 let s1 = r"abc";   // -> abc
 let s2 = r"abc'"; // -> abc'
 let s3 = r"我";  // -> 我
 let s4 = r"\x41"; // -> \x41
 let s5 = r"\n"; // -> \n
 let s6 = r"\u{6211}\u{6211}"; // -> \u{6211}\u{6211}
 let s7 = r#"""#;  // -> "
 let s8 = r"###"; // -> ###
 let s9 = r#"hello
 
     world"#;  // -> hello\n\n\tworld

String

// 使用 new 构建一个空串
let s1 = String::new();
// 调用 `to_string`
let s2 = "".to_string();
// 使用 from 基于字面量创建
let s3 = String::from("");

String的内容可以变化，因为它在堆上申请了一块内存空间，有权对这块空间扩容

let mut s = String::new();
// 使用 push_str
s.push_str("hello");
// 使用 push 
s.push_str(",");
// 使用 + 运算符，此时发生移动
s + "world";

这里的+会调用add(self, s: &str)->String方法，所以只能将&str和String相加，而不能String+String。为什么&String能够调用add是因为这里发生了解引用强制类型转换，将&String转换为了&[..]

let mut s = String::new();
s.push_str("hello");
let str = String::new("world");
// String + &String 是允许的
s + &str;

使用format!也可以创建，它和println!原理相同，常用于复杂的字符串合并

let s = format!("{}-{}-{}", "a", "b", "c")

字符串不支持索引获取字符，但可以使用chars或bytes方法来遍历字符串

let mut s1 = String::from("hello, ");
// 返回 char 
for c in s1.chars() {
  println!("{}", c);
}
// 返回对应字节数
for c in s1.bytes() {
  println!("{}", c);
}

字符串常用方法

查找和替换

contains() - 包含
replace() - 替换
find() - 查找
match_indices() - 正则匹配索引
rfind() - 从后面查找

遍历

chars() - 字符迭代器
bytes() - 字节迭代器
lines() - 行迭代器
split() - 分割
split_terminator() - 分割终止符

截取

get() - 通过索引取子字符串
trim() - trim 前后空格

转换

to_string() - 转换 string

数组

数组中的每个元素的类型必须相同，数组长度是固定的，数组类型的表示方式：[T; n]，T 表示元素类型，n 表示元素数量

// 初始化定长数组
let a = [1, 2, 3, 4, 5];
// 指定类型和数量（类型和长度都是多余的）
let a: [i32; 5] = [1, 2, 3, 4, 5];
// 指定初始值和数量，用于创建相同的元素，以及指定数量
let a = [3; 5];

使用索引访问数组元素

let a = [1, 2, 3, 4, 5];
let first = a[0];
let second = a[1];

使用len()返回数组长度

let a = [1, 2, 3, 4, 5];
a.len();

可以使用切片语法

let a = [1, 2, 3, 4, 5];
// 完整的部分
let a_slice1 = &a;
// 从索引 1 开始切，但不包含 4
let a_slice2 = &a[1..4];

元素类型和个数相同的是同类型的，同类型数组可以互相赋值

fn main() {
  let mut xs: [i32; 5] = [1, 2, 3, 4, 5];
  let ys: [i32; 5] = [6, 7, 8, 9, 10];
  xs = ys;
  println!("new array {:?}", xs);
}

遍历

let v = [1, 2, 3];
for item in v {
  println!("{item}");
}

边界检查

如果索引超过数组长度，那么就会触发 panic!，如果不确定使用的索引是否合法，应使用get(index)来获取数组元素，它的返回类型是Option<T>

let v = [10i32, 20, 30, 40, 50];
let first = v.get(0);
let tenth = v.get(10);
println!("{:?} {:?}", first, tenth);

方法

只要包含的元素可比较，就可以直接实现数组的比较操作

let v1 = [1, 2, 3];
let v2 = [1, 2, 4];
println!("{:?}", v1 < v2);

Range

Range 不是及存储元素，只是描述一个范围，并且不能够随机遍历。可以使用..快速的创建一个 Range 类型，它拥有迭代器的全部功能

let v1 = 1..3;
for item in v1 {
  println!("{item}")
}

// 包含 a ，不包含 b
for n in 1..101 {}
// 包含 a ，也包含 b
for n in 1..=101 {}

两个小数点只是一个语法糖，它相当于：

use std::ops::Range;

fn main() {
  let r = Range {start: 1, end: 10}; // r 是一个Range<i32>
  for i in r {
    print!("{:?}\t", i);
  }
}

Vec

Vec<T>也就是所谓的动态数组，允许扩容和删除元素

let v1: Vec<i32> = Vec::new();

// 或者简化代码的宏
let v2 = vec![1, 2, 3];

Vec 常用方法

push(value) - 添加元素到末尾，会返回一个Option<&T>
pop() - 移除末尾元素并返回，获取不到就返回None，而不会报错
insert(index, value) - 在指定索引插入
remove(index) - 删除指定索引元素
get(index) - 获取元素，获取不到就返回None，而不会报错
iter() - 返回迭代器
sort() - 排序
reveese() - 反转
dedup() - 去重
contains(value) - 是否包含

如果持有了不可变引用，则尝试修改动态数组是不会成功的

let mut v = vec![1, 2, 3];
let first = &v[0];
v.push(4); // error

可以使用for来遍历每个元素

for item in v {
  println!("{}", item)
}

存储不同类型的元素

如果想要存储不同类型的元素，可以使用枚举来实现

enum SpreadsheetCell {
  Int(i32),
  Float(f32),
  Text(String),
}

let row = vec![
  SpreadsheetCell::Int(3),
  SpreadsheetCell::Float(3.13),
  SpreadsheetCell::Text("hello".to_string()),
];

VecDeque

Vec 只支持在两端高效添加和移除元素。如果程序需要把值保存在队列中间，Vec 就慢了。VecDeque 是一个双端队列，支持高效的两端添加和移除操作

let deque = VecDeque::from([1, 2, 3]);

VecDeque 常用方法

push_front(value) 在队列前面添加值
push_back(value) 在队列后面添加值
pop_front() 移除并返回队列前面的值，返回Option<T>，队列为空时返回 None
pop_back() 移除并返回队列后面的值，同样返回Option<T>
front() 和 deque.back() 返回队列前端和后端元素的引用。返回Option<T>，队列为空时返回 None
front_mut() 和 back_mut() 返回Option<&mut T>

LinkedList

LinkedList<T>是 Rust 提供的双向链表

HashMap

use std::collections::HashMap;

let mut colors = HashMap::new();
colors.insert("red", "红色");
colors.get("red");

HashMap 常用方法

insert(): 插入新的 key-value 对，如果 key 已存在就替换 value，返回 Option
entry(): 获取 key 对应的访问权限，可以决定是否插入还是获取已有的值
contains_key(): 检查 key 是否存在
get(): 获取 key 对应的 value，如果 key 不存在返回 None
remove(): 删除 key-value 对，如果 key 不存在返回 None
clear(): 删除 HashMap 中的所有项
iter(): 迭代器，用于遍历 key-value 对
keys(): 迭代器，只遍历所有的 key
values(): 迭代器，只遍历所有的 value
len(): 返回 HashMap 的键值对数目
is_empty(): 判断 HashMap 是否为空
entry.or_insert(): 如果 key 不存在，插入默认值，如果存在返回修改权限
entry.or_insert_with(): 如果 key 不存在，使用函数生成默认值插入
entry.or_default(): 如果 key 不存在返回默认值，存在返回修改权限
entry.or_insert_with(): 根据 key 是否存在决定操作

HashSet

HashSet<T>是 Rust 提供的集合，元素永远不会包含同一个值的副本