MissMango0820

数据结构与算法 | 第四章：字符串

本文参考网课为 数据结构与算法 ¹ 第四章字符串，主讲人张铭、王腾蛟、赵海燕、宋国杰、邹磊、黄群。

本文使用IDE为 Clion，开发环境 C++14。

更新：2023 / 11 / 12

数据结构与算法 | 第四章：字符串

字符串
- 概念
- - 字符串
  - 字符
  - 字符编码
  - 子串
- 抽象数据类型
- 存储与实现
- - 顺序存储
  - - C / C++的标准字符串
    - - 标准串运算
      - 字符串长度
        
        字符串寻找字符
    - C++的字符串类 String
    - - 字符串类运算
      - 构造算子
        
        赋值算子
        
        提取子串
- 模式匹配
- - 概念
  - 应用
  - 分类
  - - 精确匹配
    - - 单选模式
      - 朴素匹配算法
        
        KMP 算法
    - 近似匹配
参考链接

字符串

概念

字符串

字符串 是一类简单的由 字符（ char）构成的线性结构的 线性表。

字符串 简称 串，为零个或多个 字符 / 符号 构成的有限序列。
n (>=0) 个 字符 的有限序列，一般记作 S C₀C₁…C_n-1。

S 为串名
C₀C₁…C_n-1为串值。C_i中i位置上的 字符 / 符号
n 为字符串长度。长度为零的串，不包含任何字符内容。理论上，一个字符串的长度可以为任意的有限长度，实际上：
- 定长
  具有固定的最大长度，所用内存量始终如一
- 变长
  根据实际需要伸缩，以提高内存空间利用率

字符

字符 的取值依赖于字符集。常用的字符集包括：

由 {0, 1} 所构成的二进制字符集
由4个字符组成的生物信息的DNA字符集
由26个字符和标点符号等组成的英语语言
由6763个常用汉字和682个全角非汉字符号等所构成的简体中文标准字符集GB2312
适用于跨语言、跨平台的通用字符集USC（ Universal Character Set ）

这些 字符 在计算机里是如何存储和运算呢？这就需要 字符编码 来建立 字符集 与计算机数字系统之间的对应关系。

字符编码

字符编码 会将 字符集 里的每一个字符编码为由0和1组成的序列。那么，具体，哪一个二进制序列表示哪一个符号则取决于我们所使用的编码方式。常用的编码方式有：

ASCII 编码
- 使用单字节（ 8 bits ）对字符集 charset 的128个符号进行编码
- 基于拉丁字母的编码，主要用于现代英语和多种西欧语言，也为大多数程序设计语言所采用，例如C和C++
其他编码方式
- ANSI 编码
  支持多种东方语言：GB2312、BIG5、JIS 等。不同国家/地区制定不同的标准，不同 ANSI 编码间互不兼容
- Unicode（跨语言跨平台）
  各种语言中的每一个字符具有唯一的数字编号，便于跨平台的文本转换

无论采用哪一种编码方式，对于一个给定字符集中的字符编码需要满足一组无歧义的规则，使得字符集中的每一个字符都对应唯一的一个编码。且不同的字符编码之间要满足偏序关系。
所谓偏序关系，是定义在集合上的一个二元关系满足自反性、反对称性和传递性。在偏序规则下，

连续的数字 0 - 9 是要连续编码的。像在 ASCII 编码 下，0 的编码是 48，那么 1 的编码就是 49。
连续的字符也是需要连续编码的。像在 ASCII 编码 下，大写字母 A 的编码是65，那么 B 的编码就是66。

通常在字符偏序下，根据字符的自然含义，两个字符之间是可以根据它的编码值进行直接的比较的。两个字符串就会按照构成的字符之间的编码进行大小的比较来得到字典序。

子串

一个 字符串 中任意个连续的字符组成的子序列称为该串的 子串 。

比如说一个长度为 n 的字符串 s₁ 和长度为 m 的 s₂，0<=m<=n。若存在整数 j (0<=i<=n-m) 使得 b_j = a_i+j，j = 0，1，…，m-1同时成立，则称串 s₂ 是串 s₁ 的字串，或称 s₁ 包含串 s₂。
另外，空串是任意串的子串。任意串S都是其自身的子串。

子串 相关的应用有：提取、插入、寻找、删除等等。

抽象数据类型

int length();                                   // 返回串的长度
int isEmpty();                                  // 判断串是否为空串
int find(const char c, const int s);            // 从s开始搜索串寻找一个给定字符
int strcmp(const char *s1, const char *s2);     // 串比较

void clear();                           		// 清空串

string substr(const int s, const int len);      // 从s开始提取一个长度为len的子串
string insert(const char s, const int index);   // 往串中给定位置插入一个字符
string append(const char c);                    // 往串尾添加字符
string concatenate(const char *s);              // 往本串后面链接串s

char *strcpy(char *s1, const char *s2);         // 串复制

存储与实现

字符串 是一种基本元素为 字符 的特殊线性表，所以本质上它的存储也有线性表的顺序和链式两种方式。但是对于 字符串 这类特殊的线性表来说，链式存储的结构性开销过大而很少被采用，所以我们主要以顺序存储为主来介绍 字符串 的存储与实现。

顺序存储

对于定长的 字符串 采用顺序存储方式，即事先申请固定长度的空间但需要有相应的机制来确切的知道当前串的长度。所以一般有3种处理方案：

用 字符串 的第一个元素 S[0] 作为记录串长的存储单元
缺点：该方式决定串的最大长度不能超过256 ²。
另辟空间存储串的长度
缺点：串的最大长度一般是静态给定的，而非动态申请
特殊标记串的结束
C / C++ 的标准字符串（ #include ）

C / C++的标准字符串

C / C++ 的标准字符串是将字符串变量定义为字符数组 char s[M]。

字符串的结束标记是 ASII码中8位全0码 ‘\0’，亦称 NULL。因此，字符串的实际长度为 M-1。
例如，chars s1[6]='value';，定义了一个名为 chars 的字符数组，长度为6位，但是只能存储5位字母。

需要注意的是，标准串定义成了数组，所以它是无法作为左值被赋值的。例如，s1 = s2 是不合规的。

标准串运算

函数库提供字符串处理函数来方便字符串的运算。下面是 string.h 提供的一些常用的字符串的操作：

函数	作用
`int strlen(char *s)`	串长
`char strcpy(char s1, char*s2);`	串复制
`char strcat(char s1, char *s2);`	串拼接
`int strcmp(char s1, char s2);`	串比较
`char strchr(char s, char c);`	字符定位
`char strrchr(char s, char c);`	字符定位
`int strstr(char s2, char* s1)`	子串抓取

字符串长度

1. 求字符串的长度

int strlen(char s[])
{
    int i = 0;
    while (s[i] != 0)
        i ++;
    return i;
}

2. 比较2个字符串的长度

int strcmp(const char *s1, const char *s2)          // 定义2个字符串，分别为s1、s2
{
    int i = 0;
    while (s2[i] != '\0' && s1[i] != '\0'){         // 字符串的结束标记为 \0
        if (s1[i] > s2[i])
            return 1;                               // s1比s2长
        else if (s1[i] < s2[i])
            return -1;                              // s1比s2短
        i ++;
    }
    if (s1[i] == '\0' && s2[i] != '\0')
        return -1;                                  // s1比s2短
    else if (s2[i] == '\0' && s1[i] != '\0')
        return 1;                                   // s2比s1短
    return 0;
}

或者，

int strcmp_1(char *s1, char *s2)                // 定义2个字符串，分别为s1、s2
{
    int i;
    for (i=0; s1[i] == s2[i]; ++i){
        if (s1[i] == '\0' && s2[i] == '\0')
            return 0;                           // 两个字符串相等
    }
    return (s1[i]-s2[i])/abs(s1[i]-s2[i]);      // 不等，比较第一个不同的字符
}

字符串寻找字符

1. 在字符串 s 中正向寻找字符 c

char * strchr(char *s, char c)
{
    i = 0;
    while (s[i] != '\0' && s[i] != c)       // 循环跳过非c字符
        i++;
    // 在循环结束后
    if (s[i] == '\0')                       // 当s不包含字符c则在s[i]即串尾
        return 0;
    else                                    // 当s[i]==c则返回s[i]
        return &s[i];
}

2. 在字符串 s 中反向寻找字符 c

char * strrchr(char *s, char c)
{
    i = 0;
    while (s[i] != '\0') i++;               // 获得s字符串的长度
    while (s[--i] != '\0' && s[i] != c);    // 循环反向跳过非c字符
    // 在循环结束后
    if (s[i] == '\0')                       // 当s不包含字符c则在串尾结束
        return 0;
    else                                    // 若成功则返回相应位置
        return &s[i];
}

举例，在 s = [Hello world\0] 中寻找 o：

寻找字符 o，strchar(s, 'o') 返回 4；
反向寻找 o，strchar(s, 'o') 返回 7。

C++的字符串类 String

除了采用标准字符串以外，还可以采用字符串类 String 来表示和存储字符串，以适应字符串的长度动态变化。

在 String 类中，字符串不再是以字符数组 char S[M] 这种形式来直接出现，而是采用一种动态变长的存储结构。

String 类是通过实例化标准模板库中的 STL 的 basic_string 而得到的。如下：

typedef basic_string <char> string;

它的存储结构如下：

private:                // 具体实现的字符串存储结构
    char *str;                          // 字符指针表示的串实体
    int size;                           // 字符串长度
public:                 // 成员函数
    String(char *s);                    // 构构子
    ~String();                          // 析构子
    String operator=(String & s);       // 赋值
    String operator+(String);           // 拼接
    String substr(int index, int cout); // 子串
    int find(char c, int start);        // 查找
    ...

字符串类运算

操作类别	方法	描述
子串	substr	返回一个串的子串
拷贝 / 交换	copy	将一个串拷贝到另一个串中
拷贝 / 交换	swap	交换两个串的内容
赋值	assign	把一个串、一个字符、一个子串赋值给另一个串中
赋值	=	把一个串或一个字符赋值给另一个串中
插入 / 追加	insert	在给定位置插入一个字符、多个字符或串
	+=	将一个字符或串追加到另一个串后
	append	将一个或多个字符，或串追加在另一个串后
拼接	+	通过将一个串放置在另一个串后面来构建新的新串
查询	find	找到并返回一个子序列的开始位置
替换 / 清除	replace	替换一个指定字符或一个串的子串
替换 / 清除	clear	清除串中的所有字符
统计	size	返回串中字符的数目
	length	返回size()
	max_size	返回串允许的最大长度

构造算子

String 类有多个构造函数。构造一个带有初始值的 String 类可以参照以下方法：

String::String(char *s){        // 确定新字符串需要的空间，初始值为 char *s
    size = strlen(s);           // 新字符串的长度由标准字符串函数 strlen(s) 确定
    str = new char [size+1];    // 在动态存储区域开辟一块空间，用于存储初值s，包括结束符
    assert(str != '\0');        // 开辟空间不成功时，运行异常，退出
    strcpy(str, s);             // 在空间申请成功后，用标准字符串函数strcpy将s完全复制到指针str所指的存储空间
}

例如，我们可以通过上面的带参数的构造函数通过 String s1("hello"); 定义一个 String 类的变量 s1，初始值为 hello。那么我们就可以申请一个容纳下 hello 的空间来将 hello 容纳进去，并且将 size 设置成相应的大小。

String s1("hello");

private:
    char *s;
    size_t size;        // 值为5

赋值算子

String String::operator=(String& s){        // 参数s将被赋值并覆盖本串。
    if (size != s.size){                    // 比较本串和参数串s的大小：若本串和参数串长度不一致，则释
        delete [] str;                         // 放原本的串的存储空间
        str = new char [s.size+1];             // 按照参数s的大小申请新的空间，并把参数s的串值复制到本串中
        assert(str!=0);
        size=s.size;
    }
    strcpy(str, s.str);                     // 将参数串s赋值到本串
    return *this;                           // 返回得到的字符串
}

例如，我们通过构造函数构造一个串 s2，它的初值为 hello world 并通过 String s2("hello world"); s1=s2; 将这个值赋值给 s1。而 s1 此前已经被赋值 hello，所以可以看到 hello 的空间不足以存放新的值 hello world，所以将原本的空间释放掉、申请一个新的空间来容纳新值。

提取子串

// 提取子串的函数是将本串从index开始提取连续的count个字符 作为子串返回，放到temp中
String String::Substr(int index, int count){    // 取出一自下表index开始长度为count的子串返回
    int i;
    int left = size - index;                    // 本串自下标index开始到串尾的长度为left
    String temp; char *p *q;
    if (index >= size)                          // 若下标index超过本串实际串长，则返回空串；
        return temp;
    if (count > left)                           // 若count超过自index开始剩余的子串长度
        count = left;                           // 则count截取为剩余长度
    delete [] temp.str;                         // 释放原来的存储空间
    temp.str = new char [count+1];
    assert(temp.str != 0);                      // 若开辟动态存储空间失败，则退出
    p = temp.str;                               // 若指针p指向目前暂无内容的字符数组的首字符处
    q = &str[index];                            // 指针q指向本实例串的str数组的下标index字符
    for (i=0; i<count; i++)                     // 从index开始逐个提取字符到串temp中
        *p++ = *q++;
    *p = 0;                                     // 循环结束后，让temp.str的结尾为 '\0'
    temp.size = count;
    return temp;
}

例如，我们可以通过 s2 = s1.substr(6 ,5) 从串 s1 hello world 的第6个位置开始，连续提取5个字符形成子串 world 赋值给 s2。

模式匹配

概念

模式匹配（ Pattern Matching ），在目标文本 T 中寻找和定位一个给定模式 P（ Pattern ）的过程。

应用

模式匹配 有着非常广泛的应用，例如：

进行文本编辑时对特定词语、语句的查找；
- 大文本（诸如，句子、段落或书本）中定位特定的模式；
- UNIX / Linux：sed、awk、grep；
在生物信息方面，对DNA信息的提取；
用于确认是否具有某种特定形式的结构：
- 函数式语言
…

分类

根据匹配结果的精确性，模式匹配 可以分为 精确匹配 和 近似匹配。

精确匹配

精确匹配（ Extract String Matching ），若目标 T 中至少存在一处与模式 P 完全相同的子串，则称为匹配成功。

根据模式的不同，可以进一步的分为：

单选模式
例如，Set；
多选模式
例如，包含通配符的 S？t
正则表达式

单选模式

给定模式串 P，在目标字符串 T 中搜索与模式 P 全同的子串，简称为 配串。如果找到，则返回 T 中第一个 P 的配串的首地址。

因为模式匹配频繁用于文本的模式查找，所以效率是衡量模式匹配算法的一个重要指标。因此，存在许多种用于模式匹配的算法。

这里列出一些常用的单选模式的字符串匹配算法，包含每个算法的预处理时间和匹配时间：

朴素匹配算法

朴素 匹配算法（ Native / Brute Force ），本质上是穷举，尝试所有匹配的可能。

假设 T = t₀t₁t₂…t_n， P = p₀p₂…p_m-1。i, j 分别表示 T 和 P 当前字符的下标，在目标字符串 T 中搜索与模式 P 的配串：

将模式从头与目标串的第 i 个字符开始比较：若相等，则继续逐个比较后续字符；
匹配成功（ p₀ = t_k，p₁ = t_k+1，…，p_m-1 = t_k+m-1），即 T.substr(k, m) == P；
若一趟匹配过程发生失配（ p_j != t_i ），则将 P 整体右移1位开始下一趟的匹配

例如，存在目标字符串 T = ababababababb 和模式串 P = abababb：

将P从0开始与T的第 i 个字符开始比较：若相等，则继续逐个比较后续字符；在第6个字符发生失配（ P₆ != T₆），将P整体右移1位开始下一趟的匹配；
将P从1开始与T的第 i 个字符开始比较：在第1个字符发生失配（P₀ ！= T₁ ），将P整体右移1位开始下一趟的匹配；
重复上述步骤，直至 T.substr(k, m) == P 匹配成功或者匹配失败。

例如，存在目标字符串 T = aaaaaaaaaab 和模式串 P = aaaaaab：

将P从0开始与T的第 i 个字符开始比较：若相等，则继续逐个比较后续字符；在第6个字符发生失配（ P₆ != T₆），将P整体右移1位开始下一趟的匹配；
将P从1开始与T的第 i 个字符开始比较：在第1个字符发生失配（P₆ ！= T₇ ），将P整体右移1位开始下一趟的匹配；
重复上述步骤，直至 T.substr(k, m) == P 匹配成功或者匹配失败。

朴素模式 的匹配算法实现如下：

int g, j;

int FindPattern(string T, string P, int startindex)
    for (int g=startindex; g<=T.length()-P.length(); g++){     // g为T的游标，用模板P和目标T的第g位置子串进行比较
        for (int j=0; ((j<P.length()) && (T[g+j]==P[j])); j++)
            ;
        if (j==P.length())
            return g;
    }
    return (-1);                                               // for循环结束，或者，startindex溢出，匹配失败
}

朴素模式 的匹配算法的时间复杂度分析如下：

最差情形
最佳情形

KMP 算法

Knuth - Morris - Pratt（ KMP ）发现每个字符对应的 k 值仅依赖于模式 P 本身，与目标串 T 无关。

1970年，S.A.Cook 在进行抽象机的理论研究时证明了最差情况下模式匹配可在 O（N+M） 时间内完成。
D.E.Knuth 和 V.R.Pratt 以 Cook理论为基础，构造了一种在 O（N+M） 时间内进行模式匹配的方法。
与此同时，J.H.Morris 在开发文本编辑器时为了避免检索文本时的回溯，也得到了同样的算法。

长度为m的模式P，P=p₀p₁p₂p₃…p_m-1。特征向量N表示模式P的字符分布特征，由m个特征数n_j组成 N = n₀n₁n₂n₃…n_m-1。
特征向量，简称 N向量。在很多文献中也称为 next 数组，每个特征数 n_j 对应 next 数组的一个元素。

【还是没搞懂KMP算法的思想…此处略…】

近似匹配

近似匹配（ Approximate String Matching )，若模式 P 与目标 T（或其子串）存在某种程度的相似，则称为匹配成功。

字符串相似度通常定义串变换所需基本操作数目。

字符串基本操作包括 插入、删除 和 替换 三种操作。

参考链接

数据结构与算法 ↩︎
详解计算机中的字、字节（Byte）、比特（bit）及它们之间的关系 ↩︎

你可能感兴趣的:(数据结构,数据结构)

LeetCode 刷题：数据结构与算法的实战经验分享
LeetCode刷题：数据结构与算法的实战经验分享关键词：LeetCode、数据结构、算法、刷题经验、实战摘要：本文将围绕LeetCode刷题展开，深入探讨数据结构与算法在实际刷题过程中的应用。通过分享实战经验，帮助读者更好地理解和掌握数据结构与算法知识，提升解题能力。文章将从背景介绍入手，阐述刷题的目的和意义，接着详细解释核心概念，分析它们之间的关系，然后介绍核心算法原理和具体操作步骤，结合数学
数据结构实验解析(C++版)——实验一复杂度分析拯救三金数据结构 c++算法
目录一、实验例题例题1例题2二、实验原理与背景知识1、实验原理2、背景知识三、解题思路与算法1、解题思路2、算法四、代码实现例题1代码例题2代码五、实验结果分析与总结1、实验结果分析2、该实验与数据结构的联系一、实验例题例题1时间空间限制时间限制：1SEC空间限制：128MB问题描述分析以下代码：for(i=1;iusingnamespacestd;intmain(){longlongn;//输入
【数据结构】复杂度分析
目录一、算法1.基本概念2.描述方法3.算法效率二、算法的时间复杂度三、算法的空间复杂度一、算法1.基本概念通俗的讲，算法是解决问题的方法，比如在现实生活中一道菜谱，一个安装轮椅的操作指南等。严格的说，算法是对特定问题求解步骤的一种描述，是指令的有限序列。算法具有的基本特性有：（1）有穷性。一个算法必须总是在执行有穷步之后结束，且每一步都在有求时间内完成。（2）确定性。算法中的每一条指令必须有确切
C语言指针进阶完全指南：从多级指针到函数指针的深度探索给老吕螺丝 #C语言 c语言开发语言
掌握指针基础后，你将开启C语言真正的力量之门。本文通过实战代码示例和内存布局图解，带你系统攻克指针进阶技术。一、指针核心回顾与进阶重点核心概念：指针本质：存储内存地址的变量间接访问：通过地址操作数据指针大小：64位系统固定8字节（与类型无关）进阶重点：多级指针：处理复杂间接关系动态内存管理：精准控制内存生命周期函数指针：实现代码抽象与回调复杂结构：构建链表等动态数据结构二、多级指针：指针的指针内存
数据结构：位图顾小玙数据结构算法
目录问题引入位图定义相关整型位操作疑点位运算C++库里的bitset实现应用优缺点问题引入有一道经典的面试题：有40亿个无序无符号整数，要求你高效判断一个数是否在这堆数中。想法一：暴力查找似乎能够解决问题，但显然找一次就要消耗O(N)的时间，这是不能接受的；想法二：问题的本质是查找，因此想到使用高效的二分查找：先进行一次O(NlogN)的排序，之后的每次查找都只要O(logN)。想法二的改进很不错
python json 反序列化-V1 CATTLECODE python json 开发语言
在编程中，‌反序列化函数‌用于将序列化后的数据（如JSON、XML等格式）重新转换为程序可操作的对象或数据结构。以下是不同语言和场景下的实现方式及特点：‌1.Python中的反序列化‌‌(1)标准库json模块‌‌json.loads()‌：将JSON字符串反序列化为Python对象（如字典、列表）。importjsonjson_str='{"name":"Alice","age":25}'dat
为什么HashMap选择红黑树而非AVL树？揭秘JDK的深度权衡今天你慧了码码码码码码码码码码 JavaSE基础 java 开发语言
当你为HashMap的链表转红黑树机制赞叹时，是否曾疑惑：为什么是红黑树而不是更“平衡”的AVL树？这个看似简单的选择背后，是JDK开发团队在数据结构领域数十年的经验结晶。本文将用真实场景数据，彻底解析这个高频面试题的底层逻辑。一、痛点直击：链表性能崩溃的噩梦想象一个极端场景：恶意攻击者精心构造大量哈希冲突的key，使HashMap退化成超长链表。此时查询效率从O(1)暴跌至O(n)！JDK8的解
【PTA数据结构 | C语言版】在单链表 list 的第 i 个位置上插入元素 x
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目请编写程序，将n个整数插入初始为空的单链表，第i个整数插入在第i个位置上。注意：i代表位序，从1开始。插入结束后，输出链表长度，并顺序输出链表中的每个结点的数值。最后，尝试将最后一个整数插入到链表的第0个、第n+2个位置上，以测试错误信息的输出。输入格式：输入首先在第一行给出正整数n（≤20）；随后一行给出n个int范围内的整数，数字间以
2024 年最新 Protobuf 结构化数据序列化和反序列化详细教程唤醒手腕网络爬虫技术详细教程网络协议
Protobuf序列化概述Protobuf（ProtocolBuffers）是由Google开发的一种语言中立、平台中立、可扩展的序列化结构数据的方法。它用于在不同系统之间高效地交换数据。Protobuf使用定义文件（.proto）来描述数据结构，并通过编译生成特定语言的代码。它的优点包括小巧的二进制格式、高效的序列化速度和向后兼容性，非常适合需要高性能和跨语言的应用场景。常见序列化格式序列化格式
C++11 forward_list 从基础到精通：原理、实践与性能优化码事漫谈 c++11 c++list 性能优化
文章目录一、为什么需要forward_list？二、基础篇：forward_list的核心特性与接口2.1数据结构与迭代器2.2常用接口速览2.3基础操作示例：从初始化到遍历2.3.1初始化与遍历2.3.2插入与删除：before_begin的关键作用三、进阶篇：深入理解forward_list的特殊操作3.1emplace_aftervsinsert_after：效率差异的本质3.2迭代器失效：
DAY 8 标签编码与连续变量处理
主要内容：字典的简单介绍标签编码连续特征的处理：归一化和标准化字典字典是Python中一种非常常用的数据结构，它是一种可变容器模型，可以存储任意类型的对象。字典中的每个元素都是一个键值对创建字典#空字典empty_dict={}empty_dict2=dict()#等同于empty_dict={}#带初始值的字典person={'name':'Alice','age':25,'city':'New
知识图谱系列（2）：知识图谱的技术架构与组成要素程序员查理 #知识图谱知识图谱架构人工智能 AI Agent RAG
1.引言知识图谱作为一种强大的知识表示和组织方式，已经在搜索引擎、推荐系统、智能问答等多个领域展现出巨大的价值。在之前的上一篇文章中，我们介绍了知识图谱的基础概念与发展历程，了解了知识图谱的定义、核心特征、发展历史以及在AI发展中的地位与作用。要深入理解和应用知识图谱，我们需要进一步探索其内部的技术架构和组成要素。知识图谱不仅仅是一个简单的数据结构，而是一个复杂的技术体系，涉及知识的表示、存储、查
数据结构与算法PTA 6-1【顺序表】（C语言）页面正在加载中数据结构与算法入门记录算法数据结构链表 c语言
题目：要求根据顺序表定义和已有操作，编码完成其他的10个操作。顺序表的定义和已有操作：#defineN10typedefintElemType;typedefstruct{ElemTypedata[N];intlast;}SeqList;SeqList*InitList();voidTraverseList(SeqList*list);需要你来编写的其他操作：//插入成功则返回0。如果pos非法则
【PTA数据结构 | C语言版】一元多项式的乘法运算秋说 PTA 数据结构题目集数据结构 c语言算法
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目请设计实现两个链式存储的一元多项式乘法运算的算法，并分析该算法的时间复杂度。输入格式：输入分2行，每行分别先给出多项式非零项的个数，再以指数递降方式输入一个多项式非零项系数和指数（绝对值均为不超过1000的整数）。数字间以空格分隔。输出格式：在一行中以指数递降方式输出乘积多项式非零项的系数和指数。数字间以空格分隔，但结尾不能有多余空格。零
6. ETL Pipeline-SpringAI实战起凡7 Spring AI etl 嵌入式实时数据库 ai spring 语言模型
ETLPipelineETL是提取、转换、加载的缩写，从原始的文档到数据库需要经历提取（.doc、.ppt、.xlsx等）、转换（数据结构化、清理数据、数据分块）、写入向量数据库。这个过程可以进行多种处理，确保最后的数据适合AI问答。SpringAI提供了ETL框架。它是搭建知识库框架的基石。框架介绍DocumentReader：文档读取器，读取文档，比如PDF、Word、Excel等。如：Jso
PyTorch+CNN进行猫狗识别项目
任务介绍数据结构为：big_data├──train│└──cat│└──XXX.jpg（每个文件夹含若干张图像）│└──dog│└──XXX.jpg（每个文件夹含若干张图像）├──val│└──cat│└──XXX.jpg（每个文件夹含若干张图像）│└──dog└─────└──XXX.jpg（每个文件夹含若干张图像）需要对train数据集进行训练，达到给定val数据集中的一张猫/狗的图片，识别
【双向循环带头链表】气质、小青年！链表数据结构
双向循环带头链表双向循环带头链表结构如下先设计数据结构如下。typedefintLTDataType;typedefstructListNode{structListNode*prev;structListNode*next;LTDataTypeval;}LTNode;. 第一个节点为头结点，后面链接的节点存储数据。一个指向前面的指针prev,一个指向后面的指针next，一个数据。实现下面
linux应用编程学习 xyjdwxzxxbw linux 学习服务器
查man手册man1xx查linuxshell命令，man2xxx查API，man3xxx查库函数文件平时是存在块设备中的文件系统中的，我们把这种文件叫静态文件。当我们去open打开一个文件时，linux内核做的操作包括：内核在进程中建立了一个打开文件的数据结构，记录下我们打开的这个文件；内核在内存中申请一段内存，并且将静态文件的内容从块设备中读取到内存中特定地址管理存放（叫动态文件）。打开文件后
Redis中常见的基础和高级数据结构
Redis数据类型eg：大写代表属于redis的关键字，小写代表可填值String定义：存储字节序列（二进制安全的字符串），包括文本、序列化对象和二进制数组，并允许实现计数器和bit操作。作为Redis中其他数据类型的存储单元，如：List、Set、Hashes。命令：命令|文档—Commands|DocsSETkeyvalue：设置键值对命令参数：nx：如果键已存在则失败，可以实现简易的不可重入
高德地址 AMap.GeoJSON解析geoJson并画出区域图画出区域图标记出名称获取地图的坐标古怪今人应用功能前端
GeoJSONGeoJSON一种用于编码各种地理数据结构的数据。GeoJSON对象可以表示几何、特征或特征集合。GeoJSON支持以下几何类型：点（Point）、线（LineString）、面（Polygon）、多点（MultiPoint）、多线（MultiLineString）、多面（MultiPolygon）和几何集合（GeometryCollection）。GeoJSON中的功能包含几何对象
【C语言】学习过程教训与经验杂谈：思想准备、知识回顾（五）
个人主页：艾莉丝努力练剑❄专栏传送门：《C语言》、《数据结构与算法》、C语言刷题12天IO强训、LeetCode代码强化刷题学习方向：C/C++方向⭐️人生格言：为天地立心，为生民立命，为往圣继绝学，为万世开太平前言：我们在学习过程中会碰到很多很多问题，本系列文章不会博主不会额外再创建一个新的专栏来收录，因为这一系列文章创作的初心主要是针对回顾知识点（遵循遗忘曲线并且根据自身的实际情况可以做出一些
C语言——详解二级指针及其与二维数组的误区、指针定义大全
C语言中的二级指针（也称为指针的指针）是指一个指针变量，它存储的不是普通的值，而是另一个指针的地址。这意味着你可以通过二级指针来访问和修改另一个指针的值。这种结构在C语言中非常有用，尤其是在处理动态内存分配、数组、链表等复杂数据结构时。指针变量本质上也是一个变量，包含变量类型，变量值，变量地址，变量名四个要点。指针变量与其他变量不同的地方是，指针变量的值是一个地址，我们把指针变量称为指向其保存的地
数据结构（十一）——B树
文章目录1.B树及其基本操作1.1概念1.2基本操作2.B+树的基本概念重点B树的基本特点B树的建立、插入和删除操作B+树的基本概念1.B树及其基本操作1.1概念B树又称多路平衡查找树，B树中所有节点的孩子个数的最大值称为B树的阶m。（1）性质一棵m阶B树或为空树，或为满足一下特性的m叉树：对任一节点，其所有子树高度相同。根节点的子树数∈[2,m]，关键字数∈[1,m-1]。其他节点的子树数∈[[
数据结构——20.B树爱看烟花的码农数据结构数据结构
第一部分：核心理论精讲一、B树(B-Tree)1.为什么需要B树？当数据量非常大时，内存无法一次性装下，大部分数据需要存储在磁盘等外部存储器上。磁盘I/O（读/写）操作相比内存访问非常慢。为了减少磁盘I/O次数，我们需要一种特殊的树结构，它的每个节点可以存储大量信息，从而使得树的高度尽可能低。B树（一种多路平衡查找树）就是为此而设计的。2.B树的定义(m阶)一棵m阶B树是满足以下条件的m路查找树：
【PTA数据结构 | C语言版】从顺序表 list 中删除第 i 个元素秋说 PTA 数据结构题目集数据结构 c语言算法
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目请编写程序，将n个整数存入顺序表，对任一指定的第i个位置，将这个位置上的元素从顺序表中删除。注意：i代表位序，从1开始，不是数组下标。输入格式：输入首先在第一行给出正整数n（≤10^4）；随后一行给出n个int范围内的整数，数字间以空格分隔；最后一行给出删除位序i，为int范围内的整数。输出格式：如果删除的位置不合法，则不能删除，在一行中
嵌入式C语言中void*的妙用与实战隐身模式 C/C++c语言开发语言
嵌入式C语言中void*的工程应用详解在嵌入式开发中，void*指针无处不在，理解它的使用场景和注意事项，是写好通用接口和系统模块的关键。目录嵌入式C语言中`void*`的工程应用详解✳️一、什么是`void*`二、典型应用场景1.通用参数传递2.通用回调机制3.通用数据结构（链表、队列）4.封装模块接口（如SDK、HAL）⚠️三、使用`void*`的注意事项✅建议实践：四、实战案例：事件处理机制
C++游戏开发需要具备哪些能力星宇工作室 c++开发语言
1.C++语言基础：熟悉C++语法，包括变量、数据类型、控制结构（if,for,while等）、函数、类和对象等。理解C++的内存管理，包括堆和栈的区别、动态内存分配（new/delete）和智能指针的使用。掌握C++的高级特性，如模板、异常处理、STL（标准模板库）等。2.面向对象编程（OOP）：理解面向对象的概念，如封装、继承和多态。能够设计和实现面向对象的系统。3.数据结构和算法：熟悉基本的
【漏洞挖掘】——121、Xpath注入深入刨析 FLy_鹏程万里【WEB渗透】XPath注入 SQL注入 Web渗透信息安全网络安全 web渗透
基本介绍XPath即为XML路径语言，是W3CXSLT标准的主要元素，它是一种用来确定XML(标准通用标记语言的子集)文档中某部分位置的语言。它是一种用来在内存中导航整个XML树的语言，它的设计初衷是作为一种面向XSLT和XPointer的语言，后来独立成了一种W3C标准，XPath基于XML的树状结构，有不同类型的节点，包括元素节点，属性节点和文本节点，提供在数据结构树中找寻节点的能力，可用来在
21.合并两个有序链表太白IT记算法题链表数据结构
将两个升序链表合并为一个新的升序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。思路：这里使用的主要数据结构是单链表。该算法采用经典的双指针技术来合并列表。Adummynodeiscreated;thisnodedoesnotholdanymeaningfulvaluebutservesasthestartingpointofthemergedlinkedlist.将创建一个虚拟节点;
C#中Struct与IntPtr转换：实用扩展方法阿蒙Armon C#工作中的应用 c#
C#中Struct与IntPtr转换：实用扩展方法在C#编程的世界里，我们常常会遇到需要与非托管代码交互，或者进行一些底层内存操作的场景。这时，IntPtr类型就显得尤为重要，它可以表示一个指针或句柄，用来指向非托管内存中的数据。而结构体作为一种常用的数据结构，在与IntPtr进行数据传递和转换时，往往需要一些繁琐的操作。为了简化这些操作，提高开发效率，我们可以通过扩展方法来封装相关的功能。接下来
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs