Yogaht

语音识别之CTC算法理解

前言

最近在做语音识别的项目，了解一些端到端到的声学模型，大多数用的都是CTC算法，因此把一些学习心得记录下来分享。其中有很多是借鉴别人的博客文章，也有我自己对CTC原论文中的理解，都会分享给大家。我这几天慢慢的补，每天都会写一些。

借鉴的一些博客和文章：

https://blog.csdn.net/JackyTintin/article/details/79425866 有一些ctc细节的实现可以参考

https://distill.pub/2017/ctc/ 比较详细

https://blog.csdn.net/luodongri/article/details/80100297

https://www.zhihu.com/question/53399706/answer/134881480 论文最后公式的推导

一.CTC简介

别的博客、知乎上已经有很多介绍ctc的文章了，这里就只简单说一下。

先放出CTC算法论文：ftp://ftp.idsia.ch/pub/juergen/icml2006.pdf

CTC（ Connectionist Temporal Classification，连接时序分类）是一种用于序列建模的工具，其核心是定义了特殊的目标函数/优化准则。其实就是用来解决时序类数据的分类问题。比如语音识别，OCR等等。

传统的语音识别的声学模型训练，对于每一帧的数据，需要知道对应的label才能进行有效的训练，在训练数据之前需要做语音对齐的预处理。而语音对齐的过程本身就需要进行反复多次的迭代，来确保对齐更准确，这本身就是一个比较耗时的工作。

而使用深度学习端到端的方法，语音识别的网络模型输出和标签长度通常是不对等的，网络模型输出可能是几百个拼音组合，而标签只有若干拼音，因此需要CTC算法将网络模型输出和标签进行对齐。如下图所示，若不进行对齐，输出为“wworrrlld！”。

二.CTC算法

1.序列问题形式化

序列问题可以形式化为以下函数：

$N_{w}：（R^{m}）^{T}$ ： $\left ( R^{m} \right )^{T}\rightarrow \left ( R^{n} \right )^{T}$

这个过程可以看做是对输入特征数据做了变换 $N_{w}$ ， $N_{w}$ 表示神经网络模型的变换。比如CNN、RNN等。

其中序列目标为字符串，也就是输出为n维多项概率分布（经softmax处理），n为词表的个数。

我自己的项目网络输出为（batchsize，200,1422），200就可以认为是一个时间序列；1422是总共有1421个不同的音素（拼音）加上一个blank空格这些音素的概率，总和为1（softmax）。

因此网络输出为 $y_{k}^{t}$ ，表示t时刻发音为第k个音素的概率。

2.B变换和blank实现变长映射

上面的形式是输入到输出的一对一的映射。序列学习任务一般而言是多对多的映射关系（如语音识别中，上百帧输出可能仅对应若干音节或字符，并且每个输入和输出之间，也没有清楚的对应关系）。

比如输入一个200帧的音频数据，真实的输出是长度为5的结果。经过神经网络处理之后，出来的还是序列长度是200的数据。比如有两个人都说了一句nihao这句话，他们的真实输出结果都是nihao这5个有序的音素，但是因为每个人的发音特点不一样，比如，有的人说的快有的人说的慢，原始的音频数据在经过神经网络计算之后，第一个人得到的结果可能是：nnnniiiiii…hhhhhaaaaaooo(长度是200)，第二个人说的话得到的结果可能是：niiiiii…hhhhhaaaaaooo(长度是200)。这两种结果都是属于正确的计算结果，可以想象，长度为200的数据，最后可以对应上nihao这个发音顺序的结果是非常多的。CTC就是用在这种序列有多种可能性的情况下，计算和最后真实序列值的损失值的方法。
CTC通过引入一个特殊的blank字符（%），解决多对一的映射问题。blank的具体作用有1）标记静音区；2）分隔因素（如hello中的l-l）

首先扩展原始词表为 $L^{'}=L\cup \left \{ BLANK \right \}$ 。然后对于输出字符串定义变换：1）合并连续的相同符号；2）去掉 blank 字符。

例如，对于 “aa%bb%%cc”，应用，则实际上代表的是字符串 “abc”。同理“%a%b%cc%” 也同样代表 “abc”。

$B\left ( aa\%bb\%\%cc \right )=abc$

总之，通过引入blank 及变换，实现了变长的映射。

$L^{'T}\rightarrow L^{\leq T}$

但是要注意的是，因为这个原因，CTC只能建模输出长度小于输入长度的序列问题。

3.似然函数和目标函数

和大多数有监督学习一样，CTC 使用最大似然标准进行训练。

给定输入，输出为目标序列的条件概率为：

$p \left ( l\left \right |x \right )=\sum_{\pi \in B^{-1}(l)}p \left ( \pi\left \right |x \right )$

其中， $B^{-1}(l)$ 表示了长度为且示经过变换结果为字符串的集合。 $\pi$ 表示一条由中元素组成的长度为的路径，例如当目标序列为'nihao',以下是几个路径的例子：

$\pi^{1}=\left \{ n,n,n,i,i,h,h,h,h,a,a,o \right \}$

$\pi^{2}=\left \{ n,i,i,i,i,i,h,a,o,o,o,o, \right \}$

$\pi^{3}=\left \{ n,n,n,n,n,n,i,h,h,h,a,o\right \}$

则: $B\left ( \pi^{1} \right )=B\left ( \pi^{2} \right )=B\left ( \pi^{3} \right )=\left \{ n.i.h.a.o \right \}$

CTC假设输出的概率是（相对于输入）条件独立的，因此路径 $\pi=\left \{ \pi_{1},\pi_{2},\cdots ,\pi_{T} \right \}$ 的概率为它经过的各个时刻经过某个音素的概率相乘，也就是：

$p \left ( \pi\left \right |x \right )=p \left ( \pi\left \right |y=N_{w}\left ( x \right ) \right )= \prod_{t=1}^{T}y_{\pi_{t}}^{t}$

在没有对齐的情况下，目标函数应该为 $\left \{ \pi\left\right|B\left ( \pi \right )=l \right \}$ 中所有路径概率之和，即上面列出的

$max\; p \left ( l\left \right |x \right )=max\;\sum_{\pi \in B^{-1}(l)}p \left ( \pi\left \right |x \right )=max\;\sum_{\pi \in B^{-1}(l)}\prod_{t=1}^{T}y_{\pi_{t}}^{t}$

在CTC原论文中，作者Alex Graves给出的是最小化以下目标函数，就是加了对数便于后面的梯度计算。

$O^{ML}\left ( S,N_{w} \right )=-\sum _{\left ( x,l\in S \right )}ln\left (p \left ( l\left \right |x \right ) \right )$

但是需要注意的是，路径数目的计算公式为 $C_{T-1}^{n}$ （n为音素个数），量级大约为 $\left ( T-1 \right )^{n}$ ,这么大的路径数目是无法直接计算的。因此CTC方法中借用了HMM中的向前向后算法来计算。

4.前向后向算法

在前向及后向计算中，CTC 需要将输出字符串进行扩展。具体的， $\left ( a_{1},a_{2},\cdots ,a_{m} \right )$ 每个字符之间及首尾分别插入 blank，即扩展为 $\left ( \%,a_{1},\%,a_{2},\%,\cdots \%,a_{m},\% \right )$ 下面的为原始字符串，指为扩展后的字符串。

###后面的公式太烦了我直接贴论文里面的图吧。。。###

定义：

这个代表了什么呢，可以理解为从初始到 $y_{s}^{t}$ 这一段里，所有正向路径的概率值和，而且这个值可以由 $a_{t-1}\left ( s \right )$ 和 $a_{t-1}\left ( s-1 \right )$ 得到，比如说我们上面举的例子，目标序列是（n,i,h,a,o），对于第14帧这一时刻经过 $y_{k}$ 为h的所有路径可以表示为（前置项） $\cdot y_{h}^{14}\cdot$ （后置项），所以有：

而且该值可以由 $a_{13}\left ( h \right )$ 和 $a_{13}\left ( i \right )$ 递推得到。

容易得到：

其中b代表blank, $l_{1}$ 代表第一个音素。而且有：

递归效果图如下（目标序列CAT）：

可以看到，这里有两种情况。

Case 1:

该种情况为，1）若当前生成序列为blank，则前一时刻生成序列只能为blank或者前一个label音素（这里是a）

2）若当前生成序列为重叠音素，例如‘hello’中的‘ll’时，也就是当前生成序列与s-2音素重叠 $\left ( l^{'}\left ( s \right )=l^{'}\left ( s-2 \right )\right )$ ，则不能从前一时刻的s-2序列顺接过来，因为中间必须隔着blank，且该blank在变换中保留，因此前一时刻为blank（%a）或者仍然为当前音素（aa）

因此该种情况下有：

$a_{t}\left ( s \right )=\left [ a_{t-1}\left ( s \right )+a_{t-1}\left ( s-1 \right ) \right ]\cdot y_{l_{s}^{'}}^{t}\, \, \, \, \, \, if\, l_{s}^{'}=b\, or\, l_{s}^{'}=l_{s-2}^{'}$

Case 2:

该种情况为 $l^{'}\left ( s \right )\neq l^{'}\left ( s-2 \right )\right$ 时，当前时刻输出序列为音素b（如图），则可从前一时刻的前一字符（ab），blank（%b），当前字符（bb，重复字符将在变换中消去）顺接过来。

因此该种情况下有：

$a_{t}\left ( s \right )=\left [ a_{t-1}\left ( s \right )+a_{t-1}\left ( s-1 \right )+ a_{t-1}\left ( s-2 \right )\right ]\cdot y_{l_{s}^{'}}^{t}$

论文中得出最后的似然值为：

这个理解的话，对于最后一个时间T时刻，对照最上面那个黑白圈的图，就是最后一个元素为最后一个标签序列值（黑圈）或者为blank（白圈）的所有路径概率之和就是整体的似然值。

类似前向计算，定义后向计算

则有：

5.梯度计算

下面，我们利用前向、后向计算的 $\alpha$ 和 $\beta$ 来计算梯度。为了训练能够进行，我们期望得到 $\large \tfrac{\partial p\left ( l|x \right )}{y_{k}^{t}}$ ，再根据反向传播得到 $\large \tfrac{\partial p\left ( \pi|x \right )}{\partial w}$

根据 $\large \alpha _{t}^{s}$ 、 $\large \beta _{t}^{s}$ 定义我们易得：

则有：

所以可得似然：

为计算 $\large \tfrac{\partial p\left ( l|x \right )}{y_{k}^{t}}$ ，观察上式右端求各项，仅有 $\large s=k$ 的项包含 $\large y_{k}^{t}$ ，因此，其他项的偏导为0，不需要考虑，于是有：

利用除法的求导准则有：

注： $\large \alpha _{t}^{k}$ 与 $\large \beta _{t}^{k}$ 各包含一个 $y_{k}^{t}$

中可能包含多个字符，它们计算的梯度要进行累加，因此，最后的梯度计算结果为：

其中， $\large lab\left ( l,k \right )=\left \{ s:l_{s}^{'}=k \right \}$

不过我们一般优化似然函数的对数，也就是上文提到的最小化目标函数： $O^{ML}\left ( S,N_{w} \right )=-\sum _{\left ( x,l\in S \right )}ln\left (p \left ( l\left \right |x \right ) \right )$

因此可以得到

在实际训练中为了计算方便，将CTC和softmax的梯度计算合并，原论文中提到一个参数 $u_{k}$ 是unnormalized output，我理解的就是在网络模型在最后一层softmax层之前一层的输出，即：

由此式容易求得，其中当取1，其他时候取0.

定义

于是有，，然后即可推导：

$\begin{align} \frac{\partial O}{\partial u_k} &= \sum_j \frac{\partial O}{\partial y_j} \frac{\partial y_j}{\partial u_k} \\&= \sum_j \frac{\partial (-\ln p)}{\partial y_j} \frac{\partial y_j}{\partial u_k} \\&= - \frac{1}{p} \sum_j \frac{\partial p}{\partial y_j} \frac{\partial y_j}{\partial u_k} \\&= - \frac{1}{Z} \sum_j \frac{s_j}{y_j} \cdot y_j (\delta_{jk} - y_k) \\&= - \frac{1}{Z} (s_k - \sum_j s_j y_k) \\&= y_k - \frac{s_k}{Z} \end{align}$

这正是原文中的16式，这个结果似乎可以直观理解。（实际上是）是仅观察时刻输出层时，输出符号的概率；是从整体上看，所有路径中，在时刻输出符号的那些所占的概率比例。当网络参数取最优值时，梯度等于 0，即，也就是说这两个东西应该相等，也就是局部和整体一致？

三.keras中的ctc loss实现

项目框架用的是keras，keras自带ctc loss，但是由于从backend import，需要Lambda层来自定义损失函数。

看一下官方文档：

ctc_batch_cost(y_true, y_pred, input_length, label_length)

y_true：形如(samples，max_tring_length)的张量，包含标签的真值
y_pred：形如(samples，time_steps，num_categories)的张量，包含预测值或输出的softmax值
input_length：形如(samples，1)的张量，包含y_pred中每个batch的序列长
label_length：形如(samples，1)的张量，包含y_true中每个batch的序列长

可以看到，这里的标签真值y_true是不需要进行one-hot处理的，这是因为函数内部自带稀疏处理，其实就是调用了这个函数：ctc_label_dense_to_sparse。具体的可以看源码。

此外由于数据量太大，采用数据生成的方法进行训练，也就是fit_generator函数进行训练，参数

generator：生成器函数，生成器的输出应该为：

一个形如（inputs，targets）的tuple
一个形如（inputs, targets,sample_weight）的tuple。所有的返回值都应该包含相同数目的样本。生成器将无限在数据集上循环。每个epoch以经过模型的样本数达到samples_per_epoch时，记一个epoch结束。

这里要求从数据生成器中返回的数据为（inputs,targets），但是采用ctc损失函数时，标签真实值已经作为网络输入了，网络输入应该为（data_input,y_true,input_length,label_length），这里还要求返回一个targets，只要返回和标签尺寸一致的矩阵即可通过keras的检验，yield [x,y,input_length,label_length],np.ones(batch_size)即可啦。

机器学习之向量化珠峰日记 AI理论与实践机器学习人工智能
文章目录向量化是什么为什么要向量化提升计算效率简化代码与增强可读性适配模型需求怎么做向量化数据预处理特征提取特征选择向量构建机器学习与深度学习中向量化的区别数据特征提取方式机器学习深度学习模型结构与复杂度机器学习深度学习计算资源需求机器学习深度学习数据规模适应性机器学习深度学习向量化是什么向量化是把数据转化为向量形式进行表示与处理的过程。在机器学习与深度学习的范畴内，现实中的各类数据，像文本、图像
【重回基础】理解CPU Cache及缓存一致性MESI Patrick_Lam 重回基础 CPU Cache MESI 缓存一致性
文章目录一、前言二、为何需要CPUCache三、L1、L2、L3Cache三级缓存结构四、CacheLine：与内存数据交换的最小单位五、MEIS：缓存一致性5.1底层操作5.2MESI协议参考一、前言原打算重新学习一下volatile的实现原理，其中涉及到指令调度重排和数据可见性保证，这两者的理解离不开对CPUCache的掌握，因此，先重温一下CPUCache，便有了本文。二、为何需要CPUCa
从零精通机器学习：线性回归入门吴师兄大模型 0基础实现机器学习入门到精通机器学习线性回归人工智能 python 算法回归开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
lxml学习笔记 weixin_33843409 python
问题1：有一个XML文件，如何解析问题2：解析后，如果查找、定位某个标签问题3：定位后如何操作标签，比如访问属性、文本内容等fromlxmlimportetree->导入模块，该库常用的XML处理功能都在lxml.etree中requests+lxml解析小from lxml import etree import requests page = 1 url = 'http://www.
lxml模块的学习 bad kid's cute lxml模块 lxml模块 python 爬虫
1.lxml的认识在前面学习了xpath的语法，那么在代码中我们如何使用xpath呢，对应的我们需要lxm博文链接：xpath和lxml类库安装方式：pipinstalllxml2.lxml的使用1.导入lxml的etree库(导入没有提示不代表不能用)fromlxmlimportetree2.利用etree.HTML，将字符串转化为Element对象,Element对象具有xpath的方法,返回
python技巧之下划线老虎也淘气 Python编程掌握指南 python django 开发语言
‍♂️个人主页@老虎也淘气个人主页✍作者简介：Python学习者希望大家多多支持我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注python技巧之下划线1、python的moudles文件中__all__作用2、__slots__用于限定类属性，如：3、下面的小技巧可以获取私有变量：4、下划线种类单个下划线（_）单下划线前缀的名称（例如_shahriar）双下划线前缀的名称（例如__s
大模型黑书阅读笔记--第一章 53年7月11天大模型黑书笔记人工智能自然语言处理语言模型
cnn,rnn达到了极限，憋了三十年（这段时间已经有注意力了，并且注意力也加到了cnn，rnn中，但没啥进展）憋来了工业化最先进的transformertransformer的核心概念可以理解为混合词元（token），rnn通过循环函数顺序分析次元，而transformer模型不是顺序分析，而是将每个词元与序列中其他词元关联起来。为突破cnn的极限，注意力的概念出来了：cnn做序列处理时只关注最后
AI学习第二天--监督学习半监督学习无监督学习 iisugar 机器学习支持向量机人工智能
目录1.监督学习（SupervisedLearning）比喻：技术细节：形象例子：2.无监督学习（UnsupervisedLearning）比喻：技术细节：形象例子：3.半监督学习（Semi-SupervisedLearning）比喻：技术细节：形象例子：4.三者的对比与选择表格总结：5.实际案例对比案例：电商平台用户分群6.关键逻辑总结1.监督学习（SupervisedLearning）比喻：老
使用 Docker 部署 Prometheus + Grafana 监控平台 2401_84048398 程序员 docker prometheus grafana
一、Prometheus简介==================================================================================Prometheus（普罗米修斯）是一套开源的监控&报警&时间序列数据库的组合，由SoundCloud公司开发。Prometheus基本原理是通过HTTP协议周期性抓取被监控组件的状态，这样做的好处是任意组件
聊聊Python都能做些什么 ·零落· Python入门到掌握 python 开发语言
文章目录一、Python简介二、Python都能做些什么1.Web开发2.数据分析和人工智能3.自动化运维和测试4.网络爬虫5.金融科技三、Python开源库都有哪些1.Web开发2.数据分析和科学计算3.机器学习和深度学习4.网络爬虫5.自动化和测试6.其他常用库四、相关链接一、Python简介Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。它最初由GuidovanRossu
基于改进ISODATA算法的负荷场景曲线聚类（matlab代码）电力程序小学童聚类 matlab ISODATA算法风电光伏
目录1主要内容聚类中心选取步骤核方法2部分代码3程序结果4程序链接1主要内容程序复现文献《基于机器学习的短期电力负荷预测和负荷曲线聚类研究》第三章《基于改进ISODATA算法的负荷场景曲线聚类》模型，该方法不止适用于负荷聚类，同样适用于风光等可再生能源聚类，只需要改变聚类的数据即可，该方法的通用性和可创新性强。该代码实现一种基于改进ISODATA算法的负荷场景曲线聚类方法，代码中，主要做了四种聚类
软件设计师之编译原理核心知识深度剖析：从词法到语法分析一杯年华@编程空间软考中级软考中级
软件设计师之编译原理核心知识深度剖析：从词法到语法分析在软件开发的知识体系中，编译原理是极为关键的一环，它就像一座桥梁，连接着人类可读的程序代码与计算机能够执行的机器指令。我写这篇博客的目的，是希望和大家一起学习进步，深入剖析编译原理中的词法分析和语法分析等核心知识，让这些复杂的概念变得通俗易懂，助力大家在软件设计领域更上一层楼。一、词法分析相关知识（一）正规表达式与正规集正规表达式是描述词法规则
NLP高频面试题（四）——BN和LN的区别与联系，为什么attention要用LN Chaos_Wang_ NLP常见面试题自然语言处理人工智能
在深度学习模型中，Normalization是一种极为重要的技巧，BatchNormalization（BN）和LayerNormalization（LN）是其中最为常用的两种方法。然而，二者在实际应用中有着明显的区别与联系，尤其在Transformer的Attention机制中，LN有着独特的优势。一、BN与LN的核心区别与联系1.BatchNormalization(BN)BN的思想源于一个叫
HTML入门 Yeauty html
HTML的概述什么是HTML:HyperTextMarkupLanguage超文本标记语言超文本:比普通文本更加强大,能够定义许多文本样式标记语言:通过一组标签来对内容进行标记,并且修饰-标签:为什么要学习HTML它是网页设计的设计,基本上所有的网站都是用它开发的如何来学习HTMLHTML语法规范HTML是一个.html或者.htm结尾的文件HTML文件中是头和体两部分HTML是通过一组标签来对内
《基于机器学习的负荷曲线聚类算法对比与改进：K-L-isodata的创新性研究》 TWHiwhjig 机器学习算法聚类
基于机器学习的负荷曲线聚类包括kmeansisodata和改进的L-isodata以及在其基础上再次进行改进的K-L-isodata(有创新性)，四者通过评价指标进行了对比精品代码可修改性极高有参考文献ID:93150688324967700自律的电气人基于机器学习的负荷曲线聚类是一种基于数据分析和模式识别的技术，它可以帮助我们对系统的负荷变化进行分类和理解。在负荷曲线聚类的研究中，K-means
机器学习Pandas_learn4 XW-ABAP 机器学习机器学习 pandas 人工智能
importpandasaspddefcalculate_goods_covariance():#定义商品销售数据字典goods_sales_data={"时期":["一期","二期","三期","四期"],"苹果":[15,16,3,2],"橘子":[12,14,16,18],"石榴":[11,8,7,1]}#将字典转换为DataFrame对象goods_dataframe=pd.DataFra
蓝桥杯Python赛道备赛——Day8：动态规划（基础）案例分析 SKY YEAM 蓝桥杯备赛蓝桥杯 python 动态规划
本博客就上一期中讨论的蓝桥杯动态规划基础问题（包括：递推、记忆化搜索、最长公共子序列和最长上升子序列），给出了六个常见的案例问题。每一个问题都给出了其求解方法的示例代码，以供低年级师弟师妹们学习和练习。如有不懂，欢迎在评论区提问。前序知识：（1）Python基础语法（2）Day1：基础算法（3）Day7：动态规划（基础）动态规划（基础）案例分析一、递推应用：爬楼梯问题二、递推应用：零钱兑换三、记忆
如何使用Python对Excel、CSV文件完成数据清洗与预处理？ Python 集中营 python数据分析应用 python excel 开发语言
在数据分析和机器学习项目中，数据清洗与预处理是不可或缺的重要环节。现实世界中的数据往往是不完整、不一致且含有噪声的，这些问题会严重影响数据分析的质量和机器学习模型的性能。Python作为一门强大的编程语言，提供了多种库和工具来帮助我们高效地完成数据清洗与预处理任务，其中最常用的库包括Pandas、NumPy、SciPy等。本文将详细介绍如何使用Python对Excel和CSV格式的数据文件进行清洗
AI：188-利用Python进行自然语言生成和文本摘要一键难忘 python 开发语言人工智能自然语言处理
本文收录于专栏：精通AI实战千例专栏合集https://blog.csdn.net/weixin_52908342/category_11863492.html从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践都有参考学习意义。每一个案例都附带关键代码，详细讲解供大家学习，希望可以帮到大家。正在不断更新中~一.利用Python进行自然语言生成和文本摘要近年来，人工智
理解深度学习1-简介 shangjg3 PyTorch深度学习实战深度学习人工智能
人工智能（AI）旨在打造模仿智能行为的系统。它覆盖了众多方法，涵盖了基于逻辑、搜索和概率推理的技术。机器学习是AI的一个分支，它通过对观测数据进行数学模型拟合来学习决策制定。这个领域近年来迅猛发展，现在几乎（虽不完全准确）与AI同义。深度神经网络是一类机器学习模型，将其应用到数据上的过程称为深度学习。目前，深度网络是最强大和最实用的机器学习模型之一，常见于日常生活中。我们常常用自然语言处理（Nat
【Python】字符串的常用方法 myjzwsz python 开发语言
Python的字符串是一种不可变序列类型，提供了许多内置的方法来处理文本数据。下面是一些常用的字符串方法：str.lower()-将所有字符转换为小写。str.upper()-将所有字符转换为大写。str.capitalize()-首字母大写，其余字母小写。str.title()-每个单词的首字母大写。str.swapcase()-大小写互换。str.strip([chars])-移除字符串头尾指
【实习经历Two:参与开源项目，学习并应用Git】学前端的小乐子开源社区实习记录学习 git
前端参与开源项目中使用过的git1.参与开源项目（必备技能——git)参与开源项目首先需要进入自己想参加的项目页面点击右边的Fork即可复制到自己的仓库像个人开发时常用的add、commit和push等命令就不过多介绍了，在这里主要是想记录一下自己作为从未参与过开源项目的初学者遇到的一些常用知识点，很感谢本人这次实习的mt老师很有耐心地帮助我解决使用Git过程中遇到的一些问题。a.如何在commi
从入门到精通： C#100个关键技术关键词 _老码从入门到精通 c#开发语言
C#是一种强大而灵活的面向对象编程语言，由Microsoft在2000年创建，主要用于.NET框架。通过掌握本指南中的100个关键技术关键词，你将逐步了解C#的核心概念、基本语法、面向对象编程、异常处理、文件操作、标准库等方面的知识。每个关键词都配有详细的注释，帮助你轻松理解和应用。让我们一起开始这段精彩的C#学习之旅吧！基础概念C#-一种面向对象的编程语言，由Microsoft在2000年创建，
代码随想录第五十三天| 102.沉没孤岛 105.有向图的完全可达性 106.岛屿的周长 kill bert 代码随想录算法训练营 java 算法数据结构
字符串转换序列题目描述给定一个字符串beginStr和一个字符串endStr，以及一个字典strList。找到从beginStr到endStr的最短转换序列中的字符串数目。转换规则如下：序列中第一个字符串是beginStr。序列中最后一个字符串是endStr。每次转换只能改变一个字符。转换过程中的中间字符串必须是字典strList中的字符串，且每个字符串只能使用一次。如果不存在这样的转换序列，返回
25_3_17 python进阶学习契合qht53_shine 学习 python 开发语言
学习内容：1.1函数的定义在python中函数是指可以重复执行的语句块，可以重复调用，作用是为了封装语句块,提高代码的重用性，函数是面向过程编程的最小单位1.1.1def语句def语句的作用是用来定义（创建）函数的注意：1.函数代码块以def关键词开头，后接函数标识符名称和圆括号()2.函数名是一个变量，不要轻易对其赋值3.函数有自己的名字空间，在函数外部不可以访问函数内部的变量，在函数内部可以访
【资料分享】标准规范汇总(2025.3.13更新) 交换机路由器测试之路网络协议网络协议国标行标 ITU TR069 802.11 IEEE
引言学习标准规范不仅是测试人员的基本职责，也是确保测试质量、提升产品竞争力和降低风险的关键。通过掌握和应用标准规范，测试工作可以更加规范、高效和权威，为产品和项目的成功提供有力保障。本文分享交换机路由器测试中涉及到标准规范。国标行标国家标准由国家市场监督管理总局和国家标准化管理委员会负责管理，代号为GB（国标拼音首字母），分GB（强制性标准）和GB/T（推荐性标准）。通信行业标准是针对通信技术和设
【Java】已解决：`java.sql.SQLSyntaxErrorException: SQL` 屿小夏 java sql 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
springboot一课一得 POlse springboot
SpringBoot学习之路：从基础到进阶SpringBoot是基于Spring框架的一个开源项目，它通过简化配置、自动化功能以及集成多种开箱即用的技术，使开发者能够更快地开发、测试和部署Java应用程序。它不仅减少了开发者的配置工作量，还为开发者提供了很多与生产环境相关的功能，使得SpringBoot成为现代Web开发、微服务架构和企业级应用开发的首选框架。本文将基于“SpringBoot一课一
AIGC带来数据革命：R语言如何成为数据科学家的秘密武器？程序边界 AIGC r语言开发语言
文章目录一、R语言的基础特性1.1R语言的起源与发展1.2R语言的核心优势二、R语言在AIGC中的应用场景2.1数据预处理与清洗2.2文本分析与生成2.3机器学习与模型构建2.4数据可视化与报告生成三、R语言在AIGC中的具体案例3.1金融数据分析与预测3.2医疗数据分析与建模3.3社交媒体数据分析与情感分析四、R语言在AIGC中的未来展望4.1与深度学习框架的集成4.2与云计算平台的集成4.3与
5大陷阱+实战：C#日志分析，从‘日志迷宫’到‘监控神殿’的逆袭全攻略！墨瑾轩 C#乐园 c#网络开发语言
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣你的日志还在‘打哑谜’吗？“错误日志像‘天书’读不懂？监控告警像‘哑巴’不发声？”——别慌！今天用C#日志分析，让你的系统像“福尔摩斯”一样精准破案，从实时监控到根因定位，从此告别“黑盒运维”！权威背书：日志分析≠‘抄作业’！“90%的故障因‘日志解析缺失’导
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置