BarbaraChow

语音识别入门

语音识别（Automatic Speech Recognition， ASR）

引言

语音识别： 将语音识别成文本。
微信上的语音转为文字功能。还有一些语音助手，Siri，Cortana，小度，小爱同学等等。

语音是声音的一种。声音是由振动产生的，通过空气传播到达耳朵，空气的某些地方稠密，有些稀疏，不断变化，声波到达耳朵。

振动的快慢，就是频率。人耳能听到的频率范围：20Hz-20000Hz。
语音是种特殊的声音，为什么呢？因为它是人发出的声音，里面包含了丰富的信息。其他声音不含任何信息的叫作噪音。

语音是高度结构化的振动。总的来说，它是一种既随机，又具有极强的规律性，结构性的信号。语音是极至浓缩的信息源。内容、情感、说话人、年龄等等信息都在里面。

这是耳蜗，人耳对声音的感知原理。

基于语音的人机交互：
传统的人机交互仍有局限（只用键盘鼠标），希望实现更自由、更自然的沟通（行为，表情，语言，生理信号等）。
语音是下一代人机交互的核心（用语言传递的信息比其他方式更多）。

语音识别，是人机交互中最重要的技术之一。（包括：关键词检出、设备唤醒、语音翻译等）

语音识别

基础知识

语音信号处理基础可参考我其他博客。

把每一段时域的波形变换到频域，就得到语谱图。
如下图，上面波形，下面对应的语谱图。这是宽带语谱图，所以其中明显的黑条纹就是共振峰。

大家可以想象一下吹笛子的过程，类似人的发音过过程（准确说是萧，因为笛子两头开口，萧只有一头）。
吹笛子时，声音在笛子空腔内型形成功共鸣，使得某些频率被加强，某些频率被减弱，加强或减弱哪些频率取决于笛子的哪个孔被堵住。也即是说笛子声音的共振峰对应不同的孔，语音的共振峰对应不同的口型。口型又对应着说了什么话。
所以，共振峰代表了说了什么话。

世界上第一个ASR系统（1952年）：
识别0-9的10个数字。横轴第一共振峰F1，纵轴第二共振峰F2.。

那共振峰就可以识别，ASR这件事是不是就结束了？
实际不是。还存在如下问题。一直到如今2022年，70年过去了，ASR仍然是一个很热的研究领域。

那这么多困难，一下也很难解决，我们就只关注核心困难。
主要有下面三点：

不确定性：同一个人发一个单词不一样，不同情绪，不同环境下发也不一样。比如下图两个波形都是”你们“，但完全不一样。

序列化：
1.”你们好啊“这四个字，波形上有上万个点的序列，但只对应了4个字的序列。所以怎么对齐？也算是个关键问题。
2.发音前后有相关性，语言的相关性，所以是有序性的。

知识融合：单靠波形、频谱很难识别出语音中的信息，还需要借助语言、语义信息。比如，每个字都懂，连成一句话就不懂了。

ASR早期：模式匹配方法

基于线性预测（LPC）的共振峰特征：
考虑人的发音过程，基于源-滤波模型，喉头产生的激励，通过口腔等器官的调制，产生了不同语音。那么已知语音，就用一个逆滤波产生激励，和声道信息（共振峰）。

得到共振峰后，还需要考虑两个序列的对齐：
如果模板里是比较长的发音，实际发的音比较短，就涉及对齐问题，提出了DTW算法。（详细我博客有）

总结：

ASR中期：统计模型方法

如果系统比较复杂呢，每句话都需要一个模板，需要很多个模板，模板匹配方法就不现实了。所以把模板就总结成了一个统计模型。这样就到80年代。

特征：
也提出了更复杂的特征，MFCC（详细见我其他博客）。

根据人耳对不同频率的听觉感知，设计了梅尔滤波器组。

MFCC：更具有分区性的特征。
可以看到，对不同的音，MFCC取出其中三维，画出图，该特征对不同音具有很强的区分性。

但对狗叫声、猫叫声、男的女的声进行MFCC特征提取，发现该特征在空间中一片混乱，说明它对发音的特性不敏感，只对发音内容相关。

模型：
用概率模型描述语音生成过程的不确定性。
最经典的GMM-HMM模型。

隐马尔可夫模型HMM：描述不定长序列
将发音过程描述成状态，小圈代表开头和结尾状态。每个状态有一定概率停留，也有一定概率变到下一个状态，所以就可以表示各种长度的序列（太长的序列，大不了在某个状态多停留会）
高斯混合模型GMM：描述不确定性
多个高斯模型混在一起，就能描述非常复杂的分布。

利用HMM + GMM 模型，先描述再推理。
每个音在发音空间的分布都可用一个GMM描述。
语言模型：引入语言信息

N-gram语言模型：

常见的比如，在搜索引擎里输入“我们”，就会出现下面的可能的搜索。

一般来说语言模型不限形式。最简单的方式，把一个句子分解，就是看每个词在大的语料库中所占比例。但如果句子很长，就很难，所以就拆解成片段。这就是N-gram模型。
N = 2,或3等等。N=2如：已知两个字，推下两个字。

N-gram是一个生成模型，可以从无到有的生成文字段落等。

理论基础确立：
A是语音，W是文本。求P(W|A)，根据贝叶斯公式，就等价于求如下：如果声学模型P(A|W)和语言模型P(W)都是精确的，那么基于该公式得到的结果就是最优的。

此时可以识别连续的句子了，而不是孤立词了。
词典：知道一个词是由哪些音素组成的。
上下文规则：和上下文相关的发音（音素状态）。

这种方式写系统太复杂，出现了如下方法：
把之前的映射变成有限状态转移机的结构。

现代ASR的解码过程本质是一个搜索过程：给定一段语音，在所有可能的句子里找到和该语音最匹配的句子。

这样ASR过程就简化了很多。

总结：

这个阶段ASR表面看好像发展的很好了，实际还存在几个问题：

细想想，一切都很肤浅…
所以2011年深度学习引入了语音识别。

ASR当前：深度学习方法

可以看到下图，纵轴是错误率，横轴是年份，随着技术的发展，2010年后ASR系统的错误率越来越低，甚至低于人类（人识别错误率在5%左右）

回顾问题一：不确定性

但随着深度学习的发展，人们发现DNN提取的声学特征（鲁棒性）具有更强的任务相关性，更宽的上下文（原来只是一帧或上下几帧），层次学习获得更强的抽象性和不变性（即使加入噪音，提取的特征也不会受影响，因为抽象所以不易变）。
之前人工设计的特征只是人们拍脑袋想出来的，性能好坏不好说，可扩展性不好。

用DNN代替了GMM计算似然值。
下面是GMM的一个音素的分布，GMM易混淆，区分性不强。

所以用DNN后验概率代替GMM计算似然值。2011-2014年，流行的是混合hybrid=HMM+DNN模型。

回顾问题二：序列识别问题
hybrid模型未解决序列问题，还是在用HMM离散建模。等2014后，提出了RNN模型解决序列不定长问题。

RNN优点：

解读：

状态连续：更好的描述语音信号连续的变化过程。
时序累积性：一个输入和下一个输入相关，前后相关。
端到端：不仅学习了帧之间声学相关性，还学习了长时的语言模型需要的相关性。

目前经典的两种RNN序列模型：

CTC：引入空字符实现不定长匹配（HMM只是在某个状态进行不定时长的循环）
Seq2seq+attention：模型内部学习对齐过程。

回顾问题三：引入语言信息

“我被鱼”已经累积到状态里了，来预测下一个字。

总结：

深度学习语音识别发展历程

随着深度学习技术的发展从 2012 年开始，语音识别技术经历了革命性的变化，基本可概括为三个阶段：

基于 DNN-HMM（深度神经网络 - 隐马尔科夫模型）的语音识别
基于 CTC（连接时序分类）的端到端语音识别
基于 Attention 的端到端语音识别

首先从 HMM+DNN 系统升级到 HMM+CNN/LSTM 系统，再升级到后来的 CTC 系统，近两年则逐渐转为基于 Transformer 的纯端到端系统。
与传统的 DNN-HMM 混合模型相比，端到端语音识别系统指的是，省略掉了 GMM-HMM 系统得到对齐信息和上下文相关音素的步骤，无需多次迭代，直接从神经网络开始训练。主要包括连接时序分类（CTC）模型、递归神经网络转换器（RNN-T）模型、基于注意力机制的序列到序列（Attention based Seq2Seq）模型。传统与端到端算法对比：

问题：
1.端到端技术的好处？
传统语音算法在不同语种识别基础建模单元上，语言学信息是不一样的，如汉语是基于拼音的声母韵母、英语则是英文的音素，这种技术架构对指定语种的语言学知识依赖较大，也难以扩展到多语种识别。端到端技术用统一的网络进行建模，尽量减少语种相关的发音词典编辑、建模单元选择等工作，基于数据驱动而非语言学信息来构建系统，这样后续成果也可以快速迁移到其他语言上。

2.端到端技术的局限？
由于是纯数据驱动，端到端语音识别系统没有充分利用到先验的各种语言学知识，在实际使用场景下想要达到比较好的效果，相比于传统算法需要更多的标注数据来做模型训练，虽然系统构建简化了但数据收集难度上升了；而且和其它深度学习系统类似，模型的可解释性不高，错误样例的分析与优化难度大；此外，目前的端到端技术都是序列到序列的映射，缺少传统系统中逐帧分类的信息，因此对于一些需要非常精确的时间对齐信息的场景并不适用。

3.目前较新端到端模型Transformer
在端到端这个技术体系内，对于语音识别这种序列到序列（Seq2Seq）问题，参考机器翻译的经验以及业界最近的论文成果，Transformer 网络结构相比其它结构有更好的性能。采用基于注意力（Attention）机制的 Transformer 网络结构，并做了各种细节优化，如引入多任务学习机制（Multi-Task Learning），在编码端加入 CTC 损失函数，加速模型收敛，同时在解码时利用 CTC 得分避免 Attention 错误；在解码端引入逐字的语种分类任务，加强模型对语种的区分能力。

当前主流网络

声学模型：

当前主流的深度学习语音识别系统中用于声学模型建模的神经网络的结构主要有三种：

递归神经网络（Recursive neural network, RNN）
核心思想是同一层中当前时刻的隐层输出的计算需要依赖于上一时刻的隐层输出。
简单的递归神经网络由于梯度消失的问题，能够看到的历史信息十分有限，通常经过十几次的递归之后梯度就消失为零了。因此，目前主流的递归神经网络通常都带有门控结构，保证梯度在递归的过程中不会那么快的消失，其中比较典型的结构是长短时记忆模型和门控循环单元GRU结构。
卷积神经网络（Convolutional neural network, CNN）
核心思想在于卷积和池化两个操作。
卷积操作的连接方式是局部连接，因此可以获取对于局部结构信息的精确表达，而池化操作则通过降低分辨率的方式，配合卷积操作克服局部信息本身不够稳定的问题。通过对语谱图不断的进行卷积和池化操作，卷积神经网络看到的语音特征时间和频域上的跨度不断增加，整个神经网络建模的尺度也逐渐的从局部变为整体。这种从局部到整体的建模方式可以对语音特征中谐波、共振峰等信息进行非常精确的建模，从而提升音素状态的区分性。

当然也可以结合这两种，通过级联或并联，如2015年的CLDNN。

Transformer神经网络
核心思想在于使用了一种自注意力机制代替卷积或者递归操作来实现对长时上下文的建模，通过不断叠加前馈层和自注意力层，不断的增强对长时上下文的表达。
由于采用了一种基于内容的相似性度量来表示相邻帧之间的相关性，自注意力机制对于窗口内的所有语音巾贞都是一视同仁的，不存在递归神经网络的梯度消失问题，相比之下能够看到更加长时的上下文信息。相比卷积神经网络，自注意力机制中相邻帧之间的连接权重不是一个固定的参数，而是通过内积的方式计算得到的，从而能够大幅减少参数量，使得模型更加的紧致。

语言模型：（两种）

N-gram语言模型：基于N阶马尔科夫假设，认为当前词出现的概率只和前面历史的N-1个词相关。
神经网络语言模型
早期是前馈神经网络结构。当前主流是RNN语言模型。

实际应用中，对于高频的、常用的词或者词串来说，N-gram的概率会更加的可信，而对于相对生僻的词串来说，神经网络语言模型的输出概率会更加可信，因此，我们会同时使用这两种语言模型。为了减少计算量，通常会采用两遍解码的策略，先利用N-gram语言模型解码得到多条候选识别结果（N-best），然后再利用神经网络语言模型和N-gram语言模型的平均输出概率来对N-best进行重排序。

研究前沿

目标标注数据较少，所以引入自监督。SOTA。
不同的语音任务，不同的语音信息在统一空间表示。
TTS和ASR结合等

那基于深度学习的ASR存在哪些问题呢？

比如1万条数据，其中大多数数据都是常见数据，少见数据的比例很低，所以训出的模型对常见数据擅长，对少见数据不好处理，这就是统计偏置问题。
ASR怎么解码出来的文本具体处理过目前还不清楚。
模型对不同人群有不同表现，是否会受黑客攻击之类的。

智慧水库信息化系统建设产品需求文档V2.0 小赖同学啊 test Technology Precious 物联网
智慧水库信息化系统建设产品需求文档1.引言1.1文档目的本文档旨在明确智慧水库信息化系统的建设需求，为系统设计、开发和实施提供全面依据，确保系统功能满足水库管理业务需求，提升水库管理的智能化水平和决策效率。1.2背景介绍传统水库管理面临数据采集不及时、分析手段有限、决策依赖经验等问题，难以应对复杂多变的水文情势和日益增长的管理需求。随着物联网、大数据、人工智能等技术的发展，智慧水库建设成为必然趋势
从零开始学 Linux：循序渐进的学习指南我爱学嵌入式 Linux基础 linux 服务器
Linux作为一款开源、稳定且安全的操作系统，在服务器领域、嵌入式开发、云计算等场景中占据着举足轻重的地位。对于程序员、运维工程师或IT爱好者而言，掌握Linux技能已成为一项核心竞争力。但面对命令行界面和复杂的系统架构，很多初学者往往感到无从下手。本文将为你梳理一条清晰的Linux学习路径，助你从入门到精通。一、明确学习目标：为什么学Linux？学习Linux前需明确目标，不同目标对应不同的学习
黄仁勋链博会演讲实录：脱掉皮衣，穿上唐装，中文开场
黄仁勋一度尝试用中文开场，他说，“我在美国长大，学到了很多汉语。”他表示，像DeepSeek、阿里巴巴、MiniMax、百度，他们开发的产品都是世界级的，推动了全球人工智能的发展。中国的开源AI是全球进步的催化剂，以至于全世界各个行业都有机会加入到AI革命当中。7月16日，黄仁勋身着唐装出席了第三届链博会，在此之前，他身着标志性皮衣出席多个场合活动。在此之前，英伟达官宣获得H20芯片对华的出口许可
【AI 赋能：Python 人工智能应用实战】5. 梯度下降家族：SGD/Adam优化器对比实验与选择策略 AI_DL_CODE 人工智能 python 梯度下降优化器 SGD Adam PyTorch
摘要：本文系统解析梯度下降优化器的核心原理与演进脉络，构建从理论到实战的完整知识体系。理论部分梳理优化器发展里程碑，从1951年的SGD到2018年的AdamW，揭示技术迭代逻辑；通过数学公式对比SGD、Momentum、Adam等核心算法的更新机制，解析动量加速、自适应学习率的创新点。结合损失曲面分析，阐释Momentum如何逃离鞍点、Adam如何处理悬崖梯度。实战模块基于PyTorch在MNI
【人工智能之深度学习】6. 卷积核工作原理：从边缘检测到特征抽象的逐层演进（附可视化工具与行业实战代码） AI_DL_CODE 人工智能深度学习卷积核特征提取卷积神经网络边缘检测特征可视化
摘要：卷积核是卷积神经网络（CNN）的核心组件，其通过局部感受野与参数共享机制实现高效特征提取。本文从数学本质出发，揭示卷积操作的空域-频域对偶性：空域卷积等价于频域乘积（F{f∗g}=F{f}⋅F{g}F\{f*g\}=F\{f\}⋅F\{g\}F{f∗g}=F{f}⋅F{g}），解释边缘检测核（Sobel、Laplacian）的频域响应特性。通过特征可视化实验表明，CNN特征呈现逐层抽象规律：
颠覆未来：创新代码引领人工智能与量子计算深度融合金枝玉叶9 程序员知识储备1 程序员知识储备2 程序员知识储备3 人工智能量子计算
摘要在信息时代飞速演进的背景下，人工智能与量子计算正以前所未有的速度互相融合，推动着科技边界的不断拓展。本文回顾了经典算法的智慧，展示了前沿深度学习模型的构建，并通过量子电路设计探讨了创新代码的可能性，为探索未来科技变革提供了全新视角。1.引言当前，科技创新正处于高速迭代的关键阶段，传统计算方法与新型技术的交汇处正成为研究热点。人工智能的发展已渗透到各行各业，而量子计算的崛起则为解决复杂计算问题提
【大模型】结构化提示词：让AI高效完成复杂任务的“编程语言” JosieBook AI/大数据/云计算人工智能
文章目录前言：提示词一、不同提示词写作方法对比进阶技巧对比表实战组合策略二、三板斧：精准撰写提示词的黄金法则角色设定：为AI精准定位任务描述：明确行动指南输出要求：规范成果呈现三、魔法棒：零基础也能用的“AI需求翻译机”四、结构化：把提示词写成“可插拔的乐高”五、分治法：把“庞然大物”拆成可并行的小任务前言：提示词在人工智能时代，提示词（Prompt）已成为连接人类意图与AI能力的核心媒介。优质的
新人做娱乐主播好不好，谈谈我的看法糖葫芦不甜
在当今这个数字化时代，娱乐直播已成为一种风靡全球的新兴职业，它不仅为观众提供了丰富多样的娱乐选择，也为无数怀揣梦想的新人开辟了一条通往舞台的道路。免费加入，一对一指导扶持↓对于想要尝试这一领域的新人而言，成为娱乐主播究竟好不好？这既是一个值得深思的问题，也是一段充满未知与可能的探索之旅。以下是我对此的一些看法。机遇篇：梦想的舞台，无限可能**1.低门槛，高曝光：相较于传统娱乐行业，娱乐主播的入门门
人工智能视频分析系统人员离岗报警设计方案 liuhu21 人工智能云计算运维
一、方案概述近几年安防监控技术不断的进步，特别是在人工智能推出之后。安防监控系统结合人工智能算法做到了许多以前无法做到的事情。就比如我们今天要说的离岗检测报警监控系统。以前我们只能通过人工值守监控室的方式，通过人的判断去观看现场人员在岗情况。如今有了离岗检测监控系统，系统可以自动监测现场人员是否在岗、离岗时间以及离岗人数等等。这样，大大减少了监控室值班人员的工作量，同时相较人工监管提升了工作效率。
AI新纪元：2025年深度学习技术突破与行业应用全景像素笔记杂谈人工智能深度学习 ai 自动驾驶工业数字化转型未来趋势技术创新
2025年，人工智能技术迎来爆发式增长，大模型、生成式AI和多模态技术持续突破，人形机器人量产元年正式开启，自动驾驶商业化进程加速，工业数字化转型全面铺开。这些进展不仅重塑了技术边界，更在多个行业创造了实际价值，推动AI从实验室走向产业化。本文将深入剖析2025年深度学习与AI领域的核心技术突破、行业应用案例及未来发展趋势，为技术从业者提供全面视角。一、深度学习核心技术突破：大模型、生成式AI与多
三篇AAAI顶级论文带你一键搞懂多模态！
关注gongzhonghao【计算机sci论文精选】！拿捏更多顶会顶刊发文资讯随着人工智能技术的飞速发展，多模态学习逐渐成为研究热点。多模态技术能够整合文本、图像、语音等多种模态的信息，为人工智能的应用带来了更丰富的语义理解和更强大的交互能力。此外，多模态技术在视频和语言任务中的应用也取得了显著进展。这些技术不仅提升了模型的性能，还为人工智能在更多领域的应用提供了新的可能性。今天小图给大家精选3篇
进阶向:基于Python的智能客服系统设计与实现
智能客服系统开发指南系统概述智能客服系统是人工智能领域的重要应用，它通过自然语言处理(NLP)和机器学习技术自动化处理用户查询，显著提升客户服务效率和响应速度。基于Python的实现方案因其丰富的生态系统（如NLTK、spaCy、Transformers等库）、跨平台兼容性以及易于集成的特点，成为开发智能客服系统的首选。系统架构系统核心包括两个主要功能模块：1.API集成模块负责连接各类外部服务，
计算机视觉产品推荐,个性化推荐:人工智能中的计算机视觉、NLP自然语言处理和个性化推荐系统哪个前景更好一些？...
这个问题直接回答的话可能还是有着很强的个人观点，所以不如先向你介绍一些这几个领域目前的研究现状和应用情况(不再具体介绍其中原理)你自己可以斟酌一下哪方面更适合自己个性化推荐。一．所谓计算机视觉，是指使用计算机及相关设备对生物视觉的一种模拟个性化推荐。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息，就像人类和许多其他类生物每天所做的那样[1]。现在人工智能的计算机视觉主要研究
FunASR Paraformer-zh：高效中文端到端语音识别方案全解
项目简介FunASR是阿里巴巴达摩院开源的端到端语音识别工具箱，集成了多种语音识别、语音活动检测（VAD）、说话人识别等模块。其中paraformer-zh和paraformer-zh-streaming是针对中文语音识别任务优化的端到端模型，分别适用于离线和流式场景。Paraformer采用并行Transformer架构，兼具高精度和低延迟，广泛应用于智能客服、会议转写、语音助手等场景。主要特点
Linux——shell 脚本入门基础知识到实战☆☆☆☆（变量、判断、循环、数组和函数、三剑客）渣渣珲一枚 linux 运维服务器
本文目录第一章变量1.前言2.自定义变量3.整数运算4.小数运算5.环境变量5.1位置变量5.2预定义变量第二章判断1.shell条件测试1.1数值比较1.2文件测试1.3字符串比较1.4and和or2.流程控制：if2.1单分支结构2.2双分支结构2.2多分支结构2.3嵌套结构2.4调试脚本2.5.总结（注意）3.模拟匹配：case3.1前言3.2案例1：简单的模式匹配3.3案例2：简单的Jum
AI如何塑造下一代网络安全防御体系 weishi122 web安全人工智能网络人工智能网络安全威胁检测行为分析漏洞挖掘
AI如何塑造下一代网络安全防御体系随着网络威胁日益复杂化，传统安全措施已难以应对。人工智能(AI)正通过创新解决方案重塑网络安全格局。本文将探讨AI如何推动网络安全革命，并分析实施过程中的关键挑战。日益严峻的威胁形势到2025年，网络犯罪预计将造成全球10.5万亿美元损失。传统防御手段已无法应对快速演变的威胁，这正是AI发挥关键作用的领域。人工智能：新一代数字卫士AI能实时分析海量数据，在威胁发生
新手配音兼职入门指南【专业完整版】配音新手圈
入行配音业数年，自己思索了很久，跟朋友或同行也探讨无数次这个问题——如何利用自己的专业把有用的配音、有声书知识教给别人。而作为刚想入门的新手，面对眼前海量的信息，或许根本不知道从哪里开始，今天这篇文章用任何人都可以看懂的表达方法来全面的解析一下都有哪些配音平台，怎么选择配音平台。1、配音新手圈这是一个公众号配音新手圈里面每天更新配音任务，都是适合没有基础的人去做的，每天都有任务。适合新入门的小白练
【国内超大型智能算力中心建设白皮书 2024】 AI大模型 lose and dream 人工智能开源 git 开源软件 github gitlab 开放原子
文末有福利！智算中心建设通过领先的体系架构设计，以算力基建化为主体、以算法基建化为引领、以服务智件化为依托，以设施绿色化为支撑，从基建、硬件、软件、算法、服务等全环节开展关键技术落地与应用。一、体系架构（一）总体架构图8智算中心总体架构智能算力中心建设白皮书，重点围绕基础、支撑、功能和目标四大部分，创新性地提出了智算中心总体架构。其中，基础部分是支撑智算中心建设与应用的先进人工智能理论和计算架构；
高并发解决方案：SpringBoot+Redis分布式缓存实战 fanxbl957 Web 缓存 spring boot redis
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人高并发解决方案：SpringBoot
SpringBoot缓存技术全解析：Redis+Caffeine二级缓存架构 fanxbl957 Web 缓存 spring boot redis
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot缓存技术全解析：
米信使股票群诈骗真相！郑洪盛国浩盟国一带一路项目就是资金盘不要被骗了！不成功不收费
讲述:郑洪盛国浩盟国慈善投票被骗无法出金真相！套路太深教你该如何避！！骗子引诱人上当方式很简单：先给你一点甜头尝尝，一开始入金能正常提现，也能赚一点，但当投入更多钱时，你发现你的运气开始变差了。所以，荐股类骗局最大的迷惑性是：给受害人一种假象，你是投资亏损的，而不是被骗的！广大市民对此要提高警惕，如果是还没有投资，千万不要抱有侥幸心理，一定要及时远离！一定不要打草惊蛇低碳项目数字体育，人工智能ai
程序员的技术栈及学习路径 Honeysea_70 基础知识学习经验分享笔记
程序员的技术栈是非常多元的，通常涵盖了多个领域和技术。程序员的技术栈通常根据工作需求、项目类型以及个人兴趣的不同而有所不同，但通常会有一定的共性。下面是一个较为典型的程序员的技术栈，以及如何从入门到进阶地学习这些技术。1.编程语言掌握多种编程语言一个资深程序员通常会熟练掌握至少两到三种编程语言，每种语言的侧重点不同，适用于不同的开发场景。主流编程语言：JavaScript：前端开发的核心语言，Re
Filter快速入门 Java web 撰卢 java 前端 hive spring boot
文章目录Filter快速入门登录演示Filter快速入门定义Filter:定义一个类，是实现Filter接口，并重写所有方法配置Filter:Filter类上加上==@WebFilter==注解，配置拦截资源的路径。引导类加上==@ServletComponentScan==开启Servlet组件支持(也就是在springboot的启动类上面加上这个注释)相关代码importjavax.servl
犀水家族办公室理财入门课程七：为什么我的基金一买进去就亏？犀水家族办公室
嗨大家好，老宋又来了，今天我们聊得深入一点，我们只聊一个问题，为什么你的基金一买就亏。很多小伙伴很爱学习，又是买书又是百度又是看视频，学习了很多筛选基金的办法，这指标那指标，什么三个月、半年、三年表现，阿尔法、贝塔一起上，自己在电脑面前精挑细选了一只基金，满怀希望买进去，结果一买进去就蹭蹭蹭下跌？是我智商有问题？其实乱买基金就是自己往火坑里面跳！什么？个股到处是坑，基金也有坑？大了去了，以前没听说
实现大语言模型与应用的无缝对接 meslog 技术分享语言模型 microsoft 人工智能
在当今人工智能快速发展的时代，大语言模型（LLMs）已经成为众多应用的核心驱动力。然而，如何让这些强大的模型与各种数据源和工具进行有效集成，仍然是一个挑战。ModelContextProtocol（MCP）正是为解决这一问题而设计的开放协议，它标准化了应用程序如何向大语言模型提供上下文信息。本文将介绍MCP的基本概念，并通过C#SDK展示如何实现客户端和服务器端的交互。什么是MCP？ModelCo
解决引入TransXNet模块后显存爆炸问题的全面指南 pk_xz123456 算法大数据 python 机器人数据挖掘深度学习
解决引入TransXNet模块后显存爆炸问题的全面指南前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。1.问题背景与现状分析1.1MF-PSN和TransXNet项目概述MF-PSN（Multi-FeaturePyramidStereoNetwork）是一个基于金字塔特征的多特征立体匹配网络，它通过构建多层次的特征金字塔来处理不同尺度的立体匹配问题
零基础入门数据库，万字超详细Sql server期末复习 Heyqings sql
前言本篇主要讲述的是关系型数据库SqlServer，原因也很简单，因为大部分学校还在以sqlserver为教学材料，不过没关系无论是sqlserver、mysql还是oracle,只要是关系型数据库，概念都是相通的，语句也大差不差。关系型数据库是一种采用关系模型来组织数据的数据库系统。它将数据存储在表格形式的结构中，通常称为表。这些表由行和列组成，每一行代表一条记录，每一列代表一个字段。关系型数据
《出苍茫》五五零奇怪的宝石佛朗西斯_阿道克
海瑟薇似乎什么也没听见，径直推门走了进去，刘畅他们也没有犹豫，跟在海瑟薇的身后走进了木门。木门内，又是个装修豪华的大厅，天花板、墙壁和地板上镶嵌着无数可以自行发光的宝石。宝石的密度看起来比议政厅入门的那个大厅还要高许多。在大厅的中央还有一堵围墙，显然，在这个大厅内部，还有一个封闭的房间。刘畅脸色一变，在这个大厅里，他也有了那种特别不舒服的感觉，这种感觉甚至比议政厅以及们的一进门那个大厅还要强烈。不
深度理解安全Threat Modeling威胁建模
一直想写点关于威胁建模的东西，可试了好几次都卡壳了。之前总忍不住往技术里钻，写出来的东西干巴巴的，满是专业词儿，自己回头看都觉得头大——这可不就跟我刚入门那会儿一样嘛？捧着专业书啃得云里雾里，刷B站教程也总在“好像懂了”和“完全没懂”之间反复横跳，最后草稿删了又删，愣是没写出个像样的开头。今天换了个思路，决定抛开那些绕人的术语，就从咱们能看懂的事儿说起。毕竟我太清楚了，初学者最需要的不是“高大上”
人工智能时代下的数据新职业：新兴工作岗位版图研究司南锤 economics 人工智能
目录摘要第一章：AI驱动的数据价值链重构1.1从“沉睡金矿”到“流动的血液”：数据作为核心经济资产的激活1.2知识的新经济学：零边际成本革命1.3AI作为新的“操作系统”：重塑产业竞争格局第二章：基石层：数据准备与质量保障中的角色2.1数据标注与标签领导力：数据标注经理/主管2.2“地面真实”的守护者：AI数据质量专家第三章：技术核心层：构建AI与机器学习全生命周期的工程角色3.1AI生产线架构师
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt