醒了的追梦人

语音情感识别--语音(声音的预处理)

语音信号（声音是什么）
声音是由物体振动产生的声波，是通过介质（空气或固体、液体）传播并能被人或动物听觉器官所感知的波动现象，最初发出振动的物体叫声源。声音（语音消息）的基本模拟形式是一种称为语音信号的声学波。语音信号可以通过麦克风转化成电信号，转换成语音波形图，如下图为消息"should we chase"的波形图。横坐标表示时间，纵坐标表示振幅。文本"should we chase"按照发音可以表示成音素的形式[SH UH D - W IY - CH EY S]，声波图中的每一段表示一个音素，在ARBAbet音素集中包含近64 = 2^6个符号。

声音作为波的一种，频率（声源在一秒内振动的次数）和振幅是描述波的重要属性，频率的大小与我们通常所说的音高对应，而振幅影响声音的大小。声音可以被分解为不同频率不同强度正弦波的叠加，正弦波是频率成分最为单一的一种信号，任何复杂信号都可以看成由许许多多频率不同、大小不等的正弦波复合而成。这种变换（或分解）的过程，称为傅立叶变换，通过这种分解我们可以把时域图转为频域图。

正弦信号表达式为y=Asin(ωx+φ)y=Asin⁡(ωx+φ)。其中A表示振幅。
ω/2πω/2π表示频率。
对于（空气中的）声振动而言，振幅是声压与静止压强之差的最大值。其中声压是声波在空气中传播时形成压缩和稀疏交替变化的压力增值。麦克风录制声音的原理就是将空气中的压力变动波转化成电信号的变动。

而我们平常说的声音强度（响亮程度）就是由振幅决定的，声音强度的单位是分贝（dB），计算公式如下，用实测声压和参考声压之比的常用对数（常用对数lg以10为底，自然对数ln以e为底）的20倍来表示。下式中分母是参考值的声压，通常为20微帕，人类能听到的最小声压。

分贝表示功率量之比时，等于功率强度之比的常用对数的10倍。
分贝表示场量之比时，等于场强幅值之比的常用对数的20倍。

语音链（声音是怎么发出的）
从语音信号的产生到感知的过程称为语音链，如下图所示：

下面是语音信号产生的四个步骤：

文本：消息以某种形式出现在说话者的大脑中，消息携带的信息可认为有着不同的表示形式，例如最初可能以英语文本的形式表示。假设书面语有32个符号，也就是2^5，用5个bit表示一个符号。正常的平均说话速率为15个符号每秒。上图例子中有15个字母“should we chase”，持续了0.6秒，信息流的速率为15x5/0.6 = 125 bps。
音素：为了"说出"这条消息，说话者隐式地将文本转换成对应口语形式的声音序列的符号表示，即文本符号转成音素符号，音素符号用来描述口语形式消息的基本声音及声音发生的方式（即语速和语调）。ARBAbet音素集中包含近64 = 2^6个符号，用6个bit表示一个音素，上图例子中有8个音素，持续了0.6秒，信息流的速率为8x6/0.6 = 80 bps，考虑描述信号韵律特征的额外信息（比如段长，音高，响度），文本信息编码成语音信号后，总信息速率需要再加上100bps。
发音：神经肌肉系统以一种与产生口语形式消息及其语调相一致的方式，移动舌头，唇，牙齿，颌，软腭，使这些声道发声器官按规定的方式移动，进而发出期望的声音。
刺激共振：声道系统产生物理生源和恰当的时变声道形状，产生上图所示的声学波形。

前两个阶段的信息表示是离散的，用一些简单假设就可以估计信息流的速率。
但是后两个阶段信息是连续的，以关节运动的形式发出，想要度量这些连续信息，需要进行恰当的采样和量化获得等效的数字信号，才能估计出数据的速率。事实上，因为连续的模拟信号容易收到噪声的影响，抗噪能力弱，通常会转为离散的数字信号。

在第三阶段，进行采样和量化后得到的数据率约为2000bps。
在最后一个阶段，数字语音波形的数据率可以从64kbps变化到700kbps。该数据是通过测量“表示语音信号时为达到想要的感知保真度”所需要的采样率和量化计算得到的。

比如，“电话质量”的语音处理需要保证宽带为0~4kHz，这意味着采样率为8000个样本每秒（根据香农采样定理，为了不失真地恢复模拟信号，采样频率应该不小于模拟信号频谱中最高频率的2倍），每个样本可以量化成8比特，从而得到数据率64000bps。这种表示方式很容易听懂，但对于大多数倾听者来说，语音听起来与说话者发出的原始语音会有不同。
另一方面，语音波形可以表示成“CD质量”，采用44100个样本每秒的采样率，每个样本16比特，总数据率为705600bps，此时复原的声学波听起来和原始信号几乎没有区别。
现在在音乐app上下载歌曲的时一般有四种音乐品质选择，标准（128kbps），较高（192kbps），极高（320kbps），无损品质。

将消息从文本表示转换成采样的语音波形时，数据率会增大10000倍。这些额外信息的一部分能够代表说话者的一些特征比如情绪状态，说话习惯等，但主要是由简单采样和对模拟信号进行精细量化的低效性导致的。因此，处于语音信号固有的低信息速率考虑，很多数字语音处理的重点是用更低的数据率对语音进行数字表示（通常希望数据率越低越好，同时保证重现语音信号的感知质量满足需要的水平）。

语音信号中的Analog-Digital Converter，“模-数”变换（声音是怎么保存的）
预滤波（反混叠滤波）：语音信号在采样之前要进行预滤波处理。目的有两个，一是抑制输入信号各频率分量中频率超过fs/2的所有分量（fs为采样频率），以防止混叠干扰；二是抑制50Hz的电源工频干扰。

1.采样：原始的语音信号是连续的模拟信号，需要对语音进行采样，转化为时间轴上离散的数据。
采样后，模拟信号被等间隔地取样，这时信号在时间上就不再连续了，但在幅度上还是连续的。经过采样处理之后，模拟信号变成了离散时间信号。
采样频率是指一秒钟内对声音信号的采样次数，采样频率越高声音的还原就越真实越自然。
在当今的主流采集卡上，采样频率一般共分为22.05KHz、44.1KHz、48KHz三个等级，22.05KHz只能达到FM广播的声音品质，44.1KHz则是理论上的CD音质界限（人耳一般可以感觉到20-20K Hz的声音，根据香农采样定理，采样频率应该不小于最高频率的两倍，所以40KHz是能够将人耳听见的声音进行很好的还原的一个数值，于是CD公司把采样率定为44.1KHz），48KHz则更加精确一些。
对于高于48KHz的采样频率人耳已无法辨别出来了，所以在电脑上没有多少使用价值。

2.量化：进行分级量化，将信号采样的幅度划分成几个区段，把落在某区段的采样到的样品值归成一类，并给出相应的量化值。根据量化间隔是否均匀划分，又分为均匀量化和非均匀量化。
均匀量化的特点为“大信号的信噪比大，小信号的信噪比小”。缺点为“为了保证信噪比要求，编码位数必须足够大，但是这样导致了信道利用率低，如果减少编码位数又不能满足信噪比的要求”（根据信噪比公式，编码位数越大，信噪比越大，通信质量越好）。
通常对语音信号采用非均匀量化，基本方法是对大信号使用大的量化间隔，对小信号使用小的量化间隔。由于小信号时量化间隔变小，其相应的量化噪声功率也减小（根据量化噪声功率公式），从而使小信号时的量化信噪比增大，改善了小信号时的信噪比。
量化后，信号不仅在时间上不再连续，在幅度上也不连续了。经过量化处理之后，离散时间信号变成了数字信号。

3.编码：在量化之后信号已经变成了数字信号，需要将数字信号编码成二进制。“CD质量”的语音采用44100个样本每秒的采样率，每个样本16比特，这个16比特就是编码的位数。
采样，量化，编码的过程称为A/D转换，如下图所示。反过程为D/A转换，因为A/D之前进行了预滤波，D/A转换后面还需要加一个平滑滤波器。A/D转换，D/A转换，滤波这些功能都可以用一块芯片来完成，在市面上能买到各种这样的芯片。

语音信号的预处理（声音的预处理）
语音信号的预处理一般包括预加重，分帧，加窗，端点检测。

预加重：求语音信号频谱（频谱是指时域信号在频域下的表示方式，关于频域和时域的理解如下图所示），频率越高相应的成分越小，高频部分的频谱比低频部分的难求，为此要在预处理中进行预加重（Pre-emphasis）处理。预加重的目的是提高高频部分，使信号的频谱变得平坦，以便于频谱分析或者声道参数分析。预加重可在语音信号数字化时在反混叠滤波器之前进行，但一般是在语音信号数字化之后。
短时分析：语音信号从整体来看是随时间变化的，是一个非平稳过程，不能用处理平稳信号的数字信号处理技术对其进行分析处理。但是，由于不同的语音是由人的口腔肌肉运动构成声道某种形状而产生的响应，这种运动对于语音频率来说是非常缓慢的，所以从另一方面看，虽然语音信号具有时变特性，但是在一个短时间范围内（一般认为在10-30ms）其特性基本保持相对稳定，即语音具有短时平稳性。所以任何语音信号的分析和处理必须建立在“短时”的基础上，即进行“短时分析”。
分帧：为了进行短时分析，将语音信号分为一段一段，其中每一段称为一帧，一般取10-30ms，为了使帧与帧之间平滑过渡，保持连续性，使用交叠分段的方法，可以想成一个指针p从头开始，截取一段头为p，长度为帧长的片段，然后指针p移动，移动的步长就称为帧移，每移动一次都截取一段，这样就得到很多帧。
加窗：加窗就是用一定的窗函数w(n)来乘s(n)，从而形成加窗语音信号sw(n)=s(n)∗w(n)，常用的窗函数是矩形窗和汉明窗，用矩形窗其实就是不加窗，窗函数中有个N，指的是窗口长度（样本点个数），对应一帧，通常在8kHz取样频率下，N折中选择为80-160（即10-20ms持续时间）。
端点检测：从一段语音信号中准确地找出语音信号的起始点和结束点，它的目的是为了使有效的语音信号和无用的噪声信号得以分离。对于一些公共的语音数据集可以不做这步操作，因为这些语音的内容就是有效的语音信号（可以认为研究人员已经对数据做过端点检测）。

语音信号的特征（声音的特征）
特征的选取是语音处理的关键问题，特征的好坏直接影响到语音处理（比如语音识别）的精度。然而在语音领域中，没有一个所谓的标准特征集，不同的语音系统选取的特征组合不尽相同。

语音的特征一般是由信号处理专家定义的，比较流行的特征是MFCC（梅尔频率倒谱系数）。

语音情感数据库介绍
计算机对从传感器采集来的信号进行分析和处理，得出对方正处在的情感状态，这种行为叫作情感识别。

目前对于情感识别有两种方式，一种是检测生理信号如呼吸，心律和体温等，另一种是检测情感行为如面部表情识别，语音情感识别和姿态识别。

语音情感数据集是研究语音情感识别的重要基础，按照情感描述类型可将数据集分为离散情感数据库和维度情感数据库，前者以离散的语言标签（如高兴，悲伤等）作为情感标注，后者以连续的实数坐标值表示情感。

下面介绍一些离散语音情感数据集：

Belfast英语情感数据库：40位录音者（20男20女，18-69岁），对五个段落（每个段落7-8个句子）进行演讲录制，演讲者按照五种情感倾向进行演讲：生气（anger），悲伤（sadness），高兴（happiniess），害怕（fear），中性（neutral）。
柏林Emo-DB情感数据库：德国柏林工业大学录制，10位演员（5男5女），对10个德语语音进行表演，包含了七种情感：生气（anger），悲伤（sadness），高兴（happiniess），害怕（fear），中性（neutral），厌恶（disgust），无聊（boredom）。共包含800句语料（10 位演员 x10 句话 x7 种情感＋100 条某些语句的二次版本），后经过筛选得到500多条，采样率为 48kHz （后压缩至 16kHz），16bit 量化。语料文本的选取遵从语义中性、无情感倾向的原则，且为日常口语化风格，无过多的书面语修饰。语音的录制在专业录音室中完成，要求演员在表演某个特定情感片段前通过回忆自身真实经历或体验进行情绪的酝酿，来增强情绪的真实感。
FAU AIBO儿童德语情感数据库：2009年在Interspeech会议上举办Emotion Challenge评比中指定的语音情感数据库。通过儿童与索尼公司的AIBO机器狗进行自然交互，从而进行情感数据的采集。说话人由51名儿童组成，年龄段为10-13岁，其中30个为女性。语料库包含9.2小时的语音，48401个单词。采样频率为48kHz（后压缩至 16kHz），16比特量化。该数据库中情感数据的自然度高，数据量足够大，是较为流行的一个语音情感数据库。
CASIA汉语情感数据库：中科院自动化所录制，两男两女录制500句不同的文本，通过演讲者不同的感情演讲得出，最后的语音又人工筛选，得到了大约9600条语句。分为六类情感。
ACCorpus系列汉语情感数据库：清华大学和中科院心理研究所合作录制，相对于CASIA录制工作者更多，代表性更强。包含如下 5 个相关子库：ACCorpus＿MM 多模态、多通道的情感数据库；ACCorpus＿SR 情感语音识别数据库；ACCorpus＿SA 汉语普通话情感分析数据库；ACCorpus＿FV 人脸表情视频数据库；ACCorpus＿FI 人脸表情图像数据库。以 ACCorpus＿SR 为例，该子库是由 50 位录音人（25 男25女）对 5类情感（中性、高兴、生气、恐惧和悲伤）各自表演得到，16kHz 采样，16bit 量化。
IEMOCAP：南加利福尼亚大学录制的，10个演员，1男1女演绎一个session，共5个session。录制了将近12小时的数据，有视频，语音，人脸的变动捕捉和文本。包括即兴自发的和照着稿子念的。每个utterance至少三个人评估。包括9种情感（anger，happiness，excitement，sadness，frustration，fear，surprise，other和neural）的离散标签，以及三个维度的维度标签（valence, activation and dominance）。

语音情感识别算法

常用的机器学习分类器：模式识别领域的诸多算法（传统）都曾用于语音情感识别的研究，比如GMM（高斯混合模型），SVM，KNN，HMM（隐马尔可夫模型）。用LLDs（low level descriptors）和HSFs（high level statistics functions）这些手工设计特征去训练。
声谱图+CRNN：最近很多人用声谱图加上CNN，LSTM这些深度学习模型来做。还有手工特征加声谱图一起作为特征放进深度学习模型。也有人用DBN，但是不多。
3.手工特征+CRNN：也有人用手工特征加CRNN做。

什么是 MongoDB？它的主要特点有哪些？真IT布道者 android
一、MongoDB概述MongoDB是一个开源的、面向文档的NoSQL数据库系统，由MongoDBInc.公司开发并维护。它采用BSON（BinaryJSON）格式存储数据，属于分布式文档数据库的类别。关键结论：MongoDB通过灵活的文档模型、水平扩展能力和丰富的查询功能，成为现代应用开发中最流行的NoSQL数据库之一。二、核心架构特点1.文档数据模型MongoDB使用文档（Document）作
MongoDB 与关系型数据库的核心区别（面试向详解）真IT布道者数据库 mongodb 面试
一、数据模型差异1.1结构化vs半结构化关系型数据库：严格遵循二维表结构，需要预定义Schema（字段名、数据类型、约束等）CREATETABLEusers(idINTPRIMARYKEY,nameVARCHAR(50)NOTNULL,ageINTCHECK(age>0)MongoDB：采用BSON文档模型（类似JSON），支持动态Schema//同一个集合中可以存在不同结构的文档db.users
Redis（十五）Bitmap、Hyperloglog、GEO案例、布隆过滤器 Lucky_Turtle Java redis 面试数据库
文章目录面试题常见统计类型聚合统计排序统计二值统计基数统计Hyperloglog专有名词UV（UniqueVisitor）独立访客PV（PageView）页面浏览量DAU（DailyActiveUser）日活跃用户量MAU（MonthlyActiveUser）需求原理亿级UV的Redis统计方案GEO面试题命令GEOADD获取某位置的经纬度GEOPOS返回坐标的Geohash表示GEOHASH两个
VeraCrypt磁盘加密v1.26.24，绿色便携版米豆学社磁盘加密
[软件名称]:VeraCrypt磁盘加密v1.26.24[软件大小]:17.1MB[下载通道]:夸克盘|迅雷盘软件介绍VeraCrypt加密神器️——给你的数字世界加上金钟罩VeraCrypt是一款免费开源的跨平台磁盘加密工具，它继承了经典加密软件TrueCrypt的优秀基因，并进行了全面升级。无论你是普通用户还是专业人士，都能通过这款强大的工具保护重要数据安全。核心功能亮点虚拟加密磁盘：可以在任
【原创】【4】【辅助工具】基于视觉模型+FFmpeg+MoviePy实现短视频自动化二次编辑+多赛道三块钱0794 ffmpeg 音视频自动化
主要功能目录选择-浏览选择包含视频的目录智能扫描-自动递归扫描所有视频文件️赛道管理-从文件夹名自动获取赛道或手动指定实时进度-显示扫描和导入的实时进度双数据库-支持SQLite（推荐）和MySQL重复检测-自动跳过已存在的视频文件使用场景示例假设您的视频目录结构是：D:\短视频\├──外国人系列\│├──1.mp4│├──2.mp4│└──3.mov├──美食系列\│├──美食1.mp4│└──
大模型——Obsidian加Cursor就是最强个人AI知识库不二人生大模型人工智能爬虫大模型 Obsidian cursor
大模型——Obsidian加Cursor就是最强个人AI知识库这几天因为看到了Obsidian的浏览器剪藏插件的强大（这个下节讲）所以开始玩Obsidian，想要搞一个符合自己要求的本地知识库再加上AI的加持。也装了几个Obsidian的AI插件，结果发现配置非常复杂，体验不太行，想要顺畅使用的话得看文档，甚至还有看文档都无法结局的恶性Bug，我得搜Github其他人的问题才能搞定。这些插件的作用
嵌入式 - i.MX93的GPIO寄存器解读夜流冰嵌入式笔记
有四组GPIO，gpio1~gpio4，每组32个端子，序号从0~31。例如，GPIO1_IO00~GPIO1_IO31。表示GPIO状态时，一组寄存器的32个端子用32bit表示，正好四个字节。每组GPIO都有各自的寄存器，基地址空间不同，但其布局和偏移是一致的。1，偏移0x54寄存器PDDR用来设置整组GPIO的输入输出方向，1表示输出，0表示输入。reset后值为0。2，偏移0x50寄存器P
GESP认证C++编程真题解析 | GESP202409 三级单选题和判断题热爱编程的通信人历年GESP CSP-J CSP-S真题解析 c++开发语言
欢迎大家订阅我的专栏：算法题解：C++与Python实现！本专栏旨在帮助大家从基础到进阶，逐步提升编程能力，助力信息学竞赛备战！专栏特色1.经典算法练习：根据信息学竞赛大纲，精心挑选经典算法题目，提供清晰的代码实现与详细指导，帮助您夯实算法基础。2.系统化学习路径：按照算法类别和难度分级，从基础到进阶，循序渐进，帮助您全面提升编程能力与算法思维。适合人群：准备参加蓝桥杯、GESP、CSP-J、CS
UR Studio仿真工具上线助力协作机器人快速部署与精准配置模拟欣佰特cnbestec 机器人优傲优傲机器人 UR Studio PolyScopeXAI 协作机器人
URStudio仿真工具是专为协作机器人自动化部署打造的一款集成化、在线式仿真平台。它基于PolyScopeXAI平台开发，提供从方案设计到仿真验证的一体化流程，帮助企业提升自动化项目的设计效率与实施成功率。工程师无需复杂操作即可快速上手，轻松应对多变的生产需求。无论是初学者还是资深用户，都能通过直观的界面完成仿真任务，实现智能制造的高效转型。URStudio仿真工具核心优势平台集成，提升协作效率
git配置(1): 根据remote自动选择账号执行commit ArthurBreeze git
git配置(1):根据remote自动选择账号执行commit在公司电脑上，克隆了github的仓库，也克隆了内网gitlab的仓库。希望commit和push到内网gitlab时，使用公司账号；commit和push到github时，使用个人账号。原本以为~/.gitconfig只能配置单个账户：[user]name=my_personal_nameemail=my_personal_email
C++语言学习笔记：常对象和常引用
对于既需要共享、又需要防止改变的数据应该声明为常量。一、常对象1、声明对象时用const修饰，称之为常对象。const类型说明符对象名；2、常对象的数据成员值在对象的整个生存期间不能被改变。常对象必须进行初始化，而且不能被更新。3、在定义一个变量或常量时为它指定初值叫作初始化，而在定义一个变量或常量以后使用赋值运算符修改它的值叫作赋值。4、改变对象的数据成员值有两个途径：一是通过对象名访问其成员对
LeetCode 学习day3 不喜勿喷小小小新人12123 leetcode 学习算法 python
题目：给定一个数组prices，它的第i个元素prices[i]表示一支给定股票第i天的价格。你只能选择某一天买入这只股票，并选择在未来的某一个不同的日子卖出该股票。设计一个算法来计算你所能获取的最大利润。返回你可以从这笔交易中获取的最大利润。如果你不能获取任何利润，返回0。（LeetCode121.买卖股票的最佳时机）问题分析：简而言之为求最大差Python代码：importnumpyasnpc
JSP学习 sakoba 学习 java
文章目录什么是JSP运行原理JSP基础语法JSP表达式JSP脚本片段JSP声明jsp指令九大内置对象&四大域对象内置对象四大域对象代码JSP标签、JSTL标签、EL表达式EL表达式JSP标签JSTL标签什么是JSPJSP（JavaServerPages）是由SUN公司在1996年6月发布的一种基于Java技术的服务器端编程技术，用于开发动态Web应用。从本质上讲，它是一个简化的Servlet设计。
嵌入式原理与应用篇---常见基础知识（9） Atticus-Orion 微处理器原理与应用篇上位机操作篇上位机知识篇网络微处理器原理与应用
冯诺伊曼计算机的组成部分及功能冯诺伊曼计算机的设计基于“存储程序”原理，其核心思想是将程序和数据以二进制形式存储在存储器中，由计算机自动执行。以下是各部分的功能及设计思路：一、运算器（ArithmeticLogicUnit,ALU）功能：负责执行算术运算（如加减乘除）和逻辑运算（如与、或、非），是计算机处理数据的核心部件。设计思路：通过逻辑门电路（如全加器、乘法器）实现基本运算，采用并行计算结构提
上位机知识篇---CRLF Atticus-Orion 微处理器原理与应用篇上位机知识篇上位机操作篇单片机嵌入式硬件微处理器原理与应用串口
串口通信中的CRLF：概念、原理与应用详解一、CRLF的定义与本质CRLF是两个ASCII控制字符的组合，用于表示文本行的结束，在串口通信中作为数据帧的分隔符。其具体含义为：CR（CarriageReturn）：回车符，ASCII码为0x0D（十进制13），早期打字机中表示“将打印头移至行首”；LF（LineFeed）：换行符，ASCII码为0x0A（十进制10），表示“将打印头移至下一行”。组合
基于python的公众号文章爬取思路（总结版）大数据小学僧 python 开发语言爬虫微信公众平台
目录一、技术方案分类1.接口直连模式（推荐）2.网页解析模式3.第三方API模式二、核心技术栈三、爬虫实现步骤1.接口直连模式（微信公众平台API）2.网页解析模式（搜狗微信搜索）3.第三方API模式（如清博大数据）四、可视化界面实现五、数据存储方案六、高级技巧七、注意事项八、推荐工具链一、技术方案分类1.接口直连模式（推荐）2.网页解析模式3.第三方API模式二、核心技术栈三、爬虫实现步骤1.接
OpenCV图像噪点消除五大滤波方法慕婉0307 opencv基础 opencv 人工智能计算机视觉
在数字图像处理中，噪点消除是提高图像质量的关键步骤。本文将基于OpenCV库，详细讲解五种经典的图像去噪滤波方法：均值滤波、方框滤波、高斯滤波、中值滤波和双边滤波，并通过丰富的代码示例展示它们的实际应用效果。一、图像噪点与滤波基础1.1常见图像噪声类型高斯噪声：符合正态分布的随机噪声椒盐噪声：随机出现的黑白像素点泊松噪声：光子计数噪声量化噪声：模拟信号数字化过程中产生1.2滤波方法分类滤波类型特点
打造跨平台应用的全能框架：Dioxus 人工智能我来了 IT技术开源服务器运维
在如今飞速发展的数字世界中，越来越多的开发者开始寻找能够满足跨平台需求的高效框架。而在这些选择中，Dioxus这个全栈应用框架脱颖而出。Dioxus是一款为Web、桌面和移动端开发而设计的全栈框架，采用Rust语言，具备跨平台、一体化的优势。本文将深入介绍Dioxus的独特功能，应用场景以及使用方法。Dioxus的核心特性跨平台支持：一次编写，到处运行Dioxus支持在Web、桌面和移动平台上部署
AutoGPT，自主完成复杂任务小雷FansUnion AI2025 人工智能
AutoGPT是一个开源的AIAgent项目，它的核心目标是让AI能够自主完成复杂任务，而不仅仅是回答单个问题。简单来说，它让AI具备了"自主思考和行动"的能力。1.AutoGPT的核心概念什么是AIAgent？AIAgent（智能代理）是一种能够：自主规划：将大任务分解成小步骤自主决策：根据情况选择最佳行动自主执行：调用各种工具和API完成任务自主反思：评估结果并调整策略AutoGPT的独特之处
设计模式(策略，工厂，单例，享元，门面)+模板方法 sakoba 设计模式数据库 java
文章目录前提策略模式思想实现如何拓展模板方法存在的问题思想实现如何拓展工厂模式实现问题及解决(解耦)配置文件方式使用注解单例模式实现方式1,懒汉式(线程不安全)2,懒汉式(线程安全)3,饿汉式4,双重校验锁机制(面)5,静态内部类6,枚举体现享元模式门面模式前提假设做一个需求，从文件中拿到数据并存在数据库中，文档有多种不同的类型，比如json,excel,csv等等。在做这个去求得在过程中，如何让
嵌入式硬件与应用篇---寄存器GPIO控制
在ARM架构中，通过32位寄存器控制GPIO（通用输入输出）的核心步骤和方法可分为以下几个关键环节，结合不同芯片的实现差异，具体操作需参考对应的数据手册：一、GPIO控制的核心步骤1.使能GPIO时钟必要性：多数ARM芯片的GPIO外设默认处于时钟关闭状态，需先通过时钟控制寄存器激活。示例：STM32F103（Cortex-M3）：使用RCC_APB2PeriphClockCmd函数使能对应GPI
C#区块链共识的3大必杀技：PoW、PoS、DPoS谁才是代码界的“链主”？墨瑾轩一起学学C#【二】c#区块链开发语言
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣**3大必杀技，让你的代码成为“链主”**必杀技1：工作量证明（PoW）——“算力擂台赛”问题：为什么比特币的“矿工”要疯狂算哈希？答案：因为他们在参与“算力擂台赛”！PoW核心逻辑：
从阻塞到异步：Java NIO与AIO的高性能网络编程实战全解析小张在编程网络 java nio
引言在高并发网络时代，传统BIO的“一个连接一个线程”模式早已力不从心——当万级连接涌来时，服务器线程池瞬间告急，资源耗尽的警报此起彼伏。JavaNIO与AIO的出现，如同为网络编程装上了“多线程调度器”和“异步引擎”：NIO用非阻塞机制化解并发瓶颈，让单线程管理千个连接成为可能；AIO则更进一步，通过事件回调实现真正异步，让程序在I/O等待时不再“干瞪眼”。本文将从原理到实战，带您揭开这两大高级
容器挂载传播模式学习岳来 #容器运维学习 k8s 容器挂载传播
在容器技术中，挂载传播模式（MountPropagationMode）定义了挂载点在主机和容器之间的传播行为。它决定了当主机或容器中的挂载点发生变化时，这些变化是否会影响到其他挂载点。挂载传播模式在多容器共享挂载、动态挂载更新等场景中非常重要。以下是挂载传播模式的详细解释及其分类：1.挂载传播模式的作用挂载传播模式主要用于控制挂载点的变化如何在主机和容器之间传播。例如：当主机上新增一个挂载点时，是
go build -gcflags 参数学习岳来 golang golang 学习开发语言
文章目录一、常用编译选项二、使用模式与包匹配规则三、应用场景与注意事项四、其他相关参数五、删除-gcflagsall=-N-l对构建的影响参考文档gobuild的-gcflags参数用于向Go编译器（gotoolcompile）传递额外选项，控制编译行为。其格式为-gcflags="[pattern=]arglist"，其中pattern定义作用范围，arglist是空格分隔的编译选项。以下是关键
使用 Simulink 来实现一个简化的电动汽车动力总成控制系统模型 xiaoheshang_123 手把手教你学 MATLAB 专栏 MATLAB 开发项目实例 1000 例专栏数据结构 simulink matlab
目录一、引言教程目标二、准备工作三、实现步骤详解✅步骤1：创建Simulink模型✅步骤2：添加电机与控制器模型✅步骤3：电池管理系统（BMS）✅步骤4：能量回收系统✅步骤5：连接各模块并设置仿真参数示例连线代码：设置仿真参数：✅步骤6：结果可视化✅步骤7：完整框图结构示意（文字版）四、运行仿真并测试效果五、结论与拓展方向✅本章收获：后续建议拓展方向：手把手教你学Simulink——电动车辆的动力
算法优化：前缀和+哈希表雨声敲敲，风声潇潇算法算法 java leetcode 性能优化哈希表
今天在leetcode上写到6952.统计趣味子数组的数目这道题的时候出现了超时问题，由此学习了前缀和+哈希表的方法。目前看到与此知识点相关的题目有如下：560.和为k的子数组，非常经典的前缀和+哈希表，可以从这一道题入手。6952.统计趣味子数组的数目，这道题比上一到稍微难一点，但是不至于困难。下面介绍一下前缀和+哈希表以560题为例，题目：给你一个整数数组nums和一个整数k，请你统计并返回该
hexo php推送百度,Hexo站点主动推送百度-基于Flow.ci 数数科技 hexo php推送百度
写在前面：下面是链接提交方式的对比：如何选择链接提交方式1、主动推送：最为快速的提交方式，推荐您将站点当天新产出链接立即通过此方式推送给百度，以保证新链接可以及时被百度收录。2、自动推送：最为便捷的提交方式，请将自动推送的JS代码部署在站点的每一个页面源代码中，部署代码的页面在每次被浏览时，链接会被自动推送给百度。可以与主动推送配合使用。3、sitemap：您可以定期将网站链接放到sitemap中
Three.js学习10：几何体（1）-平面几何体 stones4zd three.js 学习
-----------------------------华丽的分割线---------------------相关代码均已上传到gitee中：myThree:学习Three.js，努力加油~！Gitee静态演示地址：ThreeJS演示页面-----------------------------华丽的分割线---------------------一、几何体GeometryThree.js中物体
POS（权益证明机制） Chinatesila 区块链
由来：SunnyKing和ScottNadal首先建议使用权益证明作为工作量证明（PoW）的替代方案，并创造了权益一词。他们描述了一种算法，该算法根据个人钱包中代币的数量和年龄选择生产区块的节点。Peercoin（PPC）被创造出来，并成为第一个混合加密货币。PPC使用PoW分发令牌，并使用PoS验证交易。简介：权益证明机制的目的是让所谓的“权益者”、“锻造者”或者“验证者”来代替矿工，他们本质上
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc

语音情感识别--语音(声音的预处理)

你可能感兴趣的:(语音识别,语音情感识别,声音的预处理,语音)