你的宣妹

2021年声纹识别研究与应用学术研讨会笔记

声纹识别是国务院认定的远程身份认证方法，在研究过程中要注意信息安全和法律法规的要求，声纹识别是一个比较热的研究方向，ICCASP有36篇和speaker verification有关的文章，其中有涉及多模态、spoofing、鲁棒性、domain adaptation等，未来的应用应该是场景驱动、融合创新的，有一些例如反欺诈需要声纹掩盖等针对技术。我们需要共同维护创新环境，良性发展、合作共赢，要找准赛道，避免恶意竞争（通过非常规手段，侵权压价等），需要建立良性市场生态，可以建立产学研用联盟进行声纹识别的良性发展。

Speaker Recognition and Characterization in Xi-Vector Embedding Space

新加坡博士Long Aik Lee * 本篇为英文讲述所以笔记不是很准确

关键词： speaker embedding

说话人识别一般流程有特征提取、Speaker Embedding和scoring几个过程，首先特征提取有获得特征序列，通过embedding获取等长特征向量，最后进行评分和分类。
同一个人的embedding space内是彼此接近的，因此可以进行简单的几何计算，例如Paris-France+England = London，Paris-France嵌入表示首都的概念。
X-Vector前面经过CNN特征提取后，进行均值和标准差的pooling，通过FC层输出分类概率，第一层FC的输出即为Embedding Vector。
I-Vector使用UBM模型指导GMM做特征映射，i-vector提取的是后验均值估计，组成了嵌入向量。
特征嵌入从supervector到generative embedding再到discriminative embedding，分类器从SVM、JFA到PLDA。
X-Vector的优点是利用了深度模型，数据量大和判别学习，缺点是对非确定因素的建模和处理不强。I-Vector的优点是对非确定因素的建模和处理能力强，但是采用UBM和T矩阵是一个较浅层的模型，随训练数据的增长，性能很快饱和。所以这里提出了Xi $/ z a i /$ -Vector结合了X-Vector和i-vector嵌入的优点。
第一个要点是非确定性估计，在encoder中加入uncertainty估计值， Xi-Vector有Encorer、Temporal Aggregation和Decoder三个部分，Encoder包含两层神经网络和两个生成部分，一个是特征，一个是非确定性的估计，输出通过高斯后验概率估计后经过两层FC层输出分类概率，第一层FC输出为Xi-Vector Embedding。实验表明预测结果更加准确，Xi-Vector将生成模型和判别模型进行结合，达到了更加好的效果。具有开源代码。

*说话人分割聚类研究进展与展望

厦门大学副教授洪青阳

关键词： 图卷积神经网络、聚类
说话人分割聚类：给定一个包含多人交替说话的声音，系统需要判断每个时间段是谁在说话。有很多供使用的竞赛数据集，研究趋势从简单场景到复杂场景，挑战有噪声干扰、人数未知、语音重叠等等，如何适应新的场景也是一个迫切需要改进的方向。
系统包含分割和聚类两个部分，VAD可以做分割，VAD后进行合并和切片，将语音片段转换为聚类问题。
第一步需要提取嵌入表征向量，之前的方法有AHC聚类可以进行层次聚类，还有SC（谱聚类）、VB\VBx聚类、UIS-RNN（中国餐馆方式）、DNC（神经网络直接进行分类），另外需要进行重叠语音检测。
端到端系统从EEND到TS-VAD等等，聚类算法总结如下：

系统对比，CALLHOME数据集中，TDNN+AHC+VB效果最好，DIHARD III数据集中，Cosine相似矩阵和NME-SC的结果最好，重聚类中加入VBx，加入重叠检测很重要。VoxSRC21比赛，包含背景音、笑声杂音等等，提出wav2vec VAD做ASR模型，重叠检测通过VAD第一次分配说话人，OSD第二次分配说话人。提出的单系统已知最优。XMUSPEECH融合系统，实验经验是：
防止过拟合，合理设计子系统。
系统存在一些问题，仅依赖于embedding之间的相似度，没有考虑时序关系或者结构信息，可以利用前后时间关系从无监督打分变为有监督打分，后端采用谱聚类，采用图神经网络得到新的embedding，考虑了节点之间的连接关系。
普通卷积神经网络只是从平面结构合并，没考虑节点之间的关系，图卷积网络不仅考虑了节点特征，还有节点之间的关系，多了归一化邻接矩阵。两种改进：第一种是考虑自己的特征，每个节点增加自链接，第二个是进行归一化，使得每一行和为1。

复杂场景、神经网络有监督聚类、在线系统、联合语音识别和多模态等都是可以研究的方向。

Minding on Hard Trials

英国爱丁堡博士清华大学研究员王东

关键词： hard trails
现在的说话人识别已经达到了很高的水平，但是EER较低效果真的好吗？在其它情境中，有很多模型都是不可用的。
一般的trails都是交叉的方式，两个说话人的数据进行混别成对，其中有很多不靠谱的trails，所以EER非常低。数据里有很多bias，有很多因素影响数据分布，我们需要更加关注那些有bias的点（hard trails）。Hard trails来自分布的交叠部分。

黄色部分是hard trails，需要找到不同模型的正负例重叠区域，经过实验验证其确实是存在各个模型当中的。
除了验证实验，还用人类测试的方式，随困难程度增加，分类准确率降低，机器结果比人类还要好一些。在softmax进行分类时希望有一个margin能够增加正负例的距离，但是m方法不能产生margin的效果。在AM-softmax加入max函数，能达到margin的效果。

Target Speaker Extraction in Multi-Speaker Interaction Scenario

中国科学技术大学语音及语言处理国家工程实验室副教授杜俊

关键词： 语音分离
第一个工作是，可以通过为数据赋予性别标签的方式，将非监督的学习转化为监督学习，把预测单人转化为预测性别的任务。

第二个工作，CHiME-5挑战中已经给出diarization结果，但是其中有两人或多人重叠的语音，数据中有回音等噪声，结果不好的原因可能是因为没有考虑噪声等外界因素，这里主要考虑的是在重叠部分做分离。
数据中diarization结果不是完全对应的，做特定说话人分离，如何获取特定人的信息？考虑一个两阶段方法：第一阶段产生更多的目标说话人数据，第二阶段提取更好的目标说话人语音。如果特定说话人的数据比较少，可能结果不是很好。
第三个工作，有一个小孩子的数据库，小孩子不配合录音，所以有很多无关杂音，去掉成人声音等等噪声。采用联合语音分离增强，首先用神经网络进行降噪处理，随后再提取小孩子的语音。把小孩子和大人的声音进行分离，类似于男女的分离。实验中采用diarization中的JER和CSDER（小孩子的声音错误率）作为评估标准。
可以用来做降噪耳机，通过学习特定说话人的声音，做到提取纯人声的效果。

*Multi-Modality Matters: Audio-Visual Deep Neural Networks for Robust Person Verification

上海交通大学计算机科学与工程系副教授钱彦旻

关键词： 多模态、数据增强、知识迁移
现在我们很多都是用人脸或声音等解锁手机，但是哪一个模态都做不到100%可靠。人脸识别例如口罩、遮挡、模糊、化妆等会影响人脸的变化，声音识别例如信道污染、长短时问题、多说话人等影响，识别结果会受到影响。
三个问题，如何利用音视两个信息得到更好的结果，如何在污染的情况下保持好的性能，如何用多模态系统提升单模态系统的应用。
传统音视模态结合采用score fusion打分融合的形式，比较简单，性能不错。提出三种融合策略，AVN-F（Feature Level）、AVN-E（Embedding Level）、AVN-J（Joint），是前后端联合训练的网络。
首先是Feature Level，特征通过Transformation提取高维特征后，后进行拼接获得person embedding。提出三种方式，实验中将单模态和特征层面融合的EER结果对比，可以得到明显的性能提升。
其次是embedding level，提出三种方式，同上面一样进行单模态和多模态对比，可以看出多模态系统效果好很多。
复杂场景下，不是每一个模态都能得到高质量的数据，会有模态污染，所以需要在不同level设计好的data argumentation（数据增强）策略，增强模型的鲁棒性。单模态下即使进行数据增强，性能也并未提升很多，多模态进行数据增强后性能有了明显提升。
提出噪声分布匹配，能够生成embedding level的增强data，首先通过embedding extractor得到clean和noisy的embedding，之后得到纯噪声embedding，用高斯模型对其进行建模，可以在clean的embedding上用高斯模型进行随机采样获得新的noise embedding，后用混合数据进行训练。
最后提出了joint的融合方式，通过multitask learning做融合学习，相比于前两种方式有更进一步的下降，和score average融合还有改进。
最后应用的时候可能还是单模态，有没有可能将多模态知识迁移到单模态情况下提高性能呢？传统的教师学生模型中，用教师模型的输出优化学生模型，提出三种方式，label level、embedding level和embedding-distribution level。用多模态系统教单模态系统，以做知识迁移提升学生系统性能。

噪声与远场环境下的声纹识别

西北工业大学张晓雷

关键词： 自组织阵列、鲁棒性、通道加权融合
复杂环境下声纹识别有很多挑战，比如其他声源的加性噪声、信道畸变、多径效应产生的混响和其他说话人干扰等，解决问题包含降噪前端声纹识别系统和声纹识别的域自适应。这里只关注一个内容，基于深度学习的自组织阵列语音处理。但设备前端处理会有很多局限性，性能存在物理上限，信噪比快速降低，对距离说话人的位置、远近较为敏感。阵列中距离语音源的远近会对声纹识别产生严重影响，可以自组织麦克风阵列，将分布在说话人周围的麦克风组织起来，有效避免远场出现概率。物联网大环境的发展趋势即多设备联合处理，给我们语音产业带来指数级的增长空间，需要将传统阵列信号处理方法向自组织阵列拓展。
很多假设在实际中很难满足，导致研究一直在理论状态，是一个小众的研究课题，是否能用深度学习代替理想假设？可以采用深度模型做通道加权，将比较差设备的权重降低、通道同步（将不同厂家设备融合会产生许多问题，如时延不同等），通过深度模型解决，后应用到实际。
我们预测每个设备的信噪比，作为通道的权重。
同时还进行了真实的大规模自组织阵列数据采集，很多数据集的收集有不同步的问题。为了将两个耦合问题节点数规模小和无严格且自然同步数据的两个问题解耦合，采集了严格同步的数据，进行通道融合和通道选择上都有性能的提升。
传统鲁棒声纹识别需要做数据增强，需要将含噪声数据和完好数据进行训练，由于自组织阵列数据量庞大，相似性高有冗余，自组织阵列数据的噪声大，易在噪声不收敛等问题。采用domain adaptation，首先用clean的数据训练声纹识别器，后将参数固定，加入通道加权和融合的模块将多个通道数据融合。

segment-level通道加权融合，cross channel inter processing layer采用multi head selfattention机制。实验结果中Segment-level Sparsemax效果好很多，EER更低。
还有帧级加权融合，对每个通道的帧进行加权，做完加权后对通道进行average，得到通道级fusion，通过pooling层得到x-vector。帧级别甲醛融合在实验中EER有进一步的明显下降。实际应用可能有帧级别不同步的问题。

声纹识别与语音防伪技术前沿及工作进展

清华大学新疆大学副研究员何亮

关键词： 声纹伪造、前沿技术
语音防伪技术为了防止语音的深度伪造，在日常生活中很多人都接触过，比如就医求助、继续银行转账诈骗等等。法律是禁止滥用AI技术进行诈骗，不仅需要法律约束，还需要采用技术手段防止语音伪造。
技术热点有端到端的模型、联合识别（辅助提升）、噪声问题（鲁棒性）和远场问题等等。引入多尺度、多层次的信息，在X-Vector的主体框架，在特征、结构、池化和损失函数可以进行改进研究。训练策略有Large Margin Fine-tuning，分两阶段训练，预训练使用小margin的loss。还有多头注意力机制、ASP、MHAP等等。
语音防伪技术的评价指标一般是EER和t-DCF，数据层面通过数据增强模拟提升防伪系统性能，特征层面主要是关注于高频特征或者拼接点等，模型层面基本上都是CNN的变体，或者是直接从原始的wave来作为输入，通过加入不同滤波器，也有可能达到很好性能，还有采用多尺度信息。
真实语音基频较为清晰，高频比较模糊，如何提取这些信息很重要，可以通过Attention，关注那些最可能不一样的地方，从各种不同的角度看假在哪里。实验证明，注意力机制可以较好的改善系统的性能。
有一个改进思路：熟悉的人，更容易辨别真伪，利用说话人信息提高防伪性能。第一在特征层面，第二个层面是embedding层面，将LightCNN+AF-SIA对拼接的x-vector进行降维消融实验。
未来工作中，像网络改进、跨模态、标签错误等，Hard Trials和两阶段或者图网络、预训练+声纹或者超大规模（参数百万级以上）都可以多多关注。语音防伪方面主要是与训练+防伪或者考虑学术研究和现实应用中会发生可用性快速下降的问题，做GAN时候可不可以分为真、假或者不确定的情况？

深伪音频鉴别研究进展

中科院声学研究所研究员张鹏远

关键词： 深伪音频、攻击检测
深伪（Deep Fake），随技术的发展，伪造技术越来越成熟，在商业、艺术、医疗行业也有积极应用，在电信、经济政治社会国民等领域带来诸多风险和威胁。
首先是VAD（切掉静音部分）对鉴伪性能的影响分析，鲁棒性差、VAD导致鉴伪系统性能严重下降。不同伪造方法的静音是有较大差异的，静音部分还是存在鉴别信息的，因此我们可以很好利用静音的区分性进行鉴伪。实验表明，实际上VAD后只用语音信息增加了过拟合，采用纯静音鉴伪效果更好，VAD后的语音如果增加了静音长度信息，效果得到了明显的改善。
第二是双频带融合的语音鉴伪方法，语音合成和转换方法有很多，不同伪造方法对频谱的影响分布在不同频域。低频特征相对于全频带和高频特征，获得了最好的性能。双拼带融合对于VAD后的语音是有效的，双频带融合对于不同特征都有效。
第三个是基于交叉子带算法的回放攻击检测，需要解决的是不匹配数据集上训练获得更好的鲁棒性。非语音部分包含了大量的伪影信息，只是用VAD切出非语音部分训练，但是实验结果不尽人意，可能是因为训练数据不匹配带来了干扰。高频信噪比低于低频，表明高频部分伪影更容易被学习，测试时使用与训练相异的子带可以强迫模型取消对于语音频谱的关注，而是关注更多伪影存在的噪声频谱部分。实验表明在数据集不匹配的情况下，交叉子带算法性能有所提升，且不需要额外的数据加强。交叉子带算法能增加数据广泛度，减少过拟合。
最后是伪造语音的溯源，即用什么算法合成的语音。从声纹图中看不同模型还是有一定区别的，是否存在“模型指纹”存在？变声和合成高频差异较大，找到一些不同声码器的曲线特征：

实验表明声码器溯源还是效果比较好的。
其它还有面向未知算法的伪音频检测、防伪冒音频检测等等。

特定人合成及变声与录音回放语音攻击检测

昆山杜克大学电子与计算机工程副教授李明

关键词： 录音回放、攻击方法
Multi-Speaker Text-to-Speech，用到了类似feedback constraint，一般先做文本编码、attention和decoder，目标声纹通过编码器编码。数据分为文本相关、文本无关（实际场景下更多）两个类别，有时候数据中有人的数据是有bias的，constraint可以强制输入和输出一致，使得攻击更有针对性。
Zero-shot Voice Conversion，训练数据和测试数据是不相干的，可以用中间层梅尔谱表示加speaker encoder输出Mid Embedding全能表示向量。
假设一些编码器对于人声来说重建效果好，对于小的干扰没有很好的预测。
声码器越好，能够越能完美重建人声，忽略信道中的噪声等信息。采用GMM和VAE训练，发现两个效果差不多。

鲁棒说话人表征技术

西北工业大学教授谢磊

关键词： 鲁棒声纹表征、语音生成、声纹攻击
首先基于二元时间通道频率的说话人表征（DTCF），CNN不能学习通道间的关系，因此引入注意力机制改善通道间交互的学习。因此引入了DTCF在时间和频率维度上聚合全局上下文来重新矫正表征。远场声纹可能有mismatch问题，为解决这个问题，引入ResNet-BAM和DAT减少远近场之间的说话人表征差异，还有前端数据预处理和数据增广来解决。
进场到远场的多级迁移学习，这里用到了Teacher-Student模型，用教师干净语音模型督导带噪语音训练的学生模型。实验表明，效果要好很多，进行可视化可以看出，不同说话人边界较为模糊，通过迁移后发现speaker类之间的间距更加清晰。
Glow-WaveGAN消除声学模型和声码器的鸿沟，提出两段式建模，声学模型到声码器。中文来说音调是很重要的，还通过其他模型提高音质。
当目标声纹样本量很小甚至只有一个，能否完美复制其音色？研究Glow-WaveGAN在不同说话人空间对zero-shot任务的作用。两种方法，第一个是pretrain的encoder，第二种是joint，先训练embedding，后同模型一起进行训练，pre较joint更具复刻UNSEEN说话人的推广能力。
语音增强，能够提升语音质量，实际环境有很多干扰，需要语音前端提升信号质量。DCCRN（复数神经网络语音增强），降噪效果非常好。

在降噪量和语音过度抑制需要平衡，在DCCRN上进行改进，提出很多方案：

改进后语谱保留比较明显。
有可能需要更高采样率需求，提出超宽带语音增强模型S-DCCRN，专门对高频信息进行建模。
在此基础上还有很多拓展方案，可以看到也有其他的拓展，现在有基于声纹先验的语音增强，进行目标说话人提取，效果很不错。
最后是基于查询的说话人识别的黑盒攻击，包含生成攻击、重放攻击和对抗样本攻击（故意添加细微干扰导致预测错误）。攻击分为黑白盒攻击，还有按照攻击者的目的分类，分为目标攻击和非目标攻击。黑盒攻击考察三个方面：对抗样本的迁移性、替代模型和基于心理声学的不可感知扰动。
几个数据集的介绍：AISHELL-4多通道录音，AliMeeting数据集语音重叠比例很高，WenetSpeech中文有标注数据集
该模型可能对没有见过的数据有敏感性，如何增强拓展性是一个重要的研究方向。

声纹识别中的鲁棒性学习方法研究

中国科学技术大学副教授宋彦

关键词： 信息融合、多任务学习、域匹配
说话人识别一般用在很多保密工作当中，实际应用存在很多问题，例如复杂场景下有噪声、远场、域不匹配、短时不定时长、时间漂移的问题，一般分为两个部分，前端提取特征embedding，后端通过模型处理比对相似性，鲁棒性学习方法需要源和目标域分布基本一致，如果分布存在差异，需要做自监督的域自适应学习。
常用的前端深度模型有很多，如果把网络加深加宽等性能虽然有提升，但是会付出很大的代价，可以采用集成技术，融合多个模型的结果，但是只在结果层面进行融合，却忽视了模型内部的融合。提出融合ResNet和DenseNet（VGG）构建骨干网络，捕捉不同时频分辨率的信息，同时加强特征的重复利用，有串行和并行两种方式，有顺序的结构，也有残差和条约的部分，模型复杂度可控。
与堆叠更多卷积层来加深模型的方法比较，串行DenseR结构用密集连接把残差单元连起来，不会过多增加网络复杂度；与增大通道维度来加宽模型的方法相比较，并行的DenseR结构中，密集连接分量和残差分量不断地进行拼接和分割，对不同的信息进行融合。相对于集成技术把多个模型的输出结果进行融合，这里在每个DenseR单元实现特征的融合。
第二是基于多任务学习框架的说话人识别，前端特征学习通常基于SID（确认，给出样本和标签softmax的形式）任务进行优化，而后端是SV（给两句话判断是不是一个人）任务，两者有差异，而且学习是分阶段的，后端无法对前端特征学习进行指导。联合SID和SV提出多任务学习的框架，融合过程中发现两个loss不匹配。
和triplet loss比较，相同点是都需要构造正负样本对，但是需要计算embedding之间的距离，拉近正例，推开负例，需要一个分类器对正负例进行判别。
第三个是基于自监督的域鲁棒说话人深度特征学习，源域和目标域的分布可能不一致，而且存在多个潜在的子域（很相似的数据但是不同），随后是缺乏目标说话人的标签信息。在后端模型中，对齐两个域的分布，在前端模型中，学习域鲁棒的深度特征，但是主要作用在网络深层或者后端，依赖域的标签信息，难以处理未知的不匹配子域，没有用到潜在说话人的标签信息。
（好像很多方法都是基于框架的问题进行改进的，说明框架的设计很重要）
聚类学习获得的标签存在噪声，聚类结果不准确，类别数也难以确定；对比学习的正负例构造的有效性难以保证，未考虑源域和目标域分布的差异。

今后可以通过无监督和生成的方式生成样本。

标签噪声干扰下的说话人识别关键技术研究

厦门大学副教授李琳

关键词：
深度模型具有优势，是因为有标签数据的提供，但是通常情况下一般获得的都是错误标记、缺乏标签和干扰的数据。在图像分类领域对标签的研究还是比较早的，标签噪声指的是对样本数据提供了错误的标签。各大数据集会有或多或少的标签错误，那么在采集数据时有两种方法，人工标注或者是网络爬虫众包采集。
方法有修改损失函数，引入正则项，如果遇到标签错误样本，就会赋予比较小的更新权重；数据分段重组，把可能存在标签噪声样本切分出来，作为正确标注样本的增强数据；最后是协同训练，在能够同时训练两个说话人的空间互相监督，减少误标数据带来的影响。还有一种是改进的PLDA，通过引入标签作为隐变量，利用变分贝叶斯估计标签噪声，优化PLDA。
提出方法的框架，神经网络前端优化中，首先是基于标签置信度的训练策略，将源标签和预测标签一起加入模型训练，加上后验概率的权重调整和Sub-Center AM softmax；还有PLDA后端的优化，引入标签隐变量和改进的PLDA模型NL-PLDA，前后端结合能较好的防止噪声干扰。
基于标签置信度的训练策略中，损失函数引入网络预测标签，设计动态权重曲线，损失函数的预测标签权重动态变化效果更好，即更加相信预测标签值。其中很有可能网络单一分类，为了尽量减小loss，把所有数据归为一类，增加正则化项，来约束后验概率逼近平均概率。增加后验概率的权重调整项，可以弱化标签噪声带来的影响。Sub-Center AM softmax相当于正确样例的子中心。
后端针对NL-PLDA数据集的训练，设置了标签的隐变量，对应每个元素 $z_{n,m}$ 表示第n个样本属于第m个说话人的可能性，更新隐变量时同时计算标签的错误率，这样可以过滤高置信度的标签噪声，设置阈值过滤被错误标注的样本。
数据训练集随机添加各个百分比的噪声，网络设计了6中前端架构配置。实验中对每个部分都做了验证和说明。
应用上做了标签修正后的数据进行对比，性能达到进一步提升，错误率下降非常大；第二个应用是标签清洗，筛选出预测标签和给定标签不一致的样本，NL-PLDA筛选出正确概率较小的样本，实验证明性能提升很大。
我们可以看出标签对模型的负面影响，同时前后端的优化效果较好，可以应用在标签修正、标签清洗的场景。
但是有一些问题，标签噪声和难样本问题，不知道到底是不是错误标签；还可以利用无监督数据，拓展到半监督学习；更加注重实际应用场景。

心得

首先是一般来说，包含的领域和框架是固定的，当然还包括没有发掘的方法。创新可能来源于几个部分，前端、后端和结果等。首先是确定一个框架，上面几个部分的重点在哪，哪个部分有缺陷，选择一个自己感兴趣的领域或者方法。在框架设计当中，需要不断地实验佐证创新的点，通过合理的可视化和对比展示结果。需要注意展望部分，之前介绍了自己做了哪些工作、自己工作解决了什么问题，这里需要介绍还有什么待改进的方向或者未完成的想法等等。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那

2021年声纹识别研究与应用学术研讨会笔记

2021年声纹识别研究与应用学术研讨会笔记

Speaker Recognition and Characterization in Xi-Vector Embedding Space

*说话人分割聚类研究进展与展望

Minding on Hard Trials

Target Speaker Extraction in Multi-Speaker Interaction Scenario

*Multi-Modality Matters: Audio-Visual Deep Neural Networks for Robust Person Verification

噪声与远场环境下的声纹识别

声纹识别与语音防伪技术前沿及工作进展

深伪音频鉴别研究进展

特定人合成及变声与录音回放语音攻击检测

鲁棒说话人表征技术

声纹识别中的鲁棒性学习方法研究

标签噪声干扰下的说话人识别关键技术研究

心得

你可能感兴趣的:(论文笔记,tensorflow,机器学习,深度学习)