lc520xyp

说话人识别综述阅读1

说话人识别综述阅读

Deep learning methods in speaker recognition: a review

摘要

本文总结了深度学习在验证和识别领域的应用实践。语音识别是语音技术广泛应用的课题。在过去的5-6年里，已经开展了许多研究工作，但进展甚微。然而，随着深度学习技术在大多数机器学习领域的进步，以前的最先进的方法在说话人识别方面也被它们所取代。深度学习似乎成为了现在最先进的说话者验证和识别的解决方案。标准的x向量，除了i向量，在大多数新作品中被用作基线。收集的数据数量的增加为DL开辟了领土，在那里它们是最有效的。

介绍

Speaker identification (SI) and verification (SV)

它是一个流行的研究课题，有各种应用，如安全、取证、生物特征认证。目前在这个领域有很多的研究，很多的方法被提出来，所以这个领域的最先进技术还相当成熟。

如今，随着深度学习的硬件解决方案，深度学习(DL)的普及不断上升，它开始渗透到适用机器学习的每一个主题中。所以这是非常自然的使用深度学习的方法进行说话人识别。

本研究的目的是回顾从最早到最新的解决方案中应用于说话者识别和验证任务的深度学习方法。

说话人的识别( identification)与验证(verification )

说话者识别是从一组已知的说话者中识别一个未知的说话者的任务：找到声音最接近测试样本的说话者。

当给定集合内的所有说话者都已知时，它被称为闭集（或集中）场景。或者，如果这一组已知的扬声器可能不包含潜在的测试对象，则它被称为开放集（或集外）的说话者识别

在说话人验证中，任务是验证自称具有身份的说话者是否真的属于该身份。换句话说，我们必须验证对象是否真的是他或她所说的那个人。这意味着比较两个语音样本/话语，并确定它们是否由相同的说话者说出来。这是 - 在一般说话人验证实践中 - 通常通过将测试样本与给定说话人的样本和通用背景模型进行比较来完成（Reynolds 等，1995）。

数据库

所使用的数据库问题是至关重要的。不同方法性能的评估和比较是困难的，如果数据是不一致，所以训练和评估数据集需要不同的考虑。

在表I中，列出了当前可用的组合以及它们公开发现的不同属性。有些一些数据集是免费的，有些只免费用于研究。？？？？表1呢

主要为自动语音识别(ASR)而创建的绳索也可以用于训练（和评估）SR方法，然而，大多数研究使用的数据集特别是关注说话者识别和验证领域。

语音识别和说话人识别的训练集有所不同，语音识别包含着更多的语音信息，少的说话人信息；而说话人识别则有尽可能多的说话人，减少每个人的录音材料。

说了一些数据库情况，使用干净的数据库进行训练测试，从现实世界的使用角度来看可能不太合适，但也适合于评估SR方法和特性

较短的历史：GMM-UBM和i-向量

第一种自动说话人识别方法是基于高斯混合模型(GMM)，GMM是高斯概率密度函数(PDFs)的组合，通常用于建模多变量数据，它使用无监督的方法来聚类数据，并给出高斯概率密度函数，通过对未知样本的概率函数估计，就可以知道说话者。

GMM是由一些均值向量、协方差矩阵和权值参数化的高斯PDFs的混合物：

第g个混合分量的权重、平均向量和协方差矩阵

对于一系列的声学特征，它们的概率计算为

GMM 超向量

由于语音样本可能有不同的持续时间，因此我们在开发可以从可变长度的样本中获得固定数量的特征的方法中投入了大量的精力。在说话人识别中表现最好的方法之一是形成GMM超向量(坎贝尔等。al，2006)。

超向量是通过连接GMM（平均向量）的参数来创建的。这个固定长度的“超向量”被赋予了一种强制性的机器学习技术。在深度神经网络开始得到广泛关注之前，支持向量机(SVM)(Cortes和Vapnik，1995)被发现是性能最好的技术。

i-向量

语音识别的，先不写…

LR test

是关于说话人验证的，也先不写…

说话人验证的测量

在说话者识别（特别是在验证中）中，有两种相似性度量，如果测试观察结果是否来自目标说话者，它们通常被用来计算概率。几乎所有新的DL方法都使用这些度量（在说话者验证方案中）：向量的余弦距离和PLDA（概率线性判别分析）。

余弦距离

余弦距离只是简单地计算目标和测试i向量( and )的归一化点积，它提供了一个匹配分数

概率线性判别性分析PLDA

LDA（线性判别分析）(Bishop，2006)用于寻找正交轴，以最小化类内变异和最大化类间变异

PLDA，作为LDA的扩展(Tipping和Bishop，1997；Ioffe，2006)，是一种采用同一方法的概率方法

PLDA有能力被应用于比较任意向量，所以它被用于DL方法中。在这里，我们使用传统的i向量方法作出了一个简要的描述。

给定一组d维长度归一化的i向量 = {; = 1, . . . , ; = 1, . . . , } 从n个说话者，i-向量可以被写成下面的形式：

其中={；=1，…，}为潜在变量，={，，}为模型参数，为矩阵（称为因子加载矩阵），is为，‘的全局均值称为说话人因子，为均值和协方差为零的高斯分布噪声。

给定一个测试i向量和，一个目标说话者i向量，可以计算LR分数：

其中W=[]and={，}。使用方程。（2）和块矩阵逆的标准公式，对数似然RL评分由(Ioffe，2006)给出：

说话者识别中的深度学习

一般来说，说话者识别中的深度学习有两个主要方向。一种方法是用深度学习方法代替i-向量计算机制作为特征提取。这些工作使用声学特征(如MFCCs或光谱)作为输入，说话者id作为目标变量，对说话者样本进行训练网络，通常使用内部隐藏层的输出作为i向量替代，并应用余弦距离或PLDA作为决策。另一种主要策略是使用深度学习进行分类和决策，比如用有区别的深度网络取代余弦距离和PLDA。

自动说话人识别系统的性能通常通过等**误差率(EER)和决策成本函数(DCF)**来评估

EER是一个生物识别安全系统算法

当比率相等时，共同值被称为相等错误率。该值表示错误接受的比例等于错误拒绝的比例。等错误率值越低，生物识别系统的准确度越高。或者，决策成本函数考虑目标说话人出现的先验概率、目标和非目标说话人的比例。检测成本函数是区分和校准的同时度量。通常，DCF 曲线的最小值称为 minDCF。

用于特征提取的深度学习

(Chen and Salman, 2011)使用具有多个子集的深度神经网络创建瓶颈特征（说话人模型），每一个子集都是一个深度的自动编码器。

提出了一种混合学习策略：中间层的权重通过成本函数在多个输入（相邻帧）之间共享：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-b00frHj5-1631870164079)(E:\book\blog\说话人识别综述阅读\image-20210917142119013.png)]

(; )是输入i的经过网络的损失， (1, 2; ) 是一个损失函数，优化学习相同的说话人表示（模型），从中提取说话人模型特征。

实验采用TIMIT、NTIMIT、KING、NKING、CHN和Rus数据集。结果表明，该方法在所有数据集的情况下都优于GMM-UBM基线系统

d-向量

在(Variani等人。al，2014)选择具有多个完全连接层的网络的最后一个隐藏层的平均激活作为特征，称为“d向量”

d-向量的使用方式与i-向量的使用方式相同，说话人通过余弦距离进行验证。首先，利用13维感知线性预测(PLP)特征，附加Δ和ΔΔ值作为帧级特征向量

最后的输出层被删除，经过激活函数后的最后一层的值被用于当做特征。

结果表明，一般的i向量系统主要优于新提出的d向量系统。

j-向量

直接识别说话者有些困难，但是实际上，不同的说话者在每个音节或单词上都有自己的风格

因此，不仅在多学习设置中，使用说话者id，而且使用文本作为目标，可以提高说话者的验证性能。

损失函数：

$C_1$ 和 $C_2$ 是是说话人和文本的两个交叉熵标准， $y_1$ 和 $y_2$ 是说话人和文本的真是标签， $y_1^，$ 和 $y_2^，$ 是两个目标值的输出。

提取特征的方法和d-向量一致。去除输出层，并将最后一个隐藏层的输出作为特征向量，定义为j向量（联合向量）。

RSR2015 database 上进行训练。结果表明，j向量方法优于d向量方法。d向量和j向量的EERs分别为21.05%和9.85%

x-向量

另一个隐藏层提取的特征向量称为x向量(Snyderetal.，2018；Fang，2019)。

它基于DNN嵌入，它采用了多层DNN体系结构（具有完全连接的层)，每个层都有不同的时间上下文(他们称之为“框架”）

由于更广泛的时间上下文，该架构被称为时间延迟神经网络 (TDNN)。

主要结果表明，x向量优于一般的基于ivector的系统(i向量和x向量的eer分别为9.23%和8.00%)。

对于短言语话语，(Kanangundaram等，20al.，2019)将第六层和第七层（“第6段”和“第7段”）的维度改为150，以适应较短的持续时间。结果发现，在5秒长话语的情况下，片段6和片段7的较低维度有助于说话者验证，但在原始长话语上获得了较高的EER(使用NISTSRE2010数据集)。另一方面，(Garcia-Romero等人，2019)试图通过DNN细化方法优化长话语（2-4秒）的DNN向量系统，更新DNN参数的子集，并修改DNN架构，生成为余弦距离评分优化的嵌入。结果表明，该方法产生较低的minDCF（最小决策成本函数），但EER略高于基线x向量方法。

End-to-end systems

为了进行说话人验证，提取嵌入并在标准后端中使用，例如，PLDA。然而，理想情况下，应该直接培训说话者验证任务

(Heigold et al., 2016) 不使用余弦距离或 PLDA 分类，而是应用端到端解决方案进行说话人验证与深度网络，以获得说话人表示向量，基于最多 N 个注册话语估计说话人模型和也用于验证（余弦相似性/逻辑回归）。架构如图 4 所示。 DNN（与 d-vector 提取中使用的网络相同）和 LSTM 都应用于说话人表征计算，网络使用端到端损失进行优化：

2 = − ()

$() = (1 + ^{−(,)−})−1 $, () = 1− ()

具有验证阈值的值−/对应。（，）是说话者表示和说话者模型之间的余弦相似性。

‘ok, google’ dataset with more than 73M utterances and 80 000 speakers.

结果表明，如果使用相同的特征提取器(DNN)，则端到端架构的性能与d向量方法相似

然而，与DNN方法相比，LSTM降低了EERs：DNN和LSTM的EERs分别为2.04%和1.36%

在 (Yun et al., 2019) 中提出了另一个端到端系统，其中训练是通过余弦相似性辅助的三元组损失完成的。说话人嵌入网络接受原始语音波形的馈送，生成嵌入向量。该网络使用 LibriSpeech 通过 1.5-2.0 秒 uttarence 块进行预训练。然后使用 CHiME 2013 数据库（Vincent 等人，2013 年）仅使用特定的 2 到 4 个关键字进行说话人验证评估。关键字由 ASR 确定，该 ASR 以对抗方式用于说话人嵌入系统的训练，迫使嵌入向量与说话人无关。结果喜忧参半。三元组损失和 ASR 对抗训练在 2 个关键字的情况下没有提高 EER，只是在检查 3 或 4 个关键字时

深信网络

深度信念网络 (DBN) 是另一种用于说话人识别的深度学习网络（Ali 等人，2018 年；Banerjee 等人，2018 年）。深度信念网络是具有多层潜在变量的生成模型，这些潜在变量通常是二元的。同一层中的神经元不相连，相邻层之间的连接是无向的。由于从隐藏（潜在）层推断后验分布的困难性，DBN 的训练很困难。堆叠受限玻尔兹曼机 (RBM) 可用作 DBN 架构（图 5）。有关更多详细信息，请参阅（Hinton 等人，2006 年）。 DBN 的目标是学习未标记输入数据的抽象层次表示。在(Banerjeeetal.，2018)中，应用PCA变换降维后，将光谱图(25ms窗口大小，10ms时间步长)作为输入语音数据。RBM的第一层和第二层的激活被用作特征（单独的和一起的特征），附加到共同的MFCC特征中。

特征提取后，使用 GMM-UBM 进行说话人识别。作者使用了 ELSDSR 数据集和 22 个说话者。基于结果，从 RBM 中提取的特征有助于识别：分别使用单独的 MFCC 和混合的 MFCC+RBM 特征获得 90% 和 95% 的最终准确率。

(Ali et al., 2018) 也使用相同的声学特征提取方法，但它增加了一个词袋方法，以便将不同长度的数据转换为相同维度的向量（使用 k 均值聚类技术）。 SVM 被用作分类器。实验是在乌尔都语数据集 (Appen, 2007) 上完成的，有 10 个说话者。在这里，混合 (MFCC+DBN) 特征也表现最好：MFCC 和 MFCC+DBN 特征分别获得了 88.6% 和 92.60% 的准确率。

在 (Liu et al., 2015) 中，使用深度受限玻尔兹曼机 (RBM)、语音判别深度神经网络、说话人判别神经网络和多任务联合对用于深度特征提取的多种 DNN 方法进行了广泛评估。学习了深度神经网络。 RBM 的使用方式与上一节相同（Ali 等人，2018 年；Banerjee 等人，2018 年）。应用语音判别 DNN，文本标签作为训练数据，三音素状态作为目标。这种情况在依赖于文本的说话人验证任务中很有用。最后一个隐藏层的输出用作特征。在说话人判别 DNN 的情况下，语音判别网络的输出更改为说话人 ID。这样，就可以获得一个更特定的说话者的特征集，这是说话者验证的一个更自然的选择。在多任务设置中，前面提到的(说话人id和三角电话)输出都被用作目标。采用使用PLP特征训练的标准i向量系统作为基线(具有余弦相似性的GMM-UBM)。新提出的深度特征分别在RSR2015年的数据集上进行了测试(Larcheretal.，2012年)。

CLNets

在 (Wen et al., 2018) 中，提出了一种深度校正学习网络 (CLNet)，通过循环形式来分析独立样本。每个新实例都会进行校正预测，以更新根据先前数据所做的预测。这意味着使用增量策略而不是对说话者的片段进行平均结果。 CLNet 使用卷积层进行说话人验证。 NIST SRE 2004-2010 语料库用于实验。通过使用余弦相似度，与标准 i-vector 系统相比，获得了约 2.5% 的 EER（i-vector、标准 CNN 和 CLNets 的 EER 分别为 7.3%、5.18% 和 4.87%）。但是，使用 PLDA，i-vector 表现更好。

Text dependency 文本依赖性

尽管如此，i-vector 系统在独立于文本的场景中仍优于 DNN（Snyder 等人，2016 年）。因此，以标准 i-vector PLDA 系统为基础，(Rohdin et al., 2018) 提出了一种端到端的 DNN，可以学习 GMM-UBM 的足够统计数据并提供 i-vector。在网络的第一部分，GMM 后验通过多层架构学习，然后使用标准 i 向量作为目标，以余弦距离作为损失函数

Deep learning for classification 深度学习分类

与其应用深度特征提取来交换公共 i 向量以获得更健壮和性能更好的说话者表示，DNN 还可以用于替换后端系统进行评分和比较（如 PLDA 和余弦距离）。此类作品在文献中比与特征提取相关的作品更稀少。

Variational autoencoder 变分自编码器

变分自编码器 (VAE)（Kingma 和 Welling，2013 年；Rezende 等人，2014 年）是一种用于信号（和语音）建模的生成模型。它用于语音转换（Hsu 等，2017a；Hsu 等，2017b）、语音识别以及说话人识别（Villalba 等，2017；Pekhovsky 和 Korenevsky，2017）。 VAE 不仅使用确定性层，还包含随机神经元。 LLR 评分通过以下方式进行：

其中，，是假设1，2是分别与相同或不同的说话者相关的事实，是为说话者模型的参数。结果显示，变量似乎并不优于PLDA评分

Multi-domain features 多域功能

使用文本相关数据来帮助学习说话人 ID 也被用于说话人识别任务中的分类，（Tang 等人，2016）使用 ASR 的输出来提高说话人识别的性能。图 6 显示了提出的多任务学习。 ASR（phoneposteriors）的输出被送入 SRE 系统，反之亦然。每个任务的输入是提取的帧级谱（分别用于 ASR 和 SRE 的滤波器组和 MFCC）。实验是在 WSJ 数据集上完成的。基于结果，所提出的方法实现了与 i-vector 基线相同或略好的 EER（ivector 和多任务方法分别为 0.57% 和 0.55%）。

Replacing UBM with DNN 用DNN替换UBM

DNN 也可用于替代 UBM。通用深度信念网络 (UDBN)（Ghahabi 和 Hernando，2017 年）用作后端，其中针对每个目标说话者训练二类混合 DBN-DNN ti 增加了目标 i-vector/s 和 i- 其他 soeakers（非目标/冒名顶替者）的向量。图 7 显示了所提出方法的训练/测试阶段。首先，训练一个无监督的通用 DBN，然后通过特殊的平衡训练过程使其适应目标说话者。在测试阶段，未知 i 向量与适应的目标 i 向量匹配。基于对 NIST SRE 2006 和 2014 数据集所做的评估，所提出的算法没有实现比 i-vector PLDA 基线方法更好的性能。然而，将 DNN 方法与 PLDA（i-vector）方法相融合，显示出比单独使用 i-vector 更好的性能。

Using Contrastive loss for vector comparison 利用对比损失进行向量比较

由于说话人识别被视为一个简单的分类任务，因此可以应用 softmax 层来创建 DNN 后端系统。然而，在说话人验证中，两个（说话人建模）向量的比较是必要的。在 DNN 中，可以通过这种方式实现的一种方法是使用对比损失（Chopra 等，2005）作为深度特征的损失函数。卷积网络（即 VGG（Simonyan 和 Zisserman，2014；Yadav 和 Rai，2018））（Nagrani 等，2017）和 ResNets（He 等，2015；Chung 等，2018）可以通过这种方式进行训练执行说话人验证任务。在 VoxCeleb 和 VoxCeleb2 数据集上，获得的 EER 低于标准 i-vector PLDA 系统：i-vector、CNN 和 ResNet 的 EER 分别为 8.8%、7.8% 和 3.95%。然而，在 (Chung et al., 2018) 中，ResNet 和基线系统没有在同一个数据集上训练（RestNet：VoxCeleb2，i-vector：VexCeleb1），因此这种增加可能来自更大音频材料的影响。
wei wan …

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
扫地机类清洁产品之直流无刷电机控制悟空胆好小清洁服务机器人单片机人工智能
扫地机类清洁产品之直流无刷电机控制1.1前言扫地机产品有很多的电机控制，滚刷电机1个，边刷电机1-2个，清水泵电机，风机一个，部分中高端产品支持抹布功能，也就是存在抹布盘电机，还有追觅科沃斯石头等边刷抬升电机，滚刷抬升电机等的，这些电机有直流有刷电机，直接无刷电机，步进电机，电磁阀，挪动泵等不同类型。电机的原理，驱动控制方式也不行。接下来一段时间的几个文章会作个专题分析分享。直流有刷电机会自动持续
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
感赏日志133 马姐读书
图片发自App感赏自己今天买个扫地机，以后可以解放出来多看点书，让这个智能小机器人替我工作了。感赏孩子最近进步很大，每天按时上学，认真听课，认真背书，主动认真完成老师布置的作业。感赏自己明白自己容易受到某人的影响，心情不好，每当此刻我就会舒缓，感赏，让自己尽快抽离，想好的一面。感赏儿子今天在我提醒他事情时，告诉我谢谢妈妈对我的提醒我明白了，而不是说我啰嗦，管事情，孩子更懂事了，懂得感恩了。投射父母
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
18-115 一切思考不能有效转化为行动，都TM是扯淡！成长时间线
7月25号写了一篇关于为什么会断更如此严重的反思，然而，之后日更仅仅维持了一周，又出现了这次更严重的现象。从8月2号到昨天8月6号，5天！又是5天没有更文！虽然这次断更时间和上次一样，那为什么说这次更严重？因为上次之后就分析了问题的原因，以及应该如何解决，按理说应该会好转，然而，没过几天严重断更的现象再次出现，想想，经过反思，问题依然没有解决与改变，这让我有些担忧。到底是哪里出了问题，难道我就真的
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
利用Requests Toolkit轻松完成HTTP请求 nseejrukjhad http 网络协议网络 python
RequestsToolkit的力量：轻松构建HTTP请求Agent在现代软件开发中，API请求是与外部服务交互的核心。RequestsToolkit提供了一种便捷的方式，帮助开发者构建自动化的HTTP请求Agent。本文旨在详细介绍RequestsToolkit的设置、使用和潜在挑战。引言RequestsToolkit是一个强大的工具包，可用于构建执行HTTP请求的智能代理。这对于想要自动化与外
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
CX8903：Ebike自行车仪表电源方案开发,Ebike智能仪表电源芯片诚芯微科技社交电子
CX8903：电动Ebike自行车仪表电源方案开发,Ebike智能仪表电源芯片推荐。电动助力自行车EBIKE凭借其环保、健康、低噪、和便捷等特点，成为了越来越受欢迎的骑行便利交通工具。提供电动Ebike自行车仪表电源方案开发、E-BIKE电动助力自行车仪表供电电源解决方案。CX8903采用100V高压制造工艺（芯片最高耐压可到100V以上），SOP-8L贴片封装，CX8903内置100V/90mΩ
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
闲鱼鱼小铺怎么开通？鱼小铺开通需要哪些流程？高省APP大九
闲鱼鱼小铺是平台推出的一个专业程度的店铺，与普通店铺相比会有更多的权益，比如说发布的商品数量从50增加到500；拥有专业的店铺数据看板与分析的功能，这对于专门在闲鱼做生意的用户来说是非常有帮助的，那么鱼小铺每个人都能开通吗？大家好，我是高省APP联合创始人蓓蓓导师，高省APP是2021年推出的电商导购平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个可省钱佣金高，能
Low Power概念介绍-Voltage Area 飞奔的大虎
随着智能手机，以及物联网的普及，芯片功耗的问题最近几年得到了越来越多的重视。为了实现集成电路的低功耗设计目标，我们需要在系统设计阶段就采用低功耗设计的方案。而且，随着设计流程的逐步推进，到了芯片后端设计阶段，降低芯片功耗的方法已经很少了，节省的功耗百分比也不断下降。芯片的功耗主要由静态功耗（staticleakagepower）和动态功耗(dynamicpower)构成。静态功耗主要是指电路处于等
2019-11-04复盘——飞来山上千寻塔，闻说鸡鸣见日升。那一叶秋
1、大盘篇先上老图，看习惯了，也就知道走势了图1上证指数日线图还是那张老图，自己可以在自己的相关软件上画出来，快变盘了。2、个股篇未加仓、未减仓。分析量能的时候，突然发现这么一个东西：“放量突破年线，缩量回调。”合众科技日线图其实，最近的N只个股，在技术分析上，都到了变盘的临界时候。结合这么久的走势，特别是ZJH不断放开IPO的申请，本质上说是融资难度变大，或者说是为企业的融资开创便利。但现在市场
18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构
聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
果然只有离职的时候，才有人敢说真话！ return2ok
今天公司出了神贴。今天中午吃饭，同事问我看了论坛上的神贴了吗？什么帖子？我问。同事显得很惊讶，你居然没看，现在那个帖子可能会成为年度最佳帖子。这么厉害？我等不及了，饭没吃完就快速的奔向办公室，打开公司论坛，我要一睹这个帖子的神奇。写这帖子的童鞋胆儿真肥。这哪里是一个帖子，这是很多个帖子，组成了一个系列。某人从公司文化、管理、人事、项目管理等多个方面分析了公司的概况，并抨击了公司的各种弊端，并提出了
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class