王小二_Leon

论文翻译：基于麦克风和AEC误差互相关性的归一化的双讲检测

NORMALIZED DOUBLE-TALK DETECTION BASED ON MICROPHONE AND AEC ERROR CROSS-CORRELATION

文章目录

- NORMALIZED DOUBLE-TALK DETECTION BASED ON MICROPHONE AND AEC ERROR CROSS-CORRELATION
- 1. 介绍
- 2. 之前的工作
- 3. 基于麦克风信号和AEC误差互相关性的归一化双声检测
- - 3.1 新检验统计量与Benesty检验统计量之间的关系
- 4. 混合双讲检测
- 5. 实验和结果
- 6. 结论
- 参考文献

摘要-在本文中，我们提出了两种不同的回声消除（AEC）双声检测方案。首先，我们提出了一种基于麦克风信号和消除误差之间的互相关系数的新型归一化检测统计量。决策统计量的设计方式使其能够满足最佳双声探测器的需求。我们还表明，所提出的检测统计量收敛于最近提出的基于归一化互相关的双谈话检测器[1]，这是最著名的基于互相关的检测器。接下来，我们提出一种基于互相关系数和两个信号检测器的新型混合双声检测方案。混合算法不仅可以检测双声，还可以有效地检测和跟踪任何回声路径变化。我们将结果与其他基于互相关的双关语检测器进行比较，以显示其有效性。

1. 介绍

大多数电话会议通话都是在有回声的情况下进行的[2];如果语音与其回声之间的延迟超过几十毫秒，则回声很明显让人注意到。回声消除器 (AEC)用于消除由于扬声器-麦克风所处环境而产生的回声 [3]。回声消除是通过自适应合成回声的副本并从回声损坏的信号中减去结果来实现的[2]。当近端发言者处于活动状态或语音同时来自远端和近端时，如果启用自适应，滤波器系数将与真正的回声路径脉冲响应背离。双通话检测器用于在近端语音期间停止AEC的滤波器适应[3]。

双声检测在回声消除中起着非常重要的作用。双声检测算法应该能够快速准确地检测出双讲情况，以便尽快冻结适应；同时，它应该能够跟踪任何回声路径的变化，并且应该能够将双讲与回声路径的变化区分开来[4]。为了解决这个问题，本文提出了两种不同的双讲检测技术。用于双讲检测的最佳决策变量 ξ 应表现为[3]：

如果双讲不存在，即 $\geq T$ 。
如果双讲存在，即 $\neq0，ξ v=0，ξ<T$

图1显示了自适应回声消除器的基本结构。远端信号 $x$ 通过房间脉冲响应 $h$ 滤波，得到回声信号

其中

并且 $L$ 是回声路径的长度。将此回声信号添加到近端语音信号 $v$ 中，以获得麦克风信号

在时刻 $n$ 时，误差信号定义为：

并且误差信号被用于调整AEC自适应滤波器^h的 $L$ 抽头。

本文的结构如下。在第 2 节中，我们回顾了以前的双讲检测算法。在第3节中，提出了新颖的归一化双讲检测算法，并且我们还展示了所提出的算法与[1]中提出的算法之间的联系。我们在第4节中提出了新的混合双声检测方案。接下来，我们在第5节中对提议的算法进行了全面的研究，然后在第6节中进行了总结和结论。

2. 之前的工作

参考图1，Ye和Wu[4]首先提出使用扬声器播放的远端信号矢量 $x$ 与AEC的消除误差 $e$ ， $r_{ex} = E[ex^T]$ 之间的互相关矢量作为双声检测的基础。在本文中，我们将此算法称为 XECC。Benesty [1]的仿真结果表明，这种方法不能很好地检测双重谈话，理论推导提供了进一步的见解。请注意，近端语音 $v$ 独立于远端信号 $x$ ，并且假设所有信号均值为零，则 AEC 的误差信号与扬声器信号之间的互相关值为

其中 E[•] 表示数学期望，而 $R_{xx} = E[xx^T]$ 。显然，从等式4中我们观察到只有当回声路径发生变化时， $r_{ex}$ 才会很高；因此，这种方法更适合于跟踪回声路径变化，而不是检测双端通话。
图一：基本AEC模型

最近，贝内斯蒂等人。[1] [5]提出了一种基于远端信号向量 $x$ 与麦克风信号标量 $m（r_{xm} = E[xm]）$ 的互相关双讲检测算法，本文将其称为XMCC。贝内斯蒂用于检测 [1] 中的双重谈话的决策统计量由下式给出:

其中 $R_{xx}$ 较早定义以及麦克风信号的方差 $σ_m^2)$ 为

其中 $σ_v^2$ 是近端语音功率。

3. 基于麦克风信号和AEC误差互相关性的归一化双声检测

我们建议使用消除误差 $e$ 和麦克风信号 $m$ ， $r_{em} = E[em]$ 之间的互相关，而不是使用第2节中讨论的 $r_{ex}$ 或$ r_{xm}$，作为双声检测的基础。该算法在本文中称为MECC。

我们将新的规范化决策统计定义为：

将等式6和7代入8，我们得到：

我们从等式 9 中观察到，对于 $v = 0$ ， $ξ MECC \approx 1$ ，对于 $\neq 0$ ， $ξ MECC < 1$ 。因此，所提出的检测统计量满足了最优双讲检测器的需求。

图二：显示文中提出的MECC和XMCC双讲检测器的收敛性

(8)中 $r_{em}$ 和 $σ^2_ m$ 的值是精确的，其在实践中不可用。因此，最终决策统计数据由下式给出：

这是基于估计的^ $r_{em}[n]$ 和^ $σ^2_ m$ 。这估计值是通过使用指数递归加权算法 [6] [7] 找到的：

其中 $e [n]$ 是时刻n时捕获的消除误差样本， $m [n]$ 是时刻n时捕获的麦克风信号样本，λ 是指数加权因子。如果

我们的结论是，捕获的麦克风信号样本被近端语音破坏，并停止了AEC自适应滤波器的适应。否则，我们将继续适应。

除了简单之外，文中所提出的检测统计量的主要优点是只需要计算最大互相关，而不是计算其他算法所需的整个互相关向量。与其他算法相比，可节省大量计算成本；我们只需要 2 次乘法、2 次加法、1 次减法和 1 次除法来计算每个样本的决策统计量（即每个样本 6 次运算），而对于Benesty检验统计量，需要 $3 L + 3$ 次运算来计算每个样本的检测统计量，其中 $L$ 是帧大小（通常为 $L \geq 512$ ）。

3.1 新检验统计量与Benesty检验统计量之间的关系

本文提出的决策统计量由(10))给出，理论上可以重写为(9)，Benesty的双讲决策统计量在(5)中给出。决策统计是不同的，因为前者基于 $r_{em}$ ，后者基于 $r_{xm}$ 。尽管决策统计信息不同，但它们会导致产生类似的表达式。在 (5)中代入 $r_{xm} = R_{xx}h$ 和$ σ^2_m = h^TR_{xx}h + σ^2_v$，我们得到

并且从(9)中我们有：

除了平方根之外，决策统计量之间的另一个区别还在于分子;我们有 $ξ MECC$ 中 AEC 滤波器^ $h^T$ 的抽头和 $ξ XMCC$ 中的真实回声路径脉冲响应 $h^T$ 。然而，为了实际实现和计算简单性，[1]中的作者用 $ˆh^T$ 代替 $h^T$ ，从而产生类似的决策统计。图 2 中的模拟表明，与 Benesty 的检验统计量相比，文中提出的决策统计量具有相似的性能。然而，我们的算法要简单得多，计算效率也更高。

4. 混合双讲检测

在本节中，我们介绍了一种基于麦克风和AEC消除误差之间的互相关测量的混合双声检测器，类似于第三节中提出的想法，以及基于语音检测和基于实时循环学习（RTRL）的鉴别器的双声检测算法[8]。混合双声检测算法的架构如图 3 所示。

图三：混合双讲检测模型

在此算法中，我们在回声消除误差信号 $e$ 和由估计的互相关函数(ECC)给出的麦克风信号 $m$ 之间使用不同的互相关度量：

ECC是帧中相关性的最大值，并使用指数递归加权算法 [6] [7] 对其进行更新

其中$e[t] $是时间帧 t 中捕获的消除误差向量，$ m[t] $是时间帧$ t$中捕获的麦克风信号向量，λ 是指数加权因子。或者，我们也可以使用（10）中给出的MECC检验统计量。λ 值越小，跟踪能力越好，但估计精度越差。在实践中，对于缓慢的时变信号，通常选择 $0.9 \leq λ \leq 1$ [4]。我们从（14）中观察到，每当回声路径发生变化和/或当近端语音存在时，互相关性都很高。为了将近端语音与回声路径变化区分开来，我们使用基于实时循环学习（RTRL）[8]的语音检测器和信号判别器，这将在下面描述。

频域逻辑判别语音检测器用于检测语音的存在[9]。类概率被估计为

其中 $P_t$ 是时间帧 t 处的语音概率， $W^T$ 是经过训练的权重( $1 \times f re q u e n cy bin s$ )， $χ_t$ 是时间帧 t 处每个频率箱中提取的特征的向量。训练的权重 $W^T$ 是使用实时循环学习[10]获得的，并通过离线训练获得。有关语音检测器及其训练过程的详细讨论，请参见 [8]。

我们在麦克风上使用两个检测器来检测近端语音的存在，如图3所示。对于麦克风信号检测器（NESD），我们使用估计的后通道SNR的对数作为特征[9]：

其中 $N_{NE}$ 是近端频率箱 $k $ 和时间帧 $t$ 中的噪声能量。噪声功率 N 可以使用 [11] 进行跟踪。在本文中，我们使用最小跟踪器（对于每个频率箱，我们回顾几帧（例如25）并选择信号的最低值），然后进行平滑处理，以跟踪本底噪声[11]。该NESD检测器在麦克风上提供语音的存在，这可能是由于近端语音或远端回声。

为了区分近端语音和远端回声，我们使用特殊的检测器/鉴别器SD，这需要将近端语音与远端回声区分开来的功能。因此，我们使用麦克风信号 $M$ 的瞬时功率与远端信号 $X$ 的瞬时功率之比的对数作为特征，即

在[8]中观察到，提取的特征对于不同的场景是不同的。提取的特征通常仅针对近端语音最大，对于仅回声情况最小，对于双重通话情况，提取的特征介于两者之间。不同的特征水平对应于不同的概率水平；较大的特征对应于较高的概率。对于仅回声情况，提取的特征始终为低，与回声路径无关；因此，在没有近端语音的情况下，特殊的检测器/消旋器与回声路径无关。

当两个探测器都指示语音的存在时，我们确认近端语音的存在。基于语音检测的双声检测器[8]在单独用于双声检测时不会提供卓越的性能。然而，通过将其与所提出的互相关度量相结合，可以提高性能。混合式双讲探测器的工作原理如下：

当两个探测器都指示语音存在的高概率（即 $P_{NESD}（t）≥P_{Threshold_1}$ 和 $P_{SD}（t）≥P_{Threshold_2}$ ）和估计的互相关 $ECC(t)≥R_{th}$ 时，麦克风信号的捕获帧被近端语音破坏。
当 $P_{NESD}（t）≥P_{Threshold_1}$ 、 $P_{SD}（t）PSD（t）<PThreshold2$
当 $P_{NESD}（t）≥P_{Threshold_1}$ 、 $P_{SD}（t）PSD（t）<PThreshold2$

图四：P_m作为文中提出的MECC和CCSD双讲探测器和XECC双讲探测器的NFR函数，其中P_f = 0.1。

在第一种情况下，我们停止自适应滤波器系数的调整，但在最后两个条件下继续适应。图4中的结果显示使用ECC，但在混合双讲检测器中使用MECC检验统计量（8）的性能可能等于或略优于使用ECC检验统计量。

5. 实验和结果

现在，我们介绍所提出的双讲探测器的仿真结果。该性能的特征在于在误报概率（ $P_f$ ）约束下，未命中概率（ $P_m$ ）是近端到远端语音比（NFR）的函数 [5]。未命中（ $P_m$ ）的概率是存在时未检测到（未命中）双重谈话的概率；因此， $P_m$ 值越小，表示性能越好。为了评估所提出的双关语探测器，我们遵循[5]。

以16 KHz采样的录制数字语音用作远端语音 $x$ 和近端语音 $v$ ，并将测量的 $L = 8000$ 样本（500ms）的 $1 0^{'} \times 1 0^{'} \times 8^{'}$ 房间的脉冲响应用作扬声器 - 麦克风环境 $h$ 。我们将结果与[4]中提出的基于传统互相关（XECC）的双声探测器和[8]中提出的基于RTRL的双声探测器进行了比较。在 $P_f = 0.1$ 的约束下，四种方法的 $P_m$ 特性如图 4 所示。很明显，在全NFR值范围内，本文提出的混合的归一化检测统计量（MECC）的性能明显优于传统的（XECC）双扰检测器。此外，可以观察到，对于大多数NFR值，混合双声检测方案的性能优于基于RTRL的双响检测器。因此，我们得出结论，通过将RTRL双话检测器与所提出的互相关测量方法相结合，可以提高其性能。在较低的NFR值下，RTRL和混合双声检测器的性能优于基于最佳测试统计量的MECC算法。性能提高最有可能的原因，是由于RTRL针对存在噪声的情况下改进了语音检测功能。

应该注意的是，本文所提出的归一化决策统计量（MECC）的性能与贝内斯蒂检验统计量（XMCC）完全相同，后者是众所周知的基于互相关的双声探测器。然而，我们的检测统计在计算上非常有效，检测阈值 $T$ 与数据无关，并且对回声路径变化不敏感。

6. 结论

我们提出了两种不同的双声检测技术。首先，我们引入了新颖的归一化决策统计；其所提出的检测统计量满足了最优双声检测器的需求，计算效率非常高，并且收敛于最知名的基于互相关的双讲检测器。接下来，我们制定了混合双声检测方案。混合双谈话探测器逐帧工作；该算法不仅可以检测双声，还可以检测和跟踪任何回声路径变化。不过这是以增加计算复杂性为代价实现的。

参考文献

注：由于本文为博主自己翻译的仅供自己学习记录，为不影响文章的阅读性。公式和图片直接从文章中截图使用。如有错误，请联系博主改正！！！

【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
潜入思维的海洋：SoftCoT++如何让语言模型更聪明步子哥智能涌现语言模型人工智能自然语言处理
在人工智能的浩瀚星空下，大型语言模型（LLMs）如同一颗颗璀璨的恒星，照亮了从文本生成到复杂推理的广阔领域。然而，这些模型在推理任务中往往像是在迷雾中航行——尽管它们能抵达目的地，却常常因为固定的思维路径而错过更优的航线。2025年5月，一篇题为《SoftCoT++:Test-TimeScalingwithSoftChain-of-ThoughtReasoning》的论文如同一盏明灯，照亮了如何让
BI+AI实战：我们如何用3秒完成车企供应链推演 qq_43696218 人工智能
一、BI+AI引领财务分析新纪元在财务数据分析领域，奥威BI+AI正以革命性的姿态颠覆传统。当金蝶、用友等工具仍深陷报表泥潭时，奥威BI+AI通过深度融合商业智能（BI）与人工智能（AI），实现了从滞后报表到实时洞察的飞跃。这不仅极大地提升了财务分析的效率，更为企业的战略决策提供了前所未有的精准支持。二、BI+AI的核心技术优势‌实时动态分析‌o奥威BI+AI摒弃了静态数据集，依托原始科目余额表实
DeepSeek-V3 通俗详解：从诞生到优势，以及与 GPT-4o 的对比码事漫谈 AI ai
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站1.DeepSeek的前世今生1.1什么是DeepSeek？DeepSeek是一家专注于人工智能技术研发的公司，致力于打造高性能、低成本的AI模型。它的目标是让AI技术更加普惠，让更多人能够用上强大的AI工具。1.2DeepSeek-V3的诞生DeepSeek-V3是DeepSeek公司推出的最新一代A
企业级AI开发利器：Spring AI框架深度解析与实战_spring ai实战 AI大模型-海文人工智能 spring python 算法开发语言 java 机器学习
企业级AI开发利器：SpringAI框架深度解析与实战一、前言：Java生态的AI新纪元在人工智能技术爆发式发展的今天，Java开发者面临着一个新的挑战：如何将大语言模型（LLMs）和生成式AI（GenAI）无缝融入企业级应用。传统的Java生态缺乏统一的AI集成方案，开发者往往需要为不同AI供应商（如OpenAI、阿里云、HuggingFace）编写大量重复的接口适配代码，这不仅增加了开发成本，
图扑软件智慧云展厅，开启数字化展馆新模式智慧园区可视化 5g 人工智能大数据安全云计算
随着疫情的影响以及新兴技术的不断发展，展会的发展形式也逐渐从线下转向线上。通过“云”上启动、云端互动、双线共频的形式开展。通过应用大数据、人工智能、沉浸式交互等多重技术手段，构建数据共享、信息互通、精准匹配的高精度“云展厅”，突破时空壁垒限制。图扑软件运用HT强大的渲染功能，数字孪生“云展位”，1:1复现实际展厅内部独特的结构造型和建筑特色。也可以第一人称视角漫游，模拟用户在展厅内的参观场景，在保
转行要趁早！网络安全行业人才缺口大，企业招聘需求正旺！
网络安全行业具有人才缺口大、岗位选择多、薪资待遇好、学历要求不高等优势，对于想要转行的人员来说，是一个非常不错的选择。人才缺口大网络安全攻防技术手段日新月异，特别是现在人工智能技术飞速发展，网络安全形势复杂严峻，人才重要性凸显。教育部《网络安全人才实战能力白皮书》数据显示，到2027年，我国网络安全人员缺口将达327万。近期发布的《2024年网络安全产业人才发展报告》中提到，沿用ISC2的人才缺口
【机器学习与数据挖掘实战 | 医疗】案例18：基于Apriori算法的中医证型关联规则分析 Francek Chen 机器学习与数据挖掘实战机器学习数据挖掘 Apriori python 关联规则人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈机器学习与数据挖掘实战⌋⌋⌋机器学习是人工智能的一个分支，专注于让计算机系统通过数据学习和改进。它利用统计和计算方法，使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联和异常的过程，旨在提取有价值的信息和知识。机器学习为数据挖掘提供了强大的分析工具，而数据挖掘则是机器学习应用的重要领域，两者相辅相成，共同推动
误差的回响：反向传播算法与神经网络的惊天逆转田园Coder 人工智能科普人工智能科普
当专家系统在20世纪80年代初期大放异彩，成为人工智能实用化的耀眼明星时，另一股曾经被宣判“死刑”的力量——连接主义（神经网络）——正在寒冬的冻土下悄然涌动，孕育着一场惊天动地的复苏。马文·明斯基和西摩·帕尔特在1969年《感知机》专著中那精准而冷酷的理论批判，如同沉重的封印，将多层神经网络的研究禁锢了近二十年。他们指出的核心死结——缺乏有效算法来训练具有隐藏层的网络——仿佛一道无法逾越的天堑。单
【Html实现“心形日出”（附效果+源代码）】| JavaScript面试题：解释一下异步编程中的回调函数、Promise和Async/Await的概念。它们有什么区别？追光者♂ html5 css3 心形日出前端特效 JS面试题 Promise Async/Await
风会带走你曾经存在过的证明。——虞姬作者主页：追光者♂个人简介：[1]计算机专业硕士研究生[2]2023年城市之星领跑者TOP1(哈尔滨)[3]2022年度博客之星人工智能领域TOP4[4]阿里云社区特邀专家博主[5]CSDN-人工智能领域优质创作者无限进步，一起追光！！！
青少年编程与数学 01-012 通用应用软件简介 15 人工智能助手明月看潮生编程与数学第01阶段青少年编程人工智能应用软件编程与数学
青少年编程与数学01-012通用应用软件简介15人工智能助手一、什么是人工智能助手二、人工智能助手的产生和发展（一）早期探索阶段（二）技术突破阶段（三）广泛应用阶段三、人工智能助手的主要功能（一）信息查询（二）日程管理（三）设备控制（四）知识问答四、人工智能助手的商业模式（一）广告收入（二）增值服务（三）数据服务（四）硬件销售五、DeepSeek（一）基本情况（二）技术水平（三）产品功能（四）市场
虚拟空间中的AI协作与任务 AI天才研究院 ChatGPT AI大模型企业级应用开发实战 AI人工智能与大数据大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
虚拟空间与AI概述在当今信息化和数字化的时代，虚拟空间（VirtualSpace）已成为人们生活和工作的重要一部分。虚拟空间是一种通过计算机技术构建的虚拟环境，它能够模拟和增强现实世界中的各种交互和体验。而人工智能（AI）作为计算机科学的一个分支，通过模拟人类的认知能力来实现自动化和智能化的决策。虚拟空间与AI的结合，不仅为人类带来了全新的交互方式，也为各行业的发展注入了强大的动力。虚拟空间的定义
AI Agent: AI的下一个风口智能体在元宇宙里的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AIAgent:AI的下一个风口智能体在元宇宙里的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AIAgent,元宇宙,虚拟角色,智能交互,人工智能,虚拟世界,智能体架构,交互式应用1.背景介绍1.1问题的由来随着虚拟现实(VR)、增强现实(AR)和区块链技术的不断发展，元宇宙(Metaverse)的概念逐渐兴起。元宇宙是一个由虚拟世界
攻击者利用热门AI发动黑帽SEO攻击，通过污染搜索结果传播窃密木马 FreeBuf- 人工智能
伪装成AI主题网站的恶意页面|图片来源：ZscalerZscaler威胁实验室研究人员发现一起精心策划的恶意软件攻击活动，攻击者利用ChatGPT和LumaAI等人工智能(AI)工具的热度，通过黑帽SEO（搜索引擎优化）技术劫持搜索引擎结果，诱导用户落入恶意软件陷阱。Zscaler警告称："这些攻击背后的威胁行为者正在利用ChatGPT和LumaAI等AI工具的热度。"这些欺诈活动至少从2025年
Python/Java/Php/C#/Go/C/C++这几个主力语言，谁到底真的不行 dotNET跨平台 java c#开发语言
1.前言阿里最近又进行了史诗级的大裁员，IT行业肉眼可见的持续性衰退与没落。当潮水退却，才能看出谁在裸泳。作为当今计算机编程界的几大主力语言，谁才真正的裸泳者呢？2.描述1.Python:Python作为一款解释性的动态语言，它很早就诞生了。它的第一个发行版1991年出世，比Java还要早四年。可惜命运不济，一直没有大的作为。到了2014年人工智能的风口悄然兴起，Python一路高歌猛进。到了20
人工智能-基础篇-5-建模方式（判别式模型和生成式模型）
机器学习包括了多种建模方式，其中判别式建模（DiscriminativeModel）和生成式建模是最常见的两种。这两种建模方式都可以通过深度学习技术来实现，并用于创建不同类型的模型。简单来说：想要创建一个模型，依赖需求需要合适的建模方式来创建这个模型。通常建模方式主要分为两大类。一类是判别式模型，针对输入数据给出特定的输出。如：判断一张图片是猫还是狗，直接学习“猫”和“狗”的特征差异（如耳朵形状、
【机器学习】数学基础——张量（傻瓜篇）一叶千舟深度学习【理论】机器学习人工智能
目录前言一、张量的定义1.标量（0维张量）2.向量（1维张量）3.矩阵（2维张量）4.高阶张量（≥3维张量）二、张量的数学表示2.1张量表示法示例三、张量的运算3.1常见张量运算四、张量在深度学习中的应用4.1PyTorch示例：张量在神经网络中的运用五、总结：张量的多维世界延伸阅读前言在机器学习、深度学习以及物理学中，张量是一个至关重要的概念。无论是在人工智能领域的神经网络中，还是在高等数学、物
深度学习详解：通过案例了解机器学习基础 beist 深度学习机器学习人工智能
引言机器学习（MachineLearning，ML）和深度学习（DeepLearning，DL）是现代人工智能领域中的两个重要概念。通过让机器具备学习的能力，机器可以从数据中自动找到函数，并应用于各种任务，如语音识别、图像识别和游戏对战等。在这篇笔记中，我们将通过一个简单的案例，逐步了解机器学习的基础知识。1.1机器学习案例学习1.1.1回归问题与分类问题在机器学习中，根据所要解决的问题类型，任务
Gen AI：重塑未来的创造力工具箱一杯酒zpy 人工智能
目录页一、GenAI工具箱助力大学生涯1.通用GenAI工具2.GenAI科研辅助1.文献阅读与论文写作2.数据分析与可视化3.AI翻译工具二、GenAI办公、学习助手1.PPT制作2.表格制作3.AI思维导图4.AI办公5.AI图像处理6.AI视频处理7.AI音频处理8.AI编程工具9.AI搜索引擎说明：网盘资源密码获取：关注微信公众号【土木岛】，后台回复文件框中提示的对应关键词自动发送。点击查
【人工智能】微调的秘密武器：释放大模型的无限潜能蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在人工智能迅猛发展的今天，大规模语言模型（LLMs）以其强大的通用能力席卷各行各业。然而，如何让这些通用模型在特定领域或任务中发挥最大潜力？答案是微调（Fine-tuning）。本文深入探讨微调的理论基础、技术细节与实践方法，揭示其作为解锁大模型隐藏潜力
昇腾AI生态组件全解析：与英伟达生态的深度对比
随着人工智能技术的快速发展，国产AI芯片的崛起正在改变全球计算产业的格局。华为昇腾（Ascend）系列AI处理器凭借自主创新的达芬奇架构，构建了完整的软硬件生态体系。本文将从核心组件对比、显卡性能对标两个维度，深入剖析昇腾与英伟达（NVIDIA）生态的技术差异与适用场景。一、昇腾核心组件与英伟达对标分析1.推理引擎：MindIEvsTensorRT昇腾MindIE1.0.0基于昇腾芯片的深度学习推
媒体AI关键技术研究阿维同学大模型应用开发人工智能研究报告媒体人工智能 ai AIGC
一、引言随着人工智能技术的迅猛发展，媒体行业正经历前所未有的变革。AI技术不仅重塑了内容生产和传播模式，更为媒体创意发展提供了全新可能。在数字化、移动化和信息爆炸的大背景下，传统媒体面临巨大挑战，而AI技术为行业带来了新的机遇。媒体行业正从搜索驱动向AI驱动的内容发现转变，通过新兴技术的融合创造全新的内容消费体验[[1]]。这种转变不仅提高了内容生产效率，也为受众提供了更加个性化的媒体体验。人工智
智能汽车图像及视频处理方案，支持视频智能包装创作能力美摄科技汽车
在这个日新月异的智能时代，每一帧画面都承载着超越想象的力量。随着自动驾驶技术的飞速发展，智能汽车不仅成为了未来出行的代名词，更是技术与艺术完美融合的典范。在这场变革的浪潮中，美摄科技以创新为翼，推出了领先的智能汽车图像及视频处理方案，为智能汽车行业带来了前所未有的视觉盛宴，重新定义了智能出行的视觉体验。一、智能重塑，视觉新境界美摄科技的智能汽车图像及视频处理方案，是基于深度学习、人工智能及大数据处
利用人工智能做python爬虫
在Python爬虫领域，人工智能（AI）可以从多个维度赋能，提升爬虫的效率、智能性和应对复杂反爬策略的能力。下面从数据提取、反反爬、自动化脚本生成等方面，介绍如何结合AI技术实现更强大的Python爬虫：一、利用大语言模型辅助爬虫开发1.代码生成与优化大语言模型（如GPT系列、文心一言、通义千问等）可以根据自然语言描述快速生成Python爬虫代码。例如，你可以向模型输入“写一个Python爬虫，抓
蜂鸟云平台大更新：地图空间定价重塑与功能全面升级蜂鸟视图fengmap 信息可视化蜂鸟云地图编辑器地图绘制工具室内外地图一体化智慧园区蜂鸟视图
1.引言随着云计算、大数据以及人工智能技术的快速发展，企业对云平台的需求日益增长。蜂鸟云平台作为一款创新性的地图服务平台，已逐渐成为众多企业、政府及科研机构的核心依赖。为了更好地满足用户需求，提高平台的市场竞争力，蜂鸟云平台定期进行功能更新与优化。2024年9月21日，蜂鸟云平台将在晚上20:00至24:00进行一轮重要的系统更新。本次更新的核心内容包括地图空间的重新定价与功能优化，涉及制图、微程
AIGC领域中Copilot的创作效率对比研究 AI大模型应用工坊 AI大模型开发实战 AIGC copilot ai
AIGC领域中Copilot的创作效率对比研究关键词：AIGC、Copilot、创作效率、对比研究、代码创作摘要：本文章聚焦于AIGC领域中Copilot的创作效率对比研究。随着人工智能技术在创作领域的广泛应用，Copilot作为一款具有代表性的创作辅助工具备受关注。文章首先介绍了研究的背景、目的、预期读者等信息，接着阐述了Copilot及相关创作效率的核心概念与联系。通过详细讲解核心算法原理、数
Sklearn 机器学习数值离散化虚拟编码 Thomas Kant 人工智能机器学习 sklearn 人工智能
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】Sklearn机器学习：数值离散化+虚拟编码实战详解在机器学习的特征工程中，数值型特征并不总是适合直接输入模型。尤其是树模型或分类模型时，**将连续变量进行离散化（分箱）+虚拟编码（独热编码）**是一种常见且高效的
对话云蝠智能：大模型如何让企业呼叫系统从 “成本中心” 变身 “价值枢纽”？ MARS_AI_ 人工智能自然语言处理信息与通信交互
在人工智能重塑企业服务的浪潮中，云蝠智能（南京星蝠科技有限公司旗下品牌）以深厚的技术积累和行业实践，逐步成长为国内智能外呼领域的标杆企业。其发展路径揭示了技术自主创新与场景深度结合的必然性。一、技术架构：全栈自研奠定领先基础云蝠智能的核心竞争力源于其全链路自研技术体系。该架构覆盖语音识别（ASR）、自然语言处理（NLP）、语音合成（TTS）及软交换六大层级，实现从基础设施到操作层的闭环设计。这一分
【软件系统架构】系列四：嵌入式软件-NPU（神经网络处理器）系统及模板
目录一、什么是NPU？二、NPU与CPU/GPU/DSP对比三、NPU的工作原理核心结构：数据流架构：四、NPU芯片架构（简化图）五、NPU的优势六、NPU应用场景视觉识别语音识别自动驾驶智能监控AIoT设备七、主流NPU芯片/架构实例八、开发者工具生态（通用）九、NPU集成建议（嵌入式开发场景）十、NPU芯片选型对比+模型部署流程+嵌入式工程模板1.主流NPU芯片选型对比表2.模型部署流程（以T
MCP多模态模式 goodfornothing-s microsoft
多模式整合多模态应用在人工智能领域日益重要，能够实现更丰富的交互和更复杂的任务。模型上下文协议(MCP)提供了一个框架，用于构建能够处理各种类型数据（例如文本、图像和音频）的多模态应用。MCP不仅支持基于文本的交互，还支持多模式功能，允许模型处理图像、音频和其他数据类型。介绍在本课中，您将学习如何构建多模式应用程序。学习目标学完本课后，您将能够：了解多模式选择实现多模式应用程序。多模式支持架构多模
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文