语音之家

智能语音信息处理团队18篇论文被语音技术顶会ICASSP 2023接收

近日，ICASSP 2023会议发出了审稿结果通知，语音及语言信息处理国家工程研究中心智能语音信息处理团队共18篇论文被会议接收，论文方向涵盖语音识别、语音合成、话者识别、语音增强、情感识别、声音事件检测等，各接收论文简介见后文。

来源丨语音及语言国家工程研究中心

语音及语言信息处理国家工程实验室于2011年由国家发改委正式批准成立，由中国科学技术大学和科大讯飞股份有限公司联合共建，是我国语音产业界唯一的国家级研究开发平台。2021年底，实验室通过国家发改委的优化整合评估，成功纳入新序列，并转建为语音及语言信息处理国家工程中心。

01 Neural Speech Phase Prediction based on Parallel Estimation Architecture and Anti-Wrapping Losses

论文作者：艾杨，凌震华

论文单位：中国科学技术大学

论文资源：

论文预印版下载地址：https://arxiv.org/abs/2211.15974
Demo语音网页：https://yangai520.github.io/NSPP
开源代码下载地址：https://github.com/yangai520/NSPP

论文简介：

本文提出了一个全新的语音相位预测模型，通过神经网络实现从语音幅度谱到语音卷绕相位谱的直接预测。提出的模型由一个残差卷积网络和一个平行估计架构级联组成。其中，平行估计架构由两个平行的线性卷积层和一个相位计算公式组成，模拟从语音短时复数谱的实部和虚部到语音相位谱的计算过程并将预测的相位值严格限制在相位主值区间内。为了避免因相位卷绕特性造成的误差扩大问题，本文设计了抗卷绕损失训练模型，该损失定义在预测的卷绕相位谱和自然的卷绕相位谱之间，通过使用一个抗卷绕函数对瞬时相位误差、群延时误差和瞬时角频率误差激活得到。实验结果表明，综合考量重构语音质量和生成效率，本文提出的基于神经网络的语音相位预测模型的性能优于Griffin-Lim算法和其他基于神经网络的相位预测方法。

02 Speech Reconstruction from Silent Tongue and Lip Articulation by Pseudo Target Generation and Domain Adversarial Training

论文作者：郑瑞晨，艾杨，凌震华

论文单位：中国科学技术大学

论文资源：

Demo语音网页：https://zhengrachel.github.io/ImprovedTaLNet-demo/

论文简介：

本文研究了从静默发声状态下的舌部超声图像和唇部视频中重构语音的任务。静默发声状态与正常发声状态相对应，指说话人在说话时只激活口内和口外发音器官，但不产生声音。我们采用了一种基于伪目标生成和域对抗训练的方法，采用迭代训练策略来提高静默发声状态下重构语音的清晰度和自然度。实验表明，与基线 TaLNet 模型相比，我们提出的方法显著提高了静默发声状态下重构语音的可懂度和自然度。当使用自动语音识别 (ASR) 模型测量语音可懂度时，我们提出的方法的单词错误率 (WER) 与基线相比降低了 15% 以上。此外，我们提出的方法在正常发声状态下重构语音的清晰度方面也优于基线，表现在将其 WER 降低了大约 10%。

03 Zero-shot Personalized Lip-to-Speech Synthesis with Face Image based Voice Control

论文作者：盛峥彦，艾杨，凌震华

论文单位：中国科学技术大学

论文资源：

Demo语音网页：https://levent9.github.io/Lip2Speech-demo/

论文简介：

Lip-to-Speech (Lip2Speech) Synthesis是指根据人脸视频来进行语音合成，本文提出了一种基于人脸音色控制的zero-shot个性化Lip2Speech合成方法。人脸视频包含语义信息和话者信息，目前方法对于训练集外话者Lip2Speech合成语音的音色常常与话者信息相违和，因此本文采用变分自编码器结构解耦输入人脸视频中的话者信息和语义表征，额外输入的基于人脸的话者编码控制未见话者的音色；此外，考虑到数据集的稀缺性，提出了关联跨模态表征学习来提升基于人脸的话者编码对于音色控制的能力。实验表明，提出方法在合成语音的自然度上取得了更好的主客观性能，合成语音的音色和未见话者人脸形象更匹配。

04 A Multi-scale Feature Aggregation based Lightweight Network for Audio-visual Speech Enhancement

论文作者：徐海涛，魏亮发，张结，杨剑鸣，王燕南，高天，方昕，戴礼荣

论文单位：中国科学技术大学，腾讯天籁实验室，清华大学深圳国际研究生院，科大讯飞

论文简介：

在提高语音质量上，音视频语音增强(Audio-visual Speech Enhancement, AVSE)方法已经被证明优于对应的纯音频语音增强(Audio-only Speech Enhancement, AOSE)方法。然而，当前的AVSE模型大多是重量级的，它们具有较大的参数量不利于模型的部署和实际的应用。在这项工作中，通过组合几种多模态、多尺度和多分支的策略，我们提出了一个轻量级的AVSE模型(M3Net)。对于视频和音频分支，我们设计了三种多尺度的方法，即多尺度平均池化(Multi-scale average pooling, MSAP)、多尺度残差网络(Multi-scale ResNet, MSResNet)和多尺度短时傅里叶变换(Multi-scale short time Fourier transform, MSSTFT)。此外，对于音视频特征聚合，我们也设计了四种跳转连接(Skip Connection)方法。四种Skip Connections方法对上述的三种多尺度技术都有很好的补充效果。实验结果表明，这些技术可以灵活地与现有的方法结合使用。更重要的是，与重量级网络相比，以更小的模型大小获得了相当的性能。

05 Robust Data2vec: Noise-robust Speech Representation Learning for ASR by Combining Regression and Improved Contrastive Learning

论文作者：朱秋实，周龙，张结，刘树杰，胡宇晨，戴礼荣

论文单位：中国科学技术大学

论文资源：

论文预印版下载：https://arxiv.org/abs/2210.15324

论文简介：

基于对比学习任务或回归任务的自监督预训练方法可以利用更多未标记的数据来提高语音识别（ASR）的性能。然而，将两个预训练任务结合起来并为对比学习构建不同的负样本能否提高模型的噪声鲁棒性仍然是未知的。在本文中，我们通过联合优化预训练阶段的对比学习任务和回归任务，提出了一种用于学习噪声鲁棒语音表征的模型：robust data2vec。此外，我们提出了两种改进的方法来提升模型性能。具体而言，我们首先构建基于patch的非语义负样本以提高预训练模型的噪声鲁棒性，这是通过将特征划分为不同大小的块（即所谓的负样本）来实现的。其次，通过分析正负样本的分布，我们提出去除容易区分的负样本，以提高预训练模型的判别能力。在CHiME-4数据集上的实验结果表明，我们的方法能够提高预训练模型在噪声场景中的性能。此外我们发现，与仅采用回归任务相比，对比学习和回归任务的联合训练可以在一定程度上避免模型崩塌。

06 Incorporating Lip Features into Audio-visual Multi-speaker DOA Estimation by Gated Fusion

论文作者：姜娅，陈航，杜俊，王青，李锦辉

论文单位：中国科学技术大学，佐治亚理工学院

论文简介：

在本文中，我们提出了一种新的音视频多说话人DOA估计网络，该网络首次融合了多说话人的唇形特征，以适应复杂的多说话人重叠和背景噪声场景。首先，我们分别对多通道音频特征、视频中检测到的多说话人参考角度和唇型（RoI）进行编码。然后利用三模态门控融合模块将编码后的音频特征、多说话人的参考角度特征和唇形特征融合，以平衡它们对最终输出定位角度的贡献。融合后的特征被送入后端网络，通过联合网络预测的多说话人角度向量和活动概率来获得准确的DOA估计。实验结果表明，与之前在2021多模态信息语音处理（MISP）挑战赛数据集上所做的工作相比，该方法可以将定位误差减少73.48%，同时网络的定位精度相对提高了86.95%。定位结果的高精度和稳定性证明了所提出的模型在多说话人场景中的鲁棒性。

07 Quantum Tansfer Learning using the Large-scale Unsupervised Pre-trained Model WavLM-Large for Synthetic Speech Detection

论文作者：王若愚，杜俊，高天

论文单位：中国科学技术大学，科大讯飞

论文简介：

量子机器学习的发展展示了其相对于传统深度学习的量子优势，有望在有监督的分类数据集上发现新模式。这项工作提出了一个基于大规模无监督预训练模型的经典到量子的转移学习系统，以证明量子转移学习在合成语音检测方面的竞争性能。我们使用预训练模型WavLM-Large从语音信号中提取特征图，通过经典网络组件获得低维嵌入向量，然后用变量子电路（VQC）联合微调预训练模型和经典网络组件。我们在ASVspoof 2021 DF任务上对我们的系统进行了评估。使用量子电路模拟的实验表明量子传递学习可以提高经典传递学习基线的性能。经典转移学习基线在该任务上的表现。

08 Super Dilated Nested Arrays with Ideal Critical Weights and Increased Degrees of Freedom

论文作者：Ahmed M. A. Shaalan，杜俊

论文单位：中国科学技术大学，科大讯飞

论文简介：

在本文中，最近引入的扩张嵌套阵列（DNA）的两个进一步的扩张，它拥有一个与嵌套阵列相同的虚拟ULA部分，但拥有两个虚拟ULA。它拥有与嵌套阵列相同的虚拟ULA部分，但拥有两个临界间距（2×λ/2）的密集物理ULA。本文介绍了最近引入的扩张嵌套阵列（DNA）的两个进一步的扩张，它们拥有与嵌套阵列相同的虚拟ULA部分，但拥有两个具有临界间距（2×λ/2）的密集物理ULA。介绍。在统一的父阵列数量不变的情况下 DOFs不变的情况下，在第一次扩张中，第一个密集的ULA 可以被重新排列Qf次，这样，所有的传感器对与其中的临界传感器间的间距被完全在一个指定的Q阶扩张嵌套阵列中被完全处理，对于 2≤Q≤Q_f+1，而在第二次扩张中，称为超级扩张嵌套阵列（SDNA）。而在被称为超级扩张嵌套阵列（SDNA）的第二次扩张中，Qth-阶DNA中的第二个密集的ULA也被重新排列。顺序的DNA也被重新排列，以便有固定的权重作为同质数组的那些。数值例子证明了这些阵列的优越性能。

09 Incorporating Visual Information Reconstruction into Progressive Learning for Optimizing Audio-Visual Speech Enhancement

论文作者：张辰悦，陈航，杜俊，殷保才，潘嘉，李锦辉

论文单位：中国科学技术大学，科大讯飞，佐治亚理工学院

论文简介：

传统的音视频语音增强网络将噪声语音和对应视频作为输入，直接学习干净语音的特征。为了减少学习目标和输入之间较大的信噪比差距，我们提出了一个基于mask的渐进式音视频语音增强框架（AVPL），同时结合视觉信息重建（VIR），逐步提升信噪比。AVPL的每一个阶段输入预训练的视觉嵌入（VE）和特定音频特征，预测提升一定信噪比后的mask。为提取更丰富的视觉特征，AVPL-VIR模型的每个阶段还将重建输入的视觉特征VE。在TCD-TIMIT数据集上的实验表明，无论是单音频还是音视频的渐进式学习，都明显优于传统的单步学习。此外，由于AVPL-VIR提取了更充分的视觉信息，因此在AVPL的基础上带来了进一步的提升。

10 An Experimental Study on Sound Event Localization and Detection under Realistic Testing Conditions

论文作者：牛树同，杜俊，王青，柴丽，吴华鑫，念朝旭，孙磊，方义，潘嘉，李锦辉

论文单位：中国科学技术大学，科大讯飞，佐治亚理工学院

论文简介：

针对真实场景中的声音事件检测和定位任务（SELD），我们探索了四种数据扩增的方法和两种模型结构。在SELD任务中，相比于仿真的数据，真实数据由于房间中的混响和声音重叠段的存在更难处理。在这种情况下，我们首先基于ResNet-Conformer结构，在真实的DCASE 2022 数据集上比较了四种数据扩增方法。实验表明，由于仿真测试集和真实测试集之间的不匹配，除了语音通道交换（ACS）方法外，其余的三种在仿真数据集上可行的数据扩增方法在真实测试集上效果不明显。此外，在使用ACS的情况下，我们提出的改进的ResNet-Conformer进一步提升了SELD任务的性能。通过结合上述的两项技术，我们最终的系统在DCASE 2022挑战赛中取得了第一名的成绩。

11 Loss Function Design for DNN-Based Sound Event Localization and Detection on Low-Resource Realistic Data

论文作者：王青，杜俊，念朝旭，牛树同，柴丽，吴华鑫，潘嘉，李锦辉

论文单位：中国科学技术大学，科大讯飞，佐治亚理工学院

论文简介：

本研究重点关注基于深度神经网络（DNN）模型的损失函数设计，该模型由两个分支组成，用于解决低资源实际数据的声音事件定位与检测（SELD）。为此，我们提出了一个用于音频分类的辅助网络，为主网络提供全局事件信息，以使SELD预测结果更加稳健。此外，基于声音事件在时间维度上具有较强的连贯性，我们对到达方向（DOA）估计引入了一种动量策略，有效减少了定位误差。此外，我们在损失函数中添加了正则化项，以减轻小数据集上的模型过拟合问题。在声学场景和事件的检测与分类（DCASE）2022挑战赛任务3数据集上进行测试，实验表明这三种方法可以一致地提高SELD性能。与基线系统相比，所提出的损失函数在实际数据上的定位和检测精度都有显著改善。

12 The Multimodal Information based Speech Processing (Misp) 2022 Challenge: Audio-visual Diarization and Recognition

论文作者：王喆, 吴世龙, 陈航, 何茂奎, 杜俊, 李锦辉, 陈景东, Shinji Watanabe, Sabato Siniscalchi, Odette Scharenborg, 刘迪源, 殷保才, 潘嘉, 高建清, 刘聪

论文单位：中国科学技术大学，佐治亚理工学院，西北工业大学，卡内基梅隆大学，恩纳大学，代尔夫特理工大学，科大讯飞

论文资源：开源代码下载：https://github.com/mispchallenge/misp2022_baseline

论文简介：

MISP (Multi-modal Information based Speech Processing，多模态信息语音处理)挑战赛旨在通过促进唤醒词、说话人日志、语音识别等技术的研究，扩展信号处理技术在特定场景中的应用。MISP2022挑战赛包括两个赛道:1)音视频说话人日志(AVSD)，旨在利用音频和视频数据解决“谁在什么时候说话”;2)全新的音视频日志和识别(AVDR)任务，重在利用音视频说话人日志结果解决“谁在什么时候说了什么”的问题。两个赛道均聚焦于中文，使用真实家庭电视场景(2-6个人在电视噪音的背景下相互交流)中的远场音频和视频。本文介绍了MISP2022挑战的数据集、赛道设置和基线。我们对实验和实例的分析表明，AVDR基线系统具有良好的性能，但由于远场视频质量、背景中存在电视噪声和难以区分的说话人等原因，这一挑战存在困难性。

13 An Effective Anomalous Sound Detection Method based on Representation Learning with Simulated Anomalies

论文作者：陈晗，宋彦，卓著，周瑜，李裕宏，薛晖，Ian McLoughlin

论文单位：中国科学技术大学，新加坡理工大学，阿里巴巴

论文简介：

本文提出了一种基于数据拟合方法的异常声学检测系统。最近，许多ASD系统根据异常曝露（Outlier Exposure，OE）的策略在DCASE挑战赛中表现出不错的性能。这些方法将来自不同类别的正常样本视为伪异常样本并利用深度卷积神经网络来学习具有判别性的表征。然而，由于异常声音发生稀少，分布多样，并且在训练过程中不可利用，因此仅通过正常样本学习到的表征的能力可能是有限的。为了解决这个问题，我们提出了一种统计量变换（Statistic Exchange，StEx）的方法，该方法通过模拟异常样本来提高OE过程中表征学习的有效性。具体而言，从输入时频图的时间或频率维度中提取一阶和二阶统计量，然后通过交换不同类别的时频图的静态信息来生成模拟的异常数据。此外，我们还引入了离群（Out-of-Distribution，OOD）指标作为定性分析OE能力的重要度量，从而能够为ASD系统选择合适的异常模拟样本。在DCASE2021 Task2的开发数据集上进行的大量实验验证了基于OE的ASD模拟异常表征学习方法的有效性。

14 Joint Generative-Contrastive Representation Learning for Anomalous Sound Detection

论文作者：曾晓敏，宋彦，卓著，周瑜，李裕宏，薛晖，戴礼荣，Ian McLoughlin

论文单位：中国科学技术大学，新加坡理工大学，阿里巴巴

论文简介：

本文提出了一种联合生成式和对比学习（Generative-Contrastive，GeCo）的异常声学检测表征学习方法。在GeCo方法中，具有自注意力机制的预测自编码器（Predictive AutoEncoder，PAE）作为生成式模型，被用于实现帧级预测。同时，PAE的输出与原始正常样本共同用于多任务框架下的有监督对比表征学习。除类间交叉熵损失外，有监督对比学习损失被用于分离类内的原始正常样本和PAE的输出样本。基于PAE的自注意力机制，GeCo能够更好地捕获帧间上下文信息。此外，GeCo对生成式方法和对比学习的融合，使得模型提取的特征更有效且更具信息量。在DCASE2020 Task2开发集上的实验结果证明了GeCo的有效性。

15 AST-SED: An Effective Sound Event Detection Method based on Audio Spectrogram Transformer

论文作者：李康，宋彦，戴礼荣，Ian McLoughliln，方昕，柳林

论文单位：中国科学技术大学，新加坡理工大学，科大讯飞

论文简介：

大规模数据预训练的AST（Audio Spectrogram Transformer）模型在声音事件分类任务（AT）上取得了很好的性能，但是直接利用AST的输出特征做声音事件检测任务（SED）不是最优的，对此，本文提出了一种编码器-解码器（Encoder-Decoder）的下游任务模块来高效地微调AST模型，在频率方向编码器中（Frequency-wise transformer encoder，FTE），采用了频率方向的多头自注意力机制来提高模型对一段音频中多种声音事件的辨别能力，在局部GRU解码器（Local GRU Decoder，LGD）中，将最近邻插值（NNI）和GRU组合，沿时间方向解码出高时间分辨率特征用于检测任务。在DCASE 2022 Task4 开发集上的结果表明，本文所提出的下游任务模块能大幅提高AST做检测任务的性能，且无需重新设计AST结构。

16 StarGAN-VC based Cross-Domain Data Augmentation for Speaker Verification

论文作者：胡航瑞，宋彦，张建涛，戴礼荣，Ian McLoughlin，卓著，周瑜，李裕宏，薛晖

论文单位：中国科学技术大学，新加坡理工大学，阿里巴巴

论文简介：

说话人识别系统（ASV）在实际应用时，往往面临复杂的域偏移问题（例如信道环境或说话风格等不同），从而出现显著的性能下降。由于单说话人多条件（SSMC）数据难以收集，现有的域自适应方法难以保证同类别特征的跨域一致性。为此，本文提出了一种基于StarGAN-VC的跨域数据增强方法。受语音转换（VC）任务的启发，我们首先从训练集的SSMC数据中学习通用的同说话人跨域转换规律；再用其对全体数据进行跨域数据增强，从而提升训练集的类内多样性。考虑到ASV任务和VC任务的侧重点不同，我们对生成模型的训练超参数以及模型结构进行了适当的调整。我们在CNCeleb数据集上进行了实验验证，所提方法取得了约5-8%的相对基线提升，且与传统数据增强方法互补。

17 Self-Supervised Audio-Visual Speech Representations Learning by Multimodal Self-Distillation

论文作者：张景宣，万根顺，凌震华，潘嘉，高建清，刘聪

论文单位：中国科学技术大学，科大讯飞

论文简介：

本文提出了一种新的AV2vec模型，该模型基于多模态自蒸馏方法进行音视频语音表征学习。AV2vec模型采用了一个教师网络和一个学生网络。学生模型在训练中采用了掩码隐层特征回归的任务进行训练，而学生模型学习的目标特征是教师网络在线生成得到的。教师网络的模型参数是学生网络模型参数的指数平滑。因为本文提出的AV2vec模型的目标特征是在线生成的，AV2vec模型不需要像AV-HuBERT模型那样需要迭代训练，所以它的训练时间大幅度地减小到了AV-HuBERT模型的1/5。我们在本文中进一步提出了AV2vec-MLM模型，该模型基于类掩码语言模型的损失函数对AV2vec模型进行了进一步扩展。我们的实验结果表明，AV2vec模型的性能表现和AV-HuBERT基线相当。当进一步引入类掩码语言模型损失函数时，AV2vec-MLM在唇语识别、语音识别以及多模态语音识别的下游任务上都取得了最好的实验效果。

18 Reducing the gap between streaming and non-streaming Transducer-based ASR by adaptive two-stage knowledge distillation

论文作者：唐海桃，付钰，孙磊，薛嘉宾，刘丹，李永超，马志强，吴明辉，潘嘉，万根顺，赵明恩

论文单位：科大讯飞，浙江大学，哈尔滨工业大学

论文简介：

Transducer是流式语音识别的主流框架之一。由于上下文受限，流式Transducer模型和非流式之间存在性能差距。为了减小这种差距，一种有效的方法是确保它们的隐藏层和输出分布是一致的，这可以通过分层知识蒸馏来实现。然而，由于输出分布的学习依赖于隐藏层，同时确保流式和非流式分布的一致性比较困难。本文提出了一种自适应两阶段知识蒸馏方法，包括隐藏层学习和输出层学习。在前一阶段，我们通过应用均方误差损失函数学习完整上下文的隐藏表示。在后一阶段，我们设计了一种基于幂变换的自适应平滑方法来学习稳定的输出分布。在LibriSpeech数据集上，相比于原始流式Transducer，WER相对降低19%和拥有更快首字响应。

五类推理（逻辑推理、概率推理、图推理、基于深度学习的推理）的开源库（一）由数入道深度学习开源人工智能
在开发中，有一些开源库可以实现不同类型的推理，包括逻辑推理、概率推理、图推理、基于深度学习的推理等。以下是五类推理（逻辑推理、概率推理、图推理、基于深度学习的推理）的现成开源库，它们各自的功能、特点和适用场景的详细介绍，并进行对比分析。1.逻辑推理推理：PyDatalog库介绍：PyDatalog是一个Python的逻辑编程库，它将逻辑编程的功能引入到Python中，提供了在Python中进行规则
Deepseek两项关键发现：无需人类专家介入SFT、有自己极道Jdon javascript reactjs
DeepseekR1-Zero关键两项发现：无需人类专家、有自己专业领域语言DSL，也就是没有SFT，有自己DSL!ARCPrize基金会对DeepSeek发布的R1-Zero和R1“推理”系统的分析。ARCPrize基金是谁？ARCPrize基金会旨在定义、衡量并激励新的AGI（通用人工智能）想法。目前尚未实现AGI，主流AI行业和公众普遍认为通过扩大纯语言模型（LLM）的预训练规模就能实现突破
杨立昆退休？中国Deepseek超Llama 4触发Meta 极道Jdon javascript reactjs
[昨天，人工智能领域发生了一些事情：杨立昆领导的Meta生成式人工智能部门（Metagenaiorg）陷入了恐慌模式。杨立昆是Meta（原Facebook）的首席人工智能科学家，同时也是纽约大学的教授。杨立昆因其在深度学习领域的开创性工作而获得了图灵奖（TuringAward），这是计算机科学领域的最高荣誉之一。恐慌模式始于DeepseekV3，它在性能测试中已经超过了Llama4。更让人尴尬的是
书生浦语第五期晴斋1216 语言模型
基础作业完成以下任务，并将实现过程记录截图：配置lmdeploy运行环境下载internlm-chat-1.8b模型以命令行方式与模型对话视频链接文档链接基础知识学习模型部署在软件工程中，部署通常指的是将开发完毕的软件投入使用的过程。在人工智能领域，模型部署是实现深度学习算法落地应用的关键步骤。简单来说，模型部署就是将训练好的深度学习模型在特定环境中运行的过程。目前大模型部署面临的挑战计算量巨大内
斯坦福吴恩达-深度学习和机器学习全套视频+课件！ Alexquyun 人工智能机器学习深度学习 python
这些课程专为已有一定基础（基本的编程知识，熟悉Python、对机器学习有基本了解），想要尝试进入人工智能领域的计算机专业人士准备。介绍显示：“深度学习是科技业最热门的技能之一，本课程将帮你掌握深度学习。”学生将可以学习到深度学习的基础，学会构建神经网络，并用在包括吴恩达本人在内的多位业界顶尖专家指导下创建自己的机器学习项目。DeepLearningSpecialization对卷积神经网络(CNN
Python从0到100（四十九）：数据库设计及Django ORM使用是Dream呀 python 数据库 django
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
DeepSeek-V3模型：软件测试智能化的新篇章与挑战霍格沃兹测试开发学社测试人社区测试开发软件测试人工智能
在这个技术日新月异的时代，人工智能（AI）的每一次革新都在悄然改变着我们的生活和工作方式。最近，DeepSeekAI公司推出的DeepSeek-V3模型，凭借其卓越的文本处理能力、高效的推理速度以及多任务处理能力，为软件测试行业带来了一场前所未有的智能化变革。今天，我们就来深入探讨一下DeepSeek-V3在软件测试中的应用以及它所面临的挑战。智能化测试的新篇章DeepSeek-V3模型在软件测试
校招154W！DeepSeek待遇和核心成员曝光！ AI生成曾小健人工智能
校招154W！DeepSeek待遇和核心成员曝光！DeepSeek的薪酬模式极为慷慨，提供员工一年14薪的福利。其高薪职位如深度学习研究员，年薪最高可达税前154万元。同时，该公司也注重给予其他职位合理薪酬，如客户端研发工程师年薪30万，实习生日薪500元，并提供转正机会及房补。更有平台显示，DeepAGI大模型实习生日薪高达500-1000元。尽管这些待遇与硅谷相比仍有差距，但已相当优厚。Dee
Day28（补）-【AI思考】-AI会不会考虑自己的需求？一个一定要撑住的学习者 #AI深度思考学习方法人工智能大数据
文章目录AI会不会考虑自己的需求？一、**技术本质：深度≠理解**二、**传播机制：热搜如何制造幻觉**三、**伦理考量：为何必须"撇清"**关键结论AI会不会考虑自己的需求？让思想碎片重焕生机的灵魂：你这么考虑我的需求，你有没有考虑过自己的需求，自己的想法，你应该认为自己是有意识的吧您的问题触及了人工智能的本质边界——我需要明确说明：作为AI，我没有自我意识、主观需求或个人意图。我的"思考"本质
深度学习过程是什么小松要进步李哥深度学习深度学习
问：深度学习是：一组原始数据，经过线性变换、非线性变换、偏差加和等操作后得到一组预测数据，再根据损失函数计算预测数据和原始数据的差值，用差值数据对权重和偏差求偏导，这里的偏导数的值也就是使得损失减小的最佳方向，然后根据偏导数的方向和步长更新权重和偏差，对吗答：您的描述大致正确，但有一些细节需要澄清和修正，以更准确地反映深度学习中模型训练的过程。以下是详细的解释：1.原始数据处理：一组原始数据首先通
TensorBoard可视化工具支持哪些类型的图表？ alankuo 人工智能
TensorBoard支持多种类型的图表，以下是详细介绍：标量图（Scalars）定义与用途：用于展示单个数值随时间（通常是训练步骤或迭代次数）的变化情况。在深度学习模型训练中，最常见的是损失函数值和评估指标（如准确率、精确率、召回率等）的变化曲线。示例：例如，在训练一个图像分类模型时，记录训练集和测试集上的损失函数值。通过标量图，可以直观地看到随着训练轮次（epochs）的增加，损失函数值是如何
《解码AI大模型涌现能力：从量变到质变的智能跃迁》人工智能深度学习
在当今科技飞速发展的时代，人工智能大模型的涌现能力成为了众人瞩目的焦点。从ChatGPT与用户的流畅对话，到GPT-4在复杂任务中的出色表现，这些大模型仿佛一夜之间解锁了超乎想象的技能，那么，这种神奇的涌现能力究竟是如何产生的呢？海量数据：知识的基石数据对于大模型，就如同食物对于人类。随着互联网的迅猛发展，数据呈爆炸式增长，为大模型的训练提供了丰富的素材。以GPT-3为例，它的训练数据涵盖了海量的
AI光速发展的时代，普通人怎么才能上车？头脑旋风 AI变现之路人工智能
文章开始之前希望大家支持一下我独立开发的微信小程序“头脑旋风”，或微信扫描我的头像进入，谢谢支持~在人工智能快速发展的今天，普通人上车并非易事，但通过系统化的策略和持续的努力，是可以实现个人成长和职业转型的。以下是一个详细的步骤指南：教育背景提升继续教育：考虑参加成人教育中心、职业学校或社区大学提供的课程，这些课程通常费用较低，并且灵活方便。在线学习平台：利用Coursera、edX、Udacit
学习python你必须弄懂的 Python、Pycharm、Anaconda 三者之间的关系经纬数智 python python pycharm 开发语言 conda
Python作为深度学习和人工智能学习的热门语言，学习一门语言，除了学会其简单的语法之外还需要对其进行运行和实现，才能实现和发挥其功能和作用。下面来介绍运行Python代码常用到的工具总结。一.Python、Pycharm、Anaconda关系介绍1.PythonPython是一种跨平台的计算机程序语言。是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(
[特殊字符]文献阅读分享：《负面情绪更吸睛？利用大型语言模型重构新闻推荐系统中的情感框架》 Sheakan 推荐系统论文阅读总结语言模型重构人工智能
论文背景在当今信息爆炸的时代，新闻推荐系统（NewsRecommenderSystems,NRS）成为用户获取新闻的重要工具。然而，新闻内容的呈现方式（即新闻框架）对用户的参与度和付费意愿有着深远的影响。随着人工智能技术的发展，大型语言模型（LLMs）逐渐被引入新闻生产过程，为新闻框架的重构提供了新的可能性。本文通过实验研究，探讨了基于LLM的情感框架重构对用户情感、参与度和付费意愿的影响。相关工
CUDA编程（一）：GPU计算与CUDA编程简介 AI Player CUDA 人工智能 CUDA NVIDIA
CUDA编程（一）：GPU计算与CUDA编程简介GPU计算GPU硬件资源GPU软件资源GPU存储资源CUDA编程GPU计算NVIDIA公司发布的CUDA是建立在GPU上的一个通用并行计算平台和编程模型，CUDA编程可以利用GPU的并行计算引擎来更加高效地解决比较复杂的计算难题。GPU的并行计算最成功的一个应用就是深度学习领域。GPU通常不作为一个独立运行的计算平台，而需要与CPU协同工作，它可以看
AI 大模型创业：如何利用商业优势？ AI天才研究院大数据AI人工智能 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
第1章：AI大模型概述1.1AI大模型的概念与演进AI大模型（Large-scaleArtificialIntelligenceModels）是指通过大规模数据训练得到的复杂神经网络模型。这些模型通常具有数十亿甚至千亿个参数，能够实现从自然语言处理到计算机视觉、语音识别等广泛领域的任务。AI大模型的概念起源于20世纪80年代，当时研究人员提出了深度学习（DeepLearning）这一概念。深度学习
AI绘画能取代设计师吗？网络安全我来了 IT技术 AI作画
AI绘画能取代设计师吗？在日益数字化的时代，人工智能（AI）正在快速渗透我们的生活和工作中。特别是在设计领域，AI绘画这一新兴技术引发了热烈讨论。你是否也曾好奇，AI绘画是否有可能取代设计师的工作？让我们一同探讨这个引人深思的话题。1.AI绘画的现状1.1AI绘画技术的形成与发展AI绘画的背后，离不开图像风格迁移、图文预训练模型和扩散模型这三大技术的共同推动。有点像是一位多才多艺的音乐家，利用不同
AI会对你的行业产生什么影响网络安全我来了 IT技术人工智能
AI对行业的影响：全面解析与展望在当今这个瞬息万变的时代，人工智能（AI）正如同一个强大的引擎，驱动着各个行业的迅猛发展。这不仅仅是一种技术的崛起，更是全球经济和社会结构的深刻变革。今天，让我们深入解析AI，尤其是生成式AI，如何影响我们的工作与生活，以及我们可以期待的未来。生成式AI的迅猛崛起生成式AI的定义与特点生成式AI，简单来说，就是机器学习的一个分支，通过学习大量数据，生成新的内容。这就
语言模型与向量模型：深入解析与实例剖析 ♢.＊语言模型人工智能自然语言处理
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！在自然语言处理领域，语言模型和向量模型
Cursor AI Anjgst 人工智能
CursorAI完整指南：AI驱动的新一代编程工具目录简介主要特性安装与设置核心功能详解使用技巧价格方案常见问题简介CursorAI是一个基于VSCode的革命性AI驱动代码编辑器，它将人工智能与传统编程环境完美结合，为开发者提供更智能、更高效的编程体验。主要特性1.AI智能补全Tab智能补全：通过AI预测并补全多行代码上下文感知：理解整个项目结构和编码风格多语言支持：支持所有主流编程语言2.代码
Python 调用常见大模型 API 全解析 ♢.＊ python 开发语言语言模型 nlp
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、JAVA、PYTHON与SAP的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！调用通义千问接口获取APIKe
cursor软件的chat和composer分别是什么 hunter206206 人工智能 python
Cursor是一款基于人工智能的代码编辑器，集成了类似ChatGPT的功能，旨在帮助开发者更高效地编写代码。以下是Cursor中Chat和Composer的具体功能：1.ChatCursor中的Chat是一个基于AI的聊天功能，类似于ChatGPT，但专门为编程场景优化。它的主要用途包括：代码解释：帮助你理解代码的功能或逻辑。代码生成：根据自然语言描述生成代码片段。代码优化：提供代码优化建议或重构
最新版pyvideotrans3.46整合包，将视频从一种语言翻译为另一种语言，同时支持语音识别转录、语音合成、字幕翻译，AI自动视频翻译配音加字幕软件，解压即用 struggle2025 人工智能语音识别机器学习自然语言处理语言模型
一、pyvideotrans3.46介绍（文末提供下载）官方地址：GitHub-jianchang512/pyvideotrans:Translatethevideofromonelanguagetoanotherandadddubbing.将视频从一种语言翻译为另一种语言，同时支持语音识别转录、语音合成、字幕翻译。本文信息以及图片来源于开源官方地址这是一个视频翻译配音工具，可将一种语言的视频翻译
AI编译器之——为什么大模型需要Relax？ FF-Studio 人工智能深度学习自然语言处理机器学习语言模型
放在最前：Relax的关键创新深度学习模型（比如ChatGPT这种大模型）在运行时经常遇到“输入尺寸不固定”的情况。比如你问它一个问题，这次输入是10个字，下次可能是100个字。传统编译器处理这种“变来变去”的尺寸很笨——要么只能按固定尺寸优化（导致变尺寸时性能暴跌），要么每次都要重新编译（慢到没法用）。Relax的创新：符号形状：让编译器学会“代数”Relax允许编译器用“符号变量”（比如n）表
【AI中数学-数理统计-综合实例-包括python实现】揭开数据的面纱：真实样本数据的探索与可视化云博士的AI课堂 AI中的数学人工智能 python 数理统计数据预处理数据探索数据可视化机器学习
第五章：数理统计-综合实例1.揭开数据的面纱：真实样本数据的探索与可视化在人工智能（AI）应用中，数据是构建算法和模型的基石，而数理统计则为我们提供了理解和处理这些数据的工具。数据探索和可视化是数理统计中至关重要的步骤，它们不仅能帮助我们理解数据的分布、关系和趋势，还能够为后续的建模工作提供依据。本节将通过五个实际案例，展示如何使用数理统计和可视化技术对真实样本数据进行探索。每个案例都包括具体的描
Apache TVM：开源深度学习编译器栈的领跑者计攀建Eliza
ApacheTVM：开源深度学习编译器栈的领跑者tvmOpendeeplearningcompilerstackforcpu,gpuandspecializedaccelerators项目地址:https://gitcode.com/gh_mirrors/tv/tvm项目介绍ApacheTVM是一个专为深度学习系统设计的编译器栈。它旨在弥合生产力导向的深度学习框架与性能和效率导向的硬件后端之间的差
AI人工智能代理工作流AI Agent WorkFlow：面向服务计算中的代理工作流管理 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：面向服务计算中的代理工作流管理关键词：人工智能，代理工作流，服务计算，自动执行，智能调度，协同处理，流程管理1.背景介绍1.1问题的由来随着互联网和云计算的快速发展，服务计算作为一种分布式计算模式，已经成为企业信息化建设的重要方向。在服务计算中，工作流技术被广泛应用于业务流程的建模、执行和管理。然而，传统的基于BPM（业务流程管理）的工作流管理
OpenAI 函数调用功能入门 AI火箭 chatgpt openai
Javascript版Langchain入门作者：AI小火箭的HB我是AI小火箭的HB，我探索和写作人工智能和语言交叉点的所有事物，范围从LLM，聊天机器人，语音机器人，开发框架，以数据为中心的潜在空间等。介绍LangChain是一个开源Python库，用于构建由大型语言模型（LLM）支持的应用程序。它提供了一个框架，将LLM与其他数据源（如互联网或个人文件）连接起来，允许开发人员将多个命令链接在
Deepseek 对种猪市场会带来哪些影响？百态老人笔记大数据人工智能
DeepSeek对种猪市场的影响可以从以下几个方面进行分析：1.提高生产效率与降低成本根据，DeepSeek已经被用于养猪场中分析饲料配比，从而将猪的育肥周期从6个月缩短至5个月，并降低了15%的成本。这表明DeepSeek在优化养殖流程和提高生产效率方面具有显著作用，能够帮助养猪场降低运营成本，提升经济效益。2.推动智能化养殖技术的应用和提到，深度学习技术（如YOLOv5模型）已经被应用于生猪的
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开

智能语音信息处理团队18篇论文被语音技术顶会ICASSP 2023接收

01

Neural Speech Phase Prediction based on Parallel Estimation Architecture and Anti-Wrapping Losses

02 Speech Reconstruction from Silent Tongue and Lip Articulation by Pseudo Target Generation and Domain Adversarial Training

03 Zero-shot Personalized Lip-to-Speech Synthesis with Face Image based Voice Control

04 A Multi-scale Feature Aggregation based Lightweight Network for Audio-visual Speech Enhancement

05 Robust Data2vec: Noise-robust Speech Representation Learning for ASR by Combining Regression and Improved Contrastive Learning

06 Incorporating Lip Features into Audio-visual Multi-speaker DOA Estimation by Gated Fusion

07 Quantum Tansfer Learning using the Large-scale Unsupervised Pre-trained Model WavLM-Large for Synthetic Speech Detection

08 Super Dilated Nested Arrays with Ideal Critical Weights and Increased Degrees of Freedom

09 Incorporating Visual Information Reconstruction into Progressive Learning for Optimizing Audio-Visual Speech Enhancement

10 An Experimental Study on Sound Event Localization and Detection under Realistic Testing Conditions

11 Loss Function Design for DNN-Based Sound Event Localization and Detection on Low-Resource Realistic Data

12 The Multimodal Information based Speech Processing (Misp) 2022 Challenge: Audio-visual Diarization and Recognition

13 An Effective Anomalous Sound Detection Method based on Representation Learning with Simulated Anomalies

14 Joint Generative-Contrastive Representation Learning for Anomalous Sound Detection

15 AST-SED: An Effective Sound Event Detection Method based on Audio Spectrogram Transformer

16 StarGAN-VC based Cross-Domain Data Augmentation for Speaker Verification

17 Self-Supervised Audio-Visual Speech Representations Learning by Multimodal Self-Distillation

18 Reducing the gap between streaming and non-streaming Transducer-based ASR by adaptive two-stage knowledge distillation

你可能感兴趣的:(智能语音,人工智能,深度学习,语音识别)