cxxx17

【VC】Converting Foreign Accent Speech Without a Reference

文章目录

- 1. INTRODUCTION
- 2. RELATED WORK
- - A. 传统FAC方法
  - B. 基于sequence-to-sequence模型的FAC
  - C. 之前的reference-free的FAC方法
- 3. METHOD
- - A. 提取说话人无关的speech embedding
  - B. step 1: 产生L1-GS
  - C. step 2: 训练发音纠正模型
  - D. WaveGlow声码器
- 4. 实验配置
- 5. 实验结果
- - exp1: 评估L1-GS
  - - 客观评测
    - 主观评测
    - - 口音测试&音质测试
      - 说话人相似度
  - exp2. 评估新的L2-GS（即转换后的输出）
  - - 客观评测
    - 主观评测
    - - 口音&音质评测
      - 说话人相似度

来源：IEEE/ACM Transactions on Audio, Speech and Language Processing 2021
Foreign accent conversion（FAC）是想保留第二语言(L2)学习者的说话人特性和母语(L1)者的发音，合成新的声音。合成的声音在发声训练课中被称作golden speaker。FAC的实现方式通常是应用voice conversion将L1说话人说的句子转换为L2说话人的句子。因此FAC需要一个reference的L1说话人的句子，这样严格地限制了FAC系统的应用。本文提出了一种新的方法，即在推理阶段不需要reference音频，直接对L2句子进行转换。训练步骤分两步，首先，一个传统的FAC过程用于产生golden speaker，这个时候有L1句子的reference。接下来，训练发音纠正模型，使得L2能够转换，并匹配golden speaker。在合成阶段，发音纠正模型直接将一个新的L2句子转换成了golden-speaker. 实验结果表示，转换后的音频在美式英语语音识别系统下，相对WER降低了20.5%，可感知的外国口音的句子数降低了19%，超过73%的测听者认为L2句子和转换后得到的golden speaker是同一个说话人。

1. INTRODUCTION

FAC目的是合成non-native speaker的音色，但是发音模式是native speaker的音频。合成的声音常常被称作golden speaker，golden speaker的音频模仿L2的音色，因此和L2的音频只有发音不同，使得发音错误更明显，更有利于non-native speaker 模仿。FAC在电影配音，个性化文本到语音(TTS)合成，以及提高自动语音识别(ASR)性能上都有应用。
FAC主要的挑战在于没有golden speaker的ground truth，因为一般来说，L2 speaker是无法产生native accent的语音的。因此无法直接用传统的voice conversion的技术。之前解决这个问题的方法是在inference阶段需要一句native speaker的语音，但是这种发音练习使得L2只能联系那些L1事先录好的句子。
为了解决这个问题，本文提出了一个新的FAC系统，在推理阶段不需要reference L1句子，称之为reference-free FAC system. 假设我们有L2和L1的平行语料，训练过程可以分为如下两步。第一步，构建L2的合成器，将他们的speech embedding（后面会提到）映射到mel谱。speech embedding是由native speech的大语料中训练的声学模型得到的，因此是说话人无关的。接着我们使用从 L1句子中提取的speech embedding来驱动 L2 合成器。结果得到的就是带有L2音色和L1发音模式的golden speaker.（这里应该是假设accent耦合在speech embedding里面了）。这个时候L1就可以被丢弃了，后面不会用到了。第二步，训练一个发音纠正模型，使得L2能够转成golden speaker的句子。推理时，输入一个新的L2句子，即可输出没有口音的句子。
发音纠正模型基于state-of-the-art sequence-to- sequence语音转换模型1作为baseline。baseline系统由一个encoder（mel中提取hidden representation），注意力机制学习input和output之间的alignment，一个decoder预测输出的mel谱，以及phoneme classifiers帮助训练过程更加平滑。在本文的实验中，发现baseline很难把L2转成L1，因为L2句子有些不流利和犹豫，使得attention很难正确的对齐input和output。为了解决这个问题，本文提出的系统引入了双向解码技术，帮助发音纠正模型充分利用数据。其基本原理是，通过迫使解码器在训练过程中从正向和向后两个方向计算注意对齐，我们可以使解码器在产生对齐时从过去和未来合并有用的上下文信息。声码器用的是WaveGlow。

2. RELATED WORK

A. 传统FAC方法

口音转换是一个比语者转换还要难的任务，因为需要对口音和说话人解耦。传统方法可以分为发音（articulatory）和声学（acoustic）方法。发音方法的基本策略是构建一个L2 speaker的发音合成器，即构建L2 speaker的发声通道（ articulatory trajectories，比如舌头和唇的移动）到mel谱的映射。一旦合成器构建完成，L1 speaker 驱动 articulatory trajectories应用L2的合成器，生成L2无accent的语音。（这里没太懂，后续看一下）
将音色特性从口音当中解耦的方法是直观的，但是实际上大部分情况下收集发音数据是比较昂贵的，而且需要专业的器材。相反，在声学层面将音色特性从口音当中解耦更可实现，因为只需要用麦克风记录数据，但是对于后续的语音处理提供了更大的挑战。传统的VC用的方法（如用DTW讲source和target对齐）不能用于口音转换，因为口音转换中要求音色是不变的。2用L1和L2做完VTL normalization的MFCC相似度，然后用GMM将生成了含有L1发音，但是有L2说话特性的句子。最近，3用说话人无关的ASR声学模型估计每一帧的phone的后验概率得到 phonetic posteriorgram(PPG)，一旦L1和L2的PPG被计算出来，可以应用PPG完成many-to-many的转换，得到的效果在口音和音质方面都超过了2。

B. 基于sequence-to-sequence模型的FAC

最近4应用seq2seq模型实现FAC。首先训练L2的合成器，将L2的PPG转换为mel，接着用L1的PPG输入L2合成器，得到golden speaker句子，这种方法明显降低了L2 speech的口音。自那个时候起，seq2seq在VC领域广泛应用，并且取得了更好的效果。

C. 之前的reference-free的FAC方法

5应用了一个speaker encoder，一个多说话人的TTS和一个ASR的encoder。speaker encoder 和TTS用L1 speech训练，ASR用L1和L2的speaker训练。在推理阶段，应用speaker encoder和ASR分别提取说话人embeddings和语言学表达。将二者feed到多说话人的TTS模型中，转换成没有口音的音频。他们的评估表明转换后的音频是接近native口音的，但是转换后的音频说话人与L2的相似度不高。本文的方法为了避免这个问题，口音纠正模型是应用golden speaker数据训练的，保证了说话人的一致性。

3. METHOD

本文提出的方法需要L1+L2平行语料，具体方法如下图所示，分为两步，第一步构建一个L2 speech embedding到mel的合成器，然后将L1的speech embedding输入合成器，即得到golden speaker的句子（即发音人是L2但是发音模式是L1），称之为L1-GS。在第二步，训练发音纠正模型，使得L2句子可以直接转换成L1-GS。在推理时，可以直接把新的L2的句子转成L2-GS。

A. 提取说话人无关的speech embedding

用语音识别中的声学模型提取说话人无关的speech embedding，采用了TDNN结构，为了得到和说话人无关的speech embedding，声学模型的输入是将40-dim mfcc与i-vector拼接，用librispeech数据训练。
本文尝试了3种speech embedding:

Senone phonetic posteriorgram (Senone-PPG): softmax后的输出，这里应该用的是tri-phone，共6024维
Bottleneck feature (BNF): softmax层之前的输出，维度低一些，256维
Monophone phonetic posteriorgram (Mono-PPG): 单独的phone，但是会区分phone在词中的位置“BIE”，346维，“balloon”音频的Mono-PPG如下图所示：

B. step 1: 产生L1-GS

合成器基于Tacotron2结构，具体结构如下：

输入是speech embedding，如果输入纬度过高，就用可学习的PreNet降维（对于高维的speech embedding很重要，会影响到手收敛）。对于低维度的Mono-PPGs和BNFs，就不用PreNet了。
最终的loss用公式表示：
$\begin{aligned} L=& w_1\left(\left\|Y_{m e l}-\hat{Y}_{m e l}^{D e c o d e r}\right\|_2+\left\|Y_{m e l}-\hat{Y}_{m e l}^{\text {PostNet }}\right\|_2\right)+\\ & w_2 \mathrm{CE}\left(Y_{\text {stop }}, \hat{Y}_{\text {stop }}\right) \end{aligned}$

C. step 2: 训练发音纠正模型

Baseline1如下图所示：
$\begin{aligned} L_{\text {base }}=& w_1\left(\left\|Y_{\text {mel }}-\hat{Y}_{\text {mel }}^{\text {Decoder }}\right\|_2+\left\|Y_{\text {mel }}-\hat{Y}_{\text {mel }}^{\text {Post Net }}\right\|_2\right)+\\ & w_2 \mathrm{CE}\left(Y_{\text {stop }}, \hat{Y}_{\text {stop }}\right)+\\ & w_3\left(\mathrm{CE}\left(Y_{\text {inP }}, \hat{Y}_{\text {inP }}\right)+\mathrm{CE}\left(Y_{\text {out } P}, \hat{Y}_{\text {out } P}\right)\right) \end{aligned}$
提出的方法对加入了双向的attention，多了一个decoder的输出，前向attention和反向attention应该是一致的，loss重写为下：
$\begin{aligned} L_{b w d}=& w_1\left(\left\|Y_{m e l}-\hat{Y}_{m e l}^{b w d}\right\|_2+\left\|Y_{m e l}-\hat{Y}_{m e l-P o s t N e t}^{b w d}\right\|_2\right)+\\ & w_2 \mathrm{CE}\left(Y_{\text {stop }}, \hat{Y}_{\text {stop }}^{b w d}\right)+w_3\left(\operatorname{CE}\left(Y_{\text {outP }}, \hat{Y}_{\text {outP }}^{b w d}\right)\right) \end{aligned}$
$L_{a t t}=w_4\left\|\alpha_{f w d}-\alpha_{b w d}\right\|_2$
$L_{\text {proposed }}=L_{b a s e}+L_{b w d}+L_{a t t}$

D. WaveGlow声码器

用WaveGlow声码器，用于将转换后的mel生成audio samples。

4. 实验配置

数据集：CMU-ARCTIC
挑出了一个native 口音的说话人：BDL; American accent
数据集： L2-ARCTIC
两个non-native的说话人：YKWK, Korean; TXHC, Chinese
训练集，验证集，测试集没有重叠，分别是1032句，50句和50句。
采样率都转成16k ，声码器是按照WaveGlow的官方代码，用L2数据训练的。

5. 实验结果

分别从客观和主观指标来评价。

exp1: 评估L1-GS

L1-GS是本文提出的model的上界，探索了3种不同的speech embedding对L1-GS的影响：

客观评测

三种不同的speech embedding生成音频的WER。

可以看到L1-GS的WER在使用BNF时最低，在这里说明口音可能和native比较接近，native的ASR更适用。

主观评测

口音测试&音质测试

BNF都达到了最好的效果，且在音质上BNF稍稍好于原始的L2音频。

说话人相似度

exp2. 评估新的L2-GS（即转换后的输出）

Baseline1: C. step 2中提到的baseline，当前最好的VC模型结构
Baseline2: 5 FAC之前的工作
Proposed(without att loss)
Proposed

客观评测

MCD
$F_0$ RMSE
DDUR
WER

主观评测

口音&音质评测

说话人相似度

说话人相似度基本已经达到了上限。

你可能感兴趣的:(TTS论文阅读)

python画出分子化学空间分布（UMAP） Sakaiay python
利用umap画出分子化学空间分布图安装pipinstallumap-learn下面是用一个数据集举的例子importtorchimportumapimportpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltimportseabornassnsfromsklearn.manifoldimportTSNEfromrdkit.Chemimport
VITS 源码解析2-模型概述迪三 #NN_Audio 音频人工智能
VITs是文本到语音(Text-to-Speech,TTS)任务中最流行的技术之一，其实现思路是将文本语音信息融合到了HiFiGAN潜空间内,通过文本控制HiFiGAN的生成器，输出含文本语义的声音。VITs主要以GAN的方式训练,其生成器G是SynthesizerTrn，判别器D是MPD。VITS的判别器几乎和HiFiGAN一样，生成器则融合了文本、时序、声音三大类模型1.文件概述模型部分包含三
Linux之ansible的playbook剧本(yaml文件) 小橞 linux ansible 运维服务器
playbook剧本一个剧本（即playbook），可以包含多个play每个play用于在指定的主机上，通过模块和参数执行相应的任务每个play可以包含多个任务。任务有模块和参数构成。paly要建立在ansible文件夹下才能使用因为yaml文件对格式要求很严格所有本人在编写时会设置一下vim编译器的一些功能格式setai：自动缩进setts=2：设置tab键缩进两个空格setet：将tab键转换
《互联网时代教师自主成长的模式研究》论文阅读与思考2 宁超群
2.第二部分教师自主成长的模式建构，实质上是对新网师底层逻辑的描述。你认为，新网师的培训模式与传统常见的培训模式有哪些区别？这些区别有什么意义或价值？读完第二部分后，你对新网师有哪些新的认识或理解？你认为新网师目前哪些方面做得好，哪些方面做得还不够？答：我认为新网师的培训模式与传统常见的培训模式有以下区别：（1）培训对象的参与动机不同。新网师学员的参与是自觉自愿、积极主动，而传统培训更多是被迫参与
Python中的pyttsx3库：文本到语音转换的利器会三十六变的猫 python python 开发语言 pycharm pip
pyttsx3是一个跨平台的文本到语音转换库，它可以在没有安装其他依赖项的情况下在Windows、Linux和macOS上运行。pyttsx3使用系统自带的TTS（文本到语音）引擎，因此可以确保在各种操作系统上都具有较高的稳定性和可用性。官方文档：https://pyttsx3.readthedocs.io/en/latest/https://pyttsx3.readthedocs.io/en/l
[Python]使用pyttsx3将文字转语音小九不会Python Python python 语音识别人工智能
一、安装Pyttsx3首先，你需要在你的Python环境中安装Pyttsx3库。可以通过pip命令进行安装：pipinstallpyttsx3二、基本使用方法导入Pyttsx3库在你的Python脚本中，首先需要导入Pyttsx3库：importpyttsx3初始化TTS引擎使用pyttsx3.init()方法初始化一个TTS引擎对象：engine=pyttsx3.init()将文本转换为语音使用
【AIGC半月报】AIGC大模型启元：2024.06（下） LeeZhao@ AIGC 人工智能 AI Agent
AIGC大模型启元：2024.06（下）(1)Gen-3(2)Open-Sora1.2（Open-Sora再升级）(3)Claude3.5Sonnet（Claude升级）(4)ChatTTSv3（ChatTTS升级）(5)盘古大模型5.0(6)Falcon2(7)Glyph-ByT5-v2（清华、北大+微软）(8)LLMLeaderboardv2（大语言模型评估框架）(9)豆包MarsCode（字
【定位系列论文阅读】-Patch-NetVLAD: Multi-Scale Fusion of Locally-Global Descriptors for Place Recognition（一）醉酒柴柴论文阅读学习笔记
这里写目录标题概述研究内容Abstract第一段（介绍本文算法大致结构与优点）1.Introduction介绍第一段（介绍视觉位置识别的重要性）第二段（VPR的两种常见方法，本文方法结合了两种方法）第三段（本文贡献）第四段（为证明本文方法优越性，进行的测试以及比较）2.RelatedWork相关工作第一段（介绍早期与深度学习的全局图像描述符）第二段（介绍局部关键点描述符）第三段（局部描述符可以进一
论文阅读笔记（十九）：YOLO9000: Better, Faster, Stronger __Sunshine__ 笔记 YOLO9000 detection classification
WeintroduceYOLO9000,astate-of-the-art,real-timeobjectdetectionsystemthatcandetectover9000objectcategories.FirstweproposevariousimprovementstotheYOLOdetectionmethod,bothnovelanddrawnfrompriorwork.Theim
论文阅读笔记: DINOv2: Learning Robust Visual Features without Supervision 小夏refresh 论文计算机视觉深度学习论文阅读笔记深度学习计算机视觉人工智能
DINOv2:LearningRobustVisualFeatureswithoutSupervision论文地址:https://arxiv.org/abs/2304.07193代码地址:https://github.com/facebookresearch/dinov2摘要大量数据上的预训练模型在NLP方面取得突破，为计算机视觉中的类似基础模型开辟了道路。这些模型可以通过生成通用视觉特征(即无
chmod命令学习2 天南地北飞 linux基础学习学习 linux 服务器
递归地修改权限chmod-R很多Linux命令可以递归地应用于文件和目录，chmod命令也不例外。使用-R（或–recursive）选项能够在短时间内修改数百个文件系统对象的权限。$pwd/home/scott/pictures/libby$ls-lFdrwxrw----2scottscott...by_pool/-rw-r--r--1scottscott...libby_arrowrock.jp
微生物数据的sparcc网络分析桂渊泉树数据分析 r语言
sparcc网络分析运行sparcc首先先安装fastspar，地址https://github.com/scwatts/fastspar整理abundance_counts数据，abundance_counts.txt格式为第一列为featureID，且列名为#OTUID，其他列是样本的OTU丰度然后执行下列脚本fastspar--iterations50--exclude_iterations
周四 2020-01-09 08:00 - 24:30 多云 02h10m 么得感情的日更机器
南昌。二〇二〇年一月九日基本科研[1]:1.论文阅读论文--二小时十分2.论文实现实验--小时3.数学SINS推导回顾--O分4.科研参考书【】1)的《》看0/0页-5.科研文档1)组织工作[1]:例会--英语能力[2]:1.听力--十分2.单词--五分3.口语--五分4.英语文档1)编程能力[2]:1.编程语言C语言--O分2.数据结构与算法C语言数据结构--O分3.编程参考书1)陈正冲的《C语
【论文阅读】Mamba:选择状态空间模型的线性时间序列建模（二） syugyou Mamba状态空间模型论文阅读
文章目录3.4一个简化的SSM结构3.5选择机制的性质3.5.1和门控机制的联系3.5.2选择机制的解释3.6额外的模型细节A讨论：选择机制C选择SSM的机制Mamba论文第一部分Mamba:选择状态空间模型的线性时间序列建模(一)3.4一个简化的SSM结构如同结构SSM，选择SSM是单独序列变换可以灵活地整合进神经网络。H3结构式最知名SSM结构地基础，其通常包括受线性注意力启发的和MLP交替地
探索未来之声：GLaDOS 文本转语音引擎卓桢琳Blackbird
探索未来之声：GLaDOS文本转语音引擎项目地址:https://gitcode.com/R2D2FISH/glados-tts在科技的无垠领域中，有一项创新正悄然改变我们与机器交流的方式——GLaDOSText-to-speech(TTS)VoiceGenerator。想象一下，拥有一个如同游戏《传送门》中的智能助手般独特且富有表现力的声音，这不再仅仅是科幻梦想。GLaDOSTTS，基于神经网络
UnitTest框架 Laosdududu python
概念unittset是python自带的单元测试框架，用来做单元测试对测试的作用：自动化脚本（用例代码）执行框架用来管理运行多个测试用例作用1.组织多个用例去执行2.提供丰富的断言方法（自动化）3.生产测试报告组成部分TestCase（测试用例）是一个代码文件用来书写测试用例的代码（核心！！！TestSuite（测试套件）管理、组装多个TestCaseTestRunner（测试执行）执行TestS
SAFEFL: MPC-friendly Framework for Private and Robust Federated Learning论文阅读笔记慘綠青年627 论文阅读笔记深度学习
SAFEFL:MPC-friendlyFrameworkforPrivateandRobustFederatedLearning适用于私有和鲁棒联邦学习的MPC友好框架SAFEFL，这是一个利用安全多方计算(MPC)来评估联邦学习(FL)技术在防止隐私推断和中毒攻击方面的有效性和性能的框架。概述传统机器学习（ML）：集中收集数据->隐私保护问题privacy-preservingML(PPML)采
SPIRNGBOOT+VUE实现浏览器播放音频流并合成音频定制开发才有价值音视频人工智能语音合成
一、语音合成支持流式返回，通过WS可以实时拿到音频流，那么我们如何在VUE项目中实现合成功能呢。语音合成应用非常广泛，如商家广告合成、驾校声音合成、新闻播报、在线听书等等场景都会用到语音合成。二、VUE下实现合成并使用浏览器播放代码如下：在线语音合成流式版{{ttsText}}立即合成DOWNWAVimport*asbase64from'js-base64'importCryptoJSfrom'.
MixMAE(MixMIM):用于分层视觉变压器有效预训练的混合和掩码自编码器论文阅读皮卡丘ZPC 扩散模型阅读论文阅读
论文:MixMAE(arxiv.org)代码:Sense-X/MixMIM:MixMIM:MixedandMaskedImageModelingforEfficientVisualRepresentationLearning(github.com)摘要:本文提出MixMAE(MixedandmaskAutoEncoder)，这是一种简单而有效的预训练方法，适用于各种层次视觉变压器。现有的分层视觉变
python 文字转语音 XIAXIAgo j python玩具
参考https://blog.csdn.net/ctwy291314/article/details/81098998准备：1.安装pyttsx3的python包2.实现一个简单的代码importpyttsx3engine=pyttsx3.init()f=open("file",'r').read()engine.say(f)engine.runAndWait()3.我本来想看一下怎样将语音转为音
利用python实现文字转语音 ihateright python
装pyttsx3库：使用pip命令在终端中输入以下命令进行安装：plaintextCopycodepipinstallpyttsx3导入pyttsx3库：在Python代码中导入pyttsx3库，如下所示：pythonCopycodeimportpyttsx3创建一个TTS引擎对象：使用init()方法创建一个TTS引擎对象，如下所示：pythonCopycodeengine=pyttsx3.in
【论文阅读】LLM4CP: Adapting Large Language Models for Channel Prediction（2024） Bosenya12 科研学习论文阅读语言模型人工智能信道预测时间序列
摘要Channelprediction（信道预测）isaneffectiveapproach（有效方法）forreducingthefeedback（减少反馈）orestimationoverhead（估计开销）inmassivemulti-inputmulti-output（大规模多输入输出）(m-MIMO)systems.However,existingchannelpredictionmet
【论文阅读】AugSteal: Advancing Model Steal With Data Augmentation in Active Learning Frameworks（2024） Bosenya12 科研学习模型窃取论文阅读模型窃取模型提取数据增强主动学习
摘要Withtheproliferationof（随着）machinelearningmodels（机器学习模型）indiverseapplications,theissueofmodelsecurity（模型的安全问题）hasincreasinglybecomeafocalpoint（日益成为人们关注的焦点）.Modelstealattacks（模型窃取攻击）cancausesignifican
探索未来之声：EmotiVoice易魔声带你走进情感交融的TTS新世界瞿勋利Godly
探索未来之声：EmotiVoice易魔声带你走进情感交融的TTS新世界EmotiVoiceEmotiVoice:aMulti-VoiceandPrompt-ControlledTTSEngine项目地址:https://gitcode.com/gh_mirrors/em/EmotiVoice项目介绍在数字化沟通的浪潮中，【EmotiVoice易魔声】如同一股清新之风，为文本转语音（TTS）领域注入
Bert系列：论文阅读Rethink Training of BERT Rerankers in Multi-Stage Retrieval Pipeline 凝眸伏笔 nlp 论文阅读 bert reranker retrieval
一句话总结：提出LocalizedContrastiveEstimation(LCE)，来优化检索排序。摘要预训练的深度语言模型(LM)在文本检索中表现出色。基于丰富的上下文匹配信息，深度LM微调重新排序器从候选集合中找出更为关联的内容。同时，深度lm也可以用来提高搜索索引，构建更好的召回。当前的reranker方法并不能完全探索到检索结果的效果。因此，本文提出了LocalizedContrast
探索前沿科技：在本地系统上安装和使用Style TTS2进行高质量语音合成七哥的AI日常 tts
我们正处于一个令人激动的时代，有如此多的选择，不仅在大型语言模型方面，还有现在的文本到语音（TTS）模型。在这篇文章中，我将向您展示如何在本地系统上轻松安装这个非常出色的模型——StyleTTS2，然后进行语音克隆，或者您可以进行多语音或单语音的文本到语音转换，操作非常简单、快捷，并且具有人类级别的语音质量。StyleTTS2：前沿的文本到语音模型StyleTTS2是一款前沿的文本到语音模型，能够
A Tutorial on Near-Field XL-MIMO Communications Towards 6G【论文阅读笔记】 Cc小跟班【论文阅读】相关论文阅读笔记
此系列是本人阅读论文过程中的简单笔记，比较随意且具有严重的偏向性（偏向自己研究方向和感兴趣的），随缘分享，共同进步~论文主要内容：建立XL-MIMO模型，考虑NUSW信道和非平稳性；基于近场信道模型，分析性能（SNRscalinglaws，波束聚焦、速率、DoF）XL-MIMO设计问题：信道估计、波束码本、波束训练、DAMXL-MIMO信道特性变化：UPW➡NUSW空间平稳–>空间非平稳（可视区域
论文阅读：scMGCA----模型方法 dundunmm 论文阅读论文阅读人工智能聚类生物聚类单细胞聚类单细胞分析
Yu,Z.,Su,Y.,Lu,Y.etal.Topologicalidentificationandinterpretationforsingle-cellgeneregulationelucidationacrossmultipleplatformsusingscMGCA.NatCommun14,400(2023).https://doi.org/10.1038/s41467-023-36134
论文阅读：scHybridBERT dundunmm 论文阅读机器学习人工智能神经网络深度学习单细胞基因测序
ZhangWei,WuChenjun,XingFeiyang,JiangMingfeng,ZhangYixuan,LiuQi,ShiZhuoxing,DaiQi,scHybridBERT:integratinggeneregulationandcellgraphforspatiotemporaldynamicsinsingle-cellclustering,BriefingsinBioinform
【论文阅读】Purloining Deep Learning Models Developed for an Ultrasound Scanner to a Competitor Machine Bosenya12 科研学习模型窃取论文阅读深度学习人工智能模型安全
TheArtoftheSteal:PurloiningDeepLearningModelsDevelopedforanUltrasoundScannertoaCompetitorMachine（2024）摘要Atransferfunctionapproach（传递函数方法）hasrecentlyproveneffectiveforcalibratingdeeplearning(DL)algorit
Maven Array_06 eclipse jdk maven
Maven Maven是基于项目对象模型(POM)，信息来管理项目的构建，报告和文档的软件项目管理工具。 Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法，许多 Apache Jakarta 项目发文时使用 Maven，而且公司
ibatis的queyrForList和queryForMap区别 bijian1013 java ibatis
一.说明 iBatis的返回值参数类型也有种：resultMap与resultClass，这两种类型的选择可以用两句话说明之： 1.当结果集列名和类的属性名完全相对应的时候，则可直接用resultClass直接指定查询结果类
LeetCode[位运算] - #191 计算汉明权重 Cwind java 位运算 LeetCode Algorithm 题解
原题链接：#191 Number of 1 Bits 要求：写一个函数，以一个无符号整数为参数，返回其汉明权重。例如，‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。汉明权重：指一个字符串中非零字符的个数；对于二进制串，即其中‘1’的个数。难度：简单分析：将十进制参数转换为二进制，然后计算其中1的个数即可。 “
浅谈java类与对象 15700786134 java
java是一门面向对象的编程语言，类与对象是其最基本的概念。所谓对象，就是一个个具体的物体，一个人，一台电脑，都是对象。而类，就是对象的一种抽象，是多个对象具有的共性的一种集合，其中包含了属性与方法，就是属于该类的对象所具有的共性。当一个类创建了对象，这个对象就拥有了该类全部的属性，方法。相比于结构化的编程思路，面向对象更适用于人的思维
linux下双网卡同一个IP 被触发 linux
转自： http://q2482696735.blog.163.com/blog/static/250606077201569029441/ 由于需要一台机器有两个网卡，开始时设置在同一个网段的IP，发现数据总是从一个网卡发出，而另一个网卡上没有数据流动。网上找了下，发现相同的问题不少：一、关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
安卓按主页键隐藏程序之后无法再次打开肆无忌惮_ 安卓
遇到一个奇怪的问题，当SplashActivity跳转到MainActivity之后，按主页键，再去打开程序，程序没法再打开（闪一下），结束任务再开也是这样，只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity 本来代码： // 销毁这个Activity fin
通过cookie保存并读取用户登录信息实例知了ing JavaScript html
通过cookie的getCookies()方法可获取所有cookie对象的集合；通过getName()方法可以获取指定的名称的cookie；通过getValue()方法获取到cookie对象的值。另外，将一个cookie对象发送到客户端，使用response对象的addCookie()方法。下面通过cookie保存并读取用户登录信息的例子加深一下理解。（1）创建index.jsp文件。在改
JAVA 对象池矮蛋蛋 java ObjectPool
原文地址： http://www.blogjava.net/baoyaer/articles/218460.html Jakarta对象池 ☆为什么使用对象池恰当地使用对象池化技术，可以有效地减少对象生成和初始化时的消耗，提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
ArrayList根据条件+for循环批量删除的方法 alleni123 java
场景如下： ArrayList<Obj> list Obj-> createTime, sid. 现在要根据obj的createTime来进行定期清理。（释放内存） ------------------------- 首先想到的方法就是 for(Obj o:list){ if(o.createTime-currentT>xxx){
阿里巴巴“耕地宝”大战各种宝百合不是茶平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”，“耕地宝”由阿里巴巴投入一亿，主要是用来进行农业方面，将农民手中的散地集中起来不仅加大农民集体在土地上面的话语权，还增加了土地的流通与利用率，提高了土地的产量，有利于大规模的产业化的高科技农业的发展，阿里在农业上的探索将会引起新一轮的产业调整，但是集体化之后农民的个体的话语权将更少，国家应出台相应的法律法规保护
Spring注入有继承关系的类（1） bijian1013 java spring
一个类一个类的注入 1.AClass类 package com.bijian.spring.test2; public class AClass { String a; String b; public String getA() { return a; } public void setA(Strin
30岁转型期你能否成为成功人士 bijian1013 成功
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
[Velocity三]基于Servlet+Velocity的web应用 bit1129 velocity
什么是VelocityViewServlet 使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中，以Servlet+Velocity的方式实现web应用 Servlet + Velocity的一般步骤 1.自定义Servlet，实现VelocityViewServl
【Kafka十二】关于Kafka是一个Commit Log Service bit1129 service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解？ A message is considered "committed" when all in sync replicas for that partition have applied i
NGINX + LUA实现复杂的控制 ronin47 lua nginx 控制
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-14.输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字 bylijinnan java
public class TwoElementEqualSum { /** * 第 14 题：题目：输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字。要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字，输出任意一对即可。例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder bylijinnan java netty
今天看Netty如何实现一个Http Server org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory： pipeline.addLast("decoder", new HttpRequestDecoder()); pipeline.addLast(&quo
java敏感词过虑-基于多叉树原理 cngolon 违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包，用于java中的敏感词过滤 1、工具包自带敏感词词库，第一次调用时读入词库，故第一次调用时间可能较长，在类加载后普通pc机上html过滤5000字在80毫秒左右，纯文本35毫秒左右。 2、如需自定义词库，将jar包考入WEB-INF工程的lib目录，在WEB-INF/classes目录下建一个 utf-8的words.dict文本文件，
多线程知识 cuishikuan 多线程
T1，T2，T3三个线程工作顺序，按照T1，T2，T3依次进行 public class T1 implements Runnable{ @Override
spring整合activemq dalan_123 java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分： a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
MySQL时间字段究竟使用INT还是DateTime？ dcj3sjt126com mysql
环境：Windows XPPHP Version 5.2.9MySQL Server 5.1 第一步、创建一个表date_test（非定长、int时间） CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
Parcel: unable to marshal value dcj3sjt126com marshal
在两个activity直接传递List<xxInfo>时，出现Parcel: unable to marshal value异常。在MainActivity页面（MainActivity页面向NextActivity页面传递一个List<xxInfo>）： Intent intent = new Intent(this, Next
linux进程的查看上（ps） eksliang linux ps linux ps -l linux ps aux
ps:将某个时间点的进程运行情况选取下来转载请出自出处：http://eksliang.iteye.com/admin/blogs/2119469 http://eksliang.iteye.com ps 这个命令的man page 不是很好查阅，因为很多不同的Unix都使用这儿ps来查阅进程的状态，为了要符合不同版本的需求，所以这个
为什么第三方应用能早于System的app启动 gqdy365 System
Android应用的启动顺序网上有一大堆资料可以查阅了，这里就不细述了，这里不阐述ROM启动还有bootloader，软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来（包括wifi, power, rild, surfaceflinger, mediaserver等等）-> 启动Dalivk中的第一个进程Zygot
App Framework发送JSONP请求(3) hw1287789687 jsonp 跨域请求发送jsonp ajax请求越狱请求
App Framework 中如何发送JSONP请求呢? 使用jsonp,详情请参考:http://json-p.org/ 如何发送Ajax请求呢? (1)登录 /*** * 会员登录 * @param username * @param password */ var user_login=function(username,password){ // aler
发福利，整理了一份关于“资源汇总”的汇总 justjavac 资源
觉得有用的话，可以去github关注：https://github.com/justjavac/awesome-awesomeness-zh_CN 通用 free-programming-books-zh_CN 免费的计算机编程类中文书籍精彩博客集合 hacke2/hacke2.github.io#2 ResumeSample 程序员简历
用 Java 技术创建 RESTful Web 服务 macroli java 编程 Web REST
转载：http://www.ibm.com/developerworks/cn/web/wa-jaxrs/ JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API，可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项超声波 oracle linux
前言：这两天项目要上线了，由我负责往服务器部署整个项目，因此首先要往服务器安装oracle，服务器本身是CentOS6.5的64位系统，安装的数据库版本是11g，在整个的安装过程中碰到很多的坑，不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。安装过程中可能遇到的问题（注
HttpClient 4.3 设置keeplive 和 timeout 的方法 supben httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() { @Override public long getKeepAliveDuration(HttpResponse response, HttpContext context) { long keepAlive
Spring 4.2新特性-@Import注解的升级 wiselyman spring 4
3.1 @Import @Import注解在4.2之前只支持导入配置类在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean 3.2 示例演示java类 package com.wisely.spring4_2.imp; public class DemoService { public void doSomethin

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他