LiveVideoStack_

如何利用深度学习实现单通道语音分离？

一直以来，语音分离在音视频领域都是一个重要的课题，近年来深度学习的快速发展为解决单通道语音分离提供了一个新的思路。在LiveVideoStackCon 2019上海音视频技术大会上，大象声科高级音频算法工程师闫永杰以降噪场景为例，详细介绍了深度学习在单通道语音分离中的应用。

文 / 闫永杰

整理 / LiveVideoStack

大家好，我是来自大象声科的闫永杰，接下来我会从以下六个方面为大家介绍深度学习在单通道语音分离中的应用：

1、单通道语音分离问题的引入

2、借助深度学习来解决单通道语音分离

3、工程实践中的挑战及解决方案

4、思考

5、总结

一、单通道语音分离问题的引入

在第一部分，我会简单介绍单通道语音分离问题的引入。首先，存在一个问题就是到底什么是单通道语音分离呢？对于做与语音相关工作的工作者来说，单通道语音分离是大家比较熟悉的一个问题，那么我就先从音频采集的方式开始来为大家介绍。

1）音频采集的方式

目前主流的音频采集方式主要包括两种场景：近场拾音和远场拾音。对于近场拾音，在我们生活中是很常见的，例如我们在使用手机打电话时手持或者开启免提。对于远场拾音，我们同样也不会陌生，像现在非常火的麦克风阵列技术就是采用的远程拾音，例如小爱同学、天猫精灵等，它们都可以做到在相隔三到五米的情况下实现远距离拾音。那么，就近场拾音和远场拾音的区别所在，首先是使用场景的不同，再就是麦克风数量的不同。远场拾音采用的麦克风数量通常为多个，有两麦、四麦、六麦、七麦，甚至还包括更加非常复杂的情况。而对于近场拾音，以手机通话来举例，通常情况下使用的是单麦或者双麦。当我们手持手机时，如果仔细观察手机可以发现手机实际上是有两个麦克风的，其中位于底部的是主麦，位于顶部的是副麦，在业界副麦也常会被叫做降噪麦克风。本次为大家介绍的单通道语音，主要讨论的是单麦克风近场拾音的场景。

2）语音分离

首先，我们需要来界定一下，到底什么是语音分离？实际上，我们经常所讲的降噪、去混响、多人声分离等等的过程都属于语音分离的过程。其中，降噪指的就是语音与噪音的分离，去混响指的就是语音与混响的分离，而多人声分离的场景则相对复杂一些，在这里包含有目标人声和其它的干扰人声。其实对于以上几种语音分离的场景，它们的最终目标是相同的，即将目标人声与其它非目标人声的语音进行分离。下面就以降噪为例，为大家介绍语音分离的过程。

3）降噪

在我们的现实生活中，噪音的种类是形形色色的。如上图所示，例如在车水马龙的街道、吵闹的酒吧和KTV、人来人往的车站以及各种加工工厂，这些场景都是典型的充满嘈杂的噪音的地方。形形色色的噪音对通话质量来说是一个非常大的挑战，特别是当下所流行的视频通话，视频通话双方所处的环境各有可能，那么在嘈杂的环境中对于视频通话的良好体验就会产生巨大的挑战。因此，在语音通话中实现更好的降噪已经成为了一个必不可少的课题。

那么，降噪的最终目标是什么呢？直白的说就是将目标人声从多种噪音源中分离出来。如上图所示，在通话的过程中，实际输入的语音是包含目标人声、噪音源1、噪音源2以及其他噪音源的，其中噪音源的数量是一般都是多种，而降噪的目标就是将目标人声从中提取出来。

现在已经有了降噪的目标，那么该如何实现这个目标，解决目标人声和噪音源分离的问题呢？

二、借助深度学习来解决单通道语音分离

在第二部分，我将为大家详细介绍解决单通道语音分离的方法，首先是传统的单通道语音增强方法。

1）传统的单通道语音增强

要想实现单通道语音分离可能存在以下难点：单通道语音一般只包含一个麦克风，这很大程度上也限制了算法的能力。如果存在有多个麦克风的话，通过一些空间信息将与主讲人方向不同的噪音去除掉即可达到语音分离的目的。而单通道语音只有一个麦克风，因此就只存在一路信号，没有方位信息，这也就为实现语音分离带来了挑战。传统的语音增强算法包括有谱减法、维纳滤波、卡尔曼滤波以及其他算法。对于谱减法，其前提是先假设噪音是稳定的，稳态噪音在我们生活中也是很常见的，例如冰箱发出的声音或者是航空发动机发出的规律性噪音。谱减法先假设噪音是稳定的，然后估计噪音，估计噪音的方法是将人不说话的时间段的噪音取平均值，估出噪音以后，当人说话的时候减去对应噪音就可以认为剩余的为纯净的语音。但是这种方法存在很明显的弊端，它的前提是假设噪音都是稳态的，而实际上在日常生活中，瞬态的噪音也是非常多的，例如敲击声、咳嗽声、其他人播放音乐的声音、汽笛声等等。对于这些非稳态的噪音，谱减法基本上是无能为力的。此外，还有一点缺陷就是谱减法假设的稳态噪音实际上取的是平均值，这就有可能导致在做减法时出现负值。而当出现负值时，谱减法只是将负数直接用0替代了，这种做法实际上会在降噪的过程中额外带来新的噪音。

最后，总结一下传统语音增强算法的特点：1）传统方法是基于对信号的理解，采用人工编制的一些规则；2）由于规则是人工编制的，这就导致存在规则很难编制详尽的问题；3）存在很多需要估计的算法，通过对噪音调参得到适配的参数的调参过程十分考验人对于信号的理解以及自身经验的丰富程度；4）最后一个也是最重要的问题就是瞬态噪音，瞬态噪音不符合算法假设，传统方法对它的处理结果基本上都是不尽如人意的。

下面将为大家介绍我们解决单通道语音分离的方法。

2）计算听觉场景分析

对于这一部分，首先为大家分享一个概念——计算听觉场景分析，这套理论的主要贡献者之一是我们的首席科学家汪德亮教授，他于2001年提出理想二值掩膜（Ideal Binary Mask，IBM），并将预测IBM作为计算听觉场景分析解决语音分离问题的计算目标。上图是IBM的相关计算公式，为了方便讲解，我们先抛开公式，看下面的四张语音的图。

如图所示，可以看出与图像信号不同的是语音信号是一维的信号，而图像信号是二维的信号。对于语音信号利用一维的信息直接处理的难度是非常大的，因此我们将原始语音信号经过时频变换，如：短时傅里叶变换（STFT），就会得到左上的这张图——原始信号的幅度谱。幅度谱的颜色越深代表着能量越大，其中左上图中的红色部分就是语音的部分，看起来有一道一道的梳状条纹，是语音的谐波结构，这就是语音的元音成分。左上图是纯净语音对应的幅度谱，而右上图则是对应带噪语音的幅度谱，看起来有一些杂乱，语音成分被破话。右下图就是我刚才提到的IBM，IBM的含义是理想二值掩膜。右下图对应的是将IBM（左下图）覆盖到带噪语音谱（右上图），形成了降噪后的语音谱。而从图中可以看出，降噪后的语音谱（右下图）比噪声语音谱干净（右上图）了许多，但与纯净语音谱相比，存在部分过压的现象，听起来实际效果就是噪音基本消除，但是会有些许失真。

接下来，我们再来看IBM的计算公式，公式里面的IBM其实就是深度学习最终预测的目标，IBM计算所得的值为0和1，即可认为把最终结果分类成0和1，那么如何去界定0和1呢？界定条件如下：如果语音的能量s减去噪音的能量n大于一个θ值，θ一般取值为0，此时IBM的值为1，即我们认为语音比噪音大的地方，IBM是1；同样地，我们认为语音比噪音小的地方，IBM是0，即认为是噪音。这解释了为何将在之前图中第二层从左到右的第一张图谱覆盖到第一层从左到右的第二张图谱上所得的信号与纯净语音是有差距的。而这样做的好处就是成功将一个回归问题改变为分类问题，只需要预测它是0或者1就可以了，这就使得学习难度变小，更容易预测。但不好的地方就是听上去语音会有些许失真。但在2013年，当时这个方法所取得的效果已经算是非常好的。在此之后，陆续又有人提出了其他的一些计算目标，如TBM、IRM等，而这些目标其实都与IBM是相似的，只是进行了一些修正改进，例如IRM的值不仅仅只是0和1了，当我们认为它有一半的部分是语音，那么我们的目标值就是0.5。当前我们所采用的计算目标大多数是IRM。

3）深度学习

首先，大家可能也曾思考过深度学习方法到底是什么或者深度学习方法到底要做什么事情。简单来讲，深度学习方法的本质就是通过构建模型，来拟合一个函数映射，即我们提供一个输入并告诉应该输出什么，然后通过输入大量数据，不断学习数据之间的潜在对应关系，找到一个模型去模拟这个函数映射关系。构建模型有很多方法，例如高斯混合模型、支持向量机、多层感知机以及深度神经网络（DNN），它们的目的就是去找到一个模型能够通过输入来预测出一个目标值。在上面的函数中，刚才讲到的IBM就是对应里面的y，也就是说我们要预测的目标就是IBM，而我们输入就是前面所讲的右上图——带噪语音的幅度谱。这是因为我们在部署的时候，实际上只能拿到这个信息。输入是带噪语音的幅度谱，目标是IBM，那么这样函数映射就建立好了。接下来就是网络的构建了，网络的构建可以用简单一些的，例如全连接，卷积或者是后面发展比较好的RNN、LSTM一类的结构去构建模型。

下面，总结一下深度学习方法实现语音分离：1）首先要确定目标——IBM，当然我们在这里是以IBM为例来讲的，如果你采用IRM；2）特征输入—— 短时傅里叶变换后的幅度谱；3）训练工具现在都已经十分成熟了，Tensorflow、Pytorch都很好用；4）数据驱动，最后就是需要不断喂数据，这个喂的数据就是语音。在这里，需要讲一下的就是大部分环境中的噪音都是加性噪声，因此我们可以仿真得到混合后的声音，只需将裁好的噪音与语音加在一起即可。这样一来，我们有了训练的目标，纯净语音、噪声都是已知的，只需要把这些数据喂给网络，让它不断的调整参数，就会得到一个比较不错的效果。

下面将为大家介绍在工程实践中部署时的挑战和解决方案。

三、工程实践中的挑战及解决方案

在这一部分，我将为大家介绍工程实践中遇到的问题以及我们提出的解决方案。

1）工程实践中的挑战

前面所讲的原理其实都是非常简单的，但仅仅只是学术的，而深度学习讲究的是落地，而在落地的时候，深度学习所面临的最大挑战就是部署。对于ASR或者NLP来说都是可以部署在云端上的，因此可以对模型有一些容忍度，可发挥的空间也更大一点。但是，对于实现降噪效果的，如果运行在服务器上，它的延时、实时性都是不切实际地，所以部署的终端大多数是移动设备，例如手机、iPad，甚至是在耳机中非常弱的M4芯片上。因此，对于这些设备来说，1）功耗必须得控制好，那么计算量就不能太大；2）由于这些芯片的内存非常小，例如M4可能只有几百K的空间，因此模型参数不能太大，否则无法部署。此外，给大家讲一下我们公司最初是如何演示最终效果的，别人提供给我们一个带噪的语音，我们在服务器上跑一下再发给人家，这样一来的体验效果是很差的，后来感觉太复杂了就写了一个MATLAB的，但效果也不是实时的，这是我们当时遇到的最大的挑战。

为了解决这些问题，我们做了一些相关的优化。

2）模型优化

针对上述问题，我们对模型进行了优化，优化的方向包括控制模型参数规模和替换计算代价高昂的激活函数。首先，模型参数规模一定要降下来，模型参数最先影响的是带宽。如果模型参数大于所要部署的嵌入式设备的内存，则不可能实现部署，这是一个裁模性的考量。其次，要减少计算量，参数减少以后，乘加指令自然会减少。控制模型的大小是一个非常重要的方向，例如全连接层的经典模型，我们输入1024个节点，则输出1024个节点，仅仅一层网络就已经占用了4M的空间，然而设备却只有几百K的内存。因此，对于全连接层的使用一定要慎重，尽量选用其他结构如RNN或CNN来替代，尤其是CNN的参数共享可以带来非常大的提升。

我们在设计网络的时候，一定要考量DNN的输入与输出的大小规模，这是一个非常重要的点，尽量使用CNN或者RNN的结构去替代DNN。然后，还有最重要的一点就是选取一个好的Feature，刚才前面讲的我们用的Feature选择的是Mix语音、经过STFT后的幅度图，这虽然是最直观、最简单的，但是学起来难度较大。我们也在这方面做了很多的尝试和工作，例如将输入Feature从幅度谱改为mel谱就可以将输入规模大大减小。就像我在前面所讲的深度学习要学的是个函数映射，可能大家会有疑问，为什么在输入特征时不直接把时域的信号送进去，然后目标就是纯净语音的信号？其实如果这么做能成功的话，那肯定是最好的，但是如果你告诉网络的是一个完整、没有丢失的信息，这在它学习规律的过程中，对于深度学习来说，学习难度太大，参数量是降不下来的。因此，我们折中选取了频域的信号，选取频域信号以后，学习难度就会下降很多，不仅可以比较容易的能学到它的模式，而且参数量也会大大下降。所以，在裁模型的时候，一定要注意选取一个好的Feature。

最后一点也是来自工程实践中的一个问题，例如当我们训练好模型交给同事部署时，同事会反馈说，你用的ELU函数，一个EXP指令直接占用了600个cycle。后来我们发现问题，工程师在训练模型的时候，一定要与最终部署的同事沟通好，要了解到哪些函数对他们来说是很有挑战的。例如将ELU换成一个简单一些的RELU，部署所需指令可能就只有一个两个cycle，而如果用ELU，在性能上对实验结果来说差距是不大的，但是在部署时差距就会放大几百倍，所以一些代价高的函数一定要慎重使用。

3）算法优化

在做好模型优化后，一个比较小且合理的模型给到工程团队，工程团队在落地的时候还要做一些算法优化。1）定点化。大家都知道，如果做图像的话，一般会用int8去量化，这样带来的好处就是学习时用的float32，部署时用int8可以节省4倍的内存，这是一个很好的优化。但是，对于语音还不能用int8，我们尝试过，使用int8最终会导致精度太差，部署的模型预测出来的值与float32的值差距太大。这主要是因为对于语音，我们一般采样的是16bit，在后面量化时会使用Int16去替代float32，会带来1倍的内存带宽的下降。2）合理排布流水线，注意不要因为频繁地数据访存缺页，导致打断了流水线使cycle数急剧增加，一定要在汇编层流程上排布好流水线。3）利用平台并行计算指令。大多数平台都是有这个并行指令计算的，例如ARM上的NEON或者是SIMD，在可用的情况下一定要用起来，一般会有2到4倍的加速。经过这些优化以后，基本上就可以得到一个部署在手机上的模型。

四、思考

在这一部分，我想带着大家一起思考，为什么深度学习会有这么好的效果呢？因为深度学习具有以下优势：

1）数据驱动，一定条件下，数据越多性能越好。我们只需要采集足够多的噪音、足够多的语音，源源不断地喂给网络，就能够从中学习到语音的模式，所得的模型更加精确。为什么在这里要说一定条件下呢？一方面如果是同类噪音，采集的再多也没什么用，这就要求我们要保证数据的丰富性。另一方面，大家可能有一个疑虑，既然说是数据驱动的，如果某种噪音并未采集过或见过，那该怎么办呢？此时就要考量算法的泛化能力。深度学习中有一个概念就是过拟合，如果见过的数据都能拟合的非常好，而没见过的数据就会突然表现非常差，说明模型过拟合了，这是不可接受的。所以，在做音频降噪的时候，一定要考虑模型的泛化能力，同等条件下，如果模型越小，学习过程中最后的loss值跟大模型基本一致，那就说明模型泛化能力强。也就是说参数越少，泛化能力一定程度上越好，所以前面所讲的我们做的裁减模型的工作对泛化能力也是有很大的提高的。这样一来，在部署的时候，对于没见过噪声，预测的结果也不会太差。

2）相比传统算法手工统计的模式，深度学习可以学到更加鲁棒的模式。对于传统算法的调参是十分麻烦的，例如我们看过的有一些竞品算法公司调参，参数大概有几百个，在对接厂商的时候需要将参数逐一调整，以实现不错的效果，这中间的工作量非常大。但是，这几百个参数跟深度学习相比就太少了，深度学习的参数量基本上是百万规模的，甚至是千万规模的。因此，手工统计的那些参数所包含的信息，它所拟合的模型的建模能力跟深度学习是不可比拟的，因此深度学习相比于传统算法，它学到的模式更加鲁棒。3）深度学习有记忆的能力。对于深度学习来说，一定程度上，见过的数据越丰富，效果越好。

在这里，说一个我们的首席科学家汪老师给我们讲的故事，他在俄亥俄州作教授，有一个老同事得了海默森综合症，记忆力会减退。有一天，这个老同事回到学校去看望汪老师，他知道汪老师是做人工智能研究，根据自己的亲身感受，当时就说了一句话，No Intelligence Without Memory!这句话的意思是没有记忆就没有智能。所以说，记忆对于智能来说非常重要，深度学习有非常多的参数，它会通过记忆非常多的模式来记住语音的分布以及噪音是长什么样子的。当然，对于降噪来说，更多记忆的是语音的一种模式，因为噪音实在是太复杂了，记录噪音的难度太大了。

五、总结

最后，就是本次的总结部分了。本次演讲内容首先是介绍了单通道语音分离的定义，其中语音分离方法我们介绍了三种，主要是以降噪为例去讲的，因为降噪是比较关键的，再就是介绍了在单通道语音分离里面遇到的一些挑战，以及我们是如何去解决所遇到的困难的。

LiveVideoStack 招募

LiveVideoStack正在招募编辑/记者/运营，与全球顶尖多媒体及技术专家和LiveVideoStack年轻的伙伴一起，推动多媒体技术生态发展。了解岗位信息请在BOSS直聘上搜索“LiveVideoStack”，或通过微信“Tony_Bao_”与主编包研交流。

点击【阅读原文】或扫描图中二维码，即刻了解更多大会讲师及分享内容信息！

关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
2021-08-26 影幽
在生活中，女人与男人的感悟往往有所不同。人生最大的舞台就是生活，大幕随时都可能拉开，关键是你愿不愿意表演都无法躲避。在生活中，遇事不要急躁，不要急于下结论，尤其生气时不要做决断，要学会换位思考，大事化小小事化了，把复杂的事情尽量简单处理，千万不要把简单的事情复杂化。永远不要扭曲，别人善意，无药可救。昨天是张过期的支票，明天是张信用卡，只有今天才是现金，要善加利用！执着的攀登者不必去与别人比较自己的
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
html 中如何使用 uniapp 的部分方法某公司摸鱼前端 html uni-app 前端
示例代码：Documentconsole.log(window);效果展示：好了，现在就可以uni.使用相关的方法了
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
直抒《紫罗兰永恒花园外传》雷姆的黑色童话
没看过《紫罗兰永恒花园》的我莫名的看完了《紫罗兰永恒花园外传》，又莫名的被故事中的姐妹之情狠狠地感动了的一把。感动何在：困苦中相依为命的姐妹二人被迫分离，用一个人的自由换取另一个人的幸福。之后，虽相隔不知几许依旧心心念念彼此牵挂。这种深深的姐妹情谊就是令我为之动容的所在。贝拉和泰勒分别影片开始，海天之间一个孩童凭栏眺望，手中拿着折旧的信纸。镜头一转，挑灯伏案的薇尔莉特正在打字机前奋笔疾书。这些片段
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
从鸡肉高汤到记忆的魔法再到有效提示的艺术步子哥人工智能
还记得小时候那些天马行空的白日梦吗？也许只要按下键盘上的某个神奇组合，电脑就会发出滴滴的声响，一个隐藏的世界突然在你眼前展开，让你获得超凡的能力，摆脱平凡的生活。这听起来像是玩过太多电子游戏的幻想，但实际上，间隔重复系统给人的感觉惊人地相似。在最佳状态下，这些系统就像魔法一样神奇。本文将以一个看似平凡的鸡肉高汤食谱为例，深入浅出地探讨如何编写有效的间隔重复提示，让你像掌握烹饪技巧一样轻松地掌握记忆
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
18-115 一切思考不能有效转化为行动，都TM是扯淡！成长时间线
7月25号写了一篇关于为什么会断更如此严重的反思，然而，之后日更仅仅维持了一周，又出现了这次更严重的现象。从8月2号到昨天8月6号，5天！又是5天没有更文！虽然这次断更时间和上次一样，那为什么说这次更严重？因为上次之后就分析了问题的原因，以及应该如何解决，按理说应该会好转，然而，没过几天严重断更的现象再次出现，想想，经过反思，问题依然没有解决与改变，这让我有些担忧。到底是哪里出了问题，难道我就真的
我在意的 Yuexiaofeng
我所在意的，往往是你最容易忽略的，这让我感到为难。我所感动的，你却无动于衷，这使我感到惭愧。我所做的，你却视而不见，这让我不知如何是好。
拥有断舍离的心态，过精简生活--《断舍离》读书笔记爱吃丸子的小樱桃
不知不觉间房间里的东西越来越多，虽然摆放整齐，但也时常会觉得空间逼仄，令人心生烦闷。抱着断舍离的态度，我开始阅读《断舍离》这本书，希望从书中能找到一些有效的方法，帮助我实现空间、物品上的断舍离。《断舍离》是日本作家山下英子通过自己的经历、思考和实践总结而成的，整体内涵也从刚开始的私人生活哲学的“断舍离”升华成了“人生实践哲学”，接着又成为每个人都能实行的“改变人生的断舍离”，从“哲学”逐渐升华成“
如果做到轻松在股市赚钱？只要坚持这三个原则。履霜之人
大A股里向来就有七亏二平一赚的说法，能赚钱的都是少数人。否则股市就成了慈善机构，人人都有钱赚，谁还要上班？所以说亏钱是正常的，或者说是应该的。那么那些赚钱的人又是如何做到的呢？普通人能不能找到捷径去分一杯羹呢？方法是有的，但要做到需要你有极高的自律。第一，控制仓位，散户最大的问题是追涨杀跌，只要涨起来，就把钱往股票上砸，然后被套，隔天跌的受不了，又一刀切，全部割肉。来来回回间，遍体鳞伤。所以散户首
【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
从0到500+，我是如何利用自媒体赚钱？一列脚印
运营公众号半个多月，从零基础的小白到现在慢慢懂了一些运营的知识。做好公众号是很不容易的，要做很多事情；排版、码字、引流…通通需要自己解决，业余时间全都花费在这上面涨这么多粉丝是真的不容易，对比知乎大佬来说，我们这种没资源，没人脉，还没钱的小透明来说，想要一个月涨粉上万，怕是今天没睡醒（不过你有的方法，算我piapia打脸）至少我是清醒的，自己慢慢努力，实现我的万粉目标！大家快来围观、支持我吧！孩子
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它

如何利用深度学习实现单通道语音分离？

你可能感兴趣的:(如何利用深度学习实现单通道语音分离？)