岁月指尖流

音频基础知识

文章目录

前言
一、音频基本概念
- 1、音频的基本概念
- - ①、声音的三要素
  - ②、音量与音调
  - ③、几个基本概念
  - ④、奈奎斯特采样定律
- 2、数字音频
- - ①、采样
  - ②、量化
  - ③、编码
  - ④、其他相关概念
  - - <1>、采样位数
    - <2>、通道数
    - <3>、音频帧
    - <4>、比特率（码率）
    - <5>、音频文件大小的计算：
    - <6>、PCM 流
- 3、音频处理基础
- - ①、噪声抑制（Noise Suppression）
  - ②、回声消除（Acoustic Echo Canceller）
  - ③、自动增益控制（Auto Gain Control）
  - ④、静音检测（Voice Activity Detection）
  - ⑤、舒适噪声产生（Comfortable Noise Generation）
- 4、音频使用场景
- 5、常见音频格式
- 6、混音技术
- - ①、混音条件
  - ②、回声消除、噪音抑制和静音检测等处理
  - ③、音频重采样
  - ④、回声消除
二、音频编码原理
- 1、音频编码
- - ①、压缩编码
  - ②、音频编解码常用的三种实现方案
  - ③、音频信号压缩编码标准
  - ④、音频编码过程
  - - <1>、音频信号数字化
    - <2>、音频编码三类方法
  - ⑤、音频压缩
  - - <1>、音频信号能压缩的基本依据
    - <2>、音频信号压缩编码的分类
- 2、音频编码的基本原理讲解
- - ①、概述
  - ②、静音阈值曲线
  - ③、临界频带
  - ④、频域上的掩蔽效应
  - ⑤、时域上的遮蔽效应
- 3、音频编码基本手段
- - ①、编码基本手段之一 —— 量化和量化器
  - - <1>、基本概念
    - <2>、常见的量化器的优缺点
  - ②、编码基本手段之二 —— 语音编码器
  - - <1>、基本概念
    - <2>、波形编码器
    - - 1)、时域编码
      - 2)、频域编码
      - 3)、声码器
      - 4)、混合编码器
- 4、音频压缩格式
- - ①、WAV 编码
  - ②、mp3 编码
  - ③、AAC 编码
  - ④、Ogg 编码
  - ⑤、FLAC 编码
三、音频深度学习
- 1、深度学习在音频信号处理中的进展
- 2、应用
- - ①、语音识别
  - ②、音乐信息检索
  - ③、环境声识别
  - ④、定位和跟踪
  - ⑤、声源分离
  - ⑥、声音增强
  - ⑦、生成模型
- 3、十大音频处理任务
- - ①、音频分类
  - ②、音频指纹识别
  - ③、自动音乐标注
  - ④、音频分割
  - ⑤、音源分离
  - ⑥、节拍跟踪
  - ⑦、音乐推荐
  - ⑧、音乐信息检索
  - ⑨、音乐转录（Music Transcription）
  - ⑩、音符起始点检测

前言

本节对音频相关知识进行了详细的介绍及讲解。

一、音频基本概念

1、音频的基本概念

①、声音的三要素

声音的三要素：频率、振幅、波形

频率：声波的频率，即声音的音调，人类听觉的频率（音调）范围为 20Hz—20KHz
振幅：即声波的响度，通俗的讲就是声音的高低，一般男生的声音振幅（响度）大于女生。
波形：波形决定了其所代表声音的音色。音色不同是因为它们的介质所产生的波形不同

②、音量与音调

声音的本质（音调、音量、音色）

音调：频率
音量：振幅
音色：与材质有关，谐波（不规则的正弦波）

③、几个基本概念

比特率：表示经过编码（压缩）后的音频数据每秒钟需要用多少个比特来表示，单位常为 kbps。
响度和强度：声音的主观属性响度表示的是一个声音听来有多响的程度。响度主要随声音的强度而变化，但也受频率的影响。总的说，中频纯音听来比低频和高频纯音响一些。
采样和采样率：采样是把连续的时间信号，变成离散的数字信号。采样率是指每秒钟采集多少个样本。

④、奈奎斯特采样定律

Nyquist 采样率大于或等于连续信号最高频率分量的 2 倍时，采样信号可以用来完美重构原始连续信号。

2、数字音频

①、采样

所谓的采样就是只在时间轴上对信号进行数字化。根据奈奎斯特定律（也称作采样定律），按照比声音最高频率的 2 倍以上进行采样。

人类听觉的频率（音调）范围为 20Hz–20KHz。所以至少要大于 40KHz。

采样频率一般为 44.1kHz，这样可保证声音达到 20kHz 也能被数字化。

44.1kHz 就是代表 1 秒会采样 44100 次。

②、量化

具体每个采样又该如何表示呢？这就涉及到量化。量化是指在幅度轴上对信号进行数字化。如果用 16 比特位的二进制信号来表示一个采样，那么一个采样所表示的范围即为 [-32768， 32767] 。

下图为音频量化过程：

③、编码

每一个量化都是一个采样，将这么多采样进行存储就叫做编码。

所谓编码，就是按照一定的格式记录采样和量化后的数字数据，比如顺序存储或者压缩存储，等等。

通常所说的音频裸数据格式就是脉冲编码调制（PCM）数据。

描述一段 PCM 数据通常需要以下几个概念：量化格式（位深，通常 16bit）、采样率、声道数

对于声音格式，还有一个概念用来描述它的大小，即比特率，即 1 秒内的比特数目，用来衡量音频数据单位时间内的容量大小。

④、其他相关概念

<1>、采样位数

采样位数也叫采样大小或者量化位数。量化深度表示每个采样点用多少比特表示，音频的量化深度一般为 8、16、32 位等。

例如：量化深度为 8bit 时，每个采样点可以表示 256 个不同的量化值，而量化深度为 16bit 时，每个采样点可以表示 65536 个不同的量化值。

量化深度的大小影响到声音的质量，显然，位数越多，量化后的波形越接近原始波形，声音的质量越高，而需要的存储空间也越多；位数越少，声音的质量越低，需要的存储空间越少。

CD 音质采用的是 16 bits。

<2>、通道数

即声音的通道数目，常见的有单声道和双声道或者立体声道。

单声道的声音只能使用一个扬声器发声，或者也可以处理成两个扬声器输出同一个声道的声音，当通过两个扬声器回放单声道信息的时候，我们可以明显感觉到声音是从两个音箱中间传递到我们耳朵里的，无法判断声源的具体位置。
双声道就是有两个声音通道，其原理是人们听到声音时可以根据左耳和右耳对声音相位差来判断声源的具体位置。声音在录制过程中被分配到两个独立的声道，从而达到了很好的声音定位效果。

记录声音时，如果每次生成一个声波数据，称为单声道；每次生成两个声波数据，称为双声道（立体声）。立体声（双声道）存储大小是单声道文件的两倍。

<3>、音频帧

音频跟视频不太一样，视频的每一帧就是一副图像，但是因为音频是流式的，本身是没有一帧的概念的。

比如对于 PCM 流来说，采样率为 44100Hz，采样位数为 16，通道数为 2，那么一秒的音频固定大小的：44100162 / 8 字节。

但是人们可以规定一帧的概念，比如 amr 帧比较简单，它规定每 20ms 的音频是一帧。

<4>、比特率（码率）

指音频每秒钟播放的数据量，单位为 bit，例如对于 PCM 流，采样率为 44100Hz，采样大小为 16，声道数为 2，那么码率为：44100* 16 * 2 = 1411200 bps。

<5>、音频文件大小的计算：

文件大小 = 采样率 * 录音时间 * 采样位数 / 8 * 通道数。

<6>、PCM 流

PCM 流就是原始收录声音时，数据会保存到一串 buffer 中，这串 buffer，就采用了 PCM 格式存储的。

通常把音频采样过程也叫做脉冲编码调制编码，即 PCM（Pulse Code Modulation）编码，采样值也叫 PCM 值

编码过程：模拟信号 -> 抽样 -> 量化 -> 编码 -> 数字信号

3、音频处理基础

①、噪声抑制（Noise Suppression）

手机等设备采集的原始声音往往包含了背景噪声，影响听众的主观体验，降低音频压缩效率。以 Google 著名的开源框架 Webrtc 为例，我们对其中的噪声抑制算法进行严谨的测试，发现该算法可以对白噪声和有色噪声进行良好的抑制。满足视频或者语音通话的要求。其他常见的噪声抑制算法如开源项目 Speex 包含的噪声抑制算法，也有较好的效果，该算法适用范围较 Webrtc 的噪声抑制算法更加广泛，可以在任意采样率下使用。

②、回声消除（Acoustic Echo Canceller）

在视频或者音频通话过程中，本地的声音传输到对端播放之后，声音会被对端的麦克风采集，混合着对端人声一起传输到本地播放，这样本地播放的声音包含了本地原来采集的声音，造成主观感觉听到了自己的回声。

③、自动增益控制（Auto Gain Control）

手机等设备采集的音频数据往往有时候响度偏高，有时候响度偏低，造成声音忽大忽小，影响听众的主观感受。
自动增益控制算法根据预先配置的参数对输入声音进行正向/负向调节，使得输出的声音适宜人耳的主观感受。

④、静音检测（Voice Activity Detection）

静音检测的基本原理：计算音频的功率谱密度，如果功率谱密度小于阈值则认为是静音，否则认为是声音。静音检测广泛应用于音频编码、AGC、AECM 等。

⑤、舒适噪声产生（Comfortable Noise Generation）

舒适噪声产生的基本原理：根据噪声的功率谱密度，人为构造噪声。

广泛适用于音频编解码器。

它的应用场景：完全静音时，为了创造舒适的通话体验，在音频后处理阶段添加随机白噪声。

4、音频使用场景

在现实生活中，音频（audio）主要用在两大场景中：语音（voice）和音乐（music）。

音频开发的主要应用：

音频播放器
录音机
语音电话
音视频监控应用
音视频直播应用
音频编辑/处理软件(ktv 音效、变声, 铃声转换)
蓝牙耳机/音箱

音频开发的具体内容：

音频采集/播放；
音频算法处理（去噪、VAD 检测、回声消除、音效处理、功放/增强、混音/分离，等等）；
音频的编解码和格式转换；
音频传输协议的开发（SIP， A2DP、 AVRCP，等等）；

5、常见音频格式

WAV ：压缩率低
MIDI（Musical Instrument Digital Interface）：又称作乐器数字接口，是数字音乐/电子合成乐器的统一国际标准
MP3（MPEG-1 Audio Layer 3）：MP3 能够以高音质、低采样率对数字音频文件进行压缩。应用最普遍
MP3Pro：MP3Pro 可以在基本不改变文件大小的情况下改善原先的 MP3 音乐音质。它能够在用较低的比特率压缩音频文件的情况下，最大程度地保持压缩前的音质。
WMA (Windows Media Audio)：WMA 格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的，其压缩率一般可以达到 1:18
RealAudio：最大的特点就是可以实时传输音频信息，尤其是在网速较慢的情况下，仍然可以较为流畅地传送数据，因此 RealAudio 主要适用于网络上的在线播放
Audible：拥有四种不同的格式： Audible1、2、3、4。格式 1、2 和 3采用不同级别的语音压缩，而格式 4 采用更低的采样率和 MP3 相同的解码方式，所得到语音吐辞更清楚，而且可以更有效地从网上进行下载
AAC：高级音频编码的缩写，AAC 的音频算法在压缩能力上远远超过了以前的一些压缩算法（比如 MP3 等）。它还同时支持多达 48 个音轨、15 个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。总之，AAC 可以在比 MP3 文件缩小 30% 的前提下提供更好的音质。
Ogg Vorbis：它是完全免费、开放和没有专利限制的，同样位速率(Bit Rate)编码的 OGG 与 MP3 相比听起来更好一些
APE：是一种无损压缩音频格式，在音质不降低的前提下，大小压缩到传统无损格式WAV 文件的一半
FLAC（Free Lossless Audio Codec）：是一套著名的自由音频无损压缩编码，其特点是无损压缩。

6、混音技术

混音，顾名思义，就是把两路或者多路音频流混合在一起，形成一路音频流。
混流，则是指音视频流的混合，也就是视频画面和声音的对齐，也称混流。

①、混音条件

两路音视频流，必须符合以下条件才能混合：

格式相同，要解压成 PCM 格式。
采样率相同，要转换成相同的采样率。主流采样率包括：16kHz、32kHz、44.1kHz 和 48kHz。
帧长相同，帧长由编码格式决定，PCM 没有帧长的概念，开发者自行决定帧长。为了和主流音频编码格式的帧长保持一致，推荐采用 20ms 为帧长。
位深（Bit-Depth）或采样格式 (Sample Format) 相同，承载每个采样点数据的 bit 数目要相同。
声道数相同，必须同样是单声道或者双声道 (立体声)。这样，把格式、采样率、帧长、位深和声道数对齐了以后，两个音频流就可以混合了。

②、回声消除、噪音抑制和静音检测等处理

在混音之前，还需要做回声消除、噪音抑制和静音检测等处理。在编码之前，采集、语音前处理、混音之前的处理、混音和混音之后的处理应该按顺序进行。

③、音频重采样

重采样即是将音频进行重新采样得到新的采样率的音频。

重采样的原因
音频系统中可能存在多个音轨，而每个音轨的原始采样率可能是不一致的。
比如在播放音乐的过程中，来了一个提示音，就需要把音乐和提示音都混合到 codec 输出，音乐的原始采样率和提示音的原始采样率可能是不一致的。
问题来了，如果 codec 的采样率设置为音乐的原始采样率的话，那么提示音就会失真。
因此最简单见效的解决方法是：codec 的采样率固定一个值（44.1KHz/48KHz），所有音轨都重采样到这个采样率，然后才送到 codec，保证所有音轨听起来都不失真。

④、回声消除

回声消除就是在 Mic 采集到声音之后，将本地音箱播放出来的声音从 Mic 采集的声音数据中消除掉，使得 Mic 录制的声音只有本地用户说话的声音。

传统的回声消除都是采用硬件方式，在硬件电路上集成 DSP 处理芯片，如我们常用的固定电话、手机等都有专门的回音消除处理电路，而采用软件方式实现回声消除一直存在技术难点，包括国内应用最广泛的 QQ 超级语音，便是采用国外的 GIPS 技术，由此可见一般。

回声消除已经成为即时通讯中提供全双工语音的标准方法

回声消除的基本原理是以扬声器信号与由它产生的多路径回声的相关性为基础，建立远端信号的语音模型，利用它对回声进行估计，并不断修改滤波器的系数，使得估计值更加逼近真实的回声。然后，将回声估计值从话筒的输入信号中减去，从而达到消除回声的目的。

二、音频编码原理

1、音频编码

①、压缩编码

即压缩编码，其原理是压缩掉冗余的信号，冗余信号是指不能被人耳感知到的信号，包括人耳听觉范围之外的音频信号以及被掩蔽掉的音频信号。

模拟音频信号转换为数字信号需要经过采样和量化，量化的过程被称之为编码，根据不同的量化策略，产生了许多不同的编码方式，常见的编码方式有：PCM 和 ADPCM，这些数据代表着无损的原始数字音频信号，添加一些文件头信息，就可以存储为 WAV 文件了，它是一种由微软和 IBM 联合开发的用于音频数字存储的标准，可以很容易地被解析和播放。

②、音频编解码常用的三种实现方案

采用专用的音频芯片对语音信号进行采集和处理，音频编解码算法集成在硬件内部，如 MP3 编解码芯片、语音合成分析芯片等。使用这种方案的优点就是处理速度块，设计周期短；缺点是局限性比较大，不灵活，难以进行系统升级。
是利用 A/D 采集卡加上计算机组成硬件平台，音频编解码算法由计算机上的软件来实现。使用这种方案的优点是价格便宜，开发灵活并且利于系统的升级；缺点是处理速度较慢，开发难度较大。
使用高精度、高速度的 A/D 采集芯片来完成语音信号的采集，使用可编程的数据处理能力强的芯片来实现语音信号处理的算法，然后用 ARM 进行控制。采用这种方案的优点是系统升级能力强，可以兼容多种音频压缩格式甚至未来的音频压缩格式，系统成本较低；缺点是开发难度较大，设计者需要移植音频的解码算法到相应的 ARM 芯片中去

③、音频信号压缩编码标准

ITU/CCITT 的 G 系列：G.711 、G.721 、G.722 、G.723 、G.728 、G.729；
MPEG 系列的：MPEG-l ，MPEG-2 ，MPEG-4 ，MPEG-7 中的音频编码；
DOLBY( 杜比 ) 实验室的 AC 系列： AC-1 ， AC-2 ， AC-3 等。

④、音频编码过程

<1>、音频信号数字化

将连续的模拟信号转换成离散的数字信号，完成采样、量化和编码三个步骤。又称为脉冲编码调制(Pulse Code Modulation) ，通常由 A/D 转换器来实现。

Nyquist 采样定律：采样率大于或等于连续信号最高频率分量的 2 倍时，采样信号可以用来完美重构原始连续信号。
三要素：采样频率、量化位数、声道数

<2>、音频编码三类方法

波形编码是尽量保持输入波形不变，即重建的语音信号基本上与原始语音信号波形相同，压缩比较低；
参数编码是要求重建的信号听起来与输入语音一样，但其波形可以不同，它是以语音信号所产生的数学模型为基础的一种编码方法，压缩比较高；
混合编码是综合了波形编码的高质量潜力和参数编码的高压缩效率的混合编码的方法，这类方法也是目前低码率编码的方向。

⑤、音频压缩

<1>、音频信号能压缩的基本依据

声音信号中存在大量的冗余度；
人的听觉具有强音能抑制同时存在的弱音现象。

<2>、音频信号压缩编码的分类

无损压缩(熵编码)：霍夫曼编码、算术编码、行程编码
有损压缩
- 波形编码–PCM、DPCM、ADPCM 、子带编码、矢量量化
- 参数编码–LPC
- 混合编码–MPLPC、CELP

2、音频编码的基本原理讲解

①、概述

语音编码致力于：降低传输所需要的信道带宽，同时保持输入语音的高质量。
语音编码的目标在于：设计低复杂度的编码器以尽可能低的比特率实现高品质数据传输。

②、静音阈值曲线

指在安静环境下，人耳在各个频率能听到声音的阈值。

③、临界频带

由于人耳对不同频率的解析度不同，MPEG1/Audio 将 22khz 内可感知的频率范围，依不同编码层，不同取样频率，划分成 23~26 个临界频带。

下图列出理想临界频带的中心频率与频宽。图中可看到，人耳对低频的解析度较好。

④、频域上的掩蔽效应

幅值较大的信号会掩蔽频率相近的幅值较小的信号，如下图：

⑤、时域上的遮蔽效应

在一个很短的时间内，若出现了 2 个声音，SPL（sound pressure level）较大的声音会掩蔽 SPL 较小的声音。

时域掩蔽效应分前向掩蔽（pre-masking）和后向掩蔽（post-masking），其中 post-masking的时间会比较长，约是 pre-masking 的 10 倍。

时域遮蔽效应有助于消除前回音。

3、音频编码基本手段

①、编码基本手段之一 —— 量化和量化器

<1>、基本概念

量化和量化器：量化是把离散时间上的连续信号，转化成离散时间上的离散信号。
常见的量化器有：均匀量化器，对数量化器，非均匀量化器。
量化过程追求的目标是：最小化量化误差，并尽量减低量化器的复杂度（这 2 者本身就是一个矛盾）

<2>、常见的量化器的优缺点

均匀量化器：最简单，性能最差，仅适应于电话语音。
对数量化器：比均匀量化器复杂，也容易实现，性能比均匀量化器好。
非均匀(Non-uniform)量化器：根据信号的分布情况，来设计量化器。信号密集的地方进行细致的量化，稀疏的地方进行粗略量化。

②、编码基本手段之二 —— 语音编码器

<1>、基本概念

语音编码器分为三种类形：（a）波形编码器、（b）声码器、（c）混合编码器。

波形编码器以构造出背景噪单在内的模拟波形为目标。作用于所有输入信号，因此会产生高质量的样值并且耗费较高的比特率。
声码器（vocoder）不会再生原始波形。这组编码器会提取一组参数，这组参数被送到接收端，用来导出语音产生模形。声码器语音质量不够好。
混合编码器，它融入了波形编码器和声码器的长处。

<2>、波形编码器

波形编码器的设计常独立于信号，所以适应于各种信号的编码而不限于语音。

1)、时域编码

PCM：pulse code modulation，是最简单的编码方式。仅仅是对信号的离散和量化，常采用对数量化。
DPCM：differential pulse code modulation，差分脉冲编码，只对样本之间的差异进行编码。前一个或多个样本用来预测当前样本值。用来做预测的样本越多，预测值越精确。真实值和预测值之间的差值叫残差，是编码的对象。
ADPCM：adaptive differential pulse code modulation，自适应差分脉冲编码。即在 DPCM 的基础上，根据信号的变化，适当调整量化器和预测器，使预测值更接近真实信号，残差更小，压缩效率更高。

2)、频域编码

频域编码是把信号分解成一系列不同频率的元素，并进行独立编码。

sub-band coding：子带编码是最简单的频域编码技术。
是将原始信号由时间域转变为频率域，然后将其分割为若干个子频带，并对其分别进行数字编码的技术。
它是利用带通滤波器(BPF)组把原始信号分割为若干(例如 m 个)子频带(简称子带)。将各子带通过等效于单边带调幅的调制特性，将各子带搬移到零频率附近，分别经过 BPF(共 m个)之后，再以规定的速率(奈奎斯特速率)对各子带输出信号进行取样，并对取样数值进行通常的数字编码，其设置 m 路数字编码器。
将各路数字编码信号送到多路复用器，最后输出子带编码数据流。对不同的子带可以根据人耳感知模型，采用不同量化方式以及对子带分配不同的比特数。
transform coding：DCT 编码。
离散余弦代码转换

3)、声码器

channel vocoder：利用人耳对相位的不敏感。
homomorphic vocoder：能有效地处理合成信号。
formant vocoder：以用语音信号的绝大部分信息都位于共振峰的位置与带宽上。
linear predictive vocoder：最常用的声码器。

4)、混合编码器

波形编码器试图保留被编码信号的波形，能以中等比特率（32kbps）提供高品质语音，但无法应用在低比特率场合。声码器试图产生在听觉上与被编码信号相似的信号，能以低比特率提供可以理解的语音，但是所形成的语音听起来不自然。

混合编码器结合了 2 者的优点：

RELP：在线性预测的基础上，对残差进行编码
- 机制为：只传输小部分残差，在接受端重构全部残差（把基带的残差进行拷贝）。
MPC：multi-pulse coding，对残差去除相关性
- 用于弥补声码器将声音简单分为 voiced 和 unvoiced，而没有中间状态的缺陷。
CELP: codebook excited linear prediction
- 用声道预测其和基音预测器的级联，更好逼近原始信号。
MBE: multiband excitation
- 多带激励，目的是避免 CELP 的大量运算，获得比声码器更高的质量。

4、音频压缩格式

①、WAV 编码

WAV 编码是在 PCM 数据格式的前面加上 44 字节，分别用来描述 PCM 的采样率、声道数、数据格式等信息。

特点：音质非常好、大量软件都支持。

使用场景：多媒体开发的中间文件、保存音乐和音效素材等。

②、mp3 编码

MP3 具有不错的压缩比，使用 LAME 编码的中高码率的 MP3 文件，听感上非常接近源 WAV 文件。

特点：音质在 128Kbps 以上表现还不错，压缩比比较高，兼容性好。

使用场景：高比特率下对兼容性有要求的音乐欣赏

③、AAC 编码

AAC 是新一代的音频有损压缩技术，它通过一些附加编码技术（如 PS、 SBR 等），衍生出 LC-AAC、HE-AAC、HE-AAC V2 三中主要编码格式。

特点：在小于 128kbps 码率下表现优异，且多用于视频中的音频编码。

适用场景：128Kbps 码率下的音频编码，多用于视频中的音频轨的编码。

④、Ogg 编码

Ogg 编码音质好、完全免费。可以用更小的码率达到更好的音质，128Kbps 的 Ogg 比 192Kbps 甚至更高的 MP3 还要出色。但是目前媒体软件支持上还是不够友好。

特点：高中低码率下都有良好的表现，兼容性不够好，流媒体特性不支持。

使用场景：语音聊天的音频消息场景。

⑤、FLAC 编码

FLAC 中文可解释为无损音频压缩编码。

FLAC 是一套著名的自由音频压缩编码，其特点是无损压缩。不同于其他有损压缩编码如 MP3 及 AAC，它不会破坏任何原有的音频信息，所以可以还原音乐光盘音质。

2012 年以来它已被很多软件及硬件音频产品（如 CD 等）所支持。

特点：无损压缩、压缩率高于普通文件夹压缩格式（ ZIP、 rar 等）。使用场景：高品质音乐等。

三、音频深度学习

1、深度学习在音频信号处理中的进展

主要从语音（Speech）、音乐（Music）和环境声（Environmental Sounds）三个领域出发，分析它们之间的相似点和不同点，以及一些跨领域的通用方法描述。

2、应用

①、语音识别

语音识别指的是将语音信号转化为文字序列，它是所有基于语音交互的基础。对于语音识别而言，高斯混合模型（GMM）和马尔科夫模型（HMM）曾占据了几十年的发展历史。

②、音乐信息检索

和语音不同，音乐通常包含很广泛的声源信息，并且在不同音乐源之间存在这复杂的依赖关系。

③、环境声识别

有关环境声的任务主要有三类：声音场景识别、声音事件检测和标注。

④、定位和跟踪

利用多通道信号可以对声源位置进行跟踪和定位。跟踪和定位的主要设备条件是麦克风阵列，通常包含线性阵列、环形阵列和球形阵列等。

⑤、声源分离

指的是在多声源混合的信号中提取单一的目标声源。主要应用在一些鲁棒声音识别的预处理以及音乐编辑和重谱。

⑥、声音增强

通常为语音增强，指的是通过减小噪声来提高语音质量。主要技术是去噪自编码器、CNN、RNN、GAN（SEGAN）等。

⑦、生成模型

根据数据集中的声音属性特征来生成新的数据，要求这些数据不能和原始数据集一样、要具有多样性并且训练和生成时间要很小，理想情况下是实时的。

3、十大音频处理任务

①、音频分类

音频分类是语音处理领域的一个基本问题，从本质上说，它就是从音频中提取特征，然后判断具体属于哪一类。

②、音频指纹识别

音频指纹识别的目的是从音频中提取一段特定的数字摘要，用于快速识别该段音频是否来自音频样本，或从音频库中搜索出带有相同数字摘要的音频。

③、自动音乐标注

音乐标注是音频分类的升级版。它包含多个类别，一个音频可以同时属于不同类，也就是有多个标签。自动音乐标注的潜在应用是为音频创建元数据，以便日后的搜索，在这上面，深度学习在一定程度上有用武之地。

④、音频分割

根据定义的一组特征将音频样本分割成段。

⑤、音源分离

音源分离就是从一堆混合的音频信号中分离出来自不同音源的信号，它最常见的应用之一就是识别同时翻译音频中的歌词（如卡拉 OK）。

⑥、节拍跟踪

节拍跟踪的目标就是跟踪音频文件中每个节拍的位置。

⑦、音乐推荐

⑧、音乐信息检索

这是音频处理中最困难的任务之一，它实质上是要建立一个基于音频数据的搜索引擎。

⑨、音乐转录（Music Transcription）

音乐转录是另一个非常有挑战性的音频处理任务。它包括注释音频和创建一个“表”，以便于之后用它生成音乐

⑩、音符起始点检测

音符起始点检测是分析音频/建立音乐序列的第一步，对于以上提到的大多数任务而言，执行音符起始点检测是必要的（简单任务不需要）

我的qq：2442391036，欢迎交流！

你可能感兴趣的:(音视频开发,音视频)

pyhon+ffmpeg 常用音视频处理命令不再游移 ffmpeg 音视频 python
FFmpeg是多媒体领域的万能工具。只要涉及音视频领域的处理，基本上没有它做不了的事情！通俗点讲，从视频录制、视频编辑再到播放，它都能做！前段时间做了个短视频自动化脚本项目，需要自动处理音视频（包括一些合成、拼接、转场、调色等等），当时做的时候找各种命令还是很痛苦的，因此对用到的所有处理命令做了个汇总，方便以后使用。目录一、获取音频时长二、获取视频信息三、获取视频时长四、多个视频合并五、视频提取视
音视频知识图谱 2022.04 关键帧Keyframe
前些时间，我在知识星球上创建了一个音视频技术社群：关键帧的音视频开发圈，在这里群友们会一起做一些打卡任务。比如：周期性地整理音视频相关的面试题，汇集一份音视频面试题集锦，你可以看看《音视频面试题集锦2022.04》。再比如：循序渐进地归纳总结音视频技术知识，绘制一幅音视频知识图谱。下面是2022.04月知识图谱新增的内容节选：1）图谱路径：**采集/音频采集/声音三要素/响度******主观计量响
【物联网技术大作业】设计一个智能家居的应用场景 Dream_Chaser～期末复习智能家居物联网技术期末大作业
前言：本人的物联网技术的期末大作业，希望对你有帮助。目录大作业设计题（1）智能家居的概述。（2）介绍智能家居应用。要求至少5个方面的应用，包括每个应用所采用的设备，性能，功能。（3）画出智能家居应用图，并设计使用。大作业设计题设计一个智能家居的应用场景。要求：（1）智能家居的概述。答：智能家居，又称为智能住宅或家庭自动化，是指运用综合布线、网络通信、安全防范、自动控制及音视频等技术，将家居设施集成
抖音视频搬运如何才能不违规？抖音搬运视频违规有什么后果？氧惠导师
在抖音平台中搬运短视频的人非常多，经常能看到一些视频，别的平台中也会出现，但是又会有所不一样，其实是进行了二次编辑，那么抖音搬运视频怎么做才不会违规呢?➤推荐网购薅羊毛app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、外卖红包返利等。（应用市场搜“氧惠”下载，邀请码:521521，全网优惠上氧惠！）➤由于信息差的
WebRTC之LiveKit的基础入门使用（入门必看） tabzzz 前端 webrtc web3 typescript
LiveKit本文主要是讲解在Next13+中如何使用LiveKit来实现简单的音视频通话，想了解更多的还是要去官方文档去掌握更复杂、高级的使用方法。什么是LiveKitLiveKit是一个开源的实时通信平台，基于WebRTC，主要用于构建高质量的音视频通话、实时数据传输和互动应用。LiveKit除了方便以外的大优势就是它提供了丰富的API和SDK，支持多种平台，包括Web、iOS、Android
FFmpeg安装与使用教程 vvvae1234 ffmpeg
FFmpeg是一个强大且灵活的命令行工具，用于处理音频和视频文件。无论是视频格式转换、音频提取还是视频编辑，FFmpeg都能够轻松完成。掌握FFmpeg，将为你的视频处理工作提供极大的便利。在本教程中，我们将详细介绍FFmpeg的安装和使用，包括一些实用的操作案例，帮助你更好地理解如何使用这个强大的工具。2.FFmpeg简介2.1什么是FFmpegFFmpeg是一个开源的音视频处理库，提供了丰富的
Android平台轻量级RTSP服务模块技术接入说明音视频牛哥大牛直播SDK 轻量级RTSP服务 android 音视频轻量级RTSP服务 Android RTSP服务 Android RTSP服务器安卓RTSP服务器大牛直播SDK
技术背景为满足内网无纸化/电子教室等内网超低延迟需求，避免让用户配置单独的服务器，大牛直播SDK在推送端发布了轻量级RTSP服务SDK。轻量级RTSP服务解决的核心痛点是避免用户或者开发者单独部署RTSP或者RTMP服务，实现本地的音视频数据（如摄像头、麦克风），编码后，汇聚到内置RTSP服务，对外提供可供拉流的RTSPURL，轻量级RTSP服务，适用于内网环境下，对并发要求不高的场景，支持H.2
音视频入门基础：WAV专题（11）——FFmpeg源码中计算WAV音频文件每个packet的pts_time、dts_time的实现 cuijiecheng2018 FFmpeg源码分析音视频技术音视频 ffmpeg
=================================================================音视频入门基础：WAV专题系列文章：音视频入门基础：WAV专题（1）——使用FFmpeg命令生成WAV音频文件音视频入门基础：WAV专题（2）——WAV格式简介音视频入门基础：WAV专题（3）——FFmpeg源码中，判断某文件是否为WAV音频文件的实现音视频入门基础：W
移动应用-音视频播放绚烂的萤火移动开发 android 音视频
一.音频1.Mediaplayer设置数据源的三种方式:应用自带的音频,SD卡中的音频、网络音频MediaPlayerplayer＝newMediaPlayer();player=Mediaplayer.create(this,R.raw.XX);player＝MediaPlayer.setDatasource("SD卡路径/网络路径");设置按钮并添加监听事件,实现音乐的播放、暂停2.Sound
2023-06-02《青楼文学与中国文化》陶慕宁64 每天坚持
20230602四点三十一《青楼文学与中国文化》陶慕宁64今天早上起床的闹钟我并没有听见，是我老婆把我叫醒了，昨天晚上睡得挺好，很快就睡觉了，早上有点不想起床，被老婆叫起来了。按说昨天我应该是听完了陶慕宁老师讲的课，但是我的听课记录上显示我没有听完，还是感觉喜马拉雅手机版记录的比较详细，但是喜马拉雅电脑版上的记录没有那么详细，感觉这些音视频软件应该更精准的记录一个人的听课位置，对于我们这些学习的人
神奇酷炫的下拉菜单紫藤11
下拉菜单目前公司的销售报表上，用有这个功能，真心方便，感谢小哈录制的抖音视频，但操作更简单。一、基本用法直接按住Alt+↓即可快速生成,注意：想要实现这样的功能前提是已经输入部分内容二、进阶用法1.提示信息2.出错警告3.圈释无效信息第一次作用圈释无效信息的功能三、动态下拉列表选取数据→定义名称→数据验证→序列→输入=名称四、快速录入当前时间=now（）数据验证设置单元格格式五、借贷只能一方输入选
01-Flink安装部署及入门案例（仅供学习），音视频时代你还不会NDK开发小猪佩琪962 2024年程序员学习 flink 学习大数据
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新大数据全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵
千万级规模高性能、高并发的网络架构经验分享搬砖养女人网络架构经验分享
主题：INTO100沙龙时间：2015年11月21日下午地点：梦想加联合办公空间分享人：卫向军（毕业于北京邮电大学，现任微博平台架构师，先后在微软、金山云、新浪微博从事技术研发工作，专注于系统架构设计、音视频通讯系统、分布式文件系统和数据挖掘等领域。）架构以及我理解中架构的本质在开始谈我对架构本质的理解之前，先谈谈对今天技术沙龙主题的个人见解，千万级规模的网站感觉数量级是非常大的，对这个数量级我们
2023-07-25《优势教养》127 每天坚持
20230725四点三十五星期二《优势教养》127昨天晚上睡得早，我八点五十多就到家了，催着孩子们睡觉，孩子们睡的就早，我在水里边洗了一会，拉了几下单杠，顺着老路回来了，昨天温度比较低，感觉能听进去音视频。昨天下午没有怎么睡着，晚上也感觉没有精神。昨天下午老婆带着儿女去收拾牙，我在家没事，也没有写文章，昨天上午去姐家看她家修水，耽误昨天的两千字的电子日记也没有完成，昨天的作业打卡还没有设计好，昨天
音视频编解码技术（二）：AAC 音频编码技术音视频开发老马音视频开发流媒体服务器 Android音视频开发视频编解码音视频网络协议实时音视频网络
一、AAC编码概述AAC是高级音频编码（AdvancedAudioCoding）的缩写，出现于1997年，最初是基于MPEG-2的音频编码技术，目的是取代MP3格式。2000年，MPEG-4标准出台，AAC重新集成了其它技术包括SBR或PS特性，目前AAC可以定义为⼀种由MPEG-4标准定义的有损音频压缩格式二、AAC编码规格简述AAC共有9种规格，以适应不同的场合的需要：MPEG-2AACLC低
ffplay音视频同步分析攻城狮百里音视频音视频 C++ffplay
ffplay默认也是采用的这种同步策略。主流程ffplay中将视频同步到音频的主要方案是，如果视频播放过快，则重复播放上一帧，以等待音频；如果视频播放过慢，则丢帧追赶音频。这一部分的逻辑实现在视频输出函数video_refresh中，分析代码前，我们先来回顾下这个函数的流程图：在这个流程中，“计算上一帧显示时长”这一步骤至关重要。先来看下代码：staticvoidvideo_refresh(voi
音视频入门基础：WAV专题（5）——FFmpeg源码中解码WAV Header的实现 cuijiecheng2018 FFmpeg源码分析音视频技术音视频 ffmpeg
=================================================================音视频入门基础：WAV专题系列文章：音视频入门基础：WAV专题（1）——使用FFmpeg命令生成WAV音频文件音视频入门基础：WAV专题（2）——WAV格式简介音视频入门基础：WAV专题（3）——FFmpeg源码中，判断某文件是否为WAV音频文件的实现音视频入门基础：W
OpenHarmony 5.0 纯血鸿蒙系统 ejinxian harmonyos 华为
OpenHarmony-v5.0-Beta1版本已于2024-06-20发布。OpenHarmony5.0Beta1版本标准系统能力持续完善，ArkUI完善了组件通过CAPI调用的能力；应用框架细化了生命周期管理能力，完善了应用拉起、跳转的能力；分布式软总线连接能力和规格进一步增强；媒体完善了框架能力、视频编解码能力、音视频的应用能力，媒体库丰富了使用场景，提供更好的使用体验。OpenHarmon
即时通讯项目 NingDream816 即时通讯项目网络 redis 数据库服务器缓存设计模式
即时通讯项目需求分析功能约束可行解更优解高性能接入层优化存储层优化消息时序一致性高可用需求分析功能添加好友聊天会话列表单聊AB群聊多设备登录消息漫游消息已读，查看已读/未读列表视频通话(学音视频技术时补上)语音通话约束DAU(DailyActiveUsers，日活跃用户数量)10亿假设每人平均每天发100条消息，1000Mli*100/86400=12MliQPS(Queriespersecond
MediaStream 的媒体流对象 (stream) 和流媒体轨道 (track) 详解 Wu Youlu 前端
navigator.mediaDevices.getUserMedia和MediaStream是实时音视频处理的重要API。通过这些API，可以从摄像头、麦克风或其他设备捕获音视频流，应用于视频通话、录制等场景。本文将介绍navigator.mediaDevices.getUserMedia的参数配置、MediaStream的传参、属性和方法，配合详细的代码示例，特别是如何动态添加和移除音视频轨道
ffmpeg一些基本用法 980205 ffmpeg 流媒体
来源：ffmpeg一些基本用法|王石头的博客(iwangsen.com)音视频操作，几乎绕不开ffmpeg，因为市面上绝大多数音视频播放软件、转码软件，内核都是它。它非常的强大，轻松几条命令就可以顺利完成你想做的工作我来汇总一些经常使用的命令首先在cmd窗口进入到ffmpeg目录里面最简单的视频格式转换ffmpeg-iD:\Media\IMG_0873.MOV-ccopyD:\Media\outp
走自己的路，随自己的心减读
“走自己的路，让别人去说吧”，就是一种人生态度。别人去说，是在浪费他自己的时间，而你只管活好自己的生活。被大家熟知的超级演说家总冠军刘媛媛曾经在她的抖音视频中说：“不喜欢我的人，为啥不是你改是我改，你让别人改，别人不改，然后你就会很痛苦。”最后一句“你不喜欢我，你自己改吧。”未尝不是一种只随我心的人生态度。还记得那位今年在《脱口秀大会》上爆火的北大女生李雪琴吗？她看起一脸“丧”劲儿，凭着自己的智慧
抖音视频去水印，获取无水印原视频的方法及过程分析。附上代码截图，很简单，主要是分析过程废了些时间。 liqizheng_ 笔记 php
抖音视频去水印获取原视频地址的方法及过程分析。附上代码截图，很简单，主要是分析过程废了些时间.前言：抖音视频自己保存的都带有抖音的logo和视频片尾，让一些做自媒体和搬运工的朋友感到不爽，想要搬运还有水印，于是网上出现好多视频无水印解析的网站，包括微信小程序和公众号都在做，引流也确实可以，但是大部分都是调用的其它网站提供的解析接口，往往一些还要付费，或者不稳定各种问题。，因为他们都不是从最原始的代
抖音视频怎么去水印保存到手机上 Java搬砖组长音视频
抖音已经成为人们日常消遣的主要平台之一。无论是搞笑的视频、感人的短片，还是充满创意的短视频，抖音总能给人带来无限的欢乐与惊喜。有时候我们可能会想要将喜欢的视频保存到手机上，方便离线观看或与朋友分享，但这些视频通常会带有抖音的水印。这篇文章将向大家介绍如何去除抖音视频的水印并保存到手机上。1.使用第三方工具网站去水印许多第三方应用程序和网站可以帮助用户去除抖音视频的水印。例如，“视频解析器（www.
FFmpeg任意文件读取漏洞分析音视频开发老马 ffmpeg
背景介绍FFmpeg是一套目前非常流行的可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。它提供了录制、转换以及流化音视频的完整解决方案。目前有非常多的视音频软件或是视频网站、手机APP都采用了这个库，但是这个库历史上曝出的漏洞也非常之多。这次的漏洞是利用了ffmpeg可以处理HLS播放列表的功能，在AVI文件中的GAB2字幕块中嵌入了一个HLS文件，然后提供给ffmpeg进行转
rk3588音视频硬件编解码介绍三十度角阳光的问候音视频
目录ffmpegrk3588系列芯片编程方法最终的输出结果ffmpeg示例程序ffmpeg音视频处理中通常是用ffmpeg进行软件音视频编解码aac/h264编码，但其运行速度过慢消耗cpu占用率。因此需要寻找音视频硬件编解码方法。rk3588系列芯片自带音视频硬件编解码框架ffmedia或者mpp，其内部原理是配合内部硬件rga内存，把音视频数据读入内部rga内存中进行Mpp硬件编解码计算，包括
OpenglEs之EGL环境搭建 FlyerGo Opengl 音视频 c++opengl
前言前面我们发布了一系列的入门教程，例如C++系列的指针扫盲、多线程的使用等，JNI入门系列，ffmpeg入门系列等，有感兴趣的童鞋们可以关注往回自行查阅。今天我们的主题依然是音视频开发的范畴，做过音视频开发的都知道Opengl也是音视频开发中的一项重要技能，特别是涉及到视频录制、特效处理、画质渲染细分功能。因此后续笔者打算再出一系列的OpenglES的学习笔记，希望能与大家共同温故知新。因为前面
FFmpeg的入门实践系列七(滤镜) 星海逐愿 ffmpeg ffmpeg
欢迎诸位来阅读在下的博文~在这里，在下会不定期发表一些浅薄的知识和经验，望诸位能与在下多多交流，共同努力文章目录前期博客一、滤镜过滤器filter的简介FFmpeg编程的四大结构体1.滤镜AVFilter2.滤镜图AVFilterGraph3.滤镜实例AVFilterContext4.滤镜输入输出参数AVFilterInOut二、使用滤镜加工音视频前期博客FFmpeg的入门实践系列一(环境搭建)F
Linux 编译 qtav,QtAV 1.3.3 发布，跨平台音视频播放库丶本心灬 Linux 编译 qtav
QtAV1.3.3发布-支持调用NVIDIA的cuvid库进行CUDA硬解。支持平台：windows,linux。(是linux上第一个支持cuda硬解的么？)。有些视频播放会抖动，目前原因还不清楚。4k硬解画面貌似有点花，效果不如lavfilters好。-OpenGL和OpenGLES2支持16-bit的YUV渲染，包括9,10,12,14,16bit的little/bigendian的yuv。
ffmpeg命令详解 weixin_42178492 java 基础工作相关经验集锦
ffmpeg命令详解(转)FFmpeg是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化音视频的完整解决方案。它包含了非常先进的音频/视频编解码库libavcodec，为了保证高可移植性和编解码质量，libavcodec里很多code都是从头开发的。[百度百科]ffmpeg使用语法ffmpeg使用语法：ffmpeg[[o
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&