crazyjiang

LPC10e声码器分析

作者：JHJ([email protected])
日期：2012/08/24

欢迎转载，请注明出处

不好意思，之前文章格式完全错乱了，我现在重新发一下。不多说了，研究语音信号处理的都懂的。

LPC-10e分析器(analys.c)

1. LPC-10e分析器系统框图

图1-1 LPC - 10e分析器[1]

本文假设：

Z(0)：当前输入帧的数据，即最新输入帧； Z(-1)：前一输入帧的数据；

Z(-2)：前两输入帧的数据； Z(-n)：前n输入帧的数据；

程序中的AF，是在清/浊音窗的设置及后续程序中用到，AF表示当前窗(对应Z(-2)和Z(-1))，AF – 1表示前第一个窗(对应Z(-3)和Z(-2))，AF – 2 表示前第两个窗。

Data Buffers

INBUF Raw speech (with DC bias removed each frame)

PEBUF Preemphasized speech

LPBUF Low pass speech buffer

IVBUF Inverse filtered speech (白化滤波)

OSBUF Indexes of onsets in speech buffers

VWIN Voicing window indices

AWIN Analysis window indices

EWIN Energy window indices

VOIBUF Voicing decisions on windows in VWIN

RMSBUF RMS energy

RCBUF Reflection Coefficients

2. 在analys.c中各buffer中数据分布情况：

Vwin及Awin中存储的是窗的起点和终点的序号。

Voibuf中半帧voice的值，0代表清音，1代表浊音。

Obound中存储的是onset和vwin的关系值：

Obound = 0表示清/浊音窗两端无onset；

Obound = 1表示清/浊音窗左端有一个onset；

Obound = 2表示清/浊音窗右端有一个onset；

Obound = 3 表示清/浊音窗两端各有一个onset；

Osbuf中存储的是onset的序号，osptr指针最后一个onset存储位置的后一个存储单元，当Osbuf中无onset时候，osptr指向Osbuf[0]。程序中未考虑Osbuf溢出情况，因为Osbuf缓冲区足够大了。

每调用一次analys_( )函数，osbuf数据更新，即(index[onset] = (index[onset] – 180)) > 0的值顺序存入osbuf中,同时osptr值更新。

注：每次调用analys_( )函数，先更新以上个buffer的数据，再开始做相应的处理。

3. 确定AMDF及清/浊音窗的数据流向图

图3-1 确定AMDF[ ]

图3-2 确定清浊音窗

如图3-2所示，vwin[ ]中存放的是窗的起点和终点的值。

4. 预加重(preemp.c)

在实施LP分析前进行预加重的目的是加强语音谱中的高频共振峰，使语音短时谱以及线性分析中的余数（残差）频谱变得更为平坦，从而提高了谱参数估值的精确性。

预加重滤波器的传输函数为：

H(z) = 1 - coef * pow(z,-1)，coef = 0.9375；

其时域函数为：

pebuf(n) = inbuf(n) - coef * inbuf(n-1)；

preemp_( )函数处理的是Z(0)帧的数据，即inbuf(Z(0)) —> pebuf(Z(0))。

5. 白化滤波(ivfilt.c)

白化滤波器是指数字语音经过二阶LPC分析滤波器后，滤除共振峰的白化语音[1]。

图5-1

程序中，函数ivfilt__( )是将Lpbuf[133,312]中的数据通过ivfilter存入ivbuf[133,312]中。即lpbuf(Z(-1))—>ivbuf(Z(-1))。

6. AMDF函数(tbdm.c)

此函数的输入是白化滤波后的样点数据，把采样频率降低至原来的1/4，再计算延迟时间为20至156个样点的AMDF,由AMDF的最小值即可确定基音周期。

公式（5-1）

其中，t的取值可以为：20，21，22，23，24，25，26，27，28，29，30，31，32，33，34，35，36，37，38，40，42，44，46，48，50，54，56，58，60，62，64，66，68，70，72，74，76，78，80，84，88，92，96，100，104，108，112，116，120，124，128，132，136，140，144，148，152，156相当于在50-400Hz范围内计算60个ADMF值。

当初步计算出最小AMDF及mintau（最小AMDF所对应的基音周期）时，由于基音周期取值>40后，在整数域上的不连续性，因此需要还需要计算表tau中被遗漏的基音周期所对应的AMDF。

这里采用的方法是:基因周期>40时，取出(mintau - 3)到(mintau + 3)而不包括表tau中的值，将这些值放入新表tau2,用函数difmag_()重新计算这些未被计算过的基音周期, 从而可以提取更精确的基音周期值。

图6-1

图6-2 提取最小AMDF函数流程图

7. 低通滤波(lpfilt.c)

图7-1

按程序所示，函数Lpfilt__( )是将Inbuf[133,312]中的数据通过低通滤波器存入Lpbuf[133,312]，即inbuf(Z(0))—>lpbuf(Z(0))。

8. 确定起始点(onset.c)

为了使合成语音清楚地再现急剧变化的语音的起始点的特性，将提取语音特征参数的分析窗的起点取在语音特征短时急剧变化的起始点处在这里是用计算预加重语音x的一阶PARCOR参数的变化来确定语音巨变的起始点。计算公式如下：

Y(i) = (K(i - j)|(j=0 to N/2-1)求和) – (K(i - j)|(j=N/2 to N)求和) (公式7.1)

K(i) = n(i)/d(i) = {[x(i)x(i - 1) + 63n(i -1)/64]/[x(i)x(i) + 63d(i - 1)/64]} (公式7.2)

这里N为帧长。如果y(i)超过某个给顶的阈值，则i点为起始点。

图8-1 onset__()中prebuf数据储存结构

Osbuf中对应的序号是图7.1中pebuf所示的序号。从图7.1和图7.2中可以看出，每次调用onset__( )函数，实际上是检测Z(0)中的onset。

图8-2 onset__( )函数流程图

9. 设置清/浊音窗(placev.c)

此函数用来确定最新清/浊音窗的窗长及obound(清/浊音窗与onset的关系)。

图9-1 placev__( )中buffer数据储存结构

对应图8-1中Pebuf，Range的范围是[180,540]，窗长范围是[90,156]。因此是在Z(-2)、Z(-1)这两帧中确定最新的清/浊音窗的。

清/浊音窗的确定原则如下：

1．当range中没有onset时，两种可能性确定起始点：

(1)前一个窗的窗尾大于等于dvwinl，则起点接着此窗尾后面;

(2)前一个窗的窗尾小于dvwinl，则已默认值dvwinl为起点。

2．当range中有一个onset时，则以此onset的前一个点为当前VWIN的窗尾，窗头取max(180, onset value - 156), 表示窗起点可能为180下标, 但窗长不能超过156,此时onset在VWIN的右侧。

3．当range中有超过一个onset时，取第1个onset的点为VWIN窗头，

(1)若第1个onset和第2个onset的间距超过90时，取第2个onset为VWIN窗尾，此时窗两测各有一个onset；

(2)若此两个onset间距小于90，若此range中就2个onset，则窗尾取min(窗头+156，560)；

(3)若此两个onset间距小于90，且还有第3个点若第1个onset和第3个onset间距仍然小于90，处理方法同(2),若间距大于90，处理方法同(1)。以此类推。

10. 清/浊音判决(包括计算能量、检测过零率)(voicing.c)

清/浊音判决是利用模式匹配技术，基于低带能量，AMDF函数的最大值和最小值之比，过零率做出的。最后对基音值通过清、浊音判决结果用动态规划算法，得出前一帧的基音周期。在三清浊音窗范围内进行平滑和误差范围校正，得出第一个窗的清、浊音判决结果。

清/浊音判决是对输入语音每半帧判决一次（程序中实际是对清/浊音窗每半个窗判决一次，最后乘以一个比例因子），判决结果存入 voibuf中，0代表清音，1代表浊音。先是对当前窗做暂时的清/浊音判决，而利用这个判决结果对前两个窗做平滑处理，得出前第2个窗的判决结果，而前第1个窗的结果需要未来一个窗的结果来平滑决定。

清/浊音参数向量（VALUE）基于矩形窗的语音样点，由加窗算法决定的。清/浊音参数向量包括AMDF函数的最大值和最小值之比、过零率、能量检测、反射系数、预测增益做出决定的。

输入信号分为清音（包括无声）和浊音。清/浊音的判决由线性判别函数确定，即清/浊音判决系数（VDC）行向量和清/浊音参数列向量（VALUE）的点乘。VDC向量是一个二维向量，每一个行向量都对应一个特定的信噪比（SNR）。因此，在点乘前，先需要估计一个SNR来选择合适的VDC向量。

平滑算法是一个修改中间值的平滑器。清/浊音判别函数利用这个平滑器来确定一个信号的清/浊音的健壮性。如果在某个半帧中如果有一个onset或者清/浊音转变，则数据可以得到进一步修正。在这种情况下，清/浊音转变点会延长到onset。出于传输考虑，清/浊音转变期会有些限制。平滑器会考虑这些限制性因数。

最后，更新能量估计值和用来计算过零率(ZC)的阈值dither。

图10-1 清/浊音判决流程图

11. 基音检测(dyptrk.c)

用动态规划算法求解基音值的基本思想是：欲求出前n帧的最小AMDF，则只需要求出前n-1 帧的AMDF的权值，加上当前帧的AMDF，然后求最小值，找出最小AMDF对应的基音值就是所要求的基音值。现在的问题是如何通过前n-1帧的AMDF的权值求解前n帧的AMDF。先将前n-1帧的权值做斜率阈值限制处理，即AMDF[60]缓冲区中相邻的AMDF值的绝对值不能大于某个值，然后把限制处理后的值都减去最小AMDF，则更新了前n-1帧AMDF缓冲区。此时用这个缓冲区的值加上当前AMDF，求出最小AMDF即可。

函数dyptrk__( )中有三个重要变量：s[ ]、p[ ]和alphax。下面是这三个变量的简单说明：

s[60]：s[60]为amdf[60]的权值，与所有以前求出的 amdf[60]都关联起来。

p[120]：p[60][2]中储存的信息是：s[60]中被修改的元素的信息。比如p[5 to 10]={8,8,8,8,8,8,8},则说明s[7](即第8个元素)未被修改，而s[5 to 6]和s[8 to 10]被修改。

alphax：alphax/16为s[60]的斜率阈值，即s[60]中相邻元素的差值的绝对值不大于alphax/16,alphax的确定和清浊音有关。

12. 设置分析窗(placea.c)

确定分析窗awin

分析窗由4个参数决定：清浊音窗，起始点，零时清浊音判决，基音周期。有以下三种情况：

l 连续的浊音
即voibuf的(2,AF-2), (1,AF-1), (2,AF-1), (1,AF), (2,AF)都为1

这里先确定awin[((*af - 1) << 1) + 1]与k（其中k = (vwin[(*af << 1) + 1] + vwin[(*af << 1) + 2] + 1 - 156) / 2）的间距，然后以awin[((*af - 1) << 1) + 1]为起点，pitch为步长，确定 awin[(*af << 1) + 1]使得(|k - pitch/2|) <= awin[(*af << 1) + 1]。然后先默认分析窗的窗长为156，确定awin[(*af << 1) + 2]。对于4种情况(详见程序)需要调整当前分析帧的端点（原则是窗中不能有onset且不能超出定义域[180,540]）。

l 清浊音转变

即voibuf的(1,AF), (2,AF)不全为零且obound = 0;

处理方式同连续的浊音。

l 清音或者有起始点(obound != 0 )

AF中如果为清音或者obound != 0(非连续浊音情况)，则分析窗和清浊音窗相同。

确定能量窗ewin

l 如果本窗为清音窗，则能量窗与清浊音窗(亦即分析窗)相同。

l 若为case 3且obound = 2(清浊音窗的右端点有onset), 亦即obound = 2且非连续的浊音，则能量窗的右端点与分析窗的右端点相同，能量窗窗长为有效分析窗（即分析窗中最大整数个pitch的长度），以此来确定能量窗的左端点。

l 其他情况下，则能量窗的左端点与分析窗的左端点相同，能量窗的窗长为有效分析窗，以此来确定能量窗的右端点。

13. RMS计算(energy.c)

以prebuf(加AF能量窗，即对应Z(-2)Z(-1)输入帧)为输入，去除其直流分量，然后计算RMS值。即计算当前能量窗（AF）中预处理语音数据的RMS。

14. 协方差分析(invert.c)

书[1]，P72～P73有求解介绍。由于是在分析窗的窗内求解，因此只要分析窗确定，就可以利用相应程序得出LPC及RC值。

15. 困惑问题

1) 在analys_(&speech[1], voice, &pitch, &rms, rc, st)函数中，输入的是180个语音点，输出的是voice, pitch, rms, rc的参数值，这些参数值对应的是哪个输入帧？(2007-11-9)

答：输出的voice, pitch, rms, rc的参数值是对应AF-2清浊音窗中的参数值，因此对应的是输入帧的Z(-4)Z(-3)帧。

参考文献

[1] 王炳锡编著。西安：西安电子科技大学出版社，2002

[2] LPC10e源代码

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
linux sdl windows.h,Windows下的SDL安装奔跑吧linux内核 linux sdl windows.h
首先你要下载并安装SDL开发包。如果装在C盘下，路径为C:\SDL1.2.5如果在WINDOWS下。你可以按以下步骤：1.打开VC++，点击"Tools",Options2,点击directories选项3.选择"Includefiles"增加一个新的路径。"C:\SDL1.2.5\include"4，现在选择"Libaryfiles“增加"C:\SDL1.2.5\lib"现在你可以开始编写你的第
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
linux中sdl的使用教程,sdl使用入门 Melissa Corvinus linux中sdl的使用教程
本文通过一个简单示例讲解SDL的基本使用流程。示例中展示一个窗口，窗口里面有个随机颜色快随机移动。当我们鼠标点击关闭按钮时间窗口关闭。基本步骤如下：1.初始化SDL并创建一个窗口。SDL_Init()初始化SDL_CreateWindow()创建窗口2.纹理渲染存储RGB和存储纹理的区别：比如一个从左到右由红色渐变到蓝色的矩形，用存储RGB的话就需要把矩形中每个点的具体颜色值存储下来；而纹理只是一
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
Git常用命令－修改远程仓库地址猿大师 Linux Java git java
查看远程仓库地址gitremote-v返回结果originhttps://git.coding.net/＊＊＊＊＊.git(fetch)originhttps://git.coding.net/＊＊＊＊＊.git(push)修改远程仓库地址gitremoteset-urloriginhttps://git.coding.net/＊＊＊＊＊.git先删除后增加远程仓库地址gitremotermori
【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
webpack图片等资源的处理 dmengmeng
需要的loaderfile-loader（让我们可以引入这些资源文件）url-loader（其实是file-loader的二次封装）img-loader（处理图片所需要的）在没有使用任何处理图片的loader之前，比如说css中用到了背景图片，那么最后打包会报错的，因为他没办法处理图片。其实你只想能够使用图片的话。只加一个file-loader就可以，打开网页能准确看到图片。{test:/\.(p
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
Some jenkins settings SnC_
Jenkins连接到特定gitlabproject的特定branch我采用的方法是在pipeline的script中使用git命令来指定branch。如下：stage('Clonerepository'){steps{gitbranch:'develop',credentialsId:'gitlab-credential-id',url:'http://gitlab.com/repo.git'}}
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea
ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe