卤蛋，冲锋！

假期之不务正业—— Qt+FFmpeg+百度api进行视频的语音识别

假期之不务正业——Qt+FFmpeg+百度api进行视频的语音识别

一、前言
二、FFmpeg进行音频提取和重采样
三、对音频分段
四、百度api调用
五、Qt编程的一些补充
六、结语

一、前言

现在语音识别技术逐渐发展，先有siri开个好头，现在有各种小度小爱什么的轮番上阵。王者荣耀有语音识别以后，祖安起来也省事多了。我看一些视频教程的时候，对一些讲的不错的，也有记笔记的习惯。可是每次都是把视频暂停，然后一句一句敲出word，说实话，也没见学习效果有多好，反而效率变得低到不行。想来想去，咱也不能一直停留在这么笨比的方式，总是想整点活。

其实网上就有一些提取字幕的、或是语音识别的应用，应该效果也不错（我没试），但是要钱（emmmmm）。所以暂时先放弃这个方案，而且如果自己做一个那不是快乐加倍？于是利用假期时间，自己找了一些资料借（chao）鉴（xi）了一下，也是算是自己从零开始做的垃圾。

先放一下目前做到的：

我主要选择了4个B站的视频来测试运行结果，顺便一提，B站用手机端下载视频后，会在缓存文件里发现audio.m4s和vedio.m4s。实际上，FFmpeg可以直接打开m4s格式，因此如果仅仅是为了对音频进行处理，不需要将两个文件合流为一个（合流的方法也很简单，尤其是使用FFmpeg，可以直接百度）。

我选择的4个视频分别是冰冰vlog、卢本伟17张牌名场面、小潮院长的不要做挑战和吴恩达老师的机器学习课程，链接放在下文，我这里就夹带私货安利一波。下面是识别结果：

简单复盘一下：识别结果也算还可以，与英文相比，中文能够带上标点符号看起来更利落一些。显然，语速放慢，说话更标准时，识别效果更好（这不是废话吗）。可以看到小潮的不要做挑战的前面正经讲游戏规则时，识别结果还能接受，到后面整活了，识别结果驴唇不对马嘴。对于语速中规中矩的视频（尤其对于目的：视频教程），能有一些帮助；但如果是小视频（尤其节奏比较快的），那还是算了吧。

总体思路就是：Qt做个外壳，FFmpeg提取视频里的音频，百度api进行语音识别。由于百度开放的免费接口要求时长在1分钟以内，所以对于超过一分钟时长的音频，需要进行分段（顺便一提，免费接口使用量是中文普通话5w次，英文2w次）。下面对于各个部分的内容和遇到的（包括未处理完的）问题简单做一下记录。

以下是本实现主要参考资料的相关链接：
1、提供FFmpeg相关操作流程：
《使用 FFmpeg 进行音视频操作》，这个CSDN博客介绍了FFmpeg的主要模块、音视频解码与重采样等内容，主要都是文字介绍，具体代码实现也有一部分，有一定的参考价值（后面的记录仅写一些我的工作和问题吧，这个博客的内容不会转载的）。放下链接：
https://gitchat.csdn.net/activity/5d08d7d44ea36e699ecac739
2、提供百度API相关操作流程：
《Qt语音识别 | 百度语音识别应用》，这个B站视频介绍百度API的接口、使用Qt来调用百度API的方法，我的相关操作全部参考这个视频（因此后面的记录里代码部分不会太多，引用也经过老师同意），有兴趣的直接看视频吧。放下链接：
https://www.bilibili.com/video/BV19K411V79h

以下是上面效果展示的原视频链接：
1、【冰冰vlog.001】带大家看看每个冬天我必去的地方
https://www.bilibili.com/video/BV1vy4y1i7bS
2、【名场面】17张牌你能秒我？你能秒杀我？你今天17张牌把卢本伟秒了，我当场就把这个电脑屏幕吃掉！
https://www.bilibili.com/video/BV1W4411r7ue
3、不要“做”挑战？
https://www.bilibili.com/video/BV1x7411Z7VA
4、[中英字幕]吴恩达机器学习系列课程
https://www.bilibili.com/video/BV164411b7dx

二、FFmpeg进行音频提取和重采样

关于FFmpeg的介绍、使用，可以直接看前言的链接，或者找其他教程，这里也直接梳理一下我们需要做的事情和以及整个过程：
1.对于视频文件，需要解封装，即分离出音频流或者视频流或者其他乱七八糟的东西。得到音频流参数，如声道数、采样率、采样格式等等。
2.解封装后的音频流，再进行解码，得到音频的实际采样数据。
3.设置重采样参数，分配存储重采样的数据空间。对于重采样参数，需要配合百度API的要求：单声道、采样率16000Hz、16bit量化。
4.读取原数据，将重采样后得到的数据，并将数据写入文件，建议直接pcm文件，简单粗暴。
5.释放之前申请的资源。

对于这部分，我们可以考虑封装成一个类ExtractAudio（请不要吐槽我的命名品味，真不会），方便调用和后续的查看，最开始调试时我就是直接全写在一个函数里面的，省事是省事，但是太长了会看得累。以下是代码（.cpp）部分：

void ExtractAudio::init()
{
     
	//初始化参数
	in_nb_samples = 1024; //输入采样点数
	out_channel_layout = AV_CH_LAYOUT_MONO; //输出格式（声道数）
	out_sample_rate = SAMPLE_RATE; //输出采样率
	out_sample_fmt = AV_SAMPLE_FMT_S16; //输出样本格式
}


//打开文件函数，返回值为解封装上下文
AVFormatContext *ExtractAudio::open(QString inpath)
{
     
	av_register_all();//初始化封装库
	AVDictionary *opts = NULL;//参数设置
	AVFormatContext *format = avformat_alloc_context();//解封装上下文
	//QString转换为char数组
	QByteArray ba = inpath.toLocal8Bit();
	char* cpath = ba.data();
	//打开视频文件，参数3：0表示自动选择解封器，参数4：参数设置（比如rtsp的延时时间）
	int re = avformat_open_input(&format, (const char*)cpath, 0, &opts);
	if (re != 0)//打开失败
		return NULL;
	else
		return format;
}


//解码函数,返回值为解码器上下文
AVCodecContext *ExtractAudio::decodec(AVFormatContext *format)
{
     
	//获取流信息，不是所有的格式都需要调用
	//但是即便头已经获取过，这里再获取也没有问题
	//所以原则上每次都获取一下
	int re = avformat_find_stream_info(format, 0);//获取流信息
	if (re < 0)
		return NULL;

	//使用遍历的方法获取音视频流信息
	for (int i = 0; i < format->nb_streams; i++)
	{
     
		AVStream *as = format->streams[i];
		//音频
		if (as->codecpar->codec_type == AVMEDIA_TYPE_AUDIO)
		{
     
			audioStream = i;
			break;
		}
	}
	
	//音频解码器打开
	AVCodec *acodec = avcodec_find_decoder(format->streams[audioStream]->codecpar->codec_id); //找到音频解码器
	if (!acodec) //没有找到音频解码器
		return false;

	AVCodecContext *avctx = avcodec_alloc_context3(acodec); //创建解码器上下文
	avcodec_parameters_to_context(avctx, format->streams[audioStream]->codecpar); //配置解码器上下文参数
	avctx->thread_count = 8; //解码线程数改为8
	re = avcodec_open2(avctx, 0, 0); //打开解码器上下文
	if (re != 0) //打开解码器失败
		return NULL;

	return avctx;
}


//音频重采样初始化函数,返回值为音频重采样上下文
SwrContext *ExtractAudio::initswr(AVCodecContext *avctx, uint8_t **out_data)
{
     
	//设置音频重采样
	SwrContext *swr = swr_alloc();
	in_channel_layout = avctx->channel_layout;
	in_sample_rate = avctx->sample_rate;
	in_sample_fmt = avctx->sample_fmt;

	av_opt_set_int(swr, "in_channel_layout", in_channel_layout, 0);
	av_opt_set_int(swr, "out_channel_layout", out_channel_layout, 0);
	av_opt_set_int(swr, "in_sample_rate", in_sample_rate, 0);
	av_opt_set_int(swr, "out_sample_rate", out_sample_rate, 0);
	av_opt_set_sample_fmt(swr, "in_sample_fmt", in_sample_fmt, 0);
	av_opt_set_sample_fmt(swr, "out_sample_fmt", out_sample_fmt, 0);
	swr_init(swr);
	if (!swr_is_initialized(swr))
		return NULL;

	//计算转换样本的数量:避免缓存
	//确保输出缓冲区至少包含所有转换后的输入样本
	out_nb_samples = av_rescale_rnd(in_nb_samples, out_sample_rate, in_sample_rate, AV_ROUND_UP);
	//缓冲区将直接写入原始音频文件，无需对齐
	out_nb_channels = av_get_channel_layout_nb_channels(out_channel_layout);
	int re = av_samples_alloc_array_and_samples(&out_data, &out_linesize, out_nb_channels,
		out_nb_samples, out_sample_fmt, 0);
	if (re < 0)
		return NULL;

	return swr;
}


//音频重采样函数,返回值为输出缓冲区的字节数
//返回值为0时，未找到音频流或暂无音频流，可继续执行函数
//返回值为-1时，重采样失败，应中断
int ExtractAudio::resample(AVFormatContext *format, AVCodecContext *avctx, 
	SwrContext *swr, uint8_t **out_data, AVFrame *frame, AVPacket *pkt)
{
     
	if (pkt->stream_index != audioStream) //判断是否为音频流
		return 0;

	//解码一帧音频
	int gotFrame;
	if (avcodec_decode_audio4(avctx, frame, &gotFrame, pkt) < 0)
		return -1;
	if (!gotFrame)
		return 0;

	//重采样
	int frame_count = swr_convert(swr,
		out_data, out_nb_samples, //输出
		(const uint8_t **)frame->data, in_nb_samples  //输入
	);
	if (frame_count < 0)
		return -1;

	out_bufsize = av_samples_get_buffer_size(&out_linesize, out_nb_channels, frame_count, out_sample_fmt, 1);
	av_packet_unref(pkt);//释放，引用计数-1，为0释放空间
	av_frame_unref(frame);
	return out_bufsize;
}


// 释放空间函数
void ExtractAudio::clear(AVFormatContext *format, AVCodecContext *avctx, 
	SwrContext *swr, AVFrame *frame, AVPacket *pkt)
{
     
	//结束，释放空间
	avformat_close_input(&format);
	avcodec_close(avctx);
	swr_free(&swr);
	av_frame_free(&frame);
	av_packet_free(&pkt);
	av_free(frame);
	av_free(pkt);
}

但是这里虽然代码上释放了，占用空间并没有释放。我自己测试如果打开了一个2G的视频，即便将整个过程都跑完，引用计数也减了，free函数也用了，2G内存还是占着，吐血。所以每次感觉视频大小差不多了，就可以把应用关了重开吧。

三、对音频分段

得到重采样完的数据之后，就可以进行分段处理了。对于短语音识别，时长不能超过1分钟，我这里采用的方法就是，在从每段音频第30s处开始，一直到第60s前，计算1s以内采样值（绝对值）之和，和最小的地方，是我认为这个人声说话的停顿处。有几点补充就是，一是采样率已经默认好是16000Hz；二是每两次求和间的步进，我暂时默认为是0.01s，比如求完了第30s—第31s的和，下一次就求30.01s—31.01s的和。当然这个步进是可以进行变化的，但是个人认为没有必要使步进太小，计算次数变多后很慢（我做过步进是一个采样点的尝试，速度非常非常的慢）。

当然这个方法肯定并不是最优的，对于有BGM的视频来说，可能人不在说话，背景音乐还是有的，从一句话中间给掐断的可能性不是没有。另一个是参数的设置，这里面有很多参数是需要根据视频的情况的调整的，包括比如上面说的从第30s开始，可以换成别的数字；再比如计算1s以内的采样值之和，如果视频的节奏比较快（像小潮的一些视频）或者说话人语速感人，也可以调整；或者是步进等其他参数。但是我觉得我这里设置的参数还算中规中矩，也可以不变。对于这一部分，我们封装为SeparatePCM类。以下是代码（.cpp）部分：

#include "SeparatePCM.h"

#include <qdir.h>

#define SAMPLE_RATE 16000

SeparatePCM::SeparatePCM()
{
     
	//初始化
	//创建一个新缓冲文件夹，用于保存分段后的每一段音频数据
	QDir *folder = new QDir;
	folderStr = "D:\\temp\\temp\\";
	bool exist = folder->exists(folderStr);
	if (!exist)
	{
     
		folder->mkdir(folderStr);
	}
	delete folder;

	//音频处理相关系数初始化
	sample_rate = SAMPLE_RATE;
	sample_amount = 60 * sample_rate; //60s内的样点总数
	start = 0; //每次分段时的第0s的位置
	position = 0; //当前位置
	best_position = 0; //判断的最佳静音段位置
	now_sum = 0; //初始分段的采样点值之和
	number = 1; //初始分段序号

	//下面的参数可以根据实际情况进行调整
	step = 0.01 * sample_rate; //步进，这里设定为0.01s，可以根据实际情况调整
	threshold_len_silence = 1 * sample_rate; //判断为静音段的默认时长，这里设定为1s，可以根据实际情况调整
	start_position = (long)sample_amount / 6 * 3; //开始分段的位置，这里设定为第30s，可以根据实际情况调整
}


SeparatePCM::~SeparatePCM()
{
     
}


//打开文件函数，返回打开文件是否成功
bool SeparatePCM::open(QString inpath)
{
     
	filePath = inpath;
	QByteArray ba = filePath.toLocal8Bit();
	char* path = ba.data();
	//获取文件的指针
	FILE *file = fopen((const char*)path, "rb");
	if (!file)
		return false;
	//把指针移动到文件的结尾 ，获取文件长度
	fseek(file, 0, SEEK_END);
	//获取文件长度
	fileLength = ftell(file);
	//关闭文件
	fclose(file);
	return true;
}


//音频文件分段处理函数
void SeparatePCM::execute()
{
     
	// 打开文件
	QByteArray ba = filePath.toLocal8Bit();
	char* path = ba.data();
	FILE *file = fopen((const char*)path, "rb");

	//定义数组长度
	long bufferSize = fileLength / 2;
	
	//判断音频时长是否够60s
	if (bufferSize < sample_amount)
	{
     
		//音频文件时长不足60s，不需要分段
		outpath = folderStr + pcmStr.arg(1);
		QFile::copy(filePath, outpath);
		fclose(file);
		return;
	}

	//设置读取文件存储区
	short *fileBuffer = new short[bufferSize];
	//读文件
	fread(fileBuffer, sizeof(short), bufferSize, file);

	//对超过60s音频文件进行分段
	short max_value = 0; //音频文件采样值的最大值（绝对值）
	for (long i = 0; i < bufferSize; i++)
	{
     
		if (abs(fileBuffer[i]) > max_value)
			max_value = abs(fileBuffer[i]);
	}
	
	//记录分段中最小的采样点值之和，初始值设定大一些方便后续更新
	min_sum = (long)threshold_len_silence * max_value; 
	//分段数据缓冲区
	short *cutfileBuffer = new short[sample_amount];
	
	//循环执行音频分段，直到剩一段时长<60s
	while (true)
	{
     
		//从分段的位置开始，间隔步长，遍历寻找分段点
		for (position = start_position + start; position < (long)sample_amount + start - 1; position += step)
		{
     
			//计算默认静音时长下的采样值的和
			for (int i = 0; i < threshold_len_silence; i++)
			{
     
				now_sum = now_sum + (long)abs(fileBuffer[position - i]);
			}
			//判断是否最小
			if (now_sum < min_sum)
			{
     
				min_sum = now_sum;
				//best_position = position - threshold_len_silence / 2;
				best_position = position - (long)threshold_len_silence / 2;
			}
			now_sum = 0;
		}
		//复制数据并把结果写入文件
		copyData_and_writeFile(fileBuffer, cutfileBuffer, best_position - start + 1);
	
		//判断剩下的数据是否还需要分段（若剩下的数据不足60s，直接导出即可）
		start = best_position + 1;
		number++;
		if (start > bufferSize - sample_amount)
		{
     
			//复制数据并把结果写入文件
			copyData_and_writeFile(fileBuffer, cutfileBuffer, bufferSize - start + 1);
			break;
		}
		//为下次分段初始化
		now_sum = 0;
		min_sum = (long)threshold_len_silence * max_value;
	}
	delete[] cutfileBuffer;
	delete[] fileBuffer;

	fclose(file);

	//删除提取的音频文件
	QFile fileTemp(filePath);
	fileTemp.remove();
	fileTemp.close();
}


//复制数据并将其写入文件
//参数：文件存储区指针、分段数据缓冲区指针、数据长度
void SeparatePCM::copyData_and_writeFile(short *fileBuffer, short *cutfileBuffer, int len_cut)
{
     
	short *pfile = NULL; //设置原文件读取指针
	//复制数据
	pfile = fileBuffer + start;
	memcpy(cutfileBuffer, pfile, len_cut * 2);
	//把结果写入文件
	outpath = folderStr + pcmStr.arg(number);
	QByteArray qba = outpath.toLocal8Bit();
	char *cpath = qba.data();
	FILE *cfile = fopen((const char*)cpath, "wb");
	fwrite(cutfileBuffer, sizeof(short), len_cut, cfile);
	fclose(cfile);
}

四、百度api调用

这里也不再多说，请全部参考上文的B站视频吧，代码也不放了，基本是一模一样的。唯一的区别是我加上了“中文”或者“英文”的判断，在url里改变pid=1537或者1737。在这基础上，封装成了一个WriteText类。以下是代码（.cpp）部分：

#include "WriteText.h"
#include "Speech.h"
#include <qdir.h>
#include <qfile.h>
#include <qiodevice.h>


WriteText::WriteText()
{
     
}


WriteText::~WriteText()
{
     
}


void WriteText::execute(QString fileName, int id)
{
     
	QFile file(fileName);
	file.open(QIODevice::WriteOnly | QIODevice::Text | QIODevice::Append);

	//开始识别
	//可以获取文件夹路径下的所有文件信息
	QStringList filter;
	//文件筛选，可以置为空，获取所有文件信息
	filter << QString("*.pcm");
	//找到分段后的缓冲文件夹
	QString folderStr = "D:\\temp\\temp\\";
	//获取文件夹信息，并初始化需要识别的文件
	QDir dir(folderStr);
	dir.setNameFilters(filter);
	QFileInfoList fileInfoList = dir.entryInfoList(filter);
	int dir_count = fileInfoList.count();
	QString pcmFileName("%1.pcm");
	QString fullFileName;

	for (int i = 0; i < dir_count; i++)
	{
     
		//遍历文件夹内的所有文件
		fullFileName = folderStr + pcmFileName.arg(i + 1);
		//利用百度api进行音频识别
		Speech m_speech;
		QString str = m_speech.speechIdentify(fullFileName, id);
		//将结果写入文件中
		QTextStream txtStream(&file);
		txtStream << str << "\n";

		//删除缓存的音频分段文件
		QFile fileTemp(fullFileName);
		fileTemp.remove();
		fileTemp.close();
	}
	file.close();

	//删除保存分段音频的缓存文件夹
	dir.removeRecursively();
}

另外在提醒一点就是，调用api之前，一定要先确保自己的免费额度已经领取（如下图），否则调用api失败的同时貌似还占用了次数（我也不太清楚），反正就是算是个坑吧，我就找了半天错误，查了好久才发现是这里出错了QAQ，错误码3304。

五、Qt编程的一些补充

1、Qt在打开文件时，可能面对一些带有中文的字符串，我的方法是在需要支持中文的cpp最开始进行以下声明：

//设置UTF-8编码以支持中文
#if defined(_MSC_VER) && (_MSC_VER >= 1600)    
# pragma execution_character_set("utf-8")    
#endif

然后在构造函数里添加：

//设置中文编码
QTextCodec *codec = QTextCodec::codecForName("GBK");
QTextCodec::setCodecForLocale(codec);

即可。
当然GBK是windows系统下的，如果跨平台的话还需要找其他编码。

2、整个流程执行下来速度不算慢，但是也需要等待，这个时候肯定是要把运算的流程放入运算线程里面防止界面卡死。创建自定义线程类MyThread，继承于QThread，重写run函数，并定义bool值判断线程结束与否。先放代码：
MyThread.h：

#ifndef MYTHREAD_H
#define MYTHREAD_H
#include <QThread>
#include <QFileInfo>
#include <QMessageBox>
#include <QTextCodec>
#include <QFile>

#include "ExtractAudio.h"
#include "SeparatePCM.h"
#include "WriteText.h"

class QString;

class MyThread : public QThread
{
     
	Q_OBJECT
public:
	MyThread();

	void setMessage(const QStringList &message);
	void setLanguage(int id);
	void stop();

protected:
	void run();

	void extracrAudio(QString strInPath, QString strOutPath); //提取音频并重采样
	QString separatePCM(QString strInPath); //音频分段
	void writeText(QString strInPath); //语音识别并将结果写入txt

private:
	QStringList str_path_list; //待处理的视频文件列表
	int languageId; //传入语种id
	volatile bool m_Stopped;

signals:
	void updateProgress(int);
	void updateLabel(QString);
};

#endif // MYTHREAD_H

MyThread.cpp：

#include "mythread.h"
#include <iostream>
using namespace std;

//设置UTF-8编码以支持中文
#if defined(_MSC_VER) && (_MSC_VER >= 1600)    
# pragma execution_character_set("utf-8")    
#endif

MyThread::MyThread()
{
     
	m_Stopped = false;

	//设置中文编码
	QTextCodec *codec = QTextCodec::codecForName("GBK");
	QTextCodec::setCodecForLocale(codec);
}

void MyThread::setMessage(const QStringList &message)
{
     
	str_path_list = message;
}

void MyThread::setLanguage(int id)
{
     
	languageId = id;
}

void MyThread::stop()
{
     
	m_Stopped = true;
}

void MyThread::run()
{
     
	while (!m_Stopped)
	{
     
		//doSomething
		QString strShowLabel;
		for (int i = 0; i < str_path_list.size(); i++)
		{
     
			QString inPath = str_path_list[i]; //单个输入文件路径
			QFileInfo fileInfo = QFileInfo(inPath); //获取输入文件信息
			QString file_name = fileInfo.fileName(); //输入文件名
			QString fileSuffix = fileInfo.suffix(); //输入文件后缀

			strShowLabel = "正在处理：" + file_name; 
			emit updateLabel(strShowLabel);

			QString outPcmName = file_name.replace(fileSuffix, "pcm"); //输出pcm文件名
			QString outPcmPath = "D:\\temp\\" + outPcmName; //输出pcm路径
			QString outTextName = file_name.replace("pcm", "txt"); //输出txt文件名
			QString outTextPath = "D:\\temp\\" + outTextName; //输出txt路径

			//下面这一段是处理步骤
			extracrAudio(inPath, outPcmPath); //提取音频并重采样
			QString temppath = separatePCM(outPcmPath); //音频分段,并获取缓冲文件夹
			writeText(outTextPath); //音频识别，并将结果写入txt中
			cout << endl;

			int v = 100 * (i + 1) / str_path_list.size();
			emit updateProgress(v);
		}
		str_path_list.clear();
		strShowLabel = tr("处理结束！");
		emit updateLabel(strShowLabel);
	}		

	m_Stopped = false;
}


//提取音频并重采样
void MyThread::extracrAudio(QString strInPath, QString strOutPath)
{
     
	//申请输出空间,先按照最大需求量申请
	uint8_t **out_data;
	int GroupSize = 1; //外层size
	int innerSize = 60 * 16000 * 2; //内层size,60s*16000Hz*2Bytes*1channel
	int maxbufferSize = 0;
	out_data = (uint8_t**)malloc(sizeof(uint8_t*)*GroupSize);
	for (int i = 0; i < GroupSize; i++)
	{
     
		out_data[i] = (uint8_t*)malloc(sizeof(uint8_t)*innerSize);
	}

	ExtractAudio ea; //创建对象
	ea.init(); //初始化

	AVFormatContext *format = ea.open(strInPath); //打开文件
	if (!format)
	{
     
		QMessageBox::warning(NULL, "提示", "打开文件失败！");
		return;
	}
	cout << "Open file successed!" << endl;

	AVCodecContext *avctx = ea.decodec(format);; //解码
	if (!avctx)
	{
     
		QMessageBox::about(NULL, "提示", "解码失败！");
		return;
	}
	cout << "Decodec successed!" << endl;

	SwrContext *swr = ea.initswr(avctx, out_data); //音频重采样初始化
	if (!swr)
	{
     
		QMessageBox::about(NULL, "提示", "音频重采样初始化失败！");
		return;
	}
	cout << "Initswr successed!" << endl;

	AVFrame *frame = av_frame_alloc(); //malloc AVFrame 并初始化
	AVPacket *pkt = av_packet_alloc(); //malloc AVPacket 并初始化
	int bufferSize = 0; //输出缓冲区的字节数
	//创建写出的pcm文件
	QFile outFile(strOutPath);
	outFile.open(QIODevice::WriteOnly);
	//读取数据
	while (av_read_frame(format, pkt) >= 0)
	{
     
		// 重采样并获取输出字节数
		bufferSize = ea.resample(format, avctx, swr, out_data, frame, pkt);

		if (bufferSize > 0) //有重采样的数据，写入文件中
			outFile.write((const char*)out_data[0], bufferSize);
		else if (bufferSize == 0) //暂无重采样的数据，继续执行
			continue;
		else //重采样出现错误，停止执行
		{
     
			QMessageBox::about(NULL, "提示", "音频重采样失败！");
			break;
		}
	}
	outFile.close();

	ea.clear(format, avctx, swr, frame, pkt); //释放空间
	cout << "ExtracrAudio Finish!" << endl;

	//释放空间
	for (int i = 0; i < GroupSize; i++)
	{
     
		free(out_data[i]);
	}
	free(out_data);
}


//音频分段
QString MyThread::separatePCM(QString strInPath)
{
     
	SeparatePCM sp; //创建对象
	bool flag = sp.open(strInPath); //打开文件
	if (!flag)
	{
     
		QMessageBox::warning(NULL, "提示", "打开音频文件失败！");
		return NULL;
	}
	sp.execute(); //音频分段
	return sp.folderStr;
	cout << "SeparatePCM Finish!" << endl;
}


//语音识别并将结果写入txt
void MyThread::writeText(QString strInPath)
{
     
	WriteText wt; //创建对象
	wt.execute(strInPath, languageId); //执行
	cout << "WriteText Finish!" << endl;
}

线程函数里，两个信号void updateProgress(int)和void updateLabel(QString)用来更新界面的进度条和便签。在MyThread里面发送信号后，在界面连接信号和槽：

connect(&m_thread, SIGNAL(updateProgress(int)), this, SLOT(updateProgress(int)));
connect(&m_thread, SIGNAL(updateLabel(QString)), this, SLOT(updateLabel(QString)));

其中信号是MyThread的信号（signals），槽是界面的槽（slots）。
而如果界面向线程发送参数的话，直接调用线程里的函数。例如在界面中有两个单选按钮来提供选择“中文”或是“英文”的功能，并且将这两个合并成一个组合：

// 设置单选按钮组合
groupButton = new QButtonGroup(this);
groupButton->addButton(ui.rbtn_Chinese, 0);
groupButton->addButton(ui.rbtn_English, 1);
ui.rbtn_Chinese->setChecked(true); //默认选择中文

在点击开始按钮时，我们就需要判断选择了哪个单选按钮，并把结果传递给运算线程：

int id = groupButton->checkedId();
m_thread.setLanguage(id);

上述的void setLanguage(int id)是线程类里的一个公共函数，直接在界面里面调用即可。把界面所确定的文件列表传递给线程类也是同理。

六、结语

内容差不多就这些了，也都是一些很新手的东西，非常欢迎大佬们给出一些好的建议（尤其是FFmpeg释放内存那里，能连带解决方案就更好了），demo就不放出来了，弄了一个半成品再放出来就觉得很惭愧。

计划以后每年都利用各种假期的时间集合起来，做个小东西，同时更新一下这个系列，做什么方向就看自己的脑洞和心情，反正是假期不务正业时间，如果有好的想法也欢迎一起学习一起做。

你可能感兴趣的:(qt,ffmpeg,语音识别)

全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
在 Obsidian 中本地使用 DeepSeek — 无需互联网！知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！我将引导您完成在Obsidian中安装和使用DeepSeek-R1模型的确切步骤，这样您就可以在笔记中拥有一个由AI驱动的第二大脑。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《在RaspberryPi上运行语音识别
Windows qt打包编译好的程序 new_zhou windows qt 开发语言打包程序
在release模式下生成exe后，往外发布时需要附带运行环境（即需要的dll等）打包流程：1、将生成的exe拷贝到单独一个文件夹中；2、在应用程序中找到对应的qt终端，注意此处的终端要与自己编译exe的编译器一致。使用的是32位的话则选择32位的终端。3、打开终端后，使用cd命令切换到步骤1中所新建文件夹的路径4、使用命令进行拷贝。windeployqtxxx.exe执行完上述命令后，会将依赖的
QT5使用cmakelists引入Qt5Xlsx库并使用
1、首先需要已经有了Qt5Xlsx的头文件和库，并拷贝到程序exe路径下（以xxx.exe/3rdparty/qtxlsx路径为例，Qt5Xlsx版本为0.3.0）；2、cmakelist中：#设置QtXlsx路径set(QTXLSX_ROOT_DIR${CMAKE_CURRENT_SOURCE_DIR}/3rdparty/qtxlsx)set(QTXLSX_INCLUDE_DIR${QTXLSX
【解决Qt报warning: ‘setAxisX‘ is deprecated遇到的问题】
解决Qt报warning:‘setAxisX‘isdeprecated遇到的问题背景：移植老代码时，报如题警告。老代码：m_input_chart->setAxisY(axisY,input_series);然后修改为：m_input_chart->addAxis(axisY,Qt::AlignLeft);input_series->attachAxis(axisY);运行之后没有警告了，但是坐标
树莓派 —— 在树莓派4b板卡下编译FFmpeg源码，支持硬件编解码器（mmal或openMax硬编解码加速）信必诺 FFmpeg 树莓派 FFmpeg 编译源码 mmal openMax 树莓派树莓派4b
FFmpeg相关音视频技术、疑难杂症文章合集（掌握后可自封大侠⓿_⓿）（记得收藏，持续更新中…）正文 1、准备工作（1）树莓派烧录RaspberryPi系统（2）树莓派配置固定IP（文末）（3）xshell连接树莓派（4）
微信小程序控制空调之EMQX服务器安装与配置今天长脑子了吗服务器运维 ESP32 小程序
目录前言一、EMQX服务器安装与配置1.Windows系统安装（推荐Docker方式）二、MQTTX客户端安装与使用1.下载安装2.连接EMQX服务器三、客户端与服务器通信测试1：MQTTX自收发测试四、安全加固建议（生产环境必做）修改默认密码启用TLS加密IP访问限制常见问题排查总结前言以下是EMQX服务器安装配置、MQTTX客户端使用及通信测试的完整教程，主要Windows平台实现，并附客户端
FFmpeg滤镜相关的重要结构体 melonbo FFMPEG ffmpeg
核心结构体概览FFmpeg滤镜系统由多个关键结构体组成，构成了完整的滤镜处理框架。以下是滤镜系统中最重要的结构体及其相互关系：AVFilterGraph┬─AVFilterContext┬─AVFilter│├─AVFilterLink│└─AVFilterPad└─AVFilterInOut详细结构体分析1.AVFilterGraph（滤镜图容器）功能：管理整个滤镜图的所有组件和状态重要成员：t
每日MySQL之005：SUSE linux下卸载MySQL
卸载这里的卸载，对应于之前的安装停止MySQL服务：db2a:~#servicemysqlstop找到所有的MySQL包：db2a:~#rpm-qa|grep-imysqlmysql-community-server-5.7.19-1.sles11mysql-community-common-5.7.19-1.sles11libqt4-sql-mysql-4.6.3-5.34.2mysql-com
鸿蒙南向开发实战：如何对接图形框架？蜀道山QAQ 鸿蒙鸿蒙南向开发 OpenHarmony harmonyos 华为鸿蒙前端鸿蒙系统 android
当前，小型系统图形模块以子系统的形式在OpenHarmony中运行。开发者只需适配实现OpenHarmonyHDF层API即可。由于使用场景不同，图形子系统也支持在不同平台集成运行。例如，在Windows/Mac上开发应用程序时，可以使用QTCreator进行简单的页面布局、开发和调试。此时，图形子系统已经适配到了Windows/Mac平台上运行。如果想要将图形子系统独立集成到现有项目中，则需要进
Qt for Android 配置详细（Windows下的）总有刁民想爱朕ha
Qt开发安卓笔记作者：[email protected]年1月讨论和交流一、安装jdk配置环境变量并测试java1.7的版本太高会出现问题。。我是用的是1.6点击jdk-6u21-windows-i586.exe即可，根据提示安装，安装路径可以复制，方便管理。jdk1.6安装在C:\Java\jdk1.6jre1.6安装在C:\Java\jre1.6安装后的文件和路径如上图。1.安
[QT] QPushButton常用样式表设置
QPushButton:PushBtn->setStyleSheet(“QPushButton{border-style:none;background-color:rgb(67,138,232)}”“QPushButton:hover{background-color:red;color:white;}”“QPushButton:pressed{background-color:rgba(85,
Qt5开发从入门到精通——第五篇一节（文本编辑器 Easy Word 开发 V1.0 详解）东.' Qt5开发从入门到精通 qt 开发语言 windows c++c语言
欢迎小伙伴的点评✨✨，相互学习、互关必回、全天在线博主本着开源的精神交流Qt开发的经验、将持续更新续章，为社区贡献博主自身的开源精神‍文章目录前言一、主窗口概述基本元素1.1、菜单栏1.2、状态栏1.3、工具栏1.4、描接部件1.5、中心部件二、文本编辑器EasyWordV1.0基本功能解析三、文本编辑器EasyWordV1.0效果实例四、文本编辑器EasyWordV1.0基本原码框架设计show
医疗金融预测与语音识别中的模型优化及可解释性技术突破智能计算研究中心其他
内容概要随着人工智能技术的纵深发展，模型优化与可解释性技术正在重塑医疗诊断、金融预测及语音识别领域的应用范式。在医疗领域，基于自适应学习的动态参数调整机制，结合迁移学习的跨场景知识复用，显著提升了疾病筛查模型的泛化能力；而金融预测场景中，联邦学习框架通过分布式数据协作，在保障隐私安全的前提下，实现了风险预测模型的多维度优化。语音识别领域则依托边缘计算架构，将模型压缩技术与实时推理引擎结合，有效解决
【kafka】在Linux系统中部署配置Kafka的详细用法教程分享景天科技苑 linux基础与进阶 shell脚本编写实战 kafka linux 分布式 kafka安装配置 kafka优化
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，PyQt5和Tkinter桌面应用开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，云原生K8S，Prometheus监控，数据分析，Django
基于 esp32-s3，结合私有化大模型，集asr语音识别、llm大模型、tts语音合成，设计一个技术方案，要求用websocket保持长链接，
以下方案演示了如何基于ESP32-S3，通过私有化大模型组合ASR（语音识别）、LLM（语言大模型）和TTS（语音合成）来构建一个语音交互系统，并且通过WebSocket保持与服务器的长连接通讯。整体方案分为以下几个部分：系统整体架构与数据流协议设计与消息格式服务器端实现示例ESP32-S3端实现示例运行流程与示例下面将对各部分进行详细说明。ESP32-S3没想到私有化大模型速度也能这么快ESP3
【开源工具】基于PyQt5的局域网文件共享工具开发全解（附源码+emoji交互设计）创客白泽 Python开源项目实战开源 qt 局域网文件共享 python
【开源工具】基于PyQt5的局域网文件共享工具开发全解（附源码+emoji交互设计）个人主页：创客白泽-CSDN博客系列专栏：《Python开源项目实战》热爱不止于代码，热情源自每一个灵感闪现的夜晚。愿以开源之火，点亮前行之路。希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎点赞评论收藏⭐️加关注+分享给更多人哦文章目录项目概述✨功能特性️效果展示使用教程核心代码解析系统架构图⬇️源码
C++常用库交叉编译方法（一）（环境构建和Qt以及Boost）
原文链接欢迎大家对于本站的访问-AsterCasc前言首先这里建议从Ubuntu20.04镜像开始，目前相对最稳定的版本，无论是CentOS还是其他版本的Ubuntu多多少少都会遇到各种很烦的问题，虽然说不是解决不了，但是从Ubuntu20.04容器镜像开始是最节省时间的方式，Docker默认情况下会让容器使用宿主机的大部分资源，包括CPU和内存，虽然具体的占用情况取决于宿主机的硬件资源和Dock
C++交叉编译工具链制作以及QT交叉编译环境配置三雷科技 c++qt 数据库交叉编译
https://github.com/crosstool-ng/crosstool-ng/releasesC++交叉编译工具链制作以及QT交叉编译环境配置1源码构建2使用命令2.1查看列表2.2查看配置2.3配置2.4编译2.5编译完成后问题总结configure:error:missingrequiredtool:makeinfoconfigure:error:missingrequiredto
Python 语音识别系列-实战学习-语音识别特征提取
Python语音识别系列-实战学习-语音识别特征提取前言1.预加重、分帧和加窗2.提取特征3.可视化特征4.总结前言语音识别特征提取是语音处理中的一个重要环节，其主要任务是将连续的时域语音信号转换为连续的特征向量，以便于后续的语音识别和语音处理任务。在特征提取阶段，这些特征向量能够捕捉到语音信号中的关键信息，如音调、音色和音节等。特征提取主要可以分为以下几个方面：时域特征提取：包括自相关函数、方差
Open CASCADE+Qt：实现以鼠标为锚点缩放、平移、旋转铁心探索界 Open CASCADE+Qt 那些事 qt c++
简介本文实现在三维窗口中添加一个立方体，并实现以鼠标为锚点视图缩放、平移、旋转操作，效果见如下动图：添加立方体基于前面建立的三维窗口：OpenCASCADE+Qt：实现简单的显示窗口（下）在OCCWidget构造函数末尾，添加立方体，并将其添加到上下文中显示该立方体（绘制立方体不是本文重点）：OCCWidget::OCCWidget(QWidget*parent):QWidget{parent},
探索三维世界：Qt+assimp+OpenGL三维模型解析与显示项目推荐杨焕月Great
探索三维世界：Qt+assimp+OpenGL三维模型解析与显示项目推荐【下载地址】QtassimpOpenGL三维模型解析与显示本资源文件提供了一个基于Qt、assimp和OpenGL的三维模型解析与显示解决方案。通过assimp库，您可以轻松解析多种格式的三维模型文件（如3ds、obj等），并利用QOpenGLWidget和QOpenGLFunctions在Qt应用程序中进行模型的绘制和显示。
现代OpenGL+Qt：绘制可旋转、带光照效果的三维物体
现代OpenGL+Qt：绘制可旋转、带光照效果的三维物体去发现同类优质开源项目:https://gitcode.com/简介本仓库提供了一个使用现代OpenGL和Qt绘制三维物体的示例项目。在这个项目中，你可以通过鼠标控制三维物体的旋转和缩放，并观察到物体在光照效果下的显示效果。功能使用现代OpenGL进行图形渲染利用Qt的事件处理机制，实现鼠标控制物体的旋转和缩放实现简单的光照效果，包括漫射光的
分库分表之实战-sharding-JDBC水平分库+分表后：查询与删除操作实战
大家好，我是工藤学编程一个正在努力学习的小博主，期待你的关注实战代码系列最新文章C++实现图书管理系统（QtC++GUI界面版）SpringBoot实战系列【SpringBoot实战系列】Sharding-Jdbc实现分库分表到分布式ID生成器Snowflake自定义wrokId实战环境搭建大集合环境搭建大集合(持续更新）分库分表分库分表之实战-sharding-JDBC绑定表配置实战前情摘要：1
如何获取微信公众号用户的个人信息（包括OpenId）一杯冰美式_丶 Java相关知识
最近，对微信公众号有点兴趣，就自己研究了研究里面的一些内容，发现还挺有意思的，而且通过微信公众号可以调用一些比较有意思的接口，就比如百度开发服务平台点击进入里面的很有接口，就比较常见的翻译，语音识别，地理位置等等，都挺好的。好了，不多说，进入正题好了。我想，做微信公众号开发的，对于想获取关注了公众号的用户信息，或者说是当前与后台服务器进行交互的当前用户信息，这个功能是很重要的吧。因为，通过这个，可
海思平台ISP系列从零开始：一、PQTools工具的使用总结斟茶兵海思平台基础的Image sensor问题分析 isp 嵌入式
海思平台ISP系列：一.PQTools工具使用方法正所谓工欲善其事必先利其器，磨刀不误砍柴工，想要在海思平台开始IQ,就得利用海思SDK中提供的PQTools工具，这个工具作的很好的，里边有很多图像分析的工具，下面就开始介绍：工具入式如何使用：在海思的SDK开发包中，包含了PQTools使用的软件，以我使用的Hi33516DV300为例，PQTools工具包的目录如下：Hi3516CV500R00
ER综述论文阅读-Emotion recognition in EEG signals using deep learning methods: A review 今天早睡了情绪识别Emotion Recognition 论文阅读深度学习人工智能
EmotionrecognitioninEEGsignalsusingdeeplearningmethods:AreviewQ1期刊，2023论文链接：https://d1wqtxts1xzle7.cloudfront.net/105887899/emotionreview-libre.pdf?1695460941=&response-content-disposition=inline%3B+f
MQTT与HTTP在物联网中的比较：为什么MQTT是更好的选择
在物联网（IoT）应用中，选择合适的通信协议是实现高效、可靠数据传输的关键。HTTP和MQTT是两种常见的协议，但它们在物联网场景中的表现却有显著差异。本文将比较这两种协议，并解释为什么MQTT在物联网应用中是更好的选择。一、HTTP与MQTT的基本概念HTTP（HyperTextTransferProtocol）：HTTP是一种无状态的应用层协议，广泛应用于万维网（WWW）。它基于请求/响应模型
Photoshop 在无人机航空仪表开发中的深度应用（结合 Qt/QML）
一、Photoshop在航空仪表UI设计中的核心作用1.1设计流程概述在无人机地面站航空仪表开发中，Photoshop主要承担以下关键角色：原型设计：创建仪表的视觉原型，确定布局、色彩和交互风格视觉资源制作：生成高质量的仪表背景、指针、刻度等元素精细化调整：通过蒙版、反走样等技术提升视觉精度资源导出：为Qt/QML提供优化的图像资源1.2与Qt/QML的协作模式plaintext┌────────
Qt界面篇：Qt分割窗口QSplitter类欧特克_Glodon QT实战 Qt分割窗口 QSplitter类
效果图如下：代码如下：#include"mainwindow.h"#include#include
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。