weixin_39594895

python常用语音识别库_python语音识别

语音识别技术，也被称为自动语音识别，目标是以电脑自动将人类的语音内容转换为相应的文字。应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。

一、功能概述

实现将语音转换为文字，调取第3方接口。比如百度ai，图灵机器人，得到想要的结果。

二、软件环境

操作系统：win10

语言：Python 版本：3.5.4

Python库：baidu-aip

三、原理概述

利用windows自带的录音机，基于百度API进行wav格式的音频转文本。根据文本，调取图灵机器人接口，得到结果。

四、部署工作

1 登录百度ai，链接为：

登录账户(如果你有百度，可以直接登录，否则需要注册)

点击右边的控制台->直接进入

进入之后，拖动进度条到中间。找到已开通服务，点击百度语言。

点击创建应用

应用名字，可以自定义。我写的是语音识别，默认就已经开通了语音识别和语音合成。

这就够了，所以接口选择，不用再选了。

语音包名，选择不需要。因为接下来要展示的是用Python代码实现的，不是android和ios

应用描述，这里一定要好好写啊。不然不通过的！

点击立即创建，瞬间就创建成功了。我估摸着，我写的描述太吊了。百度不得不同意哈！

点击返回列表，在Secret Key的下面，点击显示。

复制AppID，API Key，Secret Key 这3个信息到一个文件里面。接下来的Python代码会用到！

点击左侧的技术文档

点击左边的语言合成->SDK文档->Python SDK

文本不能太长

目录结构

支持2x和3x

打开windows的cmd窗口，输入命令 pip3 install baidu-aip

我已经安装好了，效果如下:

打开Pycharm，新建一个目录ai

创建文件audio_text.py

代码如下:import time

from aip import AipSpeech

""" 你的 APPID AK SK """

APP_ID = '11212345'

API_KEY = 'pVxdhsXS1BIaiwYYNT712345'

SECRET_KEY = 'BvHQOts27LpGFbt3RAOv84WfPCW12345'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

将前面提到的AppID，API Key，Secret Key，复制到对应位置。

上面的id和KEY，后5位我改了，复制我的也没有用！

继续看文档，下面的代码可以把文件变成语言

代码如下：from aip import AipSpeech

""" 你的 APPID AK SK """

APP_ID = '11212345'

API_KEY = 'pVxdhsXS1BIaiwYYNT712345'

SECRET_KEY = 'BvHQOts27LpGFbt3RAOv84WfPCW12345'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

result = client.synthesis('你好百度', 'zh', 1, {

'vol': 5,

})

# 识别正确返回语音二进制错误则返回dict 参照下面错误码

if not isinstance(result, dict):

with open('auido.mp3', 'wb') as f:

f.write(result)

执行代码，会看到当前目录出现了一个auido.mp3文件，打开播放器，听一下声音。

我用QQ影音，打开正常

看参数

看上面的代码，可以发现

'你好百度' 对于参数text

'zh' 表示中文

1 表示客户度类型result = client.synthesis('你好百度', 'zh', 1, {

'vol': 5,

})

再来加几个参数result = client.synthesis('你好百度', 'zh', 1, {

'spd':5, # 语速-中等

'vol': 5, # 音量-中等

'pit':5, # 音调-中等

'per':0 # 发音人-女声

})

per的参数，如果是0，表示女声。我比较喜欢听女声，不要问我为什么!

语速，音量，音调，大家可以自行调节，声音会有相应的变化。

假设一段文件，有1000个子，可以使用split()方法切割，就可以得到多段语言。

接下来，需要进行语音识别，看文档

点击左边的百度语言->语音识别->Python SDK

支持的语言格式有3种。分别是pcm,wav,amr

建议使用pcm，因为它比较好实现。而另外2种语言格式，有非常高的要求，只有专业级别的设备才能录制。它才能达到百度的要求。

使用windows录音工具，保存的是wav格式，那么就需要将wav转换为pcm格式。

下面介绍一个工具ffmpeg，百度搜索就能找到。

打开网址：

点击windows图标，点击Builds

我的电脑是64位系统，选择64位，一定要选择Shared，最后点击下载。

下载完成后，将包解压到你常用的安装目录，我的安装目录是D:\Program Files (x86)

进入目录

D:\Program Files (x86)\ffmpeg-20180518-16b4f97-win64-shared\bin

里面有一个ffmpeg.exe，后面的Python代码会调用它。

添加环境变量

打开我的电脑->高级系统设置->环境变量->编辑

点击右边的新建，输入路径D:\Program Files (x86)\ffmpeg-20180518-16b4f97-win64-shared\bin

之后，一路确定...

关闭cmd窗口，再次打开cmd窗口，输入命令 ffmpeg

出现下面橘黄色提示，就表示环境变量添加成功了。

这个时候，一定要关闭Pycharm，否则Pycharm识别不到。

再次开启Pycharm

Pycharm用法如下：ffmpeg -y -i %s -acodec pcm_s16le -f s16le -ac 1 -ar 16000 %s.pcm

第一个%s 表示原始文件

第二个%s 也是原始文件，它加了后缀.pcm

继续看文档，语言时长，不要超过60s

请求时，要指定一个pcm格式的文件

看参数，主要用到的是rate和1536

上图的16000表示采样率

1536表示能识别中文和英文，它的容错率比较高

1537必须是标准的普通话，带点地方口音是不行的。

所以建议使用1536

打开win10自带的录音机，录制一段声音，比如：你叫什么呀

一定要带一个呀字，下面的代码执行会输出10个结果，否则只有一个！

注意：笔记本的麦克风在摄像头的2边，所以录制的时候，一定要对着摄像头！

默认为m4a格式的，重命名为whatyouname.m4a，将文件放入ai目录

新增文件a_t.py，内容如下：from aip import AipSpeech

""" 你的 APPID AK SK """

APP_ID = '11212345'

API_KEY = 'pVxdhsXS1BIaiwYYNT712345'

SECRET_KEY = 'BvHQOts27LpGFbt3RAOv84WfPCW12345'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

# 读取文件

def get_file_content(filePath):

with open(filePath, 'rb') as fp:

return fp.read()

# 识别本地文件

a = client.asr(get_file_content('whatyouname.m4a'), 'pcm', 16000, {

'dev_pid': 1536,

})

print(a)

注意上面的id和key。文件名为whatyouname.wav

执行文件，输出：

{'sn': '7436726851526824321', 'err_no': 3301, 'err_msg': 'speech quality error.'}

返回错误'err_no': 3301

看文档

找下面对应的3301，表示声音不清晰!

再仔细用播放器，播放一下刚才的声音，挺清晰的呀！

这里报3301不是因为声音不清晰，而是格式不支持。

使用os模块调用ffmpeg实现转码

代码如下：import os

from aip import AipSpeech

""" 你的 APPID AK SK """

APP_ID = '11212345'

API_KEY = 'pVxdhsXS1BIaiwYYNT712345'

SECRET_KEY = 'BvHQOts27LpGFbt3RAOv84WfPCW12345'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

# 读取文件

def get_file_content(filePath):

cmd_str = "ffmpeg -y -i %s -acodec pcm_s16le -f s16le -ac 1 -ar 16000 %s.pcm"%(filePath,filePath)

os.system(cmd_str) # 调用系统命令ffmpeg,传入音频文件名即可

with open(filePath + ".pcm", 'rb') as fp:

return fp.read()

# 识别本地文件

a = client.asr(get_file_content('whatyouname.m4a'), 'pcm', 16000, {

'dev_pid': 1536,

})

print(a)

执行输出，效果如下：

上面红色文件，不是报错，而是转码过程

主要看err_msg是什么，这里显示success，表示成功。

在ai目录下，会多出一个文件whatyouname.m4a.pcm。这个文件才是刚才真正发给百度的语言文件

返回的结果是一个字典，第一个结果，一般是最正确的。取第一个，就可以了!

接下来，就需要从字典取值。字典取值，不要用以下这种方法：print(a['result'])

为什么呢？如果key不存在，会直接报错!毕竟报错，是要崩溃的...

所以建议使用get方法，将最后一行的print(a)，修改为以下内容：

完整代码，我就不贴了。if a.get('result'):

print(a.get('result')[0])

执行输出：

从结果上来看就只有一个了。

jieba分词，完全开源，有集成的python库，简单易用。

jieba分词是基于前缀词典实现高效的词图扫描，生成句子中汉字所有可能成词情况所构成的有向无环图 (DAG)，动态规划查找最大概率路径, 找出基于词频的最大切分组合

安装jieba

在安装有python3 和 pip 的机子上，安装jieba库很简单，使用pip即可：pip3 install jieba

由于包很大，默认使用国外更新源比较慢，下面使用国内更新源安装

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple jieba

下图表示已经安装好了

新建一个文件jieba_test.py，代码如下：import jieba

a = jieba.cut('你叫什么名字')

print(a)

执行输出：

它是一个生成器对象，转换为列表import jieba

a = list(jieba.cut('你叫什么名字'))

print(a)

执行输出：

换一句话import jieba

a = list(jieba.cut('我想听周杰伦的夜曲'))

print(a)

执行输出：

发现，断句不对。应该是下面的结果['我想听', '周杰伦', '的', '夜曲']

新建一个words.py文件，用来存放关键字，内容如下：KEY_WORDS = ["我想听",

"我要听",

"播放",

"名字是什么",

"名字叫什么",

"你叫什么名字"

]

导入words模块，也就是上面写的文件import jieba

import words

for i in words.KEY_WORDS: # 遍历关键字

jieba.add_word(i) # 在程序中动态修改词典

a = list(jieba.cut('我想听周杰伦的夜曲'))

print(a)

执行输出：

除了使用jieba.cut以外，还有一个方法jieba.cut_for_search

该方法适合用于搜索引擎构建倒排索引的分词，粒度比较细

图灵机器人是以语义技术为核心驱动力的人工智能公司，致力于“让机器理解世界”，产品服务包括机器人开放平台、机器人OS和场景方案。

官方地址为：

首先得注册一个账号，或者使用第3方登录，都可以。

登录之后，点击创建机器人

机器人名称，可以是自己定义的名字

选择网站->教育学习->其他输入简介

创建成功之后，点击终端设置，拉到最后。

可以看到api接入，下面有一个apikey，待会会用到

右侧有一个窗口，可以和机器人聊天

点击api使用文档，初学者，先看Web API V1.0的

新建一个文件tuling.py，内容如下：import json

import requests

urls = 'http://www.tuling123.com/openapi/api' # 请求地址

data_str = {

"key":"6a944508fd5c4d499b9991862ea12345", # 你的apikey

"info":'今天天气怎么样', # 请求内容

"userid":123, # 开发者给自己的用户分配的唯一标志

}

a = requests.post(urls,data_str) # 必须使用post请求

content = (a._content).decode('utf-8') # 获取返回结果_content属性，并解码

s = json.loads(content) # 反序列化

print(s)

key是你创建机器人的apikey,上面的代码，后5位我改了，复制没用的！

执行代码输出：

{'text': '请问你想查询哪个城市', 'code': 100000}

修改info为北京

再次执行，输出：

{'code': 100000, 'text': '北京:周日 05月27日,多云西南风3-4级,最低气温17度，最高气温32度'}

参数解释：

userid 表示上下文标记，用来区分用户。举个例子，如果我更改了userid，那么我问"今天天气怎么样"

它会返回给我"你想查询哪个城市"。而我不改userid，它会直接返回天气结果。

上下文，好像只能保留上一次，我回复的内容。

a的返回结果是一个requests对象，_content才是我们真正需要的结果。

它是一个bytes类型，需要解码。解码之后一个json数据类型，反序列之后，就可以得到字符串了。

得到字符串之后，就可以调用百度接口，生成语音文件

创建一个audio_test.py文件，用来将字符串生成语音文件，内容如下：import time

from aip import AipSpeech

""" 你的 APPID AK SK """

APP_ID = '11212345'

API_KEY = 'pVxdhsXS1BIaiwYYNT712345'

SECRET_KEY = 'BvHQOts27LpGFbt3RAOv84WfPCW12345'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

def text_to_audio(text):

file_name = time.time() # 保证文件名不重复

result = client.synthesis(text, 'zh', 1, {

'spd':5,

'vol': 5,

'pit':5,

'per':0

})

# 识别正确返回语音二进制错误则返回dict 参照下面错误码

if not isinstance(result, dict):

with open('%s.mp3'%(file_name), 'wb') as f:

f.write(result)

return '%s.mp3'%(file_name)

打开tuling.py，导入模块audio_testimport json

import requests

import audio_text

urls = 'http://www.tuling123.com/openapi/api' # 请求地址

data_str = {

"key":"6a944508fd5c4d499b9991862ea12345", # 你的apikey

"info":'今天天气怎么样', # 请求内容

"userid":123, # 开发者给自己的用户分配的唯一标志

}

a = requests.post(urls,data_str) # 必须使用post请求

content = (a._content).decode('utf-8') # 获取返回结果_content属性，并解码

s = json.loads(content) # 反序列化

print(audio_text.text_to_audio(s.get['text']))

执行输出：

1527421766.491485.mp3

在当前目录会生成一个音频文件，打开播放一下

有一个女生的声音，说："请问你想查询哪个城市"

非常Nice

修改a_t.py，封装成函数，完整代码如下：import os

from aip import AipSpeech

""" 你的 APPID AK SK """

APP_ID = '11212345'

API_KEY = 'pVxdhsXS1BIaiwYYNT712345'

SECRET_KEY = 'BvHQOts27LpGFbt3RAOv84WfPCW12345'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

def get_file_content(filePath):

print(filePath)

cmd_str = "ffmpeg -y -i %s -acodec pcm_s16le -f s16le -ac 1 -ar 16000 %s.pcm"%(filePath,filePath)

print(cmd_str)

os.system(cmd_str)

with open(filePath+".pcm", 'rb') as fp:

return fp.read()

# 识别本地文件

def audio_text(file_path):

a = client.asr(get_file_content(file_path), 'pcm', 16000, {

'dev_pid': 1536,

})

# print(a["result"])

if a.get("result") :

return a.get("result")[0]

修改jieba_test.py，导入模块，完整代码如下：import jieba

import words

import tuling

for i in words.KEY_WORDS:

jieba.add_word(i)

def fenci(text):

a = list(jieba.cut(text))

# print(a)

user_key_name={

"你叫",

"你叫什么",

"你的名字",

"名字叫什么",

"你叫什么名字",

"名字是什么"

}

if user_key_name.intersection(a):

a = tuling.to_tuling('我叫肖',1)

#print('我叫肖')

print(a)

return a

a = tuling.to_tuling(text,'ai01')

return a

修改tuling.py，完整内容如下：import json

import requests

import audio_text

urls = 'http://www.tuling123.com/openapi/api'

def to_tuling(text,uid):

data_str = {

"key":"6a944508fd5c4d499b9991862ea12345",

"info":text,

"userid":uid,

}

a = requests.post(urls,data_str)

content = (a._content).decode('utf-8')

s = json.loads(content)

print(s)

return audio_text.text_to_audio(s.get('text'))

新建文件wen_da.py,内容如下：import a_t

import jieba_test

a = a_t.audio_text('How_is_the_weather.wav')

b = jieba_test.fenci(a)

How_is_the_weather.wav是我提前录制好的文件，内容是，北京天气如何？

执行wen_da.py，输出：

北京天气如何

{'code': 100000, 'text': '北京:周日 05月27日,多云西南风3-4级,最低气温17度，最高气温32度'}

1527423163.572486.mp3

打开文件1527423163.572486.mp3，听声音，内容应该是

北京:周日 05月27日,多云西南风3-4级,最低气温17度，最高气温32度

本地版的语言识别到这里就结束了！

这种方式很繁琐，很LOW!

来，看一个高大上的效果：

基于flask框架的语言识别系统

点击按钮，开始说话

说完之后，就直接语言播放天气

还能成语接龙

说不知道，就自动退出成语接龙模式

还可以听歌，比如说:"我想听世上只有妈妈好"

就会直接播放音乐

播放音乐功能，是调用了一个第3方接口musicapi

是不是很6呢？

预知后事如何,请听下回分解

注意博客更新即可！

你可能感兴趣的:(python常用语音识别库)

文本转语音常用的几个python库天蓝海乡 python 开发语言人工智能 nlp 语音识别
在Python编程领域，文本到语音（Text-to-Speech,TTS）的转换是一个常见的需求，尤其是在开发能够与用户交互的应用程序时。以下是几个流行的Python库，它们可以帮助开发者实现文本到语音的转换，并且有的可以将转换后的语音保存为MP3文件。gTTS(GoogleText-to-Speech)gTTS是一个依赖于Google的文本转语音API的Python库。它能够将文本转换为自然听起
理解 Node.js 中的 process`对象与常用操作 red润前端 node.js 前端 javascript
理解Node.js中的process对象与常用操作在Node.js中，process是一个全局对象，提供了与当前Node.js进程相关的信息和操作。无论是获取进程信息、处理信号、访问环境变量，还是控制进程行为，process都是不可或缺的工具。看到process不犯怵了1.获取进程信息process提供了许多属性和方法来获取当前进程的信息。process.pid：获取当前进程的PID（进程ID）。
npm详解：掌握 Node.js 包管理的艺术 Lv_Jin_Gang npm
在现代软件开发领域，包管理和依赖处理是任何项目不可或缺的一部分。对于基于Node.js的应用程序而言，NPM（NodePackageManager）不仅是安装和管理第三方库的标准工具，也是发布、共享和重用代码片段的核心平台。本文将深入探讨NPM的各个方面，从基础概念到高级用法，旨在为你提供一个全面而深入的理解。一、NPM简介与安装1.1NPM的诞生与重要性NPM伴随着Node.js的诞生而出现，它
Hive常用函数 - abs Called_Kingsley Hive hive 函数
Hive常用函数-abs官方解释abs(x)-returnstheabsolutevalueofx个人理解就是返回函数括号内数字的绝对值。想要获取该数的绝对值的时候就用这个函数没错使用示例selectabs(-1);>1官方示例abs(x)-returnstheabsolutevalueofxExample:>SELECTabs(0)FROMsrcLIMIT1;0>SELECTabs(-5)FRO
python之pyttsx3实现文字转语音播报 l8947943 python问题语音识别人工智能 pyttsx3 python朗读
1.pyttsx3是什么pyttsx3是Python中的文本到语音转换库，可以实现文本的朗读功能。2.pyttsx3的安装pipinstallpyttsx33.pyttsx3的demoimportpyttsx3pyttsx3.speak("Areyouok?")pyttsx3.speak("最近有许多打工人都说打工好难")戴上耳机直接跑即可。是不是很简单！那如果我们想对读音的速率，中英文问题进行自
Python报错解决：img2pdf.AlphaChannelError: Refusing to work on images with alpha channel 定星照空 python 人工智能
img2pdf.AlphaChannelError:Refusingtoworkonimageswithalphachannel-solved解决img2pdf模块不能上传含alpha通道透明度的图片的问题解决img2pdf模块PNG图片转PDF文件因alpha通道报错问题文章目录前言一、AlphaChannelError为什么出现？二、该种报错解决方法1.方法一：转化其他格式图片2.方法二：去除
基于PyCATIA的工程图视图锁定工具开发实战解析 Python×CATIA工业智造 CATIA二次开发 python 自动化
引言本文针对CATIA工程图设计中视图误操作问题，基于PySide6与PyCATIA库开发了一款轻量化视图锁定工具。通过Python二次开发实现全视图/选定视图快速锁定、非模态交互界面及状态实时反馈功能，有效提升大型装配体工程图操作效率。文章深度解析代码架构设计、关键技术实现及工程应用价值，提供完整的开发方法论。一、工具功能与工程应用场景1.1核心功能模块功能模块技术指标应用场景全视图锁定批量操作
Node.js系列（2）--性能优化指南一进制ᅟᅠ ‌‍‎‏ Node.js node.js 性能优化
Node.js性能优化指南⚡引言Node.js应用的性能优化是确保应用高效运行的关键。本文将深入探讨Node.js性能优化的各个方面，包括内存管理、CPU优化、I/O优化等，帮助开发者构建高性能的Node.js应用。性能优化概述Node.js性能优化主要包括以下方面：内存优化：内存泄漏检测、垃圾回收优化CPU优化：代码执行效率、异步处理、工作线程I/O优化：文件操作、网络请求、数据库访问缓存优化：
Spring Boot 事务详解 Dong雨 spring boot 后端 java
SpringBoot事务详解引言在现代应用程序中，事务管理是确保数据一致性和完整性的重要机制。SpringBoot提供了强大的事务管理功能，使得开发者可以轻松地定义和管理事务。本文将详细介绍SpringBoot中的事务管理，包括事务传播行为、事务属性以及声明式和编程式事务管理。声明式事务管理声明式事务管理是通过注解的方式来管理事务，最常用的注解是@Transactional。这种方式简单直观，适合
Python中Pyttsx3库实现文本转化成语音MP3格式文件定星照空 python
Pyttsx3库介绍pyttsx3库是一个功能强大且使用方便的Python本地文本转语音库。它不仅能在离线下将文本转换为语音MP3格式文件，也能在Windows、MacOS和Linux等多个操作系统上实现语音播报。同时，还可以调整语音播报的语速、音量和音色。安装与基本使用安装：cmd命令行中执行pipinstallpyttsx3。基本使用示例：importpyttsx3#初始化语音引擎engine
复习Linux的常用指令一直开心 linux 常用指令的学习笔记
https://zhuanlan.zhihu.com/p/385065437https://zhuanlan.zhihu.com/p/385065437参考：tar指令的学习linux常用命令(2)：tar命令(压缩文件/解压缩文件)_tar压缩-CSDN博客zip指令的学习Linuxzip命令|菜鸟教程tar的工作过程主要分为两个步骤，正向是打包与压缩，反向是解压缩与还原。打包指的是将一大堆文件
Adb与monkey命令学习总结你醉牛啤手机测试 adb 软件测试
主要内容adb构成和工作原理adb常用命令查看当前连接设备安装apk文件卸载APP获取包名和界面名adbshellam/pmadb文件传输其他常用命令monkey常用命令事件数频率–throttle(毫秒)，延时操作指定执行的应用–p日志-v调试选项完整应用monkey命令进行稳定性测试adb构成和工作原理全称：AndroidDebugBridge就是起到调试桥的作用。顾名思义，adb就是一个de
查询数据库中第n行数据 weixin_44231698
一般情况下分页的时候是需要的关键字。Oracle中则是rownum，MSSQL中是top关键字，MySQL中是limit关键字。查第n条数据，如：（1）select*from(SELECTROWNUMrn,A.*FROMTABLEA)bwhereb.rn=n;(2)selecttop1*fromTABLEAwhereidnotin(selecttopn-1idfromTABLEA);(3)用mys
使用PyTorch搭建Transformer神经网络:入门篇 DASA13 pytorch transformer 神经网络
1.简介Transformer是一种强大的神经网络架构,在自然语言处理等多个领域取得了巨大成功。本教程将指导您使用PyTorch框架从头开始构建一个Transformer模型。我们将逐步解释每个组件,并提供详细的代码实现。2.环境设置首先,确保您的系统中已安装Python(推荐3.7+版本)。然后,安装PyTorch和其他必要的库:pipinstalltorchnumpymatplotlib3.P
openai-agents 中custom example agent ZHOU_CAMP oi_agents 人工智能
代码pipshowopenai-agentsName:openai-agentsVersion:0.0.4Summary:OpenAIAgentsSDKHome-page:https://github.com/openai/openai-agents-pythonAuthor:Author-email:OpenAILicense-Expression:MITLocation:d:\soft\ana
jquery基础和导航栏声声codeGrandMaster django python 后端
jquery基础和导航栏目录1jQuery基础2jQuery事件3jQuery影藏和显示4jQuery滑动5、区块属性6、导航栏1jQuery基础介绍jQuery是一个JavaScript库。jQuery极大地简化了JavaScript编程。jQuery很容易学习。基础语法：$(selector).action()美元符号定义jQuery选择符（selector）“查询"和"查找”HTML元素jQ
深度剖析哈希表数据结构：原理、冲突解决与优化策略麻辣酸甜笔记
摘要哈希表作为一种高效的数据结构，在计算机科学领域广泛应用。本文深入探讨哈希表的工作原理，详细分析常见的冲突解决方法，如开放地址法、链地址法等，并进一步研究哈希表在不同场景下的优化策略，旨在帮助读者全面理解哈希表数据结构及其应用。一、引言在计算机程序中，快速查找和插入数据是常见需求。哈希表以其平均时间复杂度为O(1)的高效查找和插入特性，成为解决这类问题的有力工具。从数据库索引到编程语言的集合类实
PyTorch数据归一化处理：transforms 2401_87555420 pytorch 人工智能 python
##1.数据归一化处理：transforms.Normalize###1.1理解torchvision*torchvision.transforms：常用的图像预处理方法*torchvision.datasets：常用的数据集Dataset实现*torchvision.models：常用的CV（预训练）模型实现torchvision.transforms:常用的数据预处理方法，提升泛化能力，包括：
Python 向量检索库Faiss使用懒大王爱吃狼 python python 开发语言自动化 Python基础 python教程
Faiss（FacebookAISimilaritySearch）是一个由FacebookAIResearch开发的库，它专门用于高效地搜索和聚类大量向量。Faiss能够在几毫秒内搜索数亿个向量，这使得它非常适合于实现近似最近邻（ANN）搜索，这在许多应用中都非常有用，比如图像检索、推荐系统和自然语言处理。以下是如何使用Faiss的基本步骤和示例：1.安装Faiss首先，你需要安装Faiss。你可
通过启用Ranger插件的Hive审计日志同步到Doris做分析 fzip Doris Hive doris 审计 hive
以下是基于ApacheDoris的RangerHive审计日志同步方案详细步骤，结合审计日志插件与数据导入策略实现：一、Doris环境准备1.创建审计日志库表参考搜索结果的表结构设计，根据Ranger日志字段调整建表语句：CREATEDATABASEIFNOTEXISTSranger_audit;CREATETABLEIFNOTEXISTSranger_audit_hive_log(repoTyp
Python 应用部署云端实战指南 —— AWS、Google Cloud 与 Azure 全解析清水白石008 python Python题库 python aws azure
Python应用部署云端实战指南——AWS、GoogleCloud与Azure全解析在当下云计算飞速发展的时代，将Python应用部署到云平台已成为大多数开发者和企业的首选。无论是构建Web服务、API接口，还是自动化任务调度，云平台都能为我们提供高可靠性、弹性伸缩与简便管理的优势。本文将详细阐述如何将Python应用分别部署到AWS、GoogleCloud与Azure，并介绍各平台下涉及的部署工
【现代后端架构演进：微服务设计与云原生】蝉叫醒了夏天架构云原生微服务
现代后端架构演进：微服务设计与云原生一、架构演进历程1.单体架构到分布式系统单体架构瓶颈典型问题：代码耦合（代码行超百万级）、扩展困难（垂直扩容成本>105>10^5>105美元/节点）、技术栈固化故障扩散：数据库连接池耗尽导致全站瘫痪SOA（面向服务架构）引入ESB（企业服务总线），服务间通信延迟增加30-50ms典型案例：电信计费系统（服务拆分粒度以模块为单位）2.微服务革命（2014-）核心
Python编程：为什么使用同步原语林十一npc Python语言 python 开发语言
Python编程：为什么使用同步原语1.同步原语同步原语：计算机科学中用于实现进程或线程之间同步的机制。目的：提供一种方法来控制多个进程或线程的执行顺序，确保他们以一致的方式访问共享资源在多线程/多进程编程中，多个执行单元可能同时访问共享资源，导致竞态条件。同步原语通过协调执行顺序，确保数据一致性和操作原子性2.Python核心同步原语同步原语作用适用场景模块Lock（互斥锁）确保同一时间只有一个
AWS SAP学习笔记-概念 HainesFreeman AWS aws
1、什么是ETL应用程序，举个例子说明？ETL（Extract,Transform,Load）应用程序是一种用于数据处理和迁移的工具或程序，它主要负责从多个数据源提取数据，对数据进行转换和清洗，然后将处理后的数据加载到目标数据仓库或数据库中。ETL应用程序广泛应用于数据集成、数据仓库构建、数据分析和数据迁移等场景。ETL的三个主要步骤：Extract（提取）：从各种数据源（如数据库、文件、API等
python函数闭包和递归_闭包和递归_个人文章 - SegmentFault 思否 weixin_39830313 python函数闭包和递归
js变量的作用域:全局作用域(全局变量):在函数外面声明的变量**生命周期(变量从声明到销毁)：页面从打开到关闭.局部作用域(局部变量):在函数里面声明的变量**生命周：开始调用函数到函数执行完毕1.闭包使用介绍1.闭包介绍(closure)1.1闭包：是一个可以在函数外部访问函数内部变量的函数->闭包是函数1.2闭包作用：可以在函数外部访问函数内部变量->延长局部变量的生命周期1.3闭包语法：-
python函数闭包和递归_python函数基础3--闭包 + 递归 + 函数回调 weixin_39532019 python函数闭包和递归
一、闭包1.函数嵌套defouter():print("外层函数")definner():print("内层函数")returninner()outer()函数嵌套流程图2.闭包闭包的表现形式：函数里面嵌套函数，外层函数返回内层函数的函数名，这种情况就称之为闭包defouter():print("外层函数")definner():print("内层函数")returninnerret=outer(
探索ELF世界的大门：JElf库深度揭秘班歆韦Divine
探索ELF世界的大门：JElf库深度揭秘jelfELFparsinglibraryinjava.项目地址:https://gitcode.com/gh_mirrors/je/jelf在软件工程的浩瀚星空中，有一种文件格式如星辰般不可或缺，它便是ExecutableandLinkableFormat（ELF）——一个为Linux和Unix系统而生的传奇。今天，我们荣幸地向您介绍一款专为此格式设计的J
python中的递归、回调函数以及闭包总结敲代码敲到头发茂密 Python成长之路 python 开发语言
这里写目录标题一、递归例1：利用递归函数计算1到10的和例2：利用递归函数计算10的阶乘二、回调函数特别注意：在函数中的调用函数分为以下情况：1、同步回调2、异步回调三、闭包一、递归作用：在函数内部调用自己若干次例1：利用递归函数计算1到10的和defsum_num(num):ifnum>=1:sum=num+sum_num(num-1)else:sum=0returnsumprint(sum_n
使用Pygame实现记忆拼图游戏点我头像干啥 Ai pygame python 开发语言
引言记忆拼图游戏是一种经典的益智游戏，玩家需要通过翻转卡片来匹配相同的图案。这类游戏不仅能够锻炼玩家的记忆力，还能带来很多乐趣。本文将详细介绍如何使用Pygame库来实现一个简单的记忆拼图游戏。我们将从Pygame的基础知识开始，逐步构建游戏的各个部分，最终完成一个完整的游戏。1.Pygame简介Pygame是一个用于编写视频游戏的Python库，它基于SDL库（SimpleDirectMedia
《Python实战进阶》No28: 使用 Paramiko 实现远程服务器管理带娃的IT创业者 Python实战进阶 python 服务器开发语言
No28:使用Paramiko实现远程服务器管理摘要在现代开发与运维中，远程服务器管理是必不可少的一环。通过SSH协议，我们可以安全地连接到远程服务器并执行各种操作。Python的Paramiko模块是一个强大的工具，能够帮助我们实现自动化任务，如代码部署、批量命令执行和文件传输。本集将深入讲解Paramiko的核心功能，并通过实战案例展示如何高效管理远程服务器。核心概念和知识点SSH协议的基本原
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin