风霜高洁

从零开始搭建一个语音对话机器人

点击上方[全栈开发者社区]→右上角[...]→[设为星标⭐]

♪ 点击上方绿标收听从零开始搭建一个语音对话机器人

从零开始搭建一个语音对话机器人

01-初心缘由

01-准备工作

02-语音机器人的搭建思路

03-语音生成音频文件

04-音频文件转文字STT

05-与图灵机器人对话

06-文字转语音

07-语音对话机器人的完整代码

08-结束语

01-初心缘由

最近在研究语音识别方向，看了很多的语音识别的资料和文章，了解了一下语音识别的前世今生，其中包含了很多算法的演变，目前来说最流行的语音识别算法主要是依赖于深度学习的神经网络算法，其中RNN扮演了非常重要的作用，深度学习的应用真正让语音识别达到了商用级别。然后我想动手自己做一个语音识别系统，从GitHub上下载了两个流行的开源项目MASR和ASRT来进行复现，发现语音识别的效果没有写的那么好，其中如果要从零来训练自己的语言模型势必会非常耗时。

因此，就有了一个新的想法，借助一些开源的语音识别SDK来实现语音识别，来看看他们语音识别的效果如何。于是想到了百度和科大讯飞，然后就百度了一下，百度搜索举贤不避亲的给我推荐了百度AI开放平台！然后查看了百度语音识别的技术文档，发现对python的支持非常友好，而科大讯飞好像没有提供对python的接口支持，因而选定了百度。

虽然百度目前槽点很多，但是不得不说百度在AI方面的投入和开放是值得点赞的！百度的AI开放平台确实为开发者们带来很多的便利性，开放了非常多的AI服务，大家自行去注册使用，百度大脑AI开放平台地址：http://ai.baidu.com/

经过体验发现百度的语音识别准确率高的吓人，完爆了GitHub上的开源项目N条街，然后在CSDN浏览各位博主的博客时发现，用百度语音识别的API和图灵机器人的API可以做一个实时语音对话的机器人，感觉特别兴奋，从而决定搭建一个自己的语音对话机器人。目前，我已经实现了我的语音对话机器人，因此特意来分享一下整个的实现过程和遇到的坑，让大家可以快速的构建你们的语音对话机器人。好啦，我们开始吧！

02-准备工作

（1）准备python开发环境

需要准备的python包包括：speech_recognition(语音识别包)、pyaudio(录音接口)、wave(打开录音文件并设置音频参数)、pyttst3(文本转语音)、json(解析json串)、requests(get/post)、baid_aip(百度语音识别的aip)。

（2）准备百度API

登录百度AI开放平台语音识别：https://ai.baidu.com/tech/speech/asr ，如果没有账号自己注册即可，免费试用哦。

点击技术文档：阅读语音识别的技术文档，重点查看API文档和Python SDK，了解如何在python中调用API接口。

击立即使用：进入到服务界面，创建应用。记住最重要的App ID、API Key、Secret Key，后面调用时需要用到。

（3）准备图灵机器人：

图灵机器人大脑具备强大的中文语义分析能力，可准确理解中文含义并作出回应，是最擅长聊中文的机器人大脑，赋予软硬件产品自然流畅的人机对话能力。图灵机器人是中文语境下智能度最高的“机器人大脑”，是全球较为先进的机器人中文语言认知与计算平台，图灵机器人对中文语义理解准确率已达90%，可为智能化软硬件产品提供中文语义分析、自然语言对话、深度问答等人工智能技术服务。——源于百科（好吧，又和百度扯上点关系了。）

总之，就是需要你去图灵机器人官网，注册成功后，构建一个属于你的图灵机器人，用于后续将翻译后的文本内容对图灵机器人提问获取回答，然后我们通过TTS处理就可以获取语音输出了。

注册后创建自己的机器人，然后在机器人设置的终端设置中查看自己的apikey(这个key非常重要)，另外一定要把密钥开关关闭，不然后面在调用api时会报3001错误，无法调用图灵机器人！

03-语音机器人的搭建思路

1、首先明确我们要实现的目标，是要实现纯语音对话聊天，不需要输入文字交流。我们实时说，机器人实时回复，真正实现语音交互对话。

2、整个过程的实现流程是这样的，我们说一句话，通过录音保存为语音文件，然后调用百度API实现语音转文本STT，再然后调用图灵机器人API将文本输入得到图灵机器人的回复，最后将回复的文本转成语音输出TTS，就这样我们就实现了和机器人的语音对话了！是不是有点绕，来个流程图吧！

3、语音对话机器人的构建具体流程图，就是各种掉API，千万不要觉得头晕哦，思路清晰才能走下去。

04-语音生成音频文件

语音生产文件就需要进行录音，将我们说的话保存下来，至于保存的格式我一般都是保存为wav，其他格式支持pcm，不太建议mp3，因为需要多次转换。【百度服务端会将非pcm格式，转为pcm格式，因此使用wav会有额外的转换耗时，但是windows自带播放器识别不了pcm格式的，所以我还是喜欢用wav格式】

第一种录音方式：使用speech_recognition包进行录音，这个录音出来的效果比较好，而且代码量非常少。

import speech_recognition as sr	
	
# Use SpeechRecognition to record 使用语音识别包录制音频	
def my_record(rate=16000):	
    r = sr.Recognizer()	
    with sr.Microphone(sample_rate=rate) as source:	
        print("please say something")	
        audio = r.listen(source)	
	
    with open("voices/myvoices.wav", "wb") as f:	
        f.write(audio.get_wav_data())	
    print("录音完成！")	
	
my_record()

第二种录音方式：使用wave和pyaudio包进行录音，在python中直接使用pip install即可。

import wave	
from pyaudio import PyAudio, paInt16	
	
framerate = 16000  # 采样率	
num_samples = 2000  # 采样点	
channels = 1  # 声道	
sampwidth = 2  # 采样宽度2bytes	
FILEPATH = 'voices/myvoices.wav'	
	
	
def save_wave_file(filepath, data):	
    wf = wave.open(filepath, 'wb')	
    wf.setnchannels(channels)	
    wf.setsampwidth(sampwidth)	
    wf.setframerate(framerate)	
    wf.writeframes(b''.join(data))	
    wf.close()	
	
#录音	
def my_record():	
    pa = PyAudio()	
    #打开一个新的音频stream	
    stream = pa.open(format=paInt16, channels=channels,	
                     rate=framerate, input=True, frames_per_buffer=num_samples)	
    my_buf = [] #存放录音数据	
	
    t = time.time()	
    print('正在录音...')	
 	
    while time.time() < t + 10:  # 设置录音时间（秒）	
      #循环read，每次read 2000frames	
        string_audio_data = stream.read(num_samples)	
        my_buf.append(string_audio_data)	
    print('录音结束.')	
    save_wave_file(FILEPATH, my_buf)	
    stream.close()

05-音频文件转文字STT

我们已经在上面获取到了音频文件，那要怎么把音频文件转化为文字呢？在这里，我们就需要调用百度的语音识别API接口，同时我们需要安装这个接口包，导入模块：pip install baidu_aip。导入我们需要的模块名，然后将音频文件发送给出去，返回文字。

# 音频文件转文字：采用百度的语音识别python-SDK	
# 百度语音识别API配置参数	
from aip import AipSpeech	
	
APP_ID = 'your app_id'	
API_KEY = 'your api_key'	
SECRET_KEY = 'your secret_key'	
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)	
path = 'voices/myvoices.wav'	
	
	
# 将语音转文本STT	
def listen():	
    # 读取录音文件	
    with open(path, 'rb') as fp:	
        voices = fp.read()	
    try:	
        # 参数dev_pid：1536普通话(支持简单的英文识别)、1537普通话(纯中文识别)、1737英语、1637粤语、1837四川话、1936普通话远场	
        result = client.asr(voices, 'wav', 16000, {'dev_pid': 1537, })	
        # result = CLIENT.asr(get_file_content(path), 'wav', 16000, {'lan': 'zh', })	
        # print(result)	
        # print(result['result'][0])	
        # print(result)	
        result_text = result["result"][0]	
        print("you said: " + result_text)	
        return result_text	
    except KeyError:	
        print("KeyError")

06-与图灵机器人对话

上一步我们已经成功将我们的声音转化为文字了，然后我们再调用图灵机器人的API接口，做自动应答。图灵机器人对中文的识别准确率高达90%，是目前中文语境下智能度最高的机器人。有很多在Python中使用图灵机器人API的博客，但都是1.0版本，本博客介绍的是在Python中使用图灵机器人API v2.0的方法，1.0版本的调用方式已失效。

代码如下（这里需要导入requests、json模块）：

# 与机器人对话：调用的是图灵机器人	
import requests	
import json	
	
# 图灵机器人的API_KEY、API_URL	
turing_api_key = "your turing_api_key"	
api_url = "http://openapi.tuling123.com/openapi/api/v2"  # 图灵机器人api网址	
headers = {'Content-Type': 'application/json;charset=UTF-8'}	
	
	
# 图灵机器人回复	
def Turing(text_words=""):	
    req = {	
        "reqType": 0,	
        "perception": {	
            "inputText": {	
                "text": text_words	
            },	
	
            "selfInfo": {	
                "location": {	
                    "city": "北京",	
                    "province": "北京",	
                    "street": "车公庄西大街"	
                }	
            }	
        },	
        "userInfo": {	
            "apiKey": turing_api_key,  # 你的图灵机器人apiKey	
            "userId": "Nieson"  # 用户唯一标识(随便填, 非密钥)	
        }	
    }	
	
    req["perception"]["inputText"]["text"] = text_words	
    response = requests.request("post", api_url, json=req, headers=headers)	
    response_dict = json.loads(response.text)	
	
    result = response_dict["results"][0]["values"]["text"]	
    print("AI Robot said: " + result)	
    return result


07-文字转语音

我们得到了图灵机器人的回复之后，就需要把结果转化为语音输出，从而实现语音交互。在python中我们如何将文字转为语音并输出呢？这里就需要用到另一个模块pyttsx3，它会将文字转为语音。

import pyttsx3	
	
# 初始化语音	
engine = pyttsx3.init()  # 初始化语音库	
# 设置语速	
rate = engine.getProperty('rate')	
engine.setProperty('rate', rate-50)	
# 输出语音	
engine.say("你好，很高兴认识你！")  # 合成语音	
engine.runAndWait()

使用python进行编程就是有很多好处，比如音频的输出我们就可以采用多种方式，下面提供一种更加简便的音频输出方式：

import win32com.client	
	
speaker = win32com.client.Dispatch("SAPI.SpVoice")	
speaker.Speak("我是语音助手，小灵！")

好了，至此，我们语音机器人的所有元素都已经准备妥当，接下来进行组装！

08-语音对话机器人的完整代码

经过我的努力，已经将代码优化到了100行左右哦，按照我的步骤来，你就可以快速复现构建你的语音机器人了！

# -*- coding: utf-8 -*-#	
# -------------------------------	
# Name:SpeechRobot	
# Author:Nieson	
# Date:2019/7/19 16:31	
# 用python3实现自己的语音对话机器人	
# -------------------------------	
	
from aip import AipSpeech	
import requests	
import json	
import speech_recognition as sr	
import win32com.client	
	
# 初始化语音	
speaker = win32com.client.Dispatch("SAPI.SpVoice")	
	
	
# 1、语音生成音频文件,录音并以当前时间戳保存到voices文件中	
# Use SpeechRecognition to record 使用语音识别录制	
def my_record(rate=16000):	
    r = sr.Recognizer()	
    with sr.Microphone(sample_rate=rate) as source:	
        print("please say something")	
        audio = r.listen(source)	
	
    with open("voices/myvoices.wav", "wb") as f:	
        f.write(audio.get_wav_data())	
	
	
# 2、音频文件转文字：采用百度的语音识别python-SDK	
# 导入我们需要的模块名，然后将音频文件发送给出去，返回文字。	
# 百度语音识别API配置参数	
APP_ID = 'your app_id'	
API_KEY = 'your api_key'	
SECRET_KEY = 'your secret_key'	
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)	
path = 'voices/myvoices.wav'	
	
	
# 将语音转文本STT	
def listen():	
    # 读取录音文件	
    with open(path, 'rb') as fp:	
        voices = fp.read()	
    try:	
        # 参数dev_pid：1536普通话(支持简单的英文识别)、1537普通话(纯中文识别)、1737英语、1637粤语、1837四川话、1936普通话远场	
        result = client.asr(voices, 'wav', 16000, {'dev_pid': 1537, })	
        # result = CLIENT.asr(get_file_content(path), 'wav', 16000, {'lan': 'zh', })	
        # print(result)	
        # print(result['result'][0])	
        # print(result)	
        result_text = result["result"][0]	
        print("you said: " + result_text)	
        return result_text	
    except KeyError:	
        print("KeyError")	
        speaker.Speak("我没有听清楚，请再说一遍...")	
	
	
# 3、与机器人对话：调用的是图灵机器人	
# 图灵机器人的API_KEY、API_URL	
turing_api_key = "your turing_api_key"	
api_url = "http://openapi.tuling123.com/openapi/api/v2"  # 图灵机器人api网址	
headers = {'Content-Type': 'application/json;charset=UTF-8'}	
	
	
# 图灵机器人回复	
def Turing(text_words=""):	
    req = {	
        "reqType": 0,	
        "perception": {	
            "inputText": {	
                "text": text_words	
            },	
	
            "selfInfo": {	
                "location": {	
                    "city": "北京",	
                    "province": "北京",	
                    "street": "西二旗"	
                }	
            }	
        },	
        "userInfo": {	
            "apiKey": turing_api_key,  # 你的图灵机器人apiKey	
            "userId": "Nieson"  # 用户唯一标识(随便填, 非密钥)	
        }	
    }	
	
    req["perception"]["inputText"]["text"] = text_words	
    response = requests.request("post", api_url, json=req, headers=headers)	
    response_dict = json.loads(response.text)	
	
    result = response_dict["results"][0]["values"]["text"]	
    print("AI Robot said: " + result)	
    return result	
	
	
# 语音合成，输出机器人的回答	
while True:	
    my_record()	
    request = listen()	
    response = Turing(request)	
    speaker.Speak(response)

09-结束语

至此，我们就构建了一个完整的语音对话机器人，它可以在你无聊、寂寞、有压力、想开心的时候出现在你身边，哄你开心哟！这个机器人太聪明了，你可千万不要被她调戏了！

对了，你可以在图灵机器人官网里面进行人物设置，设置她的姓名、年龄和星座，我的机器人叫做小橘子，她具有十八般武艺，它能够闲聊、做数字计算、中英互译、讲故事、笑话、脑筋急转弯、歇后语、绕口令、顺口溜、玩成语接龙游戏，天气和日期查询，功能还是比较强大的！如果开通

付费版本就会拥有更多功能哦，可以训练自己的语料库，目前免费版只支持每天100次的调用，真真是不够用呀！

附带一下我和小度的聊天视频吧，有心的小伙伴可以做个前端页面哦！

优酷视频：https://v.youku.com/v_show/id_XNDI3OTYyMTgwNA==.html?spm=a2h3j.8428770.3416059.1

觉得本文对你有帮助？请分享给更多人

关注「全栈开发者社区」置顶星标，提升全栈技能

本公众号会不定期给大家发福利，包括送书、学习资源等，敬请期待吧！

如果感觉推送内容不错，不妨右下角点个在看转发朋友圈或收藏，感谢支持。

好文章，我在看❤️

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
上位机知识篇---SD卡&U盘镜像
常用的镜像烧录软件balenaEtcherbalenaEtcher是一个开源的、跨平台的工具，用于将操作系统镜像文件（如ISO和IMG文件）烧录到SD卡和USB驱动器中。以下是其使用方法、使用场景和使用注意事项的介绍：使用方法下载安装：根据自己的操作系统，从官方网站下载对应的安装包。Windows系统下载.exe文件后双击安装；Linux系统若下载的是.deb文件，可在终端执行“sudodpkg-
【LeetCode 热题 100】24. 两两交换链表中的节点——（解法一）迭代+哨兵 xumistore LeetCode leetcode 链表算法 java
Problem:24.两两交换链表中的节点题目：给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个经典的链表操作问题：两两交换链表中的节点(SwapNodesinPairs)。问题要求将链表中每两个相邻的节点进行交换
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
前端项目架构设计要领
1.架构设计的核心目标在设计前端项目架构时，核心目标是模块化、可维护、可扩展、可测试，以及开发效率的最大化。这些目标可以通过以下几个方面来实现：组件化：将UI功能封装为可复用的组件。模块化：将业务逻辑分解为独立的模块或服务。自动化构建与部署：实现自动化构建、测试和部署流程，减少人为操作的错误。代码规范化与检查：确保团队协作时，代码风格和质量一致。2.项目目录结构设计一个清晰合理的目录结构对大型项目
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
22、文档：Google Docs的强大与易用性 pear55 探索云技术的无限可能 Google Docs 云端文档语音输入
文档：GoogleDocs的强大与易用性1.GoogleDocs简介GoogleDocs是Google提供的在线办公套件的一部分，它是一个基于云端的文字处
docker-compose方式搭建lnmp环境——筑梦之路筑梦之路 linux系统运维国产化 docker android adb
docker-compose.yml文件#生成docker-compose.ymlcat>docker-compose.ymlnginx/conf.d/default.conf">www/index.phpecho"开始启动服务..."docker-composeup-d#获取本机ipip_addr=$(hostname-I|awk'{print$1}')echo"部署完成！"echo"访问测试页
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Android ViewBinding 使用与封装教程积跬步DEV Android 开发实战大全 android
AndroidViewBinding使用与封装教程：一、ViewBinding是什么？核心功能：为每个XML布局文件自动生成一个绑定类（如ActivityMainBinding），直接暴露所有带ID的视图引用。优点：避免繁琐的findViewById()，类型安全且编译时检查。对比DataBinding：ViewBinding仅处理视图引用，无数据绑定功能。DataBinding支持双向数据绑定，
理解TCP连接中的进程阻塞与CPU调度机制 109702008 编程 #C语言网络 tcp/ip 网络人工智能
引言在计算机网络通信中，TCP连接的建立是一个经典的三次握手过程。当用户调用connect()函数发起连接时，内核会发送SYN报文并等待对方的SYN-ACK响应。此时，调用进程通常会进入阻塞状态，暂停执行直至连接成功或超时。这一机制看似简单，但其背后的内核实现却涉及进程调度、等待队列管理和CPU资源分配等复杂操作。本文将深入探讨阻塞状态的实现原理，并解析CPU在进程阻塞期间的行为。一、进程阻塞的实
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
《分片终章的哈希裂痕：藏在数据拼接里的隐形逻辑》前端
在大文件分片传输里，有一个令人费解的现象：当所有分片的校验都显示正常，拼接后的整体文件却与源文件的哈希值不符，而问题往往精准地指向最后一片。这并非偶然的技术故障，而是数据传输链条中多重隐形逻辑交织的必然结果，如同钟表的齿轮在最后一圈突然出现难以察觉的错位。文件被切割成固定大小的分片时，最后一片往往是规则的例外。它如同拼图中形状特异的收尾piece，尺寸可能小于其他分片，却承担着衔接整体的关键作用。
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
基于架构的软件设计（Architecture-Based Software Design，ABSD）是一种以架构为核心的软件开发方法
ABSD方法与生命周期基于架构的软件设计（Architecture-BasedSoftwareDesign，ABSD）是一种以架构为核心的软件开发方法，强调在开发的各个阶段都要以架构为中心，确保系统的整体结构和质量属性得到有效管理。ABSD方法是一个自顶向下、递归细化的过程，软件系统的架构通过该方法得到细化，直到能产生软件构件和类。ABSD方法的三个基础功能的分解：使用基于模块的内聚和耦合技术，将
Leetcode 3604. Minimum Time to Reach Destination in Directed Graph Espresso Macchiato leetcode笔记 leetcode 3604 leetcode medium leetcode双周赛160 BFS 广度优先遍历最优路径
Leetcode3604.MinimumTimetoReachDestinationinDirectedGraph1.解题思路2.代码实现题目链接：3604.MinimumTimetoReachDestinationinDirectedGraph1.解题思路这一题思路上就是一个广度优先遍历，我们不断考察当前时间点以及位置的情况下，下一个点可行的位置，然后考察最近的时间点能够到达的位置，遍历全部可能
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
vue keep-alive标签的运用
keep-alive，想必大家都不会很陌生，在一些选项卡中会使用到。其实，它的作用大概就是把组件的数据给缓存起来。比如果我有一个选项卡，标签一，标签二，标签三。现在，我需要实现，当我在标签一的表单中输入内容后，点击标签二，再回到标签一，表单的内容依然存在。如果按以往的做法，不使用keep-alive，那是不能实现的。然而，我们只需要在选项卡的内容最外层包一个keep-alive标签即可。但这儿有一
C++ 设计模式：抽象工厂（Abstract Factory）冀晓武 C++设计模式 c++设计模式抽象工厂模式
链接：C++设计模式链接：C++设计模式-工厂方法链接：C++设计模式-原型模式链接：C++设计模式-建造者模式抽象工厂（AbstractFactory）是一种创建型设计模式，它提供一个接口，用于创建一系列相关或相互依赖的对象，而无需指定它们的具体类。抽象工厂模式通常用于创建一组相关的产品对象，例如不同类型的机器人和它们的配件。1.问题分析在某些情况下，我们需要创建一组相关或相互依赖的对象，但我们
Redis Sentinel（哨兵）和 Redis Cluster（集群） G丶AEOM 八股普通学习区 Redis redis 数据库缓存
哨兵机制和集群有什么区别Redis集群主要有两种，一种是RedisSentinel哨兵集群，一种是RedisCluster。主从集群，包括一个Master和多个Slave节点，Master负责数据的读写，Slave负责数据的读取，Master上收到的数据变更会同步到Slave节点上实现数据同步，但不提供容错和恢复，在Master宕机时不会选出新的Master，导致后续客户端所有写请求直接失败。所以
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st

从零开始搭建一个语音对话机器人

01-初心缘由

02-准备工作

03-语音机器人的搭建思路

05-音频文件转文字STT

06-与图灵机器人对话

08-语音对话机器人的完整代码

09-结束语

你可能感兴趣的:(从零开始搭建一个语音对话机器人)