语音识别(speech 第38页

2018-11-02

Hisspeechischaracterizedbyhumorandinspiration,whichholdsspecialappealfortheau

hongmei_yoyo·2023-07-20 14:34

《SEGAN: Speech Enhancement Generative Adversarial Network》论文阅读

本文的作者是SantiagoPascual，AntonioBonafonte，JoanSerra。研究动机目前语音增强的技术都是用在频谱域上或者高维特征上，这样的话，大多数的音频处理会受到噪声环境数量的限制并且依赖一阶统计特征。为了解决这些问题，深度网络是可以从大型的数据集上学习到复杂的映射。本论文中，提出了增强GAN网络，名叫SEGAN，它是直接用时域的波形当作输入送入到网络当中去的，在看不见的

qq_46079584·2023-07-20 14:12

语音识别预处理---语音转文字

平台：百度语音识别环境：win7+python3利用百度语音识别，由于百度限制了语音文件格式（pcm（不压缩）、wav（不压缩，pcm编码）、amr（压缩格式））和8k/16k采样率、16bit位深、单声道

长毛先生·2023-07-20 13:40

语音采集是用来干嘛的，语音采集兼职有危险吗

语音采集是一项关键技术，被广泛运用于各个领域，如人机交互、智能助理、语音识别等。然而，随着技术的快速发展，一些安全与隐私问题也逐渐浮出水面。本文旨在介绍语音采集的应用，并探讨其中的潜在危险。

配音就业圈·2023-07-20 09:30

人工智能唤醒词录音采集兼职

而在构建高质量语音识别模型的过程中，人工智能唤醒词的录音采集成为了至关重要的一环。本文将探讨人工智能唤醒词录音采集兼职的主题，深入分析其中的机遇与挑战。

配音就业圈·2023-07-20 09:22

语音数据采集兼职，语音采集兼职有危险吗

配音就业圈·2023-07-20 09:18

录音采集兼职是什么，录音采集兼职是真的吗

随着科技的不断进步，各类语音识别和语音助手软件变得越来越智能化。为了提升这些系统的准确性和反应速度，厂商和开发者需要大量的录音数据进行训

配音就业圈·2023-07-20 09:11

vue3中使用speak-tts插件进行语音播报

speak-tts插件npmispeak-tts官方地址包含更多配置等信息下面将简单模拟一下如何在vue组件中使用template{{$t('home.title')}}js//先引入下载好的插件importSpeechfrom'speak-tts

Colesyn L.·2023-07-20 05:12

从云存储的角度浅显的聊一聊 AIGC

人工智能在过去十年中从实验室走向产业化生产，在语音识别、文本识别、视频识别等感知领域取得了巨大突破。现在，你要是还没听过“通义千问”、“通义听悟”，出门都不好意思和别人打招呼。

阿里云云栖号·2023-07-20 04:27

机器学习：Self-supervised Learning for Speech and image

review:self-supervisedlearningfortextSelf-supervisedlearningforspeech使用Speech版本的bert能比较好的作用于语音任务上，如果没有

uncle_ll·2023-07-20 01:12

将大模型集成到语音识别系统中的例子

概述本文旨在探索将大型语言模型（LLMs）集成到自动语音识别（ASR）系统中以提高转录准确性的潜力。

无数据不智能·2023-07-19 22:25

2023最新ChatGPT商业运营网站系统源码+支持ChatGPT4.0+支持ai绘画+新增GPT联网功能+插件功能+Prompt角色功能+实时语音识别输入

白云如幻·2023-07-19 22:56

2023最新ChatGPT商业运营网站源码+支持ChatGPT4.0+新增GPT联网功能+支持ai绘画+实时语音识别输入+用户会员套餐+免费更新版本

白云如幻·2023-07-19 22:22

孪生网络用于分类任务（附pytorch代码）

这种网络通常用于比较两个输入的相似性，例如比较图像中的人脸或语音识别中的语音。在分类任务中，我们将使用孪生网络来比较两个输入，以确定它们是否属于同一类别。

100分100开心·2023-07-19 18:12

我们所看到的迎宾机器人，真的好用吗？

迎宾机器人是集语音识别技术和智能运动技术于一身的高科技产品，给人以真切质感，体现人性化。他不但可以认识你，可以服务你，甚至可以让我们的生活、工作及交流更舒适，更轻松。它也可以切换各种身份

sousuozhe_er·2023-07-19 10:29

AVSpeechSynthesizer 语音合成器

原文：https://developer.apple.com/documentation/avfoundation/avspeechsynthesizerAVSpeechSynthesizer可以使iOS

Xtuphe·2023-07-19 08:03

003_wz_wed_深度学习概论-用神经网络进行监督学习

监督学习应用1.通过房屋特点预测价格2.对用户投放指定在线广告3.给图像打标签4.语音识别（语音-->文本）5.机器翻译6.无人驾驶监督学习应用对于1和2，我们常用标准神经网络，对于3常用CNN，对于4

王泽0106·2023-07-18 15:42

chatgpt赋能python：简单好玩的Python程序——让你爱上编程

代码让程序说话Python中有一个库叫作Text-to-Speech(TTS)，它可以让你的代码变得有声有色。以下是一个简单的例子，能够将你输入的文本转换为机器

laingziwei·2023-07-18 14:15

英文视频实时字幕翻译

使用阿里云进行语音识别，使用腾讯云进行实时翻译。一、阿里云阿里云官网：https://www.aliyun.com/没有注册和实名认证的，请注册和实名认证一下，可以使用支付宝登录很快认证结束。

冬天的李同学·2023-07-18 10:45

对抗样本生成系列：FGSM和DeepFool

摘要：近些年来，深度学习技术在海量数据以及强大计算能力的驱动下取得了长足的发展，特别是在语音识别、计算机视觉、自然语言处理等领域，深度学习以其强大的网络表达能力刷新了一项又一项记录，各种各样基于深度学习的产品和服务也逐渐在产业界落地应用

小生很忙·2023-07-18 09:37

[iOS开发]AVFoundation浅学习

正文合成语音：-(void)speakHintMessage{//这样子可以简单的播放一段语音AVSpeechSynthesizer*synthesizer=[[AVSpeechSynthesizeralloc

Billy Miracle·2023-07-18 01:29

原来人工智能机器人的原理是这样的！

智能语音识别系统因其重要性而独立开发。智能的研发理念是满足更多个性化的外部呼叫需求，满足消费者的需求，提升背

欧能科技·2023-07-18 01:19

FFmpeg之音频重采样

为什么要重采样从设备采集的音频数据与编码器要求的数据不一致扬声器要求的音频数据与要播放的音频数据不一致更方便运算（回音消除须使用单声道，需要先转换）比如说语音识别，需要很低的采样率就可以了，高了增加了数据量

蓝天巨人·2023-07-17 17:45

一文告诉你智能语音中的VAD模块为什么这么重要

在进行语音识别的过程中，系统的处理对象是有效语音信号。尤其在在多人说话的情况下，如果不对输入信

蟪蛄不知·2023-07-17 15:31

机器学习半监督学习

半监督学习的应用包括图像分类、文本分类、语音识别、网络安全和异常检测等。在这些应用中，

薛定谔的猫1992·2023-07-17 15:37

深度学习神经网络

神经网络算法在图像识别、语音识别、自然语言处理等领域有广

薛定谔的猫1992·2023-07-17 15:34

辅助驾驶功能开发-功能规范篇(21)-4-XP行泊一体方案功能规范

OuXiang20231314XPilotParking自动泊车系统•超级自动泊车辅助（SuperAutoParkingAssist）、语音控制泊车辅助（AutoparkingwithSpeech）-产品定义超级自动泊车辅助是

保持理智+相信未来·2023-07-17 14:10

语音情感识别技术

aipersonal/Speech-Emotion-Recognition:SpeechemotionrecognitionusingLSTM,SVMandMLP|语音情感识别(github.com)

LANWENBING·2023-07-17 14:54

python开发项目基于语音识别的智能垃圾分类系统的设计与实现

博主介绍：擅长Java、微信小程序、Python、Android等，专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟Java项目精品实战案例（300套）Java微信小程序项目实战（200套）Python项目精品实战案例（100套）目录一、效果演示二、前言介绍三、主要技术3.1、PYTHON语言：2.2、MySQL数据库：3.3、Django技术：四、系统设计4

阳光倾洒·2023-07-17 11:23

演讲课程的学习

整理人：幽灵老师时间：3小时YourspeechobjectivesSomepeopleliketobeseenandenjoyperforming.Othersdon't.Mostofthetime,

宇宙公民幽灵老师·2023-07-17 11:34

基于单片机的语音识别智能垃圾桶垃圾分类的设计与实现

功能介绍以51单片机作为主控系统；液晶显示当前信息和状态；通过语音识别模块对当前垃圾种类进行语音识别；通过蜂鸣器进行声光报警提醒垃圾桶已满；采用舵机控制垃圾桶打开关闭；超声波检测当前垃圾桶满溢程度；整个电路以

咸鱼弟·2023-07-17 11:38

智能家居项目

该项目架构是简单工厂模式，将每一个功能写成一个文件，分控制工厂和设备工厂；用线程池放不同功能的线程项目实现功能：1.通过语音识别指令开关灯2.通过网络开光灯3.实现火灾报警4.通过语音识别来实现人脸识别

my hope !·2023-07-17 10:19

洗洗睡了 | 尝试语音输入记录思路

语音识别的部分我觉得还是从零开始吧。我刚刚发微博说，语音输入板的识别率很高。发完之后，就打开了昨天晚上的日记录音，然后是作为输入源，我就发现其实错的字还是蛮多的。

Burke_liu·2023-07-17 06:11

焱武记：Day 238（补记）

keynotespeech.

hmisty·2023-07-17 03:29

什么是人工智能大模型？

这些大模型在自然语言处理、计算机视觉、语音识别等领域展现了强大的性能和能力。以下是对人工智能大

Web3&Basketball·2023-07-17 02:56

一文总结语音识别必备经典模型

本文将分3期进行连载，共介绍17个在语音识别任务上曾取得SOTA的经典模型。

qiqi_ai_·2023-07-16 19:21

基于单片机语音识别智能家居系统的设计与实现

功能介绍以STM32单片机作为主控系统；液晶显示当前环境温湿度，用电器开关状态通过语音模块识别设定的语音；DHT11进行环境温湿度采集；通过语音播报模块报当前温湿度，智能回复通过语音识别可以打开灯，窗帘

CC呢·2023-07-16 18:25

C#实现百度AI-实时语音识别转写-附源码

好久没来做贡献了，今天贴一个最近弄的一个小东西，实时语音识别，该技术目前已经很普遍，不做过多介绍了网上找了很久，没有找到例子，不是要分就是要分，我只想说，程序猿何苦为难程序猿。。。。

xiaoyezi002·2023-07-16 16:18

深度前馈网络(DNN)：理解、应用和Python示例

3.2前馈传播3.3反向传播和参数更新4.深度前馈网络的应用4.1图像分类4.1.1数据预处理4.1.2模型选择与训练4.1.3迁移学习4.1.4数据增强4.1.5模型评估与调优4.1.6实际应用4.2语音识别

轩Scott·2023-07-16 14:04

基于静态和动态特征融合的语音情感识别层次网络

题目HierarchicalNetworkbasedontheFusionofStaticandDynamicFeaturesforSpeechEmotionRecognition时间2021年期刊\会议

uuu_柚子·2023-07-16 13:36

通过使用URL获得云端音频长度

业务需求：前端提供URL，后端需要在不下载音频的情况下计算出音频的长度，并向上取整解决方法：通过URL和AudioInputStream来获得音频流，分析头并计算URLaudioURL=newURL(getSpeechRequest.getAudioUrl

浪巫谣·2023-07-16 13:15

1V1直播源码开发搭建技术实时语音识别翻译功能的应用

语言是我们人类交流的工具，它的种类繁多，比如世界语言，像是中国的汉语、英国的英语、法国的法语等；又或是我们中国的方言，像是山东话、北京话、上海话等。可谓是五花八门，争奇斗艳，每一种世界语言或是方言都有他独特的风格，但语言种类繁多的同时，这也为不同地方的人们带来了一个问题：世界语言与方言各有不同，包括文字或说出话音调与词语不同，会让人很难以交流，这时候，大家可能想到一个职业或一种人能轻松解决语言不通

山东布谷科技小魏·2023-07-16 13:10

One Model To Learn Them All原文谷歌翻译版本

摘要深度学习在许多领域产生了巨大的成果，从语音识别，图像分类，翻译。但是，对于每一个问题，深入研究模型都需要对体系结构和长时间的调整进行研究。

moggynaa·2023-07-16 12:16

2020-3-5 深度学习笔记12 - 深度学习应用 4（其他应用-推荐系统 / 知识表示、推理和回答）

第十二章应用中文官网英文原版2020-2-29深度学习笔记12-深度学习应用1（大规模深度学习）2020-3-1深度学习笔记12-深度学习应用2（计算机视觉，语音识别）2020-3-2深度学习笔记12-

没人不认识我·2023-07-16 12:31

用 pesq 给 soundfile 读取的录音数据打分

音频文件来源NOIZEUS:Noisyspeechcorpus-Univ.Texas-Dallas很多python库都能计算pesq分数，如pypesq跟pesq两个库，这里讲的的是pesq的库importsoundfileassffrompesqimportpesq

半截木头渡海洋·2023-07-16 10:05

2021-05-12【Blog Day46】今天休息

7:35-8:00TEDTalk8:00-9:00MVCPresentation10:10-11:10DecapSpeechTEDTalk《Howtobehappyeveryday?

潘冠中Arthur·2023-07-16 10:57

(vue)vue项目实现语音播报

(vue)vue项目实现语音播报解决参考1：在Vue项目中，你可以使用WebSpeechAPI中的SpeechSynthesis接口来实现文本内容的自动朗读。

nyf_unknown·2023-07-16 08:38

【NLP入门教程】目录

NLP的应用范围广泛，涵盖机器翻译、文本分类、情感分析、问答系统、语音识别等诸多领域。本教程旨在为初学者提供一份全面而系统的NLP入门指南，探索NLP的核心概念、方法和技术。无论您是计

晨星同行·2023-07-16 07:58

推荐频道

语音识别(speech