E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语音识别论文笔记
Whisper对于中文
语音识别
与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语音做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过FunAsr,但是经过中文特殊优化的Whisper就未必了。中文文本标注优化Whisper经常被人诟病的一点是对中文语音转写后标点符号的支持不够完备。首先安装whisper:pipinstall-Uo
刘悦的技术分享
·
2024-01-26 08:50
whisper
语音识别
人工智能
深度学习
语言模型
【
论文笔记
】VideoGPT: Video Generation using VQ-VAE and Transformers
论文标题:VideoGPT:VideoGenerationusingVQ-VAEandTransformers论文代码:https://wilson1yan.github.io/videogpt/index.html.论文链接:https://arxiv.org/abs/2104.10157发表时间:2021年9月Abstract作者提出了VideoGPT:一种概念上简单的架构,用于将基于似然的生
来自γ星的赛亚人
·
2024-01-26 06:48
论文阅读
【语音基础】语音相关的基础
语音识别
框架和模型语音采样率
语音识别
资料端到端模型与传统模型的区别传统模型(非端到端模型)传统模型通常由不同的组件组成,例如文本处理模块、声学模型、声码器等等。
liefyuan
·
2024-01-26 00:15
音频
语音识别
FAIR-Wave2Vec 2.0模型介绍
1.自动
语音识别
(ASR)领域介绍自动
语音识别
(ASR)领域的重大突破在过去几年中取得了显著进展,以下是一些关键的发展和里程碑:深度学习的引入:2012年前后,随着深度神经网络(DNN)在
语音识别
领域的应用
科学禅道
·
2024-01-26 00:26
PyTorch
人工智能
语音识别
2016年不可错过的21个深度学习视频、教程和课程
但很快,这个领域就得到了很大的发展,目前已经被应用到很多的领域当中,例如:
语音识别
、图像识别、在一个数据集当中寻找模式、照片中的事物分类、字符文本生成、自动驾驶汽车等等。
wd_cloud
·
2024-01-25 22:31
神经网络
使用 LinkAi 打造自己的知识库和数字人
LinkAi提供的智能
语音识别
和文本分
绿皮龟
·
2024-01-25 19:41
Java基础合集
人工智能
opencv
数据挖掘
语音识别
计算机视觉
目标检测
机器学习
自然语言处理的新突破:如何推动语音助手和机器翻译的进步
基于深度学习的
语音识别
和语义理解技术,使得语音助手可以更准确地分析用户意图,提供个性化服务。
语音识别
精度的持续提高
语音识别
是语音助手的基础。
X_StarX
·
2024-01-25 18:32
自然语言处理
机器翻译
人工智能
利用 “diart“ 和 OpenAI 的 Whisper 简化实时转录
只需几行代码,diart就能让您获得类似这样的实时发言者标签:与此同时,Whisper是OpenAI最新推出的一种为自动
语音识别
(ASR)而训练的模型,它对
vitaminYZZ
·
2024-01-25 18:39
前端
语音识别
(webkitSpeechRecognition)
前端
语音识别
(webkitSpeechRecognition)-CSDN博客Excerpt文章浏览阅读1.8k次,点赞4次,收藏4次。
南七小僧
·
2024-01-25 13:17
服务器开发
网站开发
人工智能
前端
语音识别
人工智能
NLP自然语言处理介绍
NLP涉及多个技术和方法,包括
语音识别
、文本分析、语义理解、机器翻译、情感分析等。通过这些技术,NLP可以处理和分析大量的文本数据,识别文本中的关键信息和结构,并从中提取出有用的知识和洞察。NLP在
love6a6
·
2024-01-25 07:12
nlp
吴军《信息论》中大数据思维应用之
语音识别
印象最深是吴军老师告诉我们飞机的发明不是仿生鸟类翅膀的工作原理,是了解透了空气动力学,加以运用,才实现了人们飞上蓝天的梦想。我们总说要有梦想,除了做梦,还得有思想,把梦拆解成可解决的问题的思考与想法。这些,也是我作为文科生会迷上吴军博士的课程的原因。生活中,我们总要解决各式各样的问题,我们如何拆解问题,把问题变成关于大数据思维在当下最常见,也是最成功的四类应用。第一类是解决人工智能问题,把那些过去
高高_02c9
·
2024-01-25 07:44
物联网毕设 -- 智能语音台灯系统(
语音识别
+蓝牙+STM32)
目录前言一连线图1原理图2PCB效果(开发板不适应)3实物效果4APP界面5功能概括(1)硬件端(2)APP端(3)语音控制端(4)演示视频二底层代码使用方式1.使用说明2.下载程序三APP使用方式下载APP(1)操作方式(2)使用说明前言智能灯的硬件端包括STM32F103C8T6用于中控和模块数据通信,0.96寸OLED用于显示环境数据,光敏电阻实时监测光照数据,旋钮按键用于模式切换和LED调
阿柒学起来
·
2024-01-25 05:29
毕设(物联网)
物联网
语音识别
stm32
蓝牙
毕设
物联网毕设
课程设计
AI Toolkit软件安装教程(附软件下载地址)
该软件套件融合了多种顶尖人工智能技术工具,包括智能聊天机器人、光学字符识别(OCR)、文本到语音(TTS)以及自动
语音识别
(ASR)等。这些强大工具的集成旨在帮助用户优化日常任务,提升工作效能。
羽化飞翔186
·
2024-01-24 22:16
人工智能
HMM+维特比算法
二、理论描述隐含马尔可夫模型被认为是解决大多数自然语言处理问题快速、有效的方法,成功解决了复杂的
语音识别
、机器翻译等问题。HMM是一个五元组(O,Q,O0,A
一个很菜的小猪
·
2024-01-24 12:37
自然语音处理
算法
机器学习
人工智能
日更73|你的工作,会被人工智能取代吗?
它有四组大军:
语音识别
很多人都见识过了,科大讯飞的语音输入法,可以每分钟输入400个汉字,准确率极高,几乎完全可以取代速记员。加上机器翻译,就可以取代同声传译。视觉识别今天也越来越普遍了。
飛妃1224
·
2024-01-24 08:21
顶顶通
语音识别
-“将用户说的话当成静音处理”问题解决步骤
文章目录前言一、问题分析二、步骤前言顶顶通用户在使用asrproxy程序识别时,说话很快或者说的很短,可asrproxy日志却输出“ddtvoiceappid:testfault:3asrfailederror:1desc:silence”的错误。将用户说的话当成静音去处理。这种情况应当如何解决?本文将围绕这个问题提供解决方法:提示:以下是本篇文章正文内容,下面案例可供参考一、问题分析“将用户说的
H4_9Y
·
2024-01-24 08:59
FAQ
语音识别
中间件
在顶顶通呼叫中心中间件(mod_cti基于FreeSWITCH)-与讯飞星火知识大模型对接 实现机器人问答功能
配置测试5.点击呼叫可向机器人提问啦实现目标:希望能够以语音的形式向提问机器人提出问题,机器人语音回答提的问题1.准备工作1.安装了FreeSWITCH2.安装了(mod_cti基于FreeSWITCH)-
语音识别
八方来财,好运连连,万事如意
·
2024-01-24 08:22
语音识别
人工智能
java
深度学习如何入门,如何快速理解深度学习
深度学习算法包括卷积神经网络、循环神经网络和生成对抗网络等,它们在
语音识别
、图像识别、自然语言处理、机器翻译等领域都取得了很大的进展。它使用了深度
打工人何苦为难打工人
·
2024-01-24 08:28
深度学习
论文浅尝 | GMNN: Graph Markov Neural Networks
论文笔记
整理:吴锐,东南大学硕士研究生,研究方向为自然语言处理来源:ICML2019链接:http://proceedings.mlr.press/v97/qu19a/qu19a.pdf问题定义弱监督下的在关系数据中的对象分类
开放知识图谱
·
2024-01-24 08:57
细数
语音识别
中的几个former
目前在
语音识别
领域中,Tranformer已经取代了传统ASR建模方式。近几年关于ASR的研究工作很多都是基于Transformer的改进,本文将介绍其中应用较为广泛的几个former架构。
语音之家
·
2024-01-24 07:58
智能语音
语音识别
人工智能
【花雕动手做】ASRPRO
语音识别
(48)---用N20电机的苗条小车
装修屋子,找了一段墙面布线槽,外槽宽度只有23毫米,截取一段长为24厘米,尝试做个苗条小车先在线槽上安装了二只N20小电机装上二个快餐盒盖做轮子测试一下使用3.7V锂电池的动力系统(视频)https://v.youku.com/v_show/id_XNTEyNTM2NDcyOA==.html?spm=a2hcb.playlsit.page.1苗条小车的动态图准备使用连轴器,测试各种形态的轮子内部的
驴友花雕
·
2024-01-24 06:42
AI语音识别
花雕动手做
开源硬件
语音识别
人工智能
c++
嵌入式硬件
单片机
ASRPRO语音识别
用N20电机的苗条小车
用openai开源的whisper部署自己的
语音识别
系统秒杀收费产品
openai开源了自己的
语音识别
项目whisper,可将视频和语音文件转为文字,个人认为效果可以比肩科大讯飞的收费产品,并且无需GPU,普通配置就可以运行。
Java斌
·
2024-01-24 03:40
开源
whisper
语音识别
论文笔记
:SelfHAR: Improving Human Activity Recognition through Self-training with Unlabeled Data
Proc.ACMInteract.Mob.WearableUbiquitousTechnol.20211intro1.1背景——人类活动识别(HAR)旨在准确分类人类的物理活动传统方法——依赖于滑动窗口分割和手工特征提取,然后通过各种监督学习技术来识别简单和复杂的活动,如行走、跑步、骑自行车深度学习方法自动提取目标任务的有用特征——>更有效两种方法的局限性受到常规实验室HAR数据集引入的偏见和限制
UQI-LIUWJ
·
2024-01-23 22:08
论文笔记
论文阅读
MOE介绍 混合专家模型
GShardarxiv链接GShard模型架构图:参考GShard
论文笔记
(1)-MoE结构可知,MOE具备以下几种特点:改造了原本的FFN层,变成Gate+n个FFN层。
duoyasong5907
·
2024-01-23 22:50
人工智能
自然语言处理(NLP)
以下是一些常见的NLP技术和应用的例子:
语音识别
:将人类语言转换为计算机可理解的文本。例如,虚拟助手如Siri和Alexa可以通过识别用户的语音指令来执行特定的任务。
先------------------
·
2024-01-23 19:09
自然语言处理
人工智能
第2章 大模型的基础知识2.2 大模型的关键技术2.2.1 模型架构
1.背景介绍1.背景介绍大模型是现代人工智能的核心技术之一,它们在自然语言处理、图像识别、
语音识别
等领域取得了显著的成果。大模型的关键技术之一是模型架构,它决定了模型的性能和效率。
OpenChat
·
2024-01-23 16:00
机器学习开发实战代码案例详解
大数据
人工智能
语言模型
AI
LLM
Java
Python
架构设计
Agent
RPA
【AI军事竞赛】AI Chat Bot 的应用编辑平台
AI腾讯中国机器学习、语音和图像识别https://cloud.tencent.com3百度智能云百度中国机器学习、自然语言处理https://cloud.baidu.com4讯飞开放平台科大讯飞中国
语音识别
临水逸
·
2024-01-23 13:39
人工智能
自然语言处理中的查准率与查全率的关键技术,以及自然语言处理中的查准率与查全率具体实例与策略
自然语言处理涉及到许多子领域,如
语音识别
、机器翻译、情感分析、文本摘要、文本分类等。在这些任务中,查准率(Precision)和查全率(Rec
代码讲故事
·
2024-01-23 08:24
机器人智慧之心
自然语言处理
人工智能
NLP
情感分析
文本分类
查全率
查准率
深入学习卷积神经网络(CNN)的原理知识
在深度学习领域中,已经经过验证的成熟算法,目前主要有深度卷积网络(DNN)和递归网络(RNN),在图像识别,视频识别,
语音识别
领域取得了巨大的成功,正是由于这些成功,能促成了当前深度学习的大热。
AAI机器之心
·
2024-01-23 08:20
cnn
人工智能
KNN
深度学习
机器学习
神经网络
tensorflow
科技发展下的未来生活
科大讯飞在
语音识别
、深度算法等方面是一家非常优秀的公司,由18个中科大高材生在学生时代1999年组建并发展到今天,团队稳定,技术扎实,在
语音识别
、自然语音合成、语义理解、影像识别等很多方面有很深的沉淀,
nxzh
·
2024-01-23 08:58
2023-2024深度学习框架之争——选pytorch还是tensorflow?
深度学习是人工智能领域的一个重要分支,它利用多层神经网络来模拟人类的学习和推理能力,解决各种复杂的问题,如图像识别、自然语言处理、
语音识别
、推荐系统等。
NCHU-Net
·
2024-01-23 07:43
人工智能
人工智能
深度学习
pytorch
tensorflow
Drivable 3D Gaussian Avatars
论文笔记
Drivable3DGaussianAvatars
论文笔记
主要的算法架构和贡献是什么?如何使用这个deformation呢?主要的算法架构和贡献是什么?
Gamma and Beta
·
2024-01-23 07:37
读博笔记
3d
论文阅读
深度学习
人体三维重建
人工智能第三版|chap01|task01
应用和方法搜索算法和拼图问题二人博弈【对抗性游戏】自动推理产生式规则和专家系统细胞自动机神经计算遗传算法【GA】知识表示不确定性推理人工智能早期历史逻辑学家与逻辑机器人工智能近期历史到现在新千年人工智能的发展名词集合机器人、
语音识别
speoki
·
2024-01-23 04:09
人工智能
Viterbi算法
在
语音识别
中,声音信号作为观察到的事件序列,而文本字符串被看作是隐含的产生声音信号的原因,因此可对声音信号应用维特比算法寻找最有可能的文本字符串。
搬砖人NO17
·
2024-01-23 01:11
语音
神经网络共同学习
算法
LSTM解读
在自然语言处理、
语音识别
、图像处理等领域应用广泛。结构图如下:通过遗忘门、输
搬砖人NO17
·
2024-01-23 01:41
语音
神经网络共同学习
lstm
人工智能
rnn
情感
语音识别
的入门解析
关于情感
语音识别
领域的研究距今已有二三十余年的历史。不管是情感
语音识别
,还是语音情感识别,含义是一样的,都是对带有情感的语音信号进行情感的正确判断。
夜幕下的光123
·
2024-01-22 17:25
情感语音识别
语音信号
自然语言处理的发展
本文将对NLP技术进步的方方面面展开阐述,包括词嵌入、循环神经网络、Transformer、注意力机制等关键技术的发展,以及NLP在机器翻译、情感分析、智能客服、
语音识别
等领域的应用。
Java之弟
·
2024-01-22 05:27
自然语言处理
自然语言处理
人工智能
ICASSP 2024丨上海交通大学跨媒体语言智能实验室14篇入选论文分享
论文方向涵盖
语音识别
、语音合成、音色转换、情感识别、音频生成、关键词检测、数字人生成、口语语义理解、对话状态跟踪、声音
希尔贝壳AISHELL
·
2024-01-22 01:38
智能语音
人工智能
语音识别
2022-05-05《当产品经理遇到人工智能》读书笔记08 语音合成技术的产品应用
就是语音合成技术TSS2、认识语音合成技术两大类主流方法:参数法和拼接法3、语音合成系统构成语音信号的模型由三部分组成:激励模型、声道模型、辐射模型,分别模仿人的声带、声道和嘴唇典型的人机对话系统涉及6个技术模块
语音识别
器语言解析器问题求解模块语言生成器对话管理模块语音合成器
May_1013
·
2024-01-21 20:17
论文笔记
|Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting
ConvolutionalLSTMNetwork:AMachineLearningApproachforPrecipitationNowcasting论文地址一、摘要这篇文章是来自香港科技大学的团队,这个团队有和香港观测站合作,他们有一个前身的工作还有数据都是靠这个机构来收集的。这篇论文利用convolutionLSTM对降雨预报进行预测。他们的这个工作是用来做对天气的预测,他们收集了很多很多的雷
缸里有绿粥
·
2024-01-21 16:49
生产力与生产关系 —— 语音转文字,抛开键盘输入
生产力与生产关系——语音转文字,抛开键盘输入自从用了语音转文字的识别软件之后,我的码字速度有了快速的提高,现在的这段文字就是我通过
语音识别
生成的,传统的键盘输入在自己一个人的时候不太合适,那个速度太慢了
键盘国治理专家
·
2024-01-21 12:09
生产力与生产关系
生产力
数学之美一两处
引言吴军博士的《数学之美》科普性地介绍了自然语言处理、搜索引擎、
语音识别
、智能导航等人工智能应用,一些看似很智能、高大上的应用,其背后的数学原理往往却并不复杂,体现了数学之美!
快乐的阿常艾念宝
·
2024-01-21 10:43
数学之美
机器学习
数学之美
机器学习
信息指纹
加法交换律
自然语言处理的就业前景
在就业方面,计算机自然语言处理领域主要涉及人工智能、自然语言处理、机器学习、
语音识别
、信息检索等方面的工作,包括算法工程师、数据分析师、自然语言处理工程师、语音处理工程师、信息检索工程师等职位。在科技
人工智能技术与咨询
·
2024-01-21 08:50
自然语言处理
人工智能
Al和算力造就未来主流
其应用领域包括图像识别、
语音识别
、自然语言处理、机器学习、智能推荐等。算力是指计算机的处理能力或计算速度。它
Qt魔术师
·
2024-01-21 08:19
活动+兴趣+分享课件
人工智能
深度学习
机器学习
《CLRNet:Cross Layer Refinement Network for Lane Detection》
论文笔记
Abstract在智能汽车的视觉导航系统中,车道至关重要。当然,车道是一种具有高级语义的交通标志,而它具有特定的局部模式,需要详细的低级特征才能准确定位。使用不同层次的特征对于准确检测车道非常重要,但目前还没有得到充分的研究。在这项工作中,我们提出了跨层细化网络(CLRNet),旨在充分利用高层和低层特征进行车道检测。具体来说,它首先利用高级语义特征检测车道,然后根据低级特征进行细化。这样,我们就
大龙唉
·
2024-01-21 06:34
论文阅读
论文阅读
论文笔记
-‘Confidence-Guided Self Refinement for Action Prediction in Untrimmed Videos’
论文笔记
:‘Confidence-GuidedSelfRefinementforActionPredictioninUntrimmedVideos’Author:JingyiHou,XinxiaoWu,
不知道叫什么==>
·
2024-01-21 05:00
论文阅读笔记
深度学习
神经网络
计算机视觉
论文笔记
:基于CLIP引导学习的多模式假新闻检测
整理了ICME2023MultimodalFakeNewsDetectionviaCLIP-GuidedLearning)论文的阅读笔记背景模型实验背景 对于我们这一代人来说,在线社交网络在很大程度上取代了以报纸和杂志为代表的传统信息交流方式。人们喜欢在社交媒体上寻找朋友或分享观点。然而,在线网络也促进了假新闻的广泛和快速传播。 文中提出了一个FND-CLIP框架,即基于对比语言-图像预训练(
图学习的小张
·
2024-01-21 05:55
论文笔记
论文阅读
学习
视频异常检测
论文笔记
看几篇中文的学习一下别人的思路基于全局-局部自注意力网络的视频异常检测方法主要贡献:网络结构注意力模块结构:融合自注意力和自编码器的视频异常检测主要贡献:网络结构Transformer模块动态图融合门控自注意力机制的生成对抗网络视频异常检测贡献网络结构门控注意力机制基于全局-局部自注意力网络的视频异常检测方法文章信息:链接:https://kns.cnki.net/kcms2/article/ab
何大春
·
2024-01-21 05:54
论文阅读
音视频
论文阅读
python
深度学习
神经网络
人工智能
【NLP】灵魂提问:自然语言处理(NLP)技术是什么?
它可以应用于多个领域,包括自动翻译、
语音识别
、情感分析、问答系统等。
HackPig520
·
2024-01-20 22:27
自然语言处理
人工智能
10.7假期最后一天
发现平板的
语音识别
能力很强大,中英文翻译很准确。晚上做一题奥数,又不懂脑筋,爸爸差点又发火?真是一个高学压?一个糖尿病?这可怎么整啊?要么不讲话,一辅导就上火。
和垚垚共同进步
·
2024-01-20 22:18
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他