E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语音识别论文笔记
python 视频剪辑软件_用Python玩转视频剪辑,秀的飞起!
1前言半个月前,后台有个小伙伴问我,如何将视频中的音频提取出来,并且将声音转成文字写入到word中,正好接下来的文章要用到百度的
语音识别
接口。
卜可卜言
·
2023-11-05 12:56
python
视频剪辑软件
【whisper】在python中调用whisper提取字幕或翻译字幕到文本
其中有需要将视频提取字幕的需求,在我们实现过程中分为两步:先将音频分离,然后就用到了whisper来进行
语音识别
或者翻译。
w7h1te
·
2023-11-05 10:27
业务场景
python
whisper
python
开发语言
META-LEARNING WITH ATTENTION FOR IMPROVED FEW-SHOT LEARNING
论文笔记
好久没看到这么好的论文了,这才是论文嘛~普林斯顿大学的ZejiangHou(没找到中文名可能是侯泽江?)论文主要就是在MAML的基础上添加了三个部分,一个是和L2F类似的用额外网络通过输入中间变量或梯度信息计算一个权重来动态调整模型参数达到task-specific的效果,另一个是一种特殊线性分类器构造方法用于作分类器,最后一个是在inner_loop中按无监督手段把queryset里数据视为无标
李耕_嘿嘿嘿黑龙江哈哈哈哈尔滨
·
2023-11-05 07:37
android 语音评价,Android 轻松实现
语音识别
/**Copyright(C)2008TheAndroidOpenSourceProject**LicensedundertheApacheLicense,Version2.0(the"License");*youmaynotusethisfileexceptincompliancewiththeLicense.*YoumayobtainacopyoftheLicenseat**http://ww
Nate Hillick
·
2023-11-05 06:00
android
语音评价
英语
语音识别
_英语
语音识别
_英语
语音识别
软件 - 云+社区 - 腾讯云
腾讯云
语音识别
服务开放实时
语音识别
、一句话识别和录音文件识别三种服务形式,满足不同类型开发者需求...
语音识别
简介腾讯云
语音识别
为企业提供极具性价比的
语音识别
服务被微信王者荣耀腾讯视频等大量内部业务使用外部落地录音质检会议实时转写法庭审讯记录语音输入法等多个场景产品文档产品视
编程大乐趣
·
2023-11-05 06:26
以语音评测的PC端demo代码为例,讲解口语评测如何实现
腾讯智慧教育概述腾讯云智聆口语评测(英文版)(SmartOralEvaluation-English,SOE-E)是腾讯云推出的语音评测产品,是基于英语口语类教育培训场景和腾讯云的语音处理技术,应用特征提取、声学模型和
语音识别
算法
腾讯云开发者
·
2023-11-05 06:54
人工智能
语音
云计算
程序员
英语
语音识别
,语言评测,语音打分实践与代码实现
项目在这:couldn/speech-evaluation-of-english详细的可查看项目内的md文档
couldn
·
2023-11-05 06:21
语音识别
人工智能
python
接口
语音评测
[
论文笔记
] SegAN: Adversarial Network with Multi-scale L1 Loss for Medical Image Segmentation
文章于2017年6月提交到Arxiv,投稿于Neuroinformatics(2018),Publishedonline:3May2018作者单位:DepartmentofComputerScienceandEngineering,LehighUniversity文章截止2019.3.25的引用量为50文章代码见github这篇文章主要的创新点在于不同于之前的公式化loss,作者设计了一个可以进行
hellopipu
·
2023-11-05 05:40
论文笔记
GAN
GAN
Segment
AI:51-基于深度学习的电影评价
本专栏包含以下学习方向:机器学习、深度学习、自然语言处理(NLP)、机器视觉、
语音识别
、强化学习、推荐系统、机器学习操作(MLOps)、计算机视觉、虚拟现实(VR)/增强现实(AR)等等✨✨✨在这个漫长
一见已难忘
·
2023-11-04 22:24
AI领域专栏
人工智能
深度学习
speech开源框架_iOS 10 的 Speech 框架实现
语音识别
(Swift)
什么都不说先上效果早在2011年iPhone4s的上,iOS5系统就有了
语音识别
.但有以下缺陷需要-弹出键盘只支持实时语音无法自定义录音单一的输出结果不开放在2016年的WWDC上,Apple终于开放了
语音识别
weixin_39522927
·
2023-11-04 21:28
speech开源框架
Speech 框架构建语音转文本应用详解
在2016年的WWDC上,Apple介绍了一个十分有用的
语音识别
API,那就是Speech框架。事实上,Siri的
语音识别
正是由SpeechKit提供支持。
qq_32506555
·
2023-11-04 21:54
Scaled-YOLOv4: Scaling Cross Stage Partial Network
论文笔记
Scaled-YOLOv4:ScalingCrossStagePartialNetwork论文链接:https://arxiv.org/abs/2011.08036一、ProblemStatementCSPNet的作者用其CSPNet的方法分别从网络的深度,宽度,结构和输入图像的分辨率改善YOLOV4。二、Direction作者发现在RegNet中,CNN最优的深度为60左右,且当bottlene
Tianchao龙虾
·
2023-11-04 20:37
2D目标检测论文笔记
神经网络
深度学习
全志R528核心板和开发板
板载WIFI和BT模块,具备在线
语音识别
/控制和无线音频输入功能;同时提供丰富的外设接口支持,如RGB/MIPI/LVDS显示屏、RMII以太网、USB、SDIO、UART、
lu968968
·
2023-11-04 20:53
语音识别
人工智能
物联网
02:智能视频分段加速,视频延时慢放 03:智能给视频加字幕,
语音识别
加字幕 04:给视频去水印功能,裁剪遮挡去字幕 05:视频加水印,图片水印,漂
02:智能视频分段加速,视频延时慢放03:智能给视频加字幕,
语音识别
加字幕04:给视频去水印功能,裁剪遮挡去字幕www.shipinshanshan.com05:视频加水印,图片水印,漂浮水印,文字水印
视频闪闪
·
2023-11-04 19:39
音视频
语音识别
人工智能
批量视频剪辑
视频剪辑
批量剪辑视频
批量剪辑
【VSLAM系列】三:Vins-Mono
论文笔记
VINs-Mono论文1.VINS-Mono的特点:1.未知初始状态的鲁棒性初始化过程2.带imu-camera外参校准和imu校准的紧耦合,基于非线性优化的单目VIO系统3.在线重定位和四个自由度的全局姿态图优化。4.姿态图可以保存,加载,并和局部姿态图进行合并。2.传感器数据处理摄像头和imu数据融合方法:1.松耦合法,imu是独立于摄像头的模块,常使用EKF算法,imu数据此时用于状态传播,
塞拉摩
·
2023-11-04 19:06
视觉SLAM
论文阅读
数码相机
人工智能
语音识别
学习
给自己挖了个坑,一个课程论文突然让我看起了
语音识别
TAT1.https://blog.csdn.net/lukabruce/article/details/82380511隐马尔可夫模型(HMM)mark
桉豆子
·
2023-11-04 18:38
论文笔记
| TIMESNET: TEMPORAL 2D-VARIATION MODELING FOR GENERAL TIME SERIES ANALYSIS 时序数据1D-2D
文章目录一、==*ThesisKeyMessages*==二、==*KeyPoints*==2.1、==*1D-2D*==2.2、==*TimesBlock*==三、==*ArticleReflection*==1、Motivations2、解决方案的关键3、论文工作成果四、总结与讨论CSDN欲寄:https://blog.csdn.net/qq_62631255一、ThesisKeyMessag
欲寄
·
2023-11-04 17:26
论文笔记
论文阅读
深度学习
神经网络
论文笔记
:TIMESNET: TEMPORAL 2D-VARIATION MODELINGFOR GENERAL TIME SERIES ANALYSIS
ICLR20231intro时间序列一般是连续记录的,每个时刻只会记录一些标量之前的很多工作着眼于时间维度的变化,以捕捉时间依赖关系——>可以反映出、提取出时间序列的很多内在特征,比如连续性、趋势、周期性等但是现实时间序列数据中的时间序列通常是由很复杂的时间特征组成,不同的时间维度上的变化会糅杂在一起,使得建模时间维度的变化异常困难在深度学习领域,很多模型有很强的建模非线性的能力,因而可以捕获时间
UQI-LIUWJ
·
2023-11-04 17:54
论文笔记
深度学习
人工智能
yolo v1
论文笔记
yolov1参考这篇文章https://zhuanlan.zhihu.com/p/46691043摘要weframeobjectdetectionasaregressionproblemtospatiallyseparatedboundingboxesandassociatedclassprobabilities.作者将目标检测问题变成一个回归问题,包括boundingboxes的计算和目标类别的
红鲤鱼遇绿鲤鱼
·
2023-11-04 13:58
论文学习
深度学习
自动驾驶
机器学习
YOLO学习笔记之YOLO v1
论文笔记
1(超详细:翻译+理解)
前言一、Abstract(概括)二、Introduction(介绍)三、UnifiedDetection(统一检测)1、NetworkDesign(网络设计)2、Training(训练)3、Inference(推论)4、LimitationsofYOLO(YOLO的局限性)前言看过很多的YOLO中文版学习笔记,干货比较多,但是,有点干,对于很多想要入门的童鞋来说,看着很难理解,一些概念晦涩难懂,一
bufengzj
·
2023-11-04 13:17
智能算法
深度学习
初学者也能看懂的隐马尔科夫模型介绍
隐马尔可夫模型(hiddenMarkovmodel,HMM)是时间序列的概率模型,常用于词性标注,
语音识别
,文本分析等领域。HMM是基于马尔科夫链进行标注的,我们对已经观察的数据序列O进行标
小白学视觉
·
2023-11-04 11:37
算法
python
机器学习
人工智能
java
TensorFlow什么意思?TensorFlow是什么?
Google开源深度学习系统TensorFlow在很多地方可以应用,如
语音识别
,自然语言理解,计算机视觉,广告等等。
AI小菜鸡一个
·
2023-11-04 09:08
AI
java
服务器
开发语言
人工智能的应用与发展趋势
人工智能技术的应用范围广泛,包括自然语言处理、机器视觉、
语音识别
、智能推荐、自动驾驶、智能医疗等领域。
泰海科技志胜
·
2023-11-04 07:11
人工智能
whisper部署与使用
Whisper的核心功能是
语音识别
,对应生活中可以有很多应用场景。虽然效果显著,但是其核心仅仅简单粗暴的使用了Transformer。具体细节这里不展开,可以通过阅读论文或源码的方式了解。
alberic_k
·
2023-11-04 07:56
模型部署
python
pytorch
AI:53-基于机器学习的字母识别
本专栏包含以下学习方向:机器学习、深度学习、自然语言处理(NLP)、机器视觉、
语音识别
、强化学习、推荐系统、机器学习操作(MLOps)、计算机视觉、虚拟现实(VR)/增强现实(AR)等等✨✨✨在这个漫长
一见已难忘
·
2023-11-04 06:43
AI领域专栏
人工智能
机器学习
如何实现
语音识别
功能
native嵌套H5实现
语音识别
功能?看图说话,我采用的是mui框架所自带的功能!代码附上:
语音识别
语音识别
:mui.min.css文件:/*!
Rkatsiteli
·
2023-11-04 05:36
App内嵌套H5的那些事儿
语音识别
openai-whisper
whisper[博客][论文][模型卡][Colab示例]Whisper是一种通用
语音识别
模型。它是在大量不同音频数据集上进行训练的,也是一个多任务模型,可以执行多语言
语音识别
、语音翻译和语言识别。
sanbaofengs
·
2023-11-04 05:35
经验分享
whisper
开放词汇视觉定位 OV-VG: A Benchmark for Open-Vocabulary Visual Grounding
论文笔记
开放词汇视觉定位OV-VG:ABenchmarkforOpen-VocabularyVisualGrounding
论文笔记
一、Abstract二、Abstract三、相关工作A、视觉定位B、短语定位C、
乄洛尘
·
2023-11-04 04:28
目标检测研究
人工智能
论文阅读
笔记
观点|我离开AI行业的5个理由
从图像识别、
语音识别
,到自然语言生成、内容创作、自动驾驶等,AI貌似已经无处不在,尤其是深度学习算法的出现,让AI进一步融入了人类生活。但是,如今的AI真实可信吗?
Tom Hardy
·
2023-11-03 21:13
人工智能
编程语言
大数据
ai
深度学习
CoCa
论文笔记
摘要计算机视觉任务中,探索大规模预训练基础模型具有重要意义,因为这些模型可以可以极快地迁移到下游任务中。本文提出的CoCa(ContrastiveCaptioner),一个极简设计,结合对比损失和captioning损失预训练一个image-textencoder-decoder基础模型,该模型包含对比方法,如CLIP,和生成方法,如SimVLM,的学习能力。与基本的encoder-decoder
hello_dear_you
·
2023-11-03 18:28
自监督ViT
CoCa
多模态
探索“声音驱动唇形”技术的工作原理
语音合成技术是指将文字信息转换为人类可以理解的语音,它广泛应用于
语音识别
、虚拟人物的声音合成、游戏中的语音交互等领域。
小文智能
·
2023-11-03 16:05
语音识别
人工智能
声音驱动唇形
酷雷曼多种AI数字人形象,打造科技感VR虚拟展厅
△AI数字人导览如你所见,像上述全景作品中这种整合了动作驱动、唇形驱动技术、智能
语音识别
等众多人工智能技术的可视化虚拟人物,就是我们所说的AI数字人。再说简单点,所有
酷雷曼VR全景
·
2023-11-03 16:34
VR行业发展前景
vr
人工智能
科技
VR全景
AI数字人
AI:49-基于深度学习的杂草识别
本专栏包含以下学习方向:机器学习、深度学习、自然语言处理(NLP)、机器视觉、
语音识别
、强化学习、推荐系统、机器学习操作(MLOps)、计算机视觉、虚拟现实(VR)/增强现实(AR)等等✨✨✨在这个漫长
一见已难忘
·
2023-11-03 10:34
AI领域专栏
人工智能
深度学习
坚持记录博客NO:1------------------>
论文笔记
:深度学习
1.词汇学习paradigm:典范;样式;引申为课题hierarchical:分层的;等级体系的2.小知识扩展:百度创始人李宏彦创办的第一个研究所就是深度学习研究所3.重点知识:(1)什么是机器学习?答:机器学习机器就是通过算法,使得机器能从大量历史数据中学习规律,从而对新的样本做智能识别或对未来做预测.(2)BP算法?答:BP算法是人工神经网络的反向传播算法(BackPropgation)利用B
红心柚大果
·
2023-11-03 02:14
笔记
机器学习
深度学习
AI:46-基于深度学习的垃圾邮件识别
本专栏包含以下学习方向:机器学习、深度学习、自然语言处理(NLP)、机器视觉、
语音识别
、强化学习、推荐系统、机器学习操作(MLOps)、计算机视觉、虚拟现实(VR)/增强现实(AR)等等✨✨✨在这个漫长
一见已难忘
·
2023-11-03 02:40
AI领域专栏
人工智能
深度学习
【
论文笔记
】U-BERT: Pre-training User Representations for Improved Recommendation
原文作者:ZhaopengQiu,XianWu,JingyueGao,WeiFan原文标题:U-BERT:Pre-trainingUserRepresentationsforImprovedRecommendation原文来源:AAAI2021原文链接:https://www.aaai.org/AAAI21Papers/AAAI-2116.QiuZ.pdfU-BERT:Pre-trainingUs
BodyCsoulN
·
2023-11-02 22:58
论文笔记
人工智能
推荐系统
bert
深度学习
RNN神经网络适用于什么,RNN神经网络基本原理
然而,样本出现的时间顺序对于自然语言处理、
语音识别
、手写体识别等应用非常重要。对了适应这种需求,就出现了另一种神经网络结构——循环神经网络RNN。
「已注销」
·
2023-11-02 21:32
神经网络
rnn
深度学习
聚类
AI:48-基于卷积神经网络的气象图像识别
本专栏包含以下学习方向:机器学习、深度学习、自然语言处理(NLP)、机器视觉、
语音识别
、强化学习、推荐系统、机器学习操作(MLOps)、计算机视觉、虚拟现实(VR)/增强现实(AR)等等✨✨✨在这个漫长
一见已难忘
·
2023-11-02 16:55
AI领域专栏
人工智能
cnn
神经网络
AI:50-基于深度学习的柑橘类水果分类
本专栏包含以下学习方向:机器学习、深度学习、自然语言处理(NLP)、机器视觉、
语音识别
、强化学习、推荐系统、机器学习操作(MLOps)、计算机视觉、虚拟现实(VR)/增强现实(AR)等等✨✨✨在这个漫长
一见已难忘
·
2023-11-02 16:55
AI领域专栏
人工智能
深度学习
分类
介绍 TensorFlow 的基本概念和使用场景。
它可以用来建立深度学习模型,解决各种复杂的机器学习问题,如图像识别、
语音识别
、自然语言处理等。TensorFlow的基本概念是张量(Tensor),它是一个多维数组。
Stephen_CY666
·
2023-11-02 14:04
tensorflow
人工智能
python
AI智能
语音识别
模块(二)——基于Arduino的语音控制MP3播放器
文章目录简介离线语音控制模块MiniMP3模块0.96寸OLED模块实验准备安装库接线定义主要程序实验效果注意事项总结简介在前面一篇文章里我们对AI智能
语音识别
模块进行了介绍,并对离线语音模组下载固件的过程进行了一个简单描述
优信电子
·
2023-11-02 10:14
语音识别
单片机
Arduino
嵌入式硬件
模块测试
mcu
神经网络与监督式学习
除了我们之前看的预测房价的例子(标准的神经网络)比如图像识别(CNN:卷积神经网络),翻译和
语音识别
(RNN:循环神经网络),还有自动驾驶(将CNN和RNN结合起来的更定制化的神经网络)。
Ang陈
·
2023-11-02 09:42
基于深度学习的水果识别 计算机竞赛
/dancheng-senior/postgraduate2开发简介深度学习作为机器学习领域内新兴并且蓬勃发展的一门学科,它不仅改变着传统的机器学习方法,也影响着我们对人类感知的理解,已经在图像识别和
语音识别
等领域取得广泛的
Mr.D学长
·
2023-11-02 09:18
python
java
一键办公:PDF转换word、OCR识别、
语音识别
、教学办公一应俱全
前段时间,我在编辑文档时,发现自己电脑自带的word版本太低,打开同事传送过来的文件时,发现格式错乱(比如字体乱码),图片乱飞的情况,万般无奈之下,只好找到这款工具万彩办公大师以解燃眉之急。1.下载该软件最新版压缩包。image2.打开压缩包,在date文件夹里找到后缀为exe的程序,双击运行,也可以解压到桌面运行。image3.安装之后,打开桌面图标,可以看到整个界面清新,无广告,功能介绍也很完
星愿夜读
·
2023-11-02 07:39
STM32智能小车(循迹、跟随、避障、测速、蓝牙、wife、4g、
语音识别
)总结
目录1.电机模块开发1.1让小车动起来1.2串口控制小车方向1.3如何进行小车PWM调速1.4PWM方式实现小车转向2.循迹小车2.1循迹模块使用2.2循迹小车原理2.3循迹小车核心代码2.4循迹小车解决转弯平滑问题3.跟随/避障小车3.1红外壁障模块分析编辑3.2跟随小车的原理3.3跟随小车开发和调试代码3.4超声波模块介绍3.5舵机模块介绍3.6摇头避障小车开发和调试代码4.测速小车4.1测速
罗小白的干爹
·
2023-11-02 06:04
51跟32单片机
STM32
论文笔记
之Deep Neural Networks for YouTube Recommendations
DeepNeuralNetworksforYouTubeRecommendations文中把整个推荐过程分成两个步骤:•deepcandidategenerationmodel.即召回部分•deeprankingmodel.即精排部分文中指出YouTube推荐的三个主要挑战:•Scale.YouTube推荐的数据规模大,一些适合处理小规模数据的推荐算法效果不好。•Freshness.YouTube
小弦弦喵喵喵
·
2023-11-02 01:46
python
语音识别
库kaldi_Kaldi
语音识别
库在Linux下的安装和编译
1.介绍Kaldi
语音识别
工具将HTK比较零碎的各种各样的指令和功能进行整理集合,使用perl脚本调用。
岑依惜
·
2023-11-02 01:00
kaldi在linux上编译,Kaldi
语音识别
库linux环境下的安装和编译
介绍:Kaldi
语音识别
库可以说是,HTK数据库的整理加强版,将HTK比较零碎的各种各样的指令和功能进行整理,使用更加的方便,同时也加入了深度神经网络的分类器(DNN),本身由原来做HTK开发的人员制作而成
三上酱
·
2023-11-02 01:30
kaldi在linux上编译
linux编译aidl接口,ubuntu下安装kaidl实用教程
1.介绍Kaldi
语音识别
工具将HTK比较零碎的各种各样的指令和功能进行整理集合,使用perl脚本调用。
weixin_39779530
·
2023-11-02 01:30
linux编译aidl接口
ASRT从零搭建并测试
参考文章:从零开始搭建属于自己的
语音识别
API服务器(ASRT开源项目)_asrt_v0.6.1_志谦的博客-CSDN博客w我是用VM搭建使用的,用的Ubuntu20.04Server1.Server默认没有很多工具
胖多鱼
·
2023-11-02 01:25
语音识别
python
上一页
17
18
19
20
21
22
23
24
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他