E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语音识别论文笔记
【
论文笔记
】Distilling the Knowledge in a Neural Network
Abstract几乎任何机器学习算法性能提升的一个非常简单的方法是在相同数据上训练多个不同的模型,然后对它们的预测结果进行平均。不幸的是,使用整个模型集合进行预测繁琐,可能会因为计算成本过高而难以部署给大量用户,尤其是如果各个模型是庞大的神经网络时。研究表明,可以将集合中的知识压缩成一个单一模型,这样更容易部署,而我们则进一步使用不同的压缩技术发展了这种方法。本文在MNIST数据集上取得了令人惊讶
xhyu61
·
2023-12-21 10:48
论文笔记
机器学习
学习笔记
论文阅读
深度学习
人工智能
【
论文笔记
】MCANet: Medical Image Segmentation withMulti-Scale Cross-Axis Attention
医疗图像分割任务中,捕获多尺度信息、构建长期依赖对分割结果有非常大的影响。该论文提出了Multi-scaleCross-axisAttention(MCA)模块,融合了多尺度特征,并使用Attention提取全局上下文信息。论文地址:MCANet:MedicalImageSegmentationwithMulti-ScaleCross-AxisAttention代码地址:https://githu
justld
·
2023-12-21 10:47
深度学习
CNN
语义分割
论文阅读
深度学习
人工智能
语音识别
之百度语音试用和OpenAiGPT开源Whisper使用
0.前言:本文作者亲自使用了百度云
语音识别
,腾讯云,java的SpeechRecognition语言识别包和OpenAI近期免费开源的语言识别Whisper(真香警告)介绍了常见的语言识别实现原理1.NLP
默默努力的小老弟
·
2023-12-21 08:59
语言识别
语音识别
百度
GPT
Whisper
IEEE TASLP | 联合
语音识别
与口音识别的解耦交互多任务学习网络
尽管联合
语音识别
(ASR)和口音识别(AR)训练已被证明对处理多口音场景有效,但当前的多任务ASR-AR方法忽视了任务之间的粒度差异。
语音之家
·
2023-12-21 06:19
xcode
macos
语音识别
科技
IEEE
TASLP
深度学习的推理部分
在深度学习中,训练和推理是两个阶段:训练阶段:在这个阶段,深度学习模型通过使用大量标记的训练数据进行学习,调整模型的权重和参数,以便使模型能够适应输入数据并执行特定的任务(如图像分类、目标检测、
语音识别
等
何处不逢君
·
2023-12-21 05:25
目标跟踪
人工智能
计算机视觉
python
目标检测
论文笔记
| ICLR 2023 WikiWhy:回答和解释因果问题
文章目录一、前言二、主要内容三、总结CSDN叶庭云:https://yetingyun.blog.csdn.net/一、前言ICLR2023|Accept:notable-top-5%:《WikiWhy:AnsweringandExplainingCause-and-EffectQuestions》一段话总结:WikiWhy是一个新的QA数据集,围绕一个新的任务建立:用自然语言解释为什么一个答案是
叶庭云
·
2023-12-21 04:18
人工智能学习之路
ICLR
顶会
WikiWhy
因果关系
推理能力
大语言模型
【
论文笔记
】动态蛇卷积(Dynamic Snake Convolution)
精确分割拓扑管状结构例如血管和道路,对医疗各个领域至关重要,可确保下游任务的准确性和效率。然而许多因素使分割任务变得复杂,包括细小脆弱的局部结构和复杂多变的全局形态。针对这个问题,作者提出了动态蛇卷积,该结构在管状分割任务上获得了极好的性能。论文:DynamicSnakeConvolutionbasedonTopologicalGeometricConstraintsforTubularStruc
justld
·
2023-12-21 02:37
深度学习
CNN
语义分割
论文阅读
人工智能
深度学习
论文笔记
:Accurate Localization using LTE Signaling Data
1intro论文提出LTELoc,仅使用信令数据实现精准定位信令数据已经包含在已在LTE系统中,因此这种方法几乎不需要数据获取成本仅使用TA(时序提前)和RSRP【这里单位是瓦】(参考信号接收功率)TA值对应于信号从手机到达基站所需的时间长度——>考虑到光速,它相当于用户设备与基站之间的距离在4GLTE网络中,TA值介于0到63之间,每个步骤代表一个比特周期(大约0.5208μs)的提前。以大约3
UQI-LIUWJ
·
2023-12-20 23:16
论文笔记
论文阅读
论文笔记
Origin-Destination Matrix Prediction via Graph Convolution: aNew Perspective of Passenger Dema
19KDD1intro研究内容:OD矩阵预测(ODMP)预测在给定时间段内从一个地理区域到另一个地理区域的叫车订单数量本文提出了一种基于网格嵌入的单馈多任务学习模型(GEML),同时考虑出行信息和地理特征,基于图对出行模式进行建模如果直接将已有的GCNs应用到OD矩阵所生成的图上,会出现以下问题:由于数据稀疏,学习到的具有很少订单的网格嵌入往往是不可靠和无效的对于没有任何历史订单记录的孤立节点(例
UQI-LIUWJ
·
2023-12-20 23:46
论文笔记
论文阅读
声音鉴定在线测试软件,声音鉴别软件有哪些 (声音检测在线测试)
这些软件利用先进的算法和人工智能技术,通过分析声音的频率、音调、波形等特征来进行声音鉴别,广泛应用于安全监控、音乐产业、
语音识别
等领域。本文将为您介绍几款知名的声音鉴定在线测试软件。
配音新手圈
·
2023-12-20 22:42
HW02-
语音识别
Homework2PhonemeClassificationDownloadDataDownloaddatafromgoogledrive,thenunzipit.Youshouldhavelibriphone/train_split.txtlibriphone/train_labelslibriphone/test_split.txtlibriphone/feat/train/*.pt:trai
闪闪发亮的小星星
·
2023-12-20 21:54
李宏毅机器学习课程学习笔记
语音识别
人工智能
论文笔记
| ICLR 2023 ReAct:通过整合推理和行动来增强语言模型
文章目录一、前言二、主要内容三、总结CSDN叶庭云:https://yetingyun.blog.csdn.net/一、前言ICLR2023|Accept:notable-top-5%:《ReAct:SynergizingReasoningandActinginLanguageModels》一句话总结:ReAct方法在问答任务中通过提示大语言模型生成与任务相关的推理文本,并根据需求生成搜索或调用工
叶庭云
·
2023-12-20 13:52
人工智能学习之路
人工智能
ReAct
ICLR
大语言模型
顶会论文
【工作】思“运算”
(
论文笔记
及思考)培养小学生数学运算能力主要体现在以下几个方面:1-培养学生对数学运算的兴趣;多种形式的训练(如:游戏、竞赛、算式卡片、黑板视算、听算、限时口算、自编计算题等)。
Telling谭
·
2023-12-20 11:28
举例说明自然语言处理(NLP)技术。
3.
语音识别
:NLP技术可以用于
语音识别
,以将口头语言转换为文本形式,例如智能助理(如Siri和Alexa)
wxchqaz
·
2023-12-20 11:44
自然语言处理
人工智能
深度学习 tensorflow基础介绍
它可以在图像识别、
语音识别
、自然语言处理等领域取得惊人的成就。深度学习的引入引出了TensorFlow,它是一个由GoogleBrain开发的开源机器学习框架。
小楼先森
·
2023-12-20 08:48
深度学习
tensorflow
VR虚拟动漫角色智能化导览丰富体验乐趣
它们具备智能感知、
语音识别
、自然语言处理等多种技能,可以为我们带来很多帮助和便利。
VRARvrnew3d
·
2023-12-20 05:22
人工智能
语音识别
自然语言处理
vr
虚拟现实
VR公司
虚拟形象
AudioGPT 语音技术全覆盖:
语音识别
、增强、分离、风格迁移等 | 开源日报 No.114
stevearc/oil.nvimStars:1.7kLicense:MIToil.nvim是一个类似于vim-vinegar的文件浏览器,允许您像普通Neovim缓冲区一样编辑文件系统。其主要功能包括支持常见插件管理器、通过适配器抽象进行所有文件系统交互以及提供API来执行各种操作。该项目的关键特点和核心优势包括:通过适配器实现跨位置查看和修改文件支持SSH适配器,可在远程服务器上浏览文件提供丰
开源服务指南
·
2023-12-19 07:18
开源日报
语音识别
人工智能
NXP - 高性能计算E/E架构
1、未来高性能计算E/E架构的推动因素1)车辆将成为一个智能移动互联终端并成为互联网的一部分;新服务不断发展,例如自然
语音识别
(AmazonAlexa),基于云的服务,…与车辆的“开放式”连接将推动更高级别的网络安全性要求
筋斗云与自动驾驶
·
2023-12-18 20:38
EE架构
以太网
SOA
智能网联
汽车
电子电器
EEA
架构
注意力机制:一种解决深度学习中的选择问题的方法
、自顶向下的注意力机制3、基于通道的注意力机制三、注意力机制优缺点四、总结一、注意力机制基本概念注意力机制(AttentionMechanism)是一种数据处理方法,广泛应用于自然语言处理、图像识别及
语音识别
等各种不同类型的机器学习任务中
AI_dataloads
·
2023-12-18 18:12
深度学习
人工智能
论文笔记
:Bilinear Attention Networks
更精简的论文学习笔记1、摘要多模态学习中的注意力网络提供了一种选择性地利用给定视觉信息的有效方法。然而,学习每一对多模态输入通道的注意力分布的计算成本是非常昂贵的。为了解决这个问题,共同注意力为每个模态建立了两个独立的注意分布,忽略了多模态输入之间的相互作用。在本文中,我们提出了双线性注意力网络(BAN),它可以找到双线性注意力分布来无缝地利用给定地视觉语言信息。BAN考虑两组输入通道之间的双线性
hongyuyahei
·
2023-12-18 17:30
vqa
论文阅读
【
论文笔记
】RepVGG: Making VGG-style ConvNets Great Again
RepVGG:MakingVGG-styleConvNetsGreatAgain目录RepVGG:MakingVGG-styleConvNetsGreatAgain1.Introduction1.1多分支网络结构的缺点1.2RepVGG优点2.ModelRe-parameterization(模型重参数化)2.1.DiracNet2.2WinogradConvolution3.BuildingRe
chairon
·
2023-12-18 11:33
论文笔记
论文阅读
深度学习
cnn
开源
语音识别
faster-whisper部署教程
1.资源下载源码地址模型下载地址:large-v3模型:https://huggingface.co/Systran/faster-whisper-large-v3/tree/mainlarge-v2模型:https://huggingface.co/guillaumekln/faster-whisper-large-v2/tree/mainlarge-v2模型:https://huggingfa
Luke Ewin
·
2023-12-18 07:02
Python
语音识别
whisper
人工智能
faster-whisper
ASR
开源语音识别
python
论文笔记
《NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models》
paper:https://arxiv.org/abs/2304.09787code:问就是没有code!主旨:用两个autoencoder
浅度断墨
·
2023-12-18 01:53
论文阅读
【小沐学Python】Python实现
语音识别
(SpeechRecognition)
文章目录1、简介2、安装和测试2.1安装python2.2安装SpeechRecognition2.3安装pyaudio2.4安装pocketsphinx(offline)2.5安装Vosk(offline)2.6安装Whisper(offline)3测试3.1命令3.2fastapi3.3google3.4recognize_sphinx3.5语音生成音频文件结语1、简介https://pypi
爱看书的小沐
·
2023-12-17 22:49
Python
AI
python
语音识别
ai
vosk
whisper
pyaudio
fastapi
循环神经网络(1)循环神经网络的记忆能力实验
是一类具有短期记忆能力的神经网络.在循环神经网络中,神经元不但可以接受其他神经元的信息,也可以接受自身的信息,形成具有环路的网络结构.和前馈神经网络相比,循环神经网络更加符合生物神经网络的结构.目前,循环神经网络已经被广泛应用在
语音识别
Simon52314
·
2023-12-17 21:43
rnn
人工智能
深度学习
论文笔记
:CQR-SQL: Conversational Question Reformulation Enhanced Context-Dependent Text-to-SQL Parsers
论文笔记
:CQR-SQL:ConversationalQuestionReformulationEnhancedContext-DependentText-to-SQLParsers目录
论文笔记
:CQR-SQL
Q同学的nlp笔记
·
2023-12-17 14:29
Text-to-SQL
自然语言处理
NLP
sql
论文阅读
数据库
TP6引入腾讯云SDK,并使用其方法,
语音识别
例子
通过composer安装SDKcomposer官网包查询的地址:传送门特别说明:通过composer引入之后,在文件内直接使用//测试腾讯
语音识别
Route::rule("demovoice","tencentDemo
这个超人不会飞阿
·
2023-12-17 10:26
[
论文笔记
] GAMMA: A Graph Pattern Mining Framework for Large Graphs on GPU
GAMMA:AGraphPatternMiningFrameworkforLargeGraphsonGPUGAMMA:基于GPU的针对大型图的图模式挖掘框架[Paper][Code]ICDE’23摘要提出了一个基于GPU的核外(out-of-core)图模式挖掘框架(GraphPatternMining,GPM)GAMMA,充分利用主机内存来处理大型图.GAMMA采用对用户透明的自适应隐式主机内存
PeakCrosser
·
2023-12-17 06:17
Graph
Mining
论文阅读
Vue3 setup语法糖使用简易教程(下)
包括
语音识别
、机器翻译等从基础到实战都有,很详细,分享给大家。1.组件1.1组件引用组件在props里直接引入就可在template里直接使用,无需再进行注册。
Mr.Meng_95
·
2023-12-17 02:43
vue3
vue.js
人工智能自然语言处理:语言之美,算法之智
NLP技术的发展使得计算机能够执行诸如
语音识别
、情感分析、机器翻译等任务。2.
鳗小鱼
·
2023-12-17 02:39
资源分享(resource)
人工智能
自然语言处理
python
cnn
知识图谱
文心一言
bert
[
论文笔记
] 大模型gpu机器推理测速踩坑 (llama/gpt类)
cpu没报错,换gpu就报错。以下是一些踩坑:坑1:要指定gpu,可以在importtorch之前指定gpu。model=LlamaForCausalLM.from_pretrained(model_path,trust_remote_code=True).to(device)报错:RuntimeError('Expectedalltensorstobeonthesamedevice,butfou
心心喵
·
2023-12-17 00:02
nlp
论文笔记
自然语言处理
llama
gpt
[
论文笔记
] chatgpt系列 SparseMOE—GPT4的MOE结构
SparseMOE:稀疏激活的MOESwtichMOE,所有token要在K个专家网络中,选择一个专家网络。显存增加。ExpertsChoice:路由MOE:由专家选择token。这样不同的专家都选择到某个token,也可以不选择该token。由于FFN层的时间复杂度和attention层不同,FFN层的时间复杂度在O(N*d),N是输入长度,d是隐层纬度。attention层的时间复杂度在O(N
心心喵
·
2023-12-17 00:59
论文笔记
论文阅读
语言模型及Word2vec与Bert简析
语言模型可以对一段文本的合理性概率进行估计,对信息检索,机器翻译,
语音识别
等任务有着重要的作用。
沧海之巅
·
2023-12-16 11:17
大语言模型
AI
GPT
语言模型
word2vec
bert
基于PaddleNLP的深度学习对文本自动添加标点符号(一)
前言目前以深度学习对文本自动添加标点符号研究很少,已知的开源项目并不多,详细的介绍就更少了,但对文本自动添加标点符号又在古文识别
语音识别
上有重大应用。
番茄小能手
·
2023-12-16 08:59
PaddleNLP
深度学习
人工智能
特斯拉第二代机器人:市场期待与看解
首先,从技术层面来看,这款机器人融合了特斯拉在人工智能、机器人技术、机器视觉、
语音识别
等多领域的最新成果
软件开发小浩
·
2023-12-16 07:03
机器人
clean-label backdoor attacks
论文笔记
#
论文笔记
#1.论文信息论文名称Clean-LabelBackdoorAttacks作者AlexanderTurner(MIT)会议/出版社ICLR2019pdf本地pdf在线pdf代码trojanzoo-clean-label
wwweiyx
·
2023-12-16 06:10
AI安全
论文阅读
【FunASR】Paraformer
语音识别
-中文-通用-16k-离线-large-onnx
pytorchParaformer-large长音频模型集成VAD、ASR、标点与时间戳功能,可直接对时长为数小时音频进行识别,并输出带标点文字与时间戳:ASR模型:Parformer-large模型结构为非自回归
语音识别
模型
太空眼睛
·
2023-12-15 18:00
人工智能
语音识别
达摩院
docker
长音频
语音转写
离线
FunASR
Meta 新推出的实时语音翻译模型 Seamless
SeamlessM4T模型支持以下任务:语音到语音翻译(S2ST)语音到文本翻译(S2TT)文本到语音翻译(T2ST)文本到文本翻译(T2TT)自动
语音识别
(ASR)我们正在发布SemalessM4Tv2
希尔贝壳AISHELL
·
2023-12-15 18:08
智能语音
人工智能
音视频
开源
中文读唇总动员:CNVSRC 2023 研讨会圆满落幕
12月9日晚,NCMMSC-CNVSRC2023学术研讨会在苏州召开的第十八届全国人机语音通讯学术会议(NCMMSC2023)举办,会上公布了本次视觉
语音识别
竞赛CNVSRC2023的最终结果,并举行颁奖仪式
希尔贝壳AISHELL
·
2023-12-15 18:37
智能语音
人工智能
音视频
[
论文笔记
] 大模型主流Benchmark测试集介绍
自然语言处理(NLP)的进步往往通过在各种benchmark测试集上的表现来衡量。随着多语言和跨语言NLP研究的兴起,越来越多的多语言测试集被提出以评估模型在不同语言和文化背景下的泛化能力。在这篇文章中,我们将介绍几个主流的多语言NLPbenchmark测试集,包括ARCChallenge、HellaSWAG、MMLU、Multi-taskingTestGeneration(MTG)、PAWS-X
心心喵
·
2023-12-15 12:43
论文笔记
论文阅读
自然语言处理
人工智能
Gemin技术解析:背景、特点、发展、应用与前景
其中,Gemin技术以其独特的优势,在
语音识别
、自然语言处理、计算机视觉等领域展现出巨大的潜力。本文将详细介绍Gemin技术的背景、技术特点、发展历程、应用场景及未来前景。
蒙奇·D·路飞-
·
2023-12-15 12:07
人工智能
geolife笔记:比较不同轨迹相似度方法
这里采用
论文笔记
:DeepRepresentationLearningforTrajectorySimilarityComputation-CSDN博客中的方法:2收集每一个id对应的轨迹2.1经纬度转
UQI-LIUWJ
·
2023-12-15 12:59
python库整理
笔记
论文笔记
:Dual Dynamic Spatial-Temporal Graph ConvolutionNetwork for Traffic Prediction
IEEETRANSACTIONSONINTELLIGENTTRANSPORTATIONSYSTEMS20221intro1.1背景GCN和TCN被引入到交通预测中GCN能够保留交通网络的图结构信息TCN能够捕获交通流的时间特征基于GCN的交通预测方法依赖于如何构建图或邻接矩阵将道路段的交通测量作为节点通过不同道路段的直接连接来构建图道路段上的交通流量测量及其相关性在空间和时间上会动态变化(eg交通
UQI-LIUWJ
·
2023-12-15 12:59
论文笔记
论文阅读
语音识别
功能测试:90%问题,可以通过技术解决
现在市面上的智能电子产品千千万,为了达到人们使用更加方便的目的,很多智能产品都开发了
语音识别
功能,用来语音唤醒进行交互;另外,各大公司也开发出来了各种智能语音机器人,比如小米公司的“小爱”,百度公司的“
喜欢软测的小北葵
·
2023-12-15 07:47
软件测试
Python
程序员
自动化
压力测试
单元测试
测试工具
功能测试
论文笔记
:使用多角度高光谱数据估算冬小麦垂直方向叶片叶绿素浓度
本文简单介绍使用多角度高光谱数据估算冬小麦垂直方向叶片叶绿素浓度的方法和实践,论文基本信息:Wu,Bin;Huang,Wenjiang;Ye,Huichun;Luo,Peilei;Ren,Yu;Kong,Weiping.2021."UsingMulti-AngularHyperspectralDatatoEstimatetheVerticalDistributionofLeafChlorophyl
HenryYanWhu
·
2023-12-15 07:27
语音识别
功能测试:90%问题,可以通过技术解决
现在市面上的智能电子产品千千万,为了达到人们使用更加方便的目的,很多智能产品都开发了
语音识别
功能,用来语音唤醒进行交互;另外,各大公司也开发出来了各种智能语音机器人,比如小米公司的“小爱”,百度公司的“
傲天测试王
·
2023-12-15 06:48
语音识别
人工智能
postman
测试工具
python
开发语言
功能测试
【
论文笔记
】HetGNN
HeterogeneousGraphNeuralNetwork2019KDD论文链接:https://dl.acm.org/doi/pdf/10.1145/3292500.3330961官方代码:https://github.com/chuxuzhang/KDD2019_HetGNN个人实现:https://github.com/ZZy979/pytorch-tutorial/tree/maste
zzy979
·
2023-12-15 05:33
论文笔记
图神经网络
图神经网络
论文笔记
:详解GraphSAGE
论文的阅读笔记背景相关工作模型推导前向传播扩展GraphSAGE算法框架到minibatch模型训练聚合器的设置实验对GraphSAGE表达能力的理论分析(讨论其如何学习图结构)参考论文对节点嵌入不明白的可以先看这篇:
论文笔记
图学习的小张
·
2023-12-15 05:32
图数据挖掘学习路线
论文笔记
论文阅读
python
机器学习
论文笔记
:www2019 层次图视角的半监督图分类
Semi-SupervisedGraphClassification:AHierarchicalGraphPerspective(层次图视角的半监督图分类)是层次图提出的第一篇文章,也是我组会讲的第一篇文章,整理了我的笔记,对论文中的SAGE模块做了比较详细的介绍模型概述损失函数SAGE模块(SelfAttentionGraphEmbedding)算法描述与解释实验参考文献模型概述 所谓层次图指
图学习的小张
·
2023-12-15 05:32
论文笔记
图数据挖掘学习路线
论文阅读
分类
数据挖掘
论文笔记
:详解DeepWalk与Node2vec
最近读了DeepWalk和Node2vec这两篇图学习的经典文章,对自己的笔记进行了整理。DeepWalk算法笔记应用背景功能描述基本概念随机游走(RandomWalks)幂律分布(Connection:Powerlaws)词嵌入学习的经典方法(Word2vec)DeepWalk模型与损失函数推导算法描述与解释(伪代码)时间复杂度分析DeepWalk的改进算法(Node2vec)算法描述与解释(伪
图学习的小张
·
2023-12-15 05:02
论文笔记
图数据挖掘学习路线
论文阅读
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他