E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语音tts
从零到入门:人工智能学习路径全解析
从手机里的
语音
助手到电商平台的推荐系统,从自动驾驶到医疗影像分析,AI技术正在重塑人类社会的运行方式。
这题有点难度
·
2025-02-19 21:24
人工智能
学习
从代码到专利:如何用自注意力机制实现高效序列转换?——深度解析Google的Transformer架构
在传统的序列转换任务(如机器翻译、
语音
识别等)中,循环神经网络(RNN)和卷积神经网络(CNN)是常用的模型架构。然而,这些模型存在以下问题:
CodePatentMaster
·
2025-02-19 21:53
transformer
深度学习
人工智能
AIGC
架构
HarmonyOS Next
语音
合成技术深度解析
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统(截止目前API12)中的
语音
合成技术,基于实际开发实践进行总结。
·
2025-02-19 15:31
harmonyos
探索 Open WebUI:功能全面的开源交互平台
目录探索OpenWebUI:功能全面的开源交互平台轻松部署兼容多API集成精细权限和用户组管理跨设备响应式设计移动渐进式Web应用(PWA)全面支持Markdown和LaTeX免提
语音
/视频通话模型构建器原生
gs80140
·
2025-02-19 14:52
基础知识科谱
AI
人工智能
agent和android怎么结合:健康助手,旅游助手,学习助手
agent和android怎么结合:健康助手,旅游助手,学习助手创新点智能交互创新:提出全新的agent-Android交互模式,如基于手势、
语音
、眼动等多模态融合的交互方式。
ZhangJiQun&MXP
·
2025-02-19 11:00
教学
2021
论文
2024大模型以及算力
android
旅游
学习
人工智能
语言模型
自然语言处理
prompt
arXiv每日推荐-3.4:
语音
/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】SELD-TCN:SoundEventLocalization&DetectionviaTemporalConvolutionalNetworks标题:SELD-TCN:基于时间卷积网络的声音事件定位与检测作者:KarimGuirguis,BinYang备注:5pages,3tables,2figures.SubmittedtoEUSIPCO2020链接:
sapienst
·
2025-02-19 09:16
语音识别
语音识别
如何高效使用Zoom视频会议软件:功能解析与操作指南
目录1.Zoom的基本功能介绍1.1视频会议1.2
语音
会议1.3屏幕共享1.4会议录制1.5聊天和文件共享1.6会议室和个人会议ID2.Zoom的使用方法2.1安装Zoom2.2创建和加入会议2.2.1
concisedistinct
·
2025-02-19 08:39
IT工具
zoom
视频
软件
视频会议
DeepSeek自研AI芯片,AI算力新变革?
AI算力告急,成本掣肘发展当下,AI技术迅猛发展,从科研领域的复杂模型训练,到日常生活里智能
语音
助手的实时交互,算力成了决定AI发展的关键因素。作为大模型领域的后起之秀,DeepSeek对计算资源
·
2025-02-19 07:19
人工智能深度学习机器学习算法
百问网imx6ullpro调试记录(linux+qt)
1.3网络问题1.4系统启动1.5进程操作2.QT2.1tslib1.获取源码2.安装依赖文件3.编译2.2qt移植1.获取qt源码2.配置编译器3.编译2.3拷贝到开发板1.拷贝2.修改开发板配置文件q
tts
lib3
嵌入式修炼师
·
2025-02-19 06:56
linux驱动
linux
qt
Jfinal websocket onMessage无法接收二进制音频数据问题
刚开始还没找到是数据大小限制的问题(由于要测试好多其它
语音
包,例如vad4j,webrctvad这些),以为是自己哪里搞错了,就找websocket什么时候
withme977
·
2025-02-19 03:30
websocket
网络协议
网络
支持DeepSeek、Claude、Ollama等主流模型,提供人物调整,虚拟朋友、
语音
对话
支持DeepSeek、Claude、OpenAI、Gemini、ChatGLM、Ollama,人设调教,虚拟朋友、
语音
对话。它可以让你在聊天平台上对接语言模型,实现和语言模型的直接对话。
struggle2025
·
2025-02-18 21:59
人工智能
chatgpt
机器人
人工智能到底是什么?
以下是关于人工智能的具体介绍:定义-从技术角度:人工智能是让计算机系统具备像人类一样的感知、学习、推理、决策等能力,通过算法和数据使计算机能处理和理解各种复杂信息,如
语音
识别系统能听懂人类语言并转化为文字
yzx991013
·
2025-02-18 14:05
开发语言
人工智能
python
django
uniapp 小程序
语音
录制
uniapp小程序
语音
录制微信小程序管理平台添加同声编译微信公共平台登陆添加微信同声传译使用manifest.json"mp-weixin":{"appid":"xxxxxxxxxxxx","plugins
你的眼睛會笑
·
2025-02-18 10:55
uni-app
小程序
Android系统开机时间优化-实践篇(一)
Android系统开机时间优化目录背景正文优化内容小结产品功能:高清大屏、多路摄像头、蓝牙、WIFI、4G无线网络、收音机、
语音
识别等等。
漫步的傻瓜
·
2025-02-18 08:00
Android系统启动时间优化
android
linux
第二章:12.3 建立表现基准
背景介绍
语音
识别是一种常见的机器学习应用,用户通过
语音
输入代替键盘输入,系统需要将
语音
转换为文本。在这个过程中,算法的性能可以通过训练误差和交叉验证误差来评估。
望云山190
·
2025-02-17 22:40
基准性能水平
人工智能
机器学习
Audio-Visual Speech Enhancement(视听
语音
增强)领域近三年研究进展与国内团队及手机厂商动态分析
一、视听
语音
增强领域近三年研究进展多模态融合与模型轻量化多模态特征融合:中国科学技术大学团队提出通过引入超声舌头图像和唇部视频的联合建模,结合知识蒸馏技术,在训练阶段利用教师模型传递舌部运动知识,从而在推断时仅依赖唇部视频即可提升
语音
增强效果
AndrewHZ
·
2025-02-17 20:47
深度学习新浪潮
智能手机
算法
计算机视觉
硬件架构
硬件工程
智能硬件
语音
与自然语言处理(NLP):智能交互的核心技术
随着人工智能(AI)技术的飞速发展,
语音
识别与自然语言处理(NaturalLanguageProcessing,NLP)成为了智能交互系统的核心技术。
给生活加糖!
·
2025-02-17 14:21
热门知识
自然语言处理
交互
人工智能
使用多模态大语言模型进行深度学习的图像、文本和
语音
数据增强
本文通过探索利用多模态LLMs进行图像、文本和
语音
数据增强的最新文献,填补了
数行天下
·
2025-02-17 12:42
人工智能
语言模型
深度学习
人工智能
自然语言处理
ASR技术与Whisper引擎
一、ASR技术简介ASR英文全称是AutomaticSpeechRecognition,中文叫做自动
语音
识别,是利用机器对
语音
信号进行识别和理解并将其转换成相文本和命令的技术。
Catformon
·
2025-02-17 01:38
whisper
chat
tts
本地化python部署及采坑记录(2024年亲测可用)
Chat
TTS
是一个文本转
语音
的开源项目,短短2周左右的时间,在GitHub上已经斩获了24.4k的Star!
Catformon
·
2025-02-17 00:05
python
开发语言
一文带你了解人工智能:现状、应用、变革及未来展望
从智能手机的
语音
助手到自动驾驶汽车,从智能家居到医疗诊断,AI正在改变着我们的生活方式。本文将结合时事,为大家介绍当前人工智能的发展形势、在生活中的应用、人工智能的变革以及未来的发展方向。
空青726
·
2025-02-16 08:02
人工智能
chatgpt
ai
大数据
机器学习
深度学习
创业创新
《DeepSeek Janus Pro 7B:多模态人工智能大模型部署全攻略》
从智能
语音
助手到图像识别系统,从自动驾驶汽车到智能医疗诊断,多模态AI的身影无处不在,它让机器能够理解和处理多种类型的信息,如文本、图像、音频等,从而实现更加智能、高效的交互。DeepSee
空云风语
·
2025-02-16 03:57
神经网络
人工智能
深度学习
人工智能
通义模型Prompt调优的实用技巧
对较难被准确遵循的复杂规则可拆分为多条规则,有助于提升效果策略二:适当冗余关键信息策略三:使用分隔符给Prompt分段策略四:增加学习示例策略五:编写清晰地说明-指定任务所需的步骤策略六:让大模型反思自己的推理过程策略七:
语音
场景下的
大模型实战
·
2025-02-15 22:16
prompt
多开工具与
语音
识别技术的融合与创新
多开工具与
语音
识别技术的融合与创新摘要:随着科技的不断进步,多开工具和
语音
识别技术的融合与创新正在为我们的日常生活带来更加便利和高效的体验。
·
2025-02-15 18:26
程序员
鸿蒙开发:文本合成
语音
前言Android开发的同学都知道,在Android当中,实现一段文字合成
语音
播放,可以使用系统提供的对象TextToSpeech来很快的实现,如果不用系统自带的,也可以使用三方提供的,比如讯飞的
语音
合成等等
·
2025-02-15 14:19
【开发日志】数字人+LLM:从概念到实现的全程记录!
系统环境:CPU:i91490016GBGPU:GTX40608GBSYS:Windows11WSL:Ubuntu22.04本文章使用到的技术内容:数字人框架:LiveTalking大模型:Llama3.1
TTS
AI大模型-王哥
·
2025-02-15 13:11
大模型学习
大模型教程
大模型
人工智能
LLM
数字人
大模型入门
麒麟990和麒麟8000哪个好
麒麟8000是华为针对中高端市场推出的一款5G芯片,支持卫星通信技术,可以通过北斗、GPS、GLONASS等卫星系统进行定位和导航,也可以通过北斗、天通等卫星系统进行
语音
和短信通信,为用户提供更广阔的联网空间
m0_50613577
·
2025-02-15 12:33
智能手机
linux中流设备_设备端SDK(Linux)文档
:55:00功能描述摄像头直播:支持RTMP推流,当前视频支持H264,音频支持G711a以及AAC_LC格式.存储卡录像查看:将存储在SD卡等外存中的录像文件推到服务端,支持seek到指定位置操作.
语音
对讲
知酒僧
·
2025-02-15 04:59
linux中流设备
WhisperX:革命性的自动
语音
识别工具
WhisperX:革命性的自动
语音
识别工具项目地址:https://gitcode.com/gh_mirrors/wh/whisperX项目介绍WhisperX是一个开源的自动
语音
识别(ASR)项目,由
孔秋宗Mora
·
2025-02-15 03:14
WebP2P+自研回音消除:视频通话SDK嵌入式EasyRTC构建高交互性音视频应用
回音消除算法的核心在于从麦克风采集的混合信号中分离出原始
语音
信号和回声信号,并将回声信号从混合信号中移除。EasyRTC采用的自研算法基于以下几种技术:自适应滤波器:通过实时调整滤波器
Likeadust
·
2025-02-14 22:10
音视频
p2p
WebP2P
webrtc
【前端开发学习笔记17】使用ai
AI的认知&两个工具-认知同步AI早已不是新事物(接受):
语音
识别,人脸识别,无人驾驶,智能机器人...
wei387245232
·
2025-02-14 19:14
学习
笔记
使用Python和Discord API进行数据提取和分析
技术背景介绍Discord作为一个广受欢迎的VoIP和即时消息社交平台,允许用户通过
语音
通话、视频通话、文本消息以及其他媒体和文件进行互动。
scaFHIO
·
2025-02-14 15:43
python
开发语言
语音
app系统软件源码开发搭建新手启蒙篇
在移动互联网飞速发展的今天,
语音
app已经成为人们生活中不可或缺的一部分。无论是
语音
聊天、
语音
助手还是
语音
直播,这些应用都给我们的生活和工作带来了极大的便利和精神娱乐。
山东布谷科技官方
·
2025-02-14 11:50
语聊源码
语音app源码
语音系统开发
深度学习-10-深度学习发展简介
先是一月二十四号,MIT(麻省理工学院Massachuse
tts
InstituteofTechnology)的教授,人工智能研究的先驱者,MarvinMinsky去世,享年89岁。
皮皮冰燃
·
2025-02-14 10:43
深度学习
深度学习
cnn以及例子
cnnCNN即卷积神经网络(ConvolutionalNeuralNetwork),是一种专门为处理具有网格结构数据(如图像、音频)而设计的深度学习模型,在计算机视觉、
语音
识别等诸多领域都有广泛应用。
阿拉斯攀登
·
2025-02-14 10:41
机器学习
cnn
人工智能
神经网络
物联网智能
语音
控制灯光系统设计与实现
通过
语音
控制和自动调节灯光,用户可以更便捷地操作家中的照明设备,提高生活的舒适度与便利性。
木燚垚
·
2025-02-14 09:02
物联网
WebRTC与EasyRTC:开启智能硬件音视频通讯的全新旅程
一、WebRTC与智能硬件融合的崭新趋势WebRTC技术,凭借其无需插件或额外软件即可实现点对点实时通信的卓越优势,已然成为视频会议、
语音
通话及文件共享等众多领域的宠儿。
EasyNVR
·
2025-02-14 09:00
EasyRTC
webrtc
智能硬件
音视频
网络
视频监控
安全
自然语言处理(NLP)入门:基础概念与应用场景
NLP的核心目标是将非结构化的自然语言(如文本和
语音
)转化为结构化数据,使机器能够高效处理、分析和生
Ash Butterfield
·
2025-02-14 00:38
nlp
自然语言处理
人工智能
【语义分割专题文章】
一、数据篇【遥感】【道路】篇:【语义分割】【专题系列】一、Massachuse
tts
RoadsDataset马萨诸塞州道路数据集获取二、CNN篇Unet(2015):【语义分割】【专题系列】二、Unet
BoostingIsm
·
2025-02-13 22:59
Segmentation
python
uniapp
语音
时的动态音波的实现
一、实现效果该文做出来的效果:图片中的音波是动态的二、实现代码将它写为一个组件,方便之后用。命名为“audioWave.vue”.audio-wave{position:absolute;left:0;top:50%;transform:translateY(-50%);width:100%;height:40rpx;display:flex;align-items:center;justify-
雾眠气泡水@
·
2025-02-13 19:04
uni-app
常见的深度学习模型总结
应用场景:分类、回归、
语音
识别、图像识别等。2.卷积神经网络(Convolutio
编码时空的诗意行者
·
2025-02-13 13:29
深度学习
人工智能
【深入探索-deepseek】高等数学与AI的因果关系
目录数学在AI不同领域的应用区别一、计算机视觉领域1.线性代数2.微积分3.概率论与统计二、自然语言处理领域三、
语音
识别领域四、数学在AI不同领域应用的逻辑图五、参考资料数学在AI不同领域的应用区别一、
我的青春不太冷
·
2025-02-13 11:09
人工智能
机器学习
数学
用AI来变换声音:超酷的实时
语音
转换项目-Github上的免费开源项目
▲点击上方"DevOps和k8s全栈技术"关注公众号亲爱的读者朋友你们好!今天我要给大家介绍一个特别有趣的GitHub项目——RealtimeVoiceCloning,一个可以实时变换你声音的AI项目。无论你是技术达人还是刚刚入门的初学者,都能在这个项目中找到乐趣。准备好体验声音魔法了吗?让我们一探究竟!项目简介:项目名称:RealtimeVoiceCloning项目地址:https://gith
韩先超
·
2025-02-13 09:53
人工智能
github
硅基流动多模型工作流应用平台,免费2000万Token来了
目前注册可获的2000万Token,可以使用将近60种文字对话、
语音
、图像生成等主流大模型。
yuntianming3906
·
2025-02-13 05:53
经验分享
GaussianSpeech:音频驱动3DGS Avatar
本文介绍了GaussianSpeech,这是一种从
语音
合成高保真度的个性化三维人类头部虚拟形象动画序列的新方法。
AIGC探路者
·
2025-02-12 00:57
音视频
3d
科研
计算机视觉
数字人
3D视觉
talking
head
AI赋能灯塔低代码平台,AI应用落地“加速器”
AI技术已渗透到各个领域,从智能
语音
助手到精准医疗影像诊断,从金融风险预测到智能交通管理,其潜力无可限量。然而,将AI技术转化为实际应用却面临重重困难。
·
2025-02-11 21:13
人工智能
【大模型部署及其应用 】Ollama搭建运行中文大
语音
模型Llama3-8B-Chinese-Chat
Ollama是一种用于运行大语言模型(如LLaMA)的平台,适合本地化部署和运行。以下是如何在Ollama上搭建和运行中文大语言模型Llama3-8B-Chinese-Chat的步骤:下载地址:https://huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat-GGUF-8bit项目地址:https://github.com/ymcui/Chine
源代码杀手
·
2025-02-11 18:34
AIGC核心技术剖析
人工智能
深度学习
llama
探秘DeepSeek多模态交互:解锁AI融合新境界
例如,在智能客服场景中,DeepSeek能够同时理解用户的
语音
和文字输入,快速准确地回答问题,提升客户服务效率;在智能教育领域,它可以根据学生的学习情况,
计算机学长
·
2025-02-11 16:51
通用大语言模型
人工智能
基于Ernie-Bot打造
语音
对话功能
大模型场景实战培训,提示词效果调优,大模型应用定制开发,点击咨询GPT-4的
语音
对话功能前段时间在网上火了一把,许多人被其强大的自然语言处理能力和流畅的
语音
交互所吸引。
·
2025-02-11 16:25
人工智能llm语音
2025最新主流深度学习算法全解析
从
语音
助手到自动驾驶,从图像识别到自然语言处理,深度学习的应用无处不在,深刻地改变着
lucky_syq
·
2025-02-11 08:25
AI
深度学习
算法
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他