E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
VOIP语音
探索未来之声:趣玩
语音
识别新篇章——FunASR
探索未来之声:趣玩
语音
识别新篇章——FunASR去发现同类优质开源项目:https://gitcode.com/在这个数字时代,
语音
识别技术如同开启智能交互的金钥匙,而【FunASR】正是这把钥匙中的璀璨明珠
乌芬维Maisie
·
2025-02-24 07:32
AI 机器人外呼 —— 开启智能外呼新纪元
精准
语音
识别:融合前沿
语音
技术,无论是字正腔圆的普通话,还是极具地域特色的各地方言,亦或
yoloGina
·
2025-02-24 07:28
客户管理
电销系统
电话外呼系统
人工智能
机器人
数字人|通过
语音
和图片来创建高质量的视频
简介arXiv上的计算机视觉领域论文:AniPortrait:Audio-DrivenSynthesisofPhotorealisticPortraitAnimationAniPortrait:照片级真实感肖像动画的音频驱动合成核心内容围绕一种新的人像动画合成框架展开。研究内容提出AniPortrait框架:用于生成由音频和参考肖像图像驱动的高质量动画。实现方法:分2个阶段实现第一阶段,从音频中提
产品媛Gloria Deng
·
2025-02-24 07:57
AI之眼
音视频
数字人
talking
head
AniPortrait框架
AI
金融大模型应用的机遇与挑战
大模型也在从单一自然语言处理模态向
语音
、图像等多模态大模型演进。目前国内外推出了众多的大模型,国内就不下上百款,也因此被称为“百模大战”或“千模大战”。
Python程序员罗宾
·
2025-02-24 03:34
金融
人工智能
语言模型
数据库
自然语言处理
【开源】基于SSM框架“大学生艺术节”管理系统(计算机毕业设计)+万字毕业论文+远程部署+ppt+代码讲解 ssm284
10年计算机开发经验,主营业务:源码获取、项目二开、
语音
辅导、远程调试、毕业设计、课程设计、毕业论文、BUG修改一、系统环境运行环境:最好是javajdk1.8,我们在这个平台上运行的。
计算机毕业设计_gzs
·
2025-02-24 01:22
开源
课程设计
spring
毕设
mybatis
java
毕业设计
GPU与FPGA加速:硬件赋能AI应用
从
语音
识别和计算机视觉,到自然语言处理和推荐系统,AI已广泛应用于各个领域。然而,训练和部署AI模型需要大量计算资源,这对传统的CPU架构提出了巨大挑战。
AI天才研究院
·
2025-02-24 01:20
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
手撸 chatgpt 大模型:单词向量化编码和绝对位置编码算法
在深度学习中,所有无法通过传统数据结构描述的对象都会被用一个向量表示,例如图像、
语音
、单词、音频等。最初,向量中的各个字段会被初始化为随机数,然后通过大量的数据和深度学习模型来训练这些向量。
coding 迪斯尼
·
2025-02-24 00:11
chatgpt
算法
人工智能
大语言模型
程序员/设计师/编辑必看:高效办公工具如何缩短50%工作时间
针对程序员、编辑、设计师等文字工作者,多屏幕、全键盘、多功能鼠标及
语音
输入等工具可显著提升工作效率。
涛涛讲AI
·
2025-02-23 19:38
效率工具
大模型
人工智能
deepseek
人工智能(AI):科技新纪元的领航者
从智能手机上的
语音
助手到自动驾驶汽车、LLM
r_martian
·
2025-02-23 19:06
AI
人工智能
科技
Day11-04.案例-文件上传-阿里云OSS-准备
云服务:通过互联网对外提供的各种各样的服务,比如像
语音
服务,短信服务,邮件服务,视频直播服务,文字识别服务,对象存储服务等等。
我以为心都空了
·
2025-02-23 14:00
JavaWeb
阿里云
云计算
短时傅里叶变换(STFT)与逆变换(ISTFT)
引言短时傅里叶变换(Short-TimeFourierTransform,STFT)是一种将信号分解为时间和频率成分的技术,广泛应用于音频处理、
语音
分析和音乐信息检索等领域。
niuguangshuo
·
2025-02-23 09:22
音频算法
python
信号处理
傅里叶分析
数字人源头厂商-源码出售源码交付-OEM系统贴牌
搭建数字人源码系统,是融合多领域前沿技术的复杂工程,涵盖图形学、人工智能、
语音
处理等。本文将深入剖析数字人源码搭建的技术开发细节,为开发者提供全面且深入的技术指南。
余~~18538162800
·
2025-02-23 08:16
音视频
线性代数
网络
人工智能
清影2.0(AI视频生成)技术浅析(五):音频处理技术
清影2.0的音频处理技术是其视频生成平台的重要组成部分,主要用于生成与视频内容相匹配的音频,包括文本转
语音
(TTS)、音效合成和背景音乐合成。
爱研究的小牛
·
2025-02-23 08:42
AIGC—视频
AIGC—音频
人工智能
音视频
机器学习
算法
AIGC
英伟达(NVIDIA)芯片全解析:专业分类、应用场景与真实案例
你每天使用的智能手机、AI
语音
助手、自动驾驶汽车,甚至是电影特效背后,都有英伟达(NVIDIA)的芯片在默默工作。
嵌入式Jerry
·
2025-02-23 06:31
AI
分类
人工智能
数据挖掘
嵌入式硬件
linux
数据分析
算法
Opus编解码
最近项目中用到了
语音
编码opus,在网上搜了一下,资料非常少,而且没有一个完整的教程,现在简单记录下来opus的使用方法。
行走在软件开发路上的人
·
2025-02-23 06:28
音频
微服务即时通信系统---(一)项目介绍
目录框架与微服务拆分设计微服务架构设计思想入口网关子服务HTTP通信WEBSOCKET通信用户管理子服务好友管理子服务文件管理子服务消息存储子服务消息转发子服务
语音
识别子服务项目所使用到的技术栈/框架/
YangZ123123
·
2025-02-22 23:11
微服务即时通信系统
微服务
运维
架构
深入探索Mozilla的DeepSpeech:
语音
识别的新里程碑
深入探索Mozilla的DeepSpeech:
语音
识别的新里程碑项目地址:https://gitcode.com/gh_mirrors/de/DeepSpeech项目简介是一个开源的
语音
识别引擎,基于深度学习技术
温宝沫Morgan
·
2025-02-22 18:28
人工智能基础:从零开始讲解AI的基本概念、发展历程及其核心技术
从自动驾驶到
语音
助手,从推荐系统到智能制造,人工智能技术无处不在。然而,许多人对于人工智能的了解仍停留在表面,甚至对其中的一些核心概念感到陌生。
一碗黄焖鸡三碗米饭
·
2025-02-22 16:42
人工智能前沿与实践
人工智能
架构
机器学习
深度学习
数字人源码源头搭建技术全攻略,支持OEM
搭建数字人源码系统是一项综合性的技术工程,融合了计算机图形学、人工智能、
语音
处理等多学科前沿技术。本文将深入剖析数字人源码搭建的技术细节,为开发者提供详尽的技术开发指南。
余18538162800)
·
2025-02-22 16:39
python
超越实验室:打造真正在现实世界中奏效的 AI (泛化性与鲁棒性)
我们看到AI驱动着从
语音
助手到推荐引擎的各种应用,而自动驾驶汽车、个性化医疗等更具变革性的应用前景也始终令人期待。
海棠AI实验室
·
2025-02-22 00:20
人工智能理论与学术
机器学习
人工智能
信息可视化
深度学习模型:原理、架构与应用
深度学习(DeepLearning)是机器学习中的一个分支,基于人工神经网络的发展,尤其是多层神经网络的研究,使其在
语音
识别、图像处理、自然语言处理等领域取得了显著进展。
一ge科研小菜菜
·
2025-02-21 22:00
工具
深度学习
edge-tts微软文本转
语音
库
Edge-TTS是一个Python库,比较好用,直接pip安装。pipinstalledge-tts输入edge-tts,输出提示信息,安装完成。usage:edge-tts[-h][-tTEXT][-fFILE][-vVOICE][-l][--rateRATE][--volumeVOLUME][-OOVERLAPPING][--write-mediaWRITE_MEDIA][--write-su
caridle
·
2025-02-21 10:47
edge
python
AI 声音:数字音频、
语音
识别、TTS 简介与使用示例
从
语音
识别(ASR)到文本转
语音
(TTS),再到个性化声音克隆,这些技术已经深入到我们的日常生活中:
语音
助手、自动字幕生成、
语音
导航等应用无处不在。数字音频音频是声音的“数字化”。
凌虚NPG
·
2025-02-21 07:57
AI
人工智能
人工智能
语音识别
后端
python
深度学习
【音视频】如何对wav音频文件进行opus编解码?
它旨在提供高质量的
语音
和音乐传输服务,特别是在网络带宽受限的情
川弥
·
2025-02-21 03:09
音视频
python
视频编解码
bash
linux
ffmpeg
音频
数据分析
HarmonyOS Next智能
语音
助手的
语音
合成与模型优化实战
本文旨在深入探讨基于华为鸿蒙HarmonyOSNext系统(截止目前API12)构建智能
语音
助手过程中
语音
合成与模型优化技术的实战应用,基于实际开发经验进行总结。
·
2025-02-20 21:01
harmonyos
微信扫二维码挪车小程序开发制作功能
扫一下挪车,二维码代替了电话号码,只需要用手机扫描二维码,即可直接联系到车主挪车,在整个过程中,不需要知道车主联系电话或其他任何联系方式,平台会以微信、短信、
语音
通话等方式通知车主
dh13122250525
·
2025-02-20 19:32
微信小程序
《揭秘AI
语音
助手:从“听”到“说”的智能之旅》
在当今数字化时代,AI
语音
助手已成为我们生活和工作中的得力伙伴。无论是苹果的Siri、亚马逊的Alexa,还是国内的小爱同学、小度等,它们能轻松执行指令,如查询天气、播放音乐,甚至陪我们聊天解闷。
·
2025-02-20 17:17
人工智能深度学习
RealtimeSTT:实时
语音
转文本的开源神器,轻松实现高效
语音
处理
在
语音
技术飞速发展的时代,实时
语音
转文本(Speech-to-Text,简称STT)技术已逐渐成为
语音
助手、在线会议记录、字幕生成等应用的核心功能。
AI云极
·
2025-02-20 15:29
【开源系列】
语音识别
开源
语聊房软件开发流程与基础功能
以下是关键流程、基础功能及示例代码:---一、开发流程1.需求分析-明确目标用户(社交/游戏/教育)-竞品分析(Clubhouse/Discord/狼人杀)-核心功能优先级排序2.技术选型-实时
语音
:声网
ALLSectorSorft
·
2025-02-20 15:54
java
html5
javascript
鸢尾花分类项目 GUI
常见的应用包括图像识别、
语音
识别、推荐系统等。
编织幻境的妖
·
2025-02-20 14:49
分类
数据挖掘
人工智能
《神经网络与深度学习》(邱锡鹏) 内容概要【不含数学推导】
还阐述了深度学习在人工智能领域的重要地位和发展现状,以及其在图像、
语音
、自然语言处理等多个领域的成功应用。术语解释人工智能:旨在让机器模拟人类智能的技术和科学。
code_stream
·
2025-02-20 13:12
#
机器学习
神经网络
SIP协议ALG实现逻辑【概览】(一)
SIP(SessionInitiationProtocol)是一种用于控制多媒体通信会话的信令协议,广泛应用于
VoIP
(VoiceoverIP)、视频通话、即时消息等实时通信应用中。
看兵马俑的程序员
·
2025-02-20 13:34
NAT+ALG
网络
网络协议
Coze扣子专业版计费规则调整一览
专业版用户每日赠送500资源点(仅限当日有效),可抵扣智能体调用费用和模型调用费用
语音
识别API、
语音
合成API、实时音视频SDK全面开放,无需申请即可使用更新详解:智能体资源包、大模型资源包下架处理,
落笔画忧愁e
·
2025-02-20 09:33
扣子商店
Coze插件
Fastgpt接入Whisper本地模型实现
语音
识别输入
前言FastGPT默认使用了OpenAI的LLM模型和
语音
识别模型,如果想要私有化部署的话,可以使用openai开源模型Whisper。
泰山AI
·
2025-02-20 09:31
AI大模型应用开发
AI语音模型
gpt
rag
fastgpt
DeepSeek掀起推理服务器新风暴,AI应用迎来变革转折点?
AI浪潮下,推理服务器崭露头角在科技飞速发展的当下,AI是耀眼明星,席卷各行业,深刻改变生活与工作模式,从
语音
助手到医疗诊断、金融风险预测,AI无处不在。
小深ai硬件分享
·
2025-02-20 08:20
人工智能
大数据
【拥抱AI】如何实现AI外呼通话,并与客户达成确认
1.技术选型与准备主要技术组件
语音
识别(ASR):将客户的
语音
转换为文本。自然语言处理(NLP):理解和生成自然语言对话。
语音
合成(TTS):将文本转换为客户可以听到的
语音
。
奔跑草-
·
2025-02-20 06:08
人工智能
人工智能
华为的云端训练算力与迭代效率
华为云、云端训练、算力、迭代效率、人工智能、深度学习、模型训练、分布式训练、优化算法1.背景介绍人工智能(AI)技术近年来发展迅速,深度学习作为其核心驱动力,在图像识别、自然语言处理、
语音
识别等领域取得了突破性进展
AI大模型应用之禅
·
2025-02-20 05:34
DeepSeek
R1
&
AI大模型与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
AI外呼机器人:营销新利器还是骚扰电话的升级版?
AI外呼系统的核心技术是
语音
识别和自然语言处理。通过深度学习海量
yoloGina
·
2025-02-20 04:28
客户管理
外呼系统
电话外呼
人工智能
机器人
Java Pjsip (Pjsua2 api ) 2.10 windows sip
语音
呼叫教程
1.安装swigwin-4.0.1下载地址http://www.swig.org/download.html注意是swigwinWindowsusersshoulddownloadswigwin-4.0.1whichincludesaprebuiltexecutable.配置目录到winpath2.下载pjproject-2.10.zip(如果有python错误请安装py2.7及环境path配置)
java_lilin
·
2025-02-20 04:47
pjsip
pjsip
sip
pjsua2
java
sip
芯麦GC1808立体声ADC芯片解析:高性价比与全集成音频采集方案
引言在直播设备、智能
语音
终端等新兴应用的推动下,高性能音频采集系统的需求持续增长。
青牛科技-Allen
·
2025-02-20 03:16
GLOBALCHIP
音视频
单片机
嵌入式硬件
收录机
人工智能
家用电器
怎样让小爱音响免费畅听?本地音乐库与自动搜歌播放全搞定!(如何让小爱音响播放本地音乐库?如何让小爱音响自动搜索下载音乐到本地并播放?)
文章目录介绍演示环境小爱音响准备部署配置
语音
口令️注意事项⚓️相关链接⚓️介绍还在因为小爱音响的音乐资源问题苦恼吗?当你心情正好,想放首歌,却发现不是提示“没有资源”,就是让你开会员?
xiaoqiangclub
·
2025-02-20 03:45
随记·2025✍️
小爱音响
小米
小爱同学
免费听歌
实用教程
开源项目亮点:打造你的DIY智能
语音
助手——“小爱音箱自定义固件”
开源项目亮点:打造你的DIY智能
语音
助手——“小爱音箱自定义固件”项目地址:https://gitcode.com/gh_mirrors/xia/xiaoai-patch在当今智能家居设备泛滥的时代,一款能够深度定制
侯深业Dorian
·
2025-02-20 03:40
wav2lip部署方案-数字人项目
该项目商用需要通过原作者原作者github链接说明该项目可以将
语音
和视频或图片结合生成数字人。
何为标准
·
2025-02-19 23:10
python
语音
识别使用SenseVoiceSmall模型实现源码
SenseVoiceSenseVoice是具有音频理解能力的音频基础模型,包括
语音
识别(ASR)、语种识别(LID)、
语音
情感识别(SER)和声学事件分类(AEC)或声学事件检测(AED)。
丢了个猪
·
2025-02-19 23:09
python
语音识别
深度学习
机器学习
语言模型
SenseVoice 实测,阿里开源
语音
大模型,识别效果和效率优于 Whisper,居然还能检测掌声、笑声!5分钟带你部署体验
前段时间,带着大家捏了一个对话机器人:手把手带你搭建一个
语音
对话机器人,5分钟定制个人AI小助手(新手入门篇)其中
语音
识别(ASR)方案,采用的是阿里开源的FunASR,这刚不久,阿里又开源了一个更强的音频基础模型
AI码上来
·
2025-02-19 23:38
AI实战
开源
whisper
xcode
从零到入门:人工智能学习路径全解析
从手机里的
语音
助手到电商平台的推荐系统,从自动驾驶到医疗影像分析,AI技术正在重塑人类社会的运行方式。
这题有点难度
·
2025-02-19 21:24
人工智能
学习
从代码到专利:如何用自注意力机制实现高效序列转换?——深度解析Google的Transformer架构
在传统的序列转换任务(如机器翻译、
语音
识别等)中,循环神经网络(RNN)和卷积神经网络(CNN)是常用的模型架构。然而,这些模型存在以下问题:
CodePatentMaster
·
2025-02-19 21:53
transformer
深度学习
人工智能
AIGC
架构
HarmonyOS Next
语音
合成技术深度解析
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统(截止目前API12)中的
语音
合成技术,基于实际开发实践进行总结。
·
2025-02-19 15:31
harmonyos
探索 Open WebUI:功能全面的开源交互平台
目录探索OpenWebUI:功能全面的开源交互平台轻松部署兼容多API集成精细权限和用户组管理跨设备响应式设计移动渐进式Web应用(PWA)全面支持Markdown和LaTeX免提
语音
/视频通话模型构建器原生
gs80140
·
2025-02-19 14:52
基础知识科谱
AI
人工智能
agent和android怎么结合:健康助手,旅游助手,学习助手
agent和android怎么结合:健康助手,旅游助手,学习助手创新点智能交互创新:提出全新的agent-Android交互模式,如基于手势、
语音
、眼动等多模态融合的交互方式。
ZhangJiQun&MXP
·
2025-02-19 11:00
教学
2021
论文
2024大模型以及算力
android
旅游
学习
人工智能
语言模型
自然语言处理
prompt
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他