E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语音编解码
Java Pjsip (Pjsua2 api ) 2.10 windows sip
语音
呼叫教程
1.安装swigwin-4.0.1下载地址http://www.swig.org/download.html注意是swigwinWindowsusersshoulddownloadswigwin-4.0.1whichincludesaprebuiltexecutable.配置目录到winpath2.下载pjproject-2.10.zip(如果有python错误请安装py2.7及环境path配置)
java_lilin
·
2025-02-20 04:47
pjsip
pjsip
sip
pjsua2
java
sip
芯麦GC1808立体声ADC芯片解析:高性价比与全集成音频采集方案
引言在直播设备、智能
语音
终端等新兴应用的推动下,高性能音频采集系统的需求持续增长。
青牛科技-Allen
·
2025-02-20 03:16
GLOBALCHIP
音视频
单片机
嵌入式硬件
收录机
人工智能
家用电器
怎样让小爱音响免费畅听?本地音乐库与自动搜歌播放全搞定!(如何让小爱音响播放本地音乐库?如何让小爱音响自动搜索下载音乐到本地并播放?)
文章目录介绍演示环境小爱音响准备部署配置
语音
口令️注意事项⚓️相关链接⚓️介绍还在因为小爱音响的音乐资源问题苦恼吗?当你心情正好,想放首歌,却发现不是提示“没有资源”,就是让你开会员?
xiaoqiangclub
·
2025-02-20 03:45
随记·2025✍️
小爱音响
小米
小爱同学
免费听歌
实用教程
开源项目亮点:打造你的DIY智能
语音
助手——“小爱音箱自定义固件”
开源项目亮点:打造你的DIY智能
语音
助手——“小爱音箱自定义固件”项目地址:https://gitcode.com/gh_mirrors/xia/xiaoai-patch在当今智能家居设备泛滥的时代,一款能够深度定制
侯深业Dorian
·
2025-02-20 03:40
wav2lip部署方案-数字人项目
该项目商用需要通过原作者原作者github链接说明该项目可以将
语音
和视频或图片结合生成数字人。
何为标准
·
2025-02-19 23:10
python
语音
识别使用SenseVoiceSmall模型实现源码
SenseVoiceSenseVoice是具有音频理解能力的音频基础模型,包括
语音
识别(ASR)、语种识别(LID)、
语音
情感识别(SER)和声学事件分类(AEC)或声学事件检测(AED)。
丢了个猪
·
2025-02-19 23:09
python
语音识别
深度学习
机器学习
语言模型
SenseVoice 实测,阿里开源
语音
大模型,识别效果和效率优于 Whisper,居然还能检测掌声、笑声!5分钟带你部署体验
前段时间,带着大家捏了一个对话机器人:手把手带你搭建一个
语音
对话机器人,5分钟定制个人AI小助手(新手入门篇)其中
语音
识别(ASR)方案,采用的是阿里开源的FunASR,这刚不久,阿里又开源了一个更强的音频基础模型
AI码上来
·
2025-02-19 23:38
AI实战
开源
whisper
xcode
从零到入门:人工智能学习路径全解析
从手机里的
语音
助手到电商平台的推荐系统,从自动驾驶到医疗影像分析,AI技术正在重塑人类社会的运行方式。
这题有点难度
·
2025-02-19 21:24
人工智能
学习
从代码到专利:如何用自注意力机制实现高效序列转换?——深度解析Google的Transformer架构
在传统的序列转换任务(如机器翻译、
语音
识别等)中,循环神经网络(RNN)和卷积神经网络(CNN)是常用的模型架构。然而,这些模型存在以下问题:
CodePatentMaster
·
2025-02-19 21:53
transformer
深度学习
人工智能
AIGC
架构
[总结] 音视频开发工程师之路
前言音视频开发是一个涉及多个技术领域的复杂方向,涵盖了音频处理、视频渲染、
编解码
技术、流媒体传输等多个方面。以下是一个简要的学习路线指南,帮助你逐步掌握音视频开发的核心技能。
二进制怪兽
·
2025-02-19 20:17
音视频
音视频
HarmonyOS Next
语音
合成技术深度解析
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统(截止目前API12)中的
语音
合成技术,基于实际开发实践进行总结。
·
2025-02-19 15:31
harmonyos
探索 Open WebUI:功能全面的开源交互平台
目录探索OpenWebUI:功能全面的开源交互平台轻松部署兼容多API集成精细权限和用户组管理跨设备响应式设计移动渐进式Web应用(PWA)全面支持Markdown和LaTeX免提
语音
/视频通话模型构建器原生
gs80140
·
2025-02-19 14:52
基础知识科谱
AI
人工智能
agent和android怎么结合:健康助手,旅游助手,学习助手
agent和android怎么结合:健康助手,旅游助手,学习助手创新点智能交互创新:提出全新的agent-Android交互模式,如基于手势、
语音
、眼动等多模态融合的交互方式。
ZhangJiQun&MXP
·
2025-02-19 11:00
教学
2021
论文
2024大模型以及算力
android
旅游
学习
人工智能
语言模型
自然语言处理
prompt
arXiv每日推荐-3.4:
语音
/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】SELD-TCN:SoundEventLocalization&DetectionviaTemporalConvolutionalNetworks标题:SELD-TCN:基于时间卷积网络的声音事件定位与检测作者:KarimGuirguis,BinYang备注:5pages,3tables,2figures.SubmittedtoEUSIPCO2020链接:
sapienst
·
2025-02-19 09:16
语音识别
语音识别
如何高效使用Zoom视频会议软件:功能解析与操作指南
目录1.Zoom的基本功能介绍1.1视频会议1.2
语音
会议1.3屏幕共享1.4会议录制1.5聊天和文件共享1.6会议室和个人会议ID2.Zoom的使用方法2.1安装Zoom2.2创建和加入会议2.2.1
concisedistinct
·
2025-02-19 08:39
IT工具
zoom
视频
软件
视频会议
DeepSeek自研AI芯片,AI算力新变革?
AI算力告急,成本掣肘发展当下,AI技术迅猛发展,从科研领域的复杂模型训练,到日常生活里智能
语音
助手的实时交互,算力成了决定AI发展的关键因素。作为大模型领域的后起之秀,DeepSeek对计算资源
·
2025-02-19 07:19
人工智能深度学习机器学习算法
Jfinal websocket onMessage无法接收二进制音频数据问题
刚开始还没找到是数据大小限制的问题(由于要测试好多其它
语音
包,例如vad4j,webrctvad这些),以为是自己哪里搞错了,就找websocket什么时候
withme977
·
2025-02-19 03:30
websocket
网络协议
网络
支持DeepSeek、Claude、Ollama等主流模型,提供人物调整,虚拟朋友、
语音
对话
支持DeepSeek、Claude、OpenAI、Gemini、ChatGLM、Ollama,人设调教,虚拟朋友、
语音
对话。它可以让你在聊天平台上对接语言模型,实现和语言模型的直接对话。
struggle2025
·
2025-02-18 21:59
人工智能
chatgpt
机器人
人工智能到底是什么?
以下是关于人工智能的具体介绍:定义-从技术角度:人工智能是让计算机系统具备像人类一样的感知、学习、推理、决策等能力,通过算法和数据使计算机能处理和理解各种复杂信息,如
语音
识别系统能听懂人类语言并转化为文字
yzx991013
·
2025-02-18 14:05
开发语言
人工智能
python
django
uniapp 小程序
语音
录制
uniapp小程序
语音
录制微信小程序管理平台添加同声编译微信公共平台登陆添加微信同声传译使用manifest.json"mp-weixin":{"appid":"xxxxxxxxxxxx","plugins
你的眼睛會笑
·
2025-02-18 10:55
uni-app
小程序
Android系统开机时间优化-实践篇(一)
Android系统开机时间优化目录背景正文优化内容小结产品功能:高清大屏、多路摄像头、蓝牙、WIFI、4G无线网络、收音机、
语音
识别等等。
漫步的傻瓜
·
2025-02-18 08:00
Android系统启动时间优化
android
linux
第二章:12.3 建立表现基准
背景介绍
语音
识别是一种常见的机器学习应用,用户通过
语音
输入代替键盘输入,系统需要将
语音
转换为文本。在这个过程中,算法的性能可以通过训练误差和交叉验证误差来评估。
望云山190
·
2025-02-17 22:40
基准性能水平
人工智能
机器学习
Audio-Visual Speech Enhancement(视听
语音
增强)领域近三年研究进展与国内团队及手机厂商动态分析
一、视听
语音
增强领域近三年研究进展多模态融合与模型轻量化多模态特征融合:中国科学技术大学团队提出通过引入超声舌头图像和唇部视频的联合建模,结合知识蒸馏技术,在训练阶段利用教师模型传递舌部运动知识,从而在推断时仅依赖唇部视频即可提升
语音
增强效果
AndrewHZ
·
2025-02-17 20:47
深度学习新浪潮
智能手机
算法
计算机视觉
硬件架构
硬件工程
智能硬件
语音
与自然语言处理(NLP):智能交互的核心技术
随着人工智能(AI)技术的飞速发展,
语音
识别与自然语言处理(NaturalLanguageProcessing,NLP)成为了智能交互系统的核心技术。
给生活加糖!
·
2025-02-17 14:21
热门知识
自然语言处理
交互
人工智能
使用多模态大语言模型进行深度学习的图像、文本和
语音
数据增强
本文通过探索利用多模态LLMs进行图像、文本和
语音
数据增强的最新文献,填补了
数行天下
·
2025-02-17 12:42
人工智能
语言模型
深度学习
人工智能
自然语言处理
ASR技术与Whisper引擎
一、ASR技术简介ASR英文全称是AutomaticSpeechRecognition,中文叫做自动
语音
识别,是利用机器对
语音
信号进行识别和理解并将其转换成相文本和命令的技术。
Catformon
·
2025-02-17 01:38
whisper
chattts本地化python部署及采坑记录(2024年亲测可用)
ChatTTS是一个文本转
语音
的开源项目,短短2周左右的时间,在GitHub上已经斩获了24.4k的Star!
Catformon
·
2025-02-17 00:05
python
开发语言
麒麟SoC的详细架构组成介绍
的主要组成部分1.应用处理器(ApplicationProcessor,AP)2.图形处理单元(GPU)3.神经网络处理单元(NPU)4.图像信号处理器(ISP)5.调制解调器(Modem,基带芯片)6.多媒体
编解码
器
小蘑菇二号
·
2025-02-16 16:33
麒麟
一文带你了解人工智能:现状、应用、变革及未来展望
从智能手机的
语音
助手到自动驾驶汽车,从智能家居到医疗诊断,AI正在改变着我们的生活方式。本文将结合时事,为大家介绍当前人工智能的发展形势、在生活中的应用、人工智能的变革以及未来的发展方向。
空青726
·
2025-02-16 08:02
人工智能
chatgpt
ai
大数据
机器学习
深度学习
创业创新
《DeepSeek Janus Pro 7B:多模态人工智能大模型部署全攻略》
从智能
语音
助手到图像识别系统,从自动驾驶汽车到智能医疗诊断,多模态AI的身影无处不在,它让机器能够理解和处理多种类型的信息,如文本、图像、音频等,从而实现更加智能、高效的交互。DeepSee
空云风语
·
2025-02-16 03:57
神经网络
人工智能
深度学习
人工智能
通义模型Prompt调优的实用技巧
对较难被准确遵循的复杂规则可拆分为多条规则,有助于提升效果策略二:适当冗余关键信息策略三:使用分隔符给Prompt分段策略四:增加学习示例策略五:编写清晰地说明-指定任务所需的步骤策略六:让大模型反思自己的推理过程策略七:
语音
场景下的
大模型实战
·
2025-02-15 22:16
prompt
多开工具与
语音
识别技术的融合与创新
多开工具与
语音
识别技术的融合与创新摘要:随着科技的不断进步,多开工具和
语音
识别技术的融合与创新正在为我们的日常生活带来更加便利和高效的体验。
·
2025-02-15 18:26
程序员
鸿蒙开发:文本合成
语音
前言Android开发的同学都知道,在Android当中,实现一段文字合成
语音
播放,可以使用系统提供的对象TextToSpeech来很快的实现,如果不用系统自带的,也可以使用三方提供的,比如讯飞的
语音
合成等等
·
2025-02-15 14:19
【开发日志】数字人+LLM:从概念到实现的全程记录!
i91490016GBGPU:GTX40608GBSYS:Windows11WSL:Ubuntu22.04本文章使用到的技术内容:数字人框架:LiveTalking大模型:Llama3.1TTS:GPT-SoVits
语音
转视频
AI大模型-王哥
·
2025-02-15 13:11
大模型学习
大模型教程
大模型
人工智能
LLM
数字人
大模型入门
麒麟990和麒麟8000哪个好
麒麟8000是华为针对中高端市场推出的一款5G芯片,支持卫星通信技术,可以通过北斗、GPS、GLONASS等卫星系统进行定位和导航,也可以通过北斗、天通等卫星系统进行
语音
和短信通信,为用户提供更广阔的联网空间
m0_50613577
·
2025-02-15 12:33
智能手机
华为FreeBuds Pro4和FreeBuds Pro3区别,相比上一代升级了什么
FreeBudsPro4FreeBudsPro3音质采用升级版星闪核心技术与L2HC4.0智能无损
编解码
协议,传输码率大幅提升至2.3Mbps,可支持48kHz/2
芥子沫
·
2025-02-15 05:33
华为
linux中流设备_设备端SDK(Linux)文档
:55:00功能描述摄像头直播:支持RTMP推流,当前视频支持H264,音频支持G711a以及AAC_LC格式.存储卡录像查看:将存储在SD卡等外存中的录像文件推到服务端,支持seek到指定位置操作.
语音
对讲
知酒僧
·
2025-02-15 04:59
linux中流设备
WhisperX:革命性的自动
语音
识别工具
WhisperX:革命性的自动
语音
识别工具项目地址:https://gitcode.com/gh_mirrors/wh/whisperX项目介绍WhisperX是一个开源的自动
语音
识别(ASR)项目,由
孔秋宗Mora
·
2025-02-15 03:14
WebP2P+自研回音消除:视频通话SDK嵌入式EasyRTC构建高交互性音视频应用
回音消除算法的核心在于从麦克风采集的混合信号中分离出原始
语音
信号和回声信号,并将回声信号从混合信号中移除。EasyRTC采用的自研算法基于以下几种技术:自适应滤波器:通过实时调整滤波器
Likeadust
·
2025-02-14 22:10
音视频
p2p
WebP2P
webrtc
【前端开发学习笔记17】使用ai
AI的认知&两个工具-认知同步AI早已不是新事物(接受):
语音
识别,人脸识别,无人驾驶,智能机器人...
wei387245232
·
2025-02-14 19:14
学习
笔记
使用Python和Discord API进行数据提取和分析
技术背景介绍Discord作为一个广受欢迎的VoIP和即时消息社交平台,允许用户通过
语音
通话、视频通话、文本消息以及其他媒体和文件进行互动。
scaFHIO
·
2025-02-14 15:43
python
开发语言
语音
app系统软件源码开发搭建新手启蒙篇
在移动互联网飞速发展的今天,
语音
app已经成为人们生活中不可或缺的一部分。无论是
语音
聊天、
语音
助手还是
语音
直播,这些应用都给我们的生活和工作带来了极大的便利和精神娱乐。
山东布谷科技官方
·
2025-02-14 11:50
语聊源码
语音app源码
语音系统开发
cnn以及例子
cnnCNN即卷积神经网络(ConvolutionalNeuralNetwork),是一种专门为处理具有网格结构数据(如图像、音频)而设计的深度学习模型,在计算机视觉、
语音
识别等诸多领域都有广泛应用。
阿拉斯攀登
·
2025-02-14 10:41
机器学习
cnn
人工智能
神经网络
物联网智能
语音
控制灯光系统设计与实现
通过
语音
控制和自动调节灯光,用户可以更便捷地操作家中的照明设备,提高生活的舒适度与便利性。
木燚垚
·
2025-02-14 09:02
物联网
WebRTC与EasyRTC:开启智能硬件音视频通讯的全新旅程
一、WebRTC与智能硬件融合的崭新趋势WebRTC技术,凭借其无需插件或额外软件即可实现点对点实时通信的卓越优势,已然成为视频会议、
语音
通话及文件共享等众多领域的宠儿。
EasyNVR
·
2025-02-14 09:00
EasyRTC
webrtc
智能硬件
音视频
网络
视频监控
安全
Java中文乱码浅析及解决方案
基本概念在解决这个问题之前,我们需要先理解几个基本概念:字符编码(CharacterEncoding):是一套用于字符集(CharacterSet)的
编解码
规则,决定了计算机如何使用数字来表示特定字符。
南方淮竹
·
2025-02-14 06:43
实用解决方案
java
乱码
解决方案
案例分析
x265 接口函数 API 功能详细介绍
接口函数详细介绍x265_param_alloc:该函数会分配一个x265_param的实例,这个结构体用于存储x265
编解码
器的参数。
码流怪侠
·
2025-02-14 04:22
视频编解码
HEVC
x265
音视频
API
Android平台FFmpeg多媒体处理实战
本文还有配套的精品资源,点击获取简介:FFmpeg在Android平台为开发者提供强大的音视频处理能力,涵盖
编解码
、容器格式解析、软硬解码切换、音频重采样和视频转换等关键功能。
雲明
·
2025-02-14 04:21
FFmpeg音视频
编解码
优化
FFmpeg音视频
编解码
优化关键词FFmpeg音视频
编解码
优化策略性能测试实战案例摘要本文将围绕FFmpeg音视频
编解码
优化这一主题,详细介绍FFmpeg的基础知识、安装配置、音视频
编解码
原理、性能优化方法
AI天才研究院
·
2025-02-14 04:51
计算
AI大模型企业级应用开发实战
DeepSeek
R1
&
大数据AI人工智能大模型
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
Linux 上使用 Rust、Golang 和 C++ 进行应用开发比较
作为一名前音视频
编解码
工程师,最常使用的语言是c/c++,但是永久了总想尝试下其他语言。
孽小倩
·
2025-02-14 04:17
linux
开发语言
linux
rust
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他