E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语音SDK
AI 声音:数字音频、
语音
识别、TTS 简介与使用示例
从
语音
识别(ASR)到文本转
语音
(TTS),再到个性化声音克隆,这些技术已经深入到我们的日常生活中:
语音
助手、自动字幕生成、
语音
导航等应用无处不在。数字音频音频是声音的“数字化”。
凌虚NPG
·
2025-02-21 07:57
AI
人工智能
人工智能
语音识别
后端
python
深度学习
两种方案实现调用 DeepSeek API
在调用DeepSeekAPI时,通常有两种主要方案,分别是通过HTTP请求和通过
SDK
(软件开发生套件)。下面将详细介绍这两种方案。
Rverdoser
·
2025-02-21 06:21
苹果签名
苹果企业签名
【音视频】如何对wav音频文件进行opus编解码?
它旨在提供高质量的
语音
和音乐传输服务,特别是在网络带宽受限的情
川弥
·
2025-02-21 03:09
音视频
python
视频编解码
bash
linux
ffmpeg
音频
数据分析
量化交易入门——平台框架、技术类策略、量化心得
量化平台分类:本地:MC、TB、WH、TS、MT4云端:聚宽、优矿、米筐、bigquant
SDK
/量化API:万得、东财choice、掘金量化开源框架:PyCTP、Vnpy、zipline、quicklib
アナリスト
·
2025-02-21 00:16
机器学习
深度学习
概率论
算法
HarmonyOS Next智能
语音
助手的
语音
合成与模型优化实战
本文旨在深入探讨基于华为鸿蒙HarmonyOSNext系统(截止目前API12)构建智能
语音
助手过程中
语音
合成与模型优化技术的实战应用,基于实际开发经验进行总结。
·
2025-02-20 21:01
harmonyos
TT无人机零散笔记
TT扩展板上传模式:
sdk
:软件开发工具包。一键安装驱动:扩展模块使用Mind+编程是通过USB串口,因此在首次使用Mind+连接扩展模块时需要一键安装驱动。
xzal12
·
2025-02-20 20:12
TT无人机
无人机
笔记
基于Linux平台的多实例RTSP|RTMP直播播放器深度解析与技术实现
本文将结合大牛直播
SDK
的Linux平台RTSP/RTMP播放器功能,深入解析其实现原理、关键技术点以及优化策略。通过对代码的详细分析和实际应用的结合,帮助开发者更好地理解和应用该技术。
音视频牛哥
·
2025-02-20 19:07
RTSP播放器
RTMP播放器
大牛直播SDK
音视频
实时音视频
视频编解码
linux
rtsp播放器
linux
rtmp播放器
linux国产rtmp播放器
linux国产rtsp播放器
iOS平台RTSP|RTMP直播播放器技术接入说明
技术背景大牛直播
SDK
自2015年发布RTSP、RTMP直播播放模块,迭代从未停止,SmartPlayer功能强大、性能强劲、高稳定、超低延迟、超低资源占用。
音视频牛哥
·
2025-02-20 19:06
RTSP播放器
RTMP播放器
大牛直播SDK
objective-c
iOS
rtsp播放器
iOS
rtmp播放器
iOS
rtsp
player
iOS
rtmp
player
iOS播放器
大牛直播SDK
微信扫二维码挪车小程序开发制作功能
扫一下挪车,二维码代替了电话号码,只需要用手机扫描二维码,即可直接联系到车主挪车,在整个过程中,不需要知道车主联系电话或其他任何联系方式,平台会以微信、短信、
语音
通话等方式通知车主
dh13122250525
·
2025-02-20 19:32
微信小程序
使用Arcgis API for android加载OpenStreetMap底图并完成定位
环境:Android
SDK
API22,AndroidStudio1.2.2,arcgisandroid
SDK
10.2.7如何基于ArcgisAPIforandroid在AndroidStudio新建一个项目就不再赘述了
续汉冕
·
2025-02-20 17:46
移动开发
android
android
studio
arcgis
api
《揭秘AI
语音
助手:从“听”到“说”的智能之旅》
在当今数字化时代,AI
语音
助手已成为我们生活和工作中的得力伙伴。无论是苹果的Siri、亚马逊的Alexa,还是国内的小爱同学、小度等,它们能轻松执行指令,如查询天气、播放音乐,甚至陪我们聊天解闷。
·
2025-02-20 17:17
人工智能深度学习
ArcGIS Runtime
SDK
for iOS 开发之地图范围(map extent)
注:本篇文章翻译自:https://developers.arcgis.com/ios/objective-c/guide/iphone
sdk
-mapnavigation.htm;地图视图包含了地图范围被定义和改变的选项
hlj184
·
2025-02-20 16:08
ArcGIS
for
IOS
arcgis
ios开发
map
extent
RealtimeSTT:实时
语音
转文本的开源神器,轻松实现高效
语音
处理
在
语音
技术飞速发展的时代,实时
语音
转文本(Speech-to-Text,简称STT)技术已逐渐成为
语音
助手、在线会议记录、字幕生成等应用的核心功能。
AI云极
·
2025-02-20 15:29
【开源系列】
语音识别
开源
uni-app adb安卓wifi无线调试
工具手机和电脑连接的同一个WIFICMD进入到adb工具所在目录,可以使用HBuilder自带adb,如:D:\Tools\HBuilderX\plugins\launcher\tools\adbs,也可以使用Android
SDK
景影随形
·
2025-02-20 15:25
uni-app
网络错误
语聊房软件开发流程与基础功能
以下是关键流程、基础功能及示例代码:---一、开发流程1.需求分析-明确目标用户(社交/游戏/教育)-竞品分析(Clubhouse/Discord/狼人杀)-核心功能优先级排序2.技术选型-实时
语音
:声网
ALLSectorSorft
·
2025-02-20 15:54
java
html5
javascript
鸢尾花分类项目 GUI
常见的应用包括图像识别、
语音
识别、推荐系统等。
编织幻境的妖
·
2025-02-20 14:49
分类
数据挖掘
人工智能
《神经网络与深度学习》(邱锡鹏) 内容概要【不含数学推导】
还阐述了深度学习在人工智能领域的重要地位和发展现状,以及其在图像、
语音
、自然语言处理等多个领域的成功应用。术语解释人工智能:旨在让机器模拟人类智能的技术和科学。
code_stream
·
2025-02-20 13:12
#
机器学习
神经网络
应用内自动续订商品,畅享无缝服务体验
HarmonyOS
SDK
应用内支付服务(IAPKit)为开发者提供应用内自动续期订阅商品能力,用户购买后在一段时间内允许访问增值功能或内容,周期结束后可以选择自
·
2025-02-20 12:38
harmonyos-next
Coze扣子专业版计费规则调整一览
专业版用户每日赠送500资源点(仅限当日有效),可抵扣智能体调用费用和模型调用费用
语音
识别API、
语音
合成API、实时音视频
SDK
全面开放,无需申请即可使用更新详解:智能体资源包、大模型资源包下架处理,
落笔画忧愁e
·
2025-02-20 09:33
扣子商店
Coze插件
Fastgpt接入Whisper本地模型实现
语音
识别输入
前言FastGPT默认使用了OpenAI的LLM模型和
语音
识别模型,如果想要私有化部署的话,可以使用openai开源模型Whisper。
泰山AI
·
2025-02-20 09:31
AI大模型应用开发
AI语音模型
gpt
rag
fastgpt
DeepSeek掀起推理服务器新风暴,AI应用迎来变革转折点?
AI浪潮下,推理服务器崭露头角在科技飞速发展的当下,AI是耀眼明星,席卷各行业,深刻改变生活与工作模式,从
语音
助手到医疗诊断、金融风险预测,AI无处不在。
小深ai硬件分享
·
2025-02-20 08:20
人工智能
大数据
mid-360|环境配置及传感器特定方向点云数据提取
本文将使用mid360实现简单的识别前方有障碍物时无人机悬停功能环境配置新建文件夹用于存储
SDK
以及ROS包gitclonehttps://github.com/Livox-
SDK
/Livox-
SDK
2
yangjh542426
·
2025-02-20 07:15
px4
ros
ubuntu
ubuntu
无人机
【拥抱AI】如何实现AI外呼通话,并与客户达成确认
1.技术选型与准备主要技术组件
语音
识别(ASR):将客户的
语音
转换为文本。自然语言处理(NLP):理解和生成自然语言对话。
语音
合成(TTS):将文本转换为客户可以听到的
语音
。
奔跑草-
·
2025-02-20 06:08
人工智能
人工智能
探索Vearch:高效的深度学习向量相似度搜索系统
在本文中,我们将介绍Vearch的技术背景及其核心原理,演示如何使用VearchPython
SDK
进行安装和设置,并分析一些实际应用场景,最后提供一些实战建议。
scaFHIO
·
2025-02-20 06:08
深度学习
人工智能
python
华为的云端训练算力与迭代效率
华为云、云端训练、算力、迭代效率、人工智能、深度学习、模型训练、分布式训练、优化算法1.背景介绍人工智能(AI)技术近年来发展迅速,深度学习作为其核心驱动力,在图像识别、自然语言处理、
语音
识别等领域取得了突破性进展
AI大模型应用之禅
·
2025-02-20 05:34
DeepSeek
R1
&
AI大模型与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
AI外呼机器人:营销新利器还是骚扰电话的升级版?
AI外呼系统的核心技术是
语音
识别和自然语言处理。通过深度学习海量
yoloGina
·
2025-02-20 04:28
客户管理
外呼系统
电话外呼
人工智能
机器人
Java Pjsip (Pjsua2 api ) 2.10 windows sip
语音
呼叫教程
1.安装swigwin-4.0.1下载地址http://www.swig.org/download.html注意是swigwinWindowsusersshoulddownloadswigwin-4.0.1whichincludesaprebuiltexecutable.配置目录到winpath2.下载pjproject-2.10.zip(如果有python错误请安装py2.7及环境path配置)
java_lilin
·
2025-02-20 04:47
pjsip
pjsip
sip
pjsua2
java
sip
芯麦GC1808立体声ADC芯片解析:高性价比与全集成音频采集方案
引言在直播设备、智能
语音
终端等新兴应用的推动下,高性能音频采集系统的需求持续增长。
青牛科技-Allen
·
2025-02-20 03:16
GLOBALCHIP
音视频
单片机
嵌入式硬件
收录机
人工智能
家用电器
怎样让小爱音响免费畅听?本地音乐库与自动搜歌播放全搞定!(如何让小爱音响播放本地音乐库?如何让小爱音响自动搜索下载音乐到本地并播放?)
文章目录介绍演示环境小爱音响准备部署配置
语音
口令️注意事项⚓️相关链接⚓️介绍还在因为小爱音响的音乐资源问题苦恼吗?当你心情正好,想放首歌,却发现不是提示“没有资源”,就是让你开会员?
xiaoqiangclub
·
2025-02-20 03:45
随记·2025✍️
小爱音响
小米
小爱同学
免费听歌
实用教程
开源项目亮点:打造你的DIY智能
语音
助手——“小爱音箱自定义固件”
开源项目亮点:打造你的DIY智能
语音
助手——“小爱音箱自定义固件”项目地址:https://gitcode.com/gh_mirrors/xia/xiaoai-patch在当今智能家居设备泛滥的时代,一款能够深度定制
侯深业Dorian
·
2025-02-20 03:40
Steamworks:Steamworks平台概览_2024-07-25_00-28-31.Tex
Steamworks:Steamworks平台概览Steamworks简介1.1Steamworks平台概述Steamworks是一个由Valve公司开发的全面的软件开发工具包(
SDK
),旨在帮助游戏开发者和发行商在
chenjj4003
·
2025-02-20 03:39
游戏开发2
php
服务器
linux
性能优化
arcgis
游戏
github
Oculus
SDK
:Oculus集成Unity开发环境_2024-07-26_05-43-25.Tex
Oculus
SDK
:Oculus集成Unity开发环境Oculus
SDK
:Oculus集成Unity开发环境环境准备Unity版本选择在开始集成Oculus
SDK
到Unity开发环境之前,选择正确的Unity
chenjj4003
·
2025-02-20 03:09
游戏开发
unity
游戏引擎
microsoft
mr
ui
c#
python
百度智能云千帆 ModelBuilder 技术实践系列:通过
SDK
快速构建并发布垂域模型
1千帆
SDK
简介在平台的基础能力之上,我们围绕大模型工具链
百度智能云技术站
·
2025-02-20 01:25
百度智能云千帆大模型平台
ModelBuilder
百度
LLMops
LMops
大模型训练
wav2lip部署方案-数字人项目
该项目商用需要通过原作者原作者github链接说明该项目可以将
语音
和视频或图片结合生成数字人。
何为标准
·
2025-02-19 23:10
python
语音
识别使用SenseVoiceSmall模型实现源码
SenseVoiceSenseVoice是具有音频理解能力的音频基础模型,包括
语音
识别(ASR)、语种识别(LID)、
语音
情感识别(SER)和声学事件分类(AEC)或声学事件检测(AED)。
丢了个猪
·
2025-02-19 23:09
python
语音识别
深度学习
机器学习
语言模型
SenseVoice 实测,阿里开源
语音
大模型,识别效果和效率优于 Whisper,居然还能检测掌声、笑声!5分钟带你部署体验
前段时间,带着大家捏了一个对话机器人:手把手带你搭建一个
语音
对话机器人,5分钟定制个人AI小助手(新手入门篇)其中
语音
识别(ASR)方案,采用的是阿里开源的FunASR,这刚不久,阿里又开源了一个更强的音频基础模型
AI码上来
·
2025-02-19 23:38
AI实战
开源
whisper
xcode
从零到入门:人工智能学习路径全解析
从手机里的
语音
助手到电商平台的推荐系统,从自动驾驶到医疗影像分析,AI技术正在重塑人类社会的运行方式。
这题有点难度
·
2025-02-19 21:24
人工智能
学习
从代码到专利:如何用自注意力机制实现高效序列转换?——深度解析Google的Transformer架构
在传统的序列转换任务(如机器翻译、
语音
识别等)中,循环神经网络(RNN)和卷积神经网络(CNN)是常用的模型架构。然而,这些模型存在以下问题:
CodePatentMaster
·
2025-02-19 21:53
transformer
深度学习
人工智能
AIGC
架构
海康
SDK
中NET_DVR_CapturePicture方法截图使用心得概述
在深入研究了
SDK
使用手册后,我们发现了一个名为NET_DVR_CapturePicture的方法,它能够截取BMP格式的图片。相较于JPEG
Mr1Qian
·
2025-02-19 19:07
spring
boot
java
sdkman
【大模型系列】入门常识备忘
模型库(相当于maven仓库的原理)1、huggingface网址https://huggingface.co/2、魔塔社区网址:https://modelscope.cn/home使用python
sdk
万物皆字节
·
2025-02-19 16:45
LLM
ai
HarmonyOS Next
语音
合成技术深度解析
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统(截止目前API12)中的
语音
合成技术,基于实际开发实践进行总结。
·
2025-02-19 15:31
harmonyos
探索 Open WebUI:功能全面的开源交互平台
目录探索OpenWebUI:功能全面的开源交互平台轻松部署兼容多API集成精细权限和用户组管理跨设备响应式设计移动渐进式Web应用(PWA)全面支持Markdown和LaTeX免提
语音
/视频通话模型构建器原生
gs80140
·
2025-02-19 14:52
基础知识科谱
AI
人工智能
认识 ADB(Android Debug Bridge,Android
SDK
中的一个工具)
一、ADB概述ADB,全称AndroidDebugBridge,是Android
SDK
中的一个工具ADB位于Android
SDK
下platform-tools目录中ADB起到调试桥的作用,ADB可以让开发者通过
我命由我12345
·
2025-02-19 13:45
运维
-
ADB
adb
android
android-studio
android
studio
android
jetpack
安卓
android
runtime
agent和android怎么结合:健康助手,旅游助手,学习助手
agent和android怎么结合:健康助手,旅游助手,学习助手创新点智能交互创新:提出全新的agent-Android交互模式,如基于手势、
语音
、眼动等多模态融合的交互方式。
ZhangJiQun&MXP
·
2025-02-19 11:00
教学
2021
论文
2024大模型以及算力
android
旅游
学习
人工智能
语言模型
自然语言处理
prompt
arXiv每日推荐-3.4:
语音
/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】SELD-TCN:SoundEventLocalization&DetectionviaTemporalConvolutionalNetworks标题:SELD-TCN:基于时间卷积网络的声音事件定位与检测作者:KarimGuirguis,BinYang备注:5pages,3tables,2figures.SubmittedtoEUSIPCO2020链接:
sapienst
·
2025-02-19 09:16
语音识别
语音识别
探索水平视界:Horizon
SDK
for iOS深度解析与应用推荐
探索水平视界:Horizon
SDK
foriOS深度解析与应用推荐去发现同类优质开源项目:https://gitcode.com/项目介绍在数字时代的洪流中,视频录制与摄影已不仅仅是捕捉瞬间的艺术,它更是技术创新的前沿阵地
杭律沛Meris
·
2025-02-19 08:40
如何高效使用Zoom视频会议软件:功能解析与操作指南
目录1.Zoom的基本功能介绍1.1视频会议1.2
语音
会议1.3屏幕共享1.4会议录制1.5聊天和文件共享1.6会议室和个人会议ID2.Zoom的使用方法2.1安装Zoom2.2创建和加入会议2.2.1
concisedistinct
·
2025-02-19 08:39
IT工具
zoom
视频
软件
视频会议
DeepSeek自研AI芯片,AI算力新变革?
AI算力告急,成本掣肘发展当下,AI技术迅猛发展,从科研领域的复杂模型训练,到日常生活里智能
语音
助手的实时交互,算力成了决定AI发展的关键因素。作为大模型领域的后起之秀,DeepSeek对计算资源
·
2025-02-19 07:19
人工智能深度学习机器学习算法
批量更新 AWS ECS Fargate 服务:自动化平台版本升级
本文将介绍如何使用Python和AWS
SDK
(boto3)来批量更新ECSFargate服务,自动化这一过程。背景AWSFargate会定期发布新的平台版本,以提供新功能和进行例行维护。
ivwdcwso
·
2025-02-19 06:26
开发
运维
aws
自动化
云计算
Fargate
ecs
Jfinal websocket onMessage无法接收二进制音频数据问题
刚开始还没找到是数据大小限制的问题(由于要测试好多其它
语音
包,例如vad4j,webrctvad这些),以为是自己哪里搞错了,就找websocket什么时候
withme977
·
2025-02-19 03:30
websocket
网络协议
网络
上一页
6
7
8
9
10
11
12
13
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他