E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语音导航系统
python爬取知乎live_GitHub - hjlarry/zhihulive: 一个用来管理沉淀你所购知乎live的工具 ✨✨...
知乎Live内容管理器简介这是一个管理你购买过的知乎LIVE的工具,使用场景是往往我们听过的live是
语音
格式,无法保存、沉淀和搜索。
weixin_39546661
·
2025-04-19 14:45
python爬取知乎live
中老年人轻松上手DeepSeek指南:智能生活,一学就会
它支持
语音
和文字两种交互方式,操作简单,完全免费,特别适合中老年人使用。
星际棋手
·
2025-04-19 14:14
001
星际茶馆
经验分享
国内AI搜索平台与ChatGPT横向对比分析
一、核心技术差异1、百度文小言基于文心大模型4.0升级,主打“新搜索”能力,支持多模态输入(
语音
、图片、视频)和富媒体搜索结果。
AI搜索研究院
·
2025-04-19 10:23
人工智能
记录Docker部署CosyVoice V2.0声音克隆
#记录工作CosyVoice是由FunAudioLLM团队开发的一个开源多语言大规模
语音
生成模型,提供了从推理、训练到部署的全栈解决方案。
love530love
·
2025-04-19 00:19
docker
容器
运维
windows
Unity麦克风采样audio44100HZ 转16000HZ
unity默认是44100HZ但是发到阿里的
语音
sdk只识别8K和16K的所以需要转换采样一下AudioClipResampleAudio44100(AudioClipsourceClip){//1.提取原始数据
虾米神探
·
2025-04-18 19:18
语音识别
人工智能
4月18日复盘
随着算力的提升,深度学习可以处理图像,文本,音频,视频等各种内容,主要应用领域有:图像处理:分类、目标检测、图像分割(语义分割)自然语言处理:LLM、NLP、Transformer
语音
识别:对话
四万二千
·
2025-04-18 19:13
正式复盘
python
深度学习
云蝠智能大模型:赋能 AI 呼叫行业,开启智能通信新时代
一、核心技术优势:精准识别与智能对话的完美结合高精准
语音
识别:云蝠智能大模型的
语音
识别技术堪称行业典范。它能够精准捕捉用户的
语音
输入,并迅速转换为文本数据。
MARS_AI_
·
2025-04-18 17:02
人工智能
自然语言处理
语音识别
信息与通信
nlp
.wav转语谱图
,waveimportmatplotlib.pyplotaspltimportnumpyasnpimportosfilename='source-02.wav'#调用wave模块中的open函数,打开
语音
文件
哈特谢普苏特
·
2025-04-18 14:08
python
音频处理知识汇总
Whisper 模型压缩技术:轻量级
语音
识别方案
Whisper模型压缩技术:轻量级
语音
识别方案关键词:Whisper模型、模型压缩、轻量级
语音
识别、知识蒸馏、模型量化、剪枝优化、边缘部署摘要:本文深入探讨OpenAIWhisper模型的压缩技术体系,
AI学长带你学AI
·
2025-04-18 10:16
CSDN
whisper
语音识别
人工智能
ai
AI大模型识别多人发音的实时
语音
交互理论研究
目录摘要第一章引言第二章研究方法2.1多说话人分离技术2.1.1现有工具的使用与调优2.2
语音
识别与转录2.2.1调优后的实时识别代码:2.3音频流处理与队列管理第三章实时
语音
识别3.1多说话人分离技术的实时处理
一只老虎
·
2025-04-18 08:03
人工智能
算法研究
编程开发
人工智能
交互
python
实时语音识别
SpeechBrain 中文预训练模型:助力中文
语音
识别的强大工具
SpeechBrain中文预训练模型:助力中文
语音
识别的强大工具speechbrain.tar.gz项目地址:https://gitcode.com/open-source-toolkit/a3461项目介绍在
语音
识别领域
管彩嫒Zachary
·
2025-04-18 08:01
智谱 AI 开源 GLM-4-Voice:中英文实时交互
语音
模型
微信公众号|搜一搜:蚝油菜花快速阅读智谱AI推出开源端到端
语音
模型GLM-4-Voice。模型能理解和生成中英文
语音
,支持实时
语音
对话。可根据用户指令改变
语音
的情感、语调、语速、方言等属性。
蚝油菜花
·
2025-04-18 02:52
每日
AI
项目与应用实例
人工智能
开源
语音识别
智谱
语言模型
50款热门Unity插件大合集,包括角色控制、资源管理、环境设计、UI界面、
语音
聊天、天气系统等,帮助开发者加速开发过程、提升游戏质量、优化性能,并为不同类型的项目提供完备的支持。
插件提供的工具包括角色控制、资源管理、环境设计、UI界面、
语音
聊天、天气系统等,帮助开发者加速开发过程、提升游戏质量、优化性能,并为不同类型的项目提供完备的支持。InvectorFSMAITem
Unity游戏资源学习屋
·
2025-04-18 02:21
Unity插件
开源项目faster-whisper和whisper是啥关系
OpenAIWhisper是OpenAI开源的一款通用
语音
识别模型,经过在大规模
语音
数据集(包含680,000小时监督数据)的训练,支持99种语言的识别、翻译及语言识别任务。
@程序员小袁
·
2025-04-17 21:22
开源项目
AI
大模型
whisper
[特殊字符] 深入剖析 AI 大模型的位置编码原理:从理论到实践 [特殊字符]
一、引言在自然语言处理(NLP)的星辰大海中,Transformer架构犹如一艘超级战舰,而位置编码就是它的
导航系统
!本文将带你深入探索这个让AI理解"顺序"奥秘的黑科技~你知道吗?
AI大模型顾潇
·
2025-04-17 18:00
人工智能
llama
自然语言处理
大模型开发
多模态
AI大模型
微调
AI Agent的多模态交互:整合文本、
语音
和视觉
AIAgent的多模态交互:整合文本、
语音
和视觉关键词:AIAgent、多模态交互、文本处理、
语音
识别、视觉识别摘要:本文围绕AIAgent的多模态交互展开,详细探讨了如何整合文本、
语音
和视觉三种重要模态
AI天才研究院
·
2025-04-17 16:18
DeepSeek
R1
&
大数据AI人工智能大模型
人工智能
交互
ai
零基础学simulink仿真建模--无人机领域建模实例:基于Simulink的无人机惯性
导航系统
(INS)仿真建模示例
目录手把手教你学Simulink——基于Simulink的无人机惯性
导航系统
(INS)仿真建模示例一、背景介绍二、理论基础三、所需工具和环境四、步骤详解步骤1:创建Simulink模型步骤2:定义无人机的基本参数步骤
amy_mhd
·
2025-04-17 15:42
无人机
matlab
simulink
COZE扣子平台TTS
语音
合成智能体及API访问功能完善
☞░前往老猿Python博客░https://blog.csdn.net/LaoYuanPython一、引言在《在扣子(coze)配置一个提供TTS
语音
合成服务+咨询服务的综合智能体:
语音
合成助手》介绍了如何在
LaoYuanPython
·
2025-04-17 14:37
零基础机器学习入门
老猿Python
python
语音合成
TTS中文文本转语音
AI智能体
COZE扣子
部署Fish-Speech实现声音克隆及文本转
语音
FishSpeech是由FishAudio团队开发的一款开源文本转
语音
(TTS)模型,支持多语言的
语音
合成和识别。它采用先进的深度学习技术,能够生成自然流畅的
语音
,并提供高质量的
语音
转文字功能。
培根芝士
·
2025-04-17 12:51
AI
linux
人工智能
运维
【论文精读(GELUS)】GAUSSIAN ERROR LINEAR UNITS (GELUS)
GELU:让计算机视觉、NLP、
语音
任务性能飙升的激活函数本文探讨的高斯误差线性单元(GaussianErrorLinearUnit,GELU)是由DanHendrycks和KevinGimpel提出的一种高性能神经网络激活函数
Open NLP
·
2025-04-17 08:27
NLP(自然语言处理)
神经网络
nlp
计算机视觉
深度学习
自然语言处理
RNN-时间序列预测模型
RNN-应用场景
语音
识别音乐生成情感分析:根据输入的评论,猜测评论的分数。DNA序列分析语言翻译等带时间序列应用的场景后面产生的结果,是受到前面结果的影响的。
生产队的驴儿
·
2025-04-17 06:13
Python
Python入门知识整理
数据分析
1024程序员节
Rasa 的工作流程
下面是Rasa工作流程的详细解释:1.用户输入用户通过对话界面(比如聊天框、
语音
输入等)发送信息。这个信息可以是自然语言文本,Rasa将对其进行处理。
YiHanXii
·
2025-04-16 20:08
Rasa
linux
人工智能
docker
语言模型
基于深度学习的
语音
识别
基于深度学习的
语音
识别技术利用深度学习模型将
语音
信号转换为文本。这项技术在智能助理、自动字幕生成、电话客服系统、
语音
翻译等领域有着广泛的应用。
SEU-WYL
·
2025-04-16 19:30
深度学习dnn
深度学习
人工智能
dnn
通义发布
语音
模型 MinMo:全双工、多口音;MiniCPM-o :端侧 GPT-4o 级视觉、
语音
、多模态实时流式大模型
开发者朋友们大家好:这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(Real-TimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。本期编辑:@qqq,@鲍勃01有话题的技术1、MiniCPM-o:端侧可用的GPT-4o级视觉、
RTE开发者社区
·
2025-04-16 19:57
语音识别
人工智能
FreeTTS:开启人机
语音
交互的新时代
FreeTTS:开启人机
语音
交互的新时代【下载地址】FreeTTS
语音
合成库FreeTTS是一个基于Java的
语音
合成库,它提供了强大的
语音
合成功能,使得开发者能够在应用程序或Web页面中实现人机
语音
交互
岑童嵘
·
2025-04-16 09:24
ESP32移植Openharmony外设篇(10)inmp441麦克风
其核心特点包括:高信噪比(SNR):61dBA,适合远场和近场
语音
采集。数字接口:支持24位I²S输出,可直接连接微控制器或DSP,无需额外编解码器。低功耗:工作电流仅1.4mA,适用于电池供电设备。
王子娱乐
·
2025-04-16 02:10
鸿蒙
harmonyos
华为
物联网
单片机
【计算机网络】什么是路由?核心概念与实战详解
引言路由(Routing)是互联网的“
导航系统
”,负责将数据包从源设备精准送达目标设备。无论是浏览网页、发送消息还是视频通话,背后都依赖路由技术。本文将用通俗类比+技术深度的方式,解析路由的核心机制。
学废了wuwu
·
2025-04-15 23:16
计算机网络
智能路由器
网络
深度剖析:人工智能算法优化策略与实践
目录引言人工智能算法优化的重要性常见的人工智能算法优化策略数据预处理优化模型结构优化算法参数调优优化策略的实践案例案例一:电商推荐系统案例二:智能
语音
助手总结引言在当今数字化时代,人工智能(AI)已渗透到各个领域
xiayan827
·
2025-04-15 20:59
人工智能
英飞凌高信噪比MEMS麦克风驱动人工智能交互
我们坚定不移地致力于创新,在主动降噪、
语音
透传、录音室录音、音频变焦和其他相关技术方面取得了显著进步,对此我们深感自豪。
·
2025-04-15 17:45
人工智能
多模态大模型:技术原理与实战 多模态大模型在情绪识别领域的应用
1.2传统方法的局限性传统的情绪识别方法主要依赖于单一模态数据,如文本、
语音
或面部表情。然而,人类情绪
AI天才研究院
·
2025-04-15 15:59
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
计算
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
Android CosyVoice 大模型
语音
合成(可运行,已跑通,可直接复制粘贴的实用代码)
AndroidCosyVoice大模型
语音
合成流式文本
语音
合成(CosyVoice大模型)可运行,已跑通,可直接复制粘贴的实用代码。
netkiller-BG7NYT
·
2025-04-15 11:35
编程手札
android
【AI大模型】Cherry Studio和Deepseek模型搭建本地知识库+硅基流动API调用+本地ollama模型调用
传统知识库依赖人工整理和规则化检索,难以应对动态增长的非结构化数据(如文档、图片、
语音
等),而AI大模型通过自然语言理解、推理能力及多模态分析,可实现智能化的知识提取、关联与交互,成为构建新一代知识库的核心技术支撑
JinSu_
·
2025-04-15 09:18
学习体会
人工智能
Cherry
Studio
Deepseek模型
硅基流动API调用
本地ollama模型调用
融媒体中心智能
语音
识别系统设计与实现
县级融媒体中心智能
语音
识别系统设计与实现序言随着融媒体时代的快速发展,新闻采编、专题节目制作对
语音
转写效率的要求日益提高。
Bruce_xiaowei
·
2025-04-15 03:40
编程
笔记
总结经验
媒体
语音识别
人工智能
景点讲解还在靠人工?教你用二维码打造智慧景区导览系统
通过简单的“一景一码”,游客只需掏出手机扫一扫,就能看到景点介绍、听到
语音
讲解,甚至还能浏览历史视频。这种方式不仅操作简单,还能让景区以极低的成本实现导览服务的数字化升级。
·
2025-04-14 20:15
二维码
腾讯逆袭!发布混元T1正式版,实战不输DeepSeek-R1,便宜3/4|黄仁勋为什么一边笑着“认错”,一边给量子计算站台?
智能体不但是AI领域核心,更可能引发科学范式重大变革25万GPU,估值350亿美元冲刺IPO,财务定时炸弹,GenAI不祥之兆元宝“粘”不过豆包OpenAI
语音
智能体诞生,怼脸实拍语气狂到飞起,API降到每分钟
gzu_01
·
2025-04-14 20:48
量子计算
人工智能
嵌入式系统中的OTA升级技术:从嵌入式Linux到无线更新
例如,智能家居设备可以通过OTA升级新增
语音
控制功能,从而提升用户体验。据统计,智能设
学习ing1
·
2025-04-14 18:04
linux
运维
服务器
自主决策系统中的路径规划算法与神经搜索机制
1.自主
导航系统
概述1.1自主
导航系统
定义与应用场景自主
导航系统
是指能够使机器人、无人机、自动驾驶车辆等自主移动设备在未知环境中自主规划路径、避开障碍物并完成既定任务的系统。
学习ing1
·
2025-04-14 18:03
算法
flutter 专题二十 Dart 语言的空安全特性
在Dart
语音
中,空安全支持三条核心原则:•默认不可空:除非将变量显式声明为可空,否则它默认一定是要是非空的类型。•渐进迁移:开发者可以自由地选择迁移的时机,以及需要迁移的代码。并且
leluckys
·
2025-04-14 11:21
Flutter面试与实战
flutter
GPT-4o:多模态AI的全面突破
详细分析:核心观点:GPT-4o是一个多模态自回归模型,具备处理文本、音频、图像和视频输入的能力,并能生成文本、音频和图像输出,在文本推理、
语音
识别、翻译和视觉理解等多个领域实现了显著的性能提升。
2501_90976089
·
2025-04-14 11:19
聚类
算法
人工智能
大模型在边缘部署可行吗?一文解析边缘AI的落地路径
引言:边缘AI的热潮随着人工智能技术的不断突破,尤其是在大语言模型(LLM)、计算机视觉、
语音
识别等领域的广泛应用,越来越多的企业和开发者开始关注“边缘AI”的潜力。
moppol
·
2025-04-14 09:08
人工智能
云计算
机器学习系列----介绍前馈神经网络和卷积神经网络 (CNN)
这两种网络模型在图像处理、
语音
识别等多个领域取得了巨大的成功。本篇博客将详细介绍前
DK22151
·
2025-04-14 02:53
机器学习
机器学习
神经网络
cnn
大模型 + 机械臂:通过
语音
控制实现物体抓取(Gazebo 仿真验证)
本文结合
语音
识别、视觉大模型(VLM)和机械臂运动控制,实现了一套通过
语音
指令控制机械臂在Gazebo仿真环境中抓取物体的系统。
江湖独行侠
·
2025-04-13 18:32
人工智能
计算机视觉
云知声三度冲击港股:三年累亏12亿,市场份额仅0.6%
成立于2012年的云知声,曾以其独特的
语音
技术和AI解决方案在一级市场备受追捧。然而,随着市场对AI概念的祛魅和对其盈利能力的质疑,云知声的上市之路变得愈发艰难。尽管在过去十年
财经三剑客
·
2025-04-13 17:54
人工智能
通过python如何实现视频提取音频,并将音频转文本
大致思路:(1)使用moviepy库中的VideoFileClip类读取视频文件,并将其转换为音频文件;(2)使用pydub库中的splitonsilence函数将音频文件分割成多个音频片段,以便进行
语音
识别
Micheal_Dad
·
2025-04-13 16:21
音视频
语音识别
python
DiffRhythm:端到端全流程音乐生成的技术革命
由西北工业大学音频
语音
与语言处理实验室(ASLPLab)与香港中文大学(深圳)联合研发的DiffRhythm,首次将端到端全流程音乐生成与10秒极速推理结合,实现了从歌词输入到完整双轨立体声歌曲(含人声与伴奏
花生糖@
·
2025-04-13 11:21
AIGC学习资料库
AI·未来
DiffRhythm
AI音乐
论文速览 | IEEE INFOCOM 2023 | mmEavesdropper: Signal Augmentation-based Directional Eavesdropping with
SignalAugmentation-basedDirectionalEavesdroppingwithmmWaveRadar|基于毫米波雷达的声音窃听系统:信号增强技术实现定向窃听1引言在这个信息时代,
语音
隐私安全已经成为一个日益严峻的问题
R.X. NLOS
·
2025-04-13 11:49
#
无线感知/雷达成像论文速递
论文速览
Infocom
2023
窃听
毫米波窃听
2025年AI
语音
克隆工具全面评估与选型指南
2025年AI
语音
克隆工具全面评估与选型指南(基于多维度技术对比、应用场景及伦理风险分析)一、核心评估维度与行业标准技术性能克隆相似度:声音特征的还原精度,如音色、语调、口音等(CosyVoice2.0
赛博AI Lewis
·
2025-04-13 10:43
人工智能
人工智能
基于python的
语音
识别与蓝牙通信的温控系统
基于python的
语音
识别与蓝牙通信的温控系统大家好我是小俊学长,混迹在java圈的辛苦码农。今天要和大家聊的是一款基于python的
语音
识别与蓝牙通信的温控系统。
小俊学长
·
2025-04-13 09:05
语音识别
人工智能
【资料分享】基于单片机红外音频温度传输系统设计-基于单片机RGB颜色智能识别系统设计-基于单片机智能市电温度控制系统设计-基于单片机汽车环境监测系统设计(转发)
827基于单片机红外音频温度传输系统设计-设计资料(1)红外光通信装置利用红外发光管和红外光接收模块作为收发器件,用来定向传输
语音
信号,传输距离为2m.(2)传输的
语音
信号用Φ3.5mm的音频插孔线路输入
Mr song song
·
2025-04-13 09:05
单片机
嵌入式硬件
物联网
基于单片机红外音频温度传输系统设计
软件设计原理图五、程序六、文章目录一概要 基于单片机红外音频温度传输系统设计概要一、系统概述本系统旨在设计一种基于单片机的红外音频温度传输系统,该系统通过红外光通信装置,利用红外发光管和红外光接收模块实现
语音
信号及环境温度数据的定向传输
QQ2193276455
·
2025-04-13 09:34
单片机
单片机
嵌入式硬件
上一页
12
13
14
15
16
17
18
19
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他