E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
目标检测语音告警
小狐狸AI数字人源码独立SAAS部署全开源+搭建环境教程
声音核心功能亮点:1:1真人级克隆技术声音克隆:上传3分钟音频,AI深度学习声纹特征,复刻语气、情感、方言形象克隆:通过照片/视频建模,生成动态3D数字人,表情自然,动作流畅智能口型同步引擎AI算法精准匹配唇形与
语音
kaui52066
·
2025-03-15 18:34
kaui52066精品源码
人工智能
uni-app
前端
小程序
php
小狐狸AI数字人
数字人源码
目标检测
中衡量模型速度和精度的指标:FPS和mAP
FPS(FramesPerSecond)定义:FPS是“每秒传输帧数”的缩写,用于衡量计算机视觉系统(如
目标检测
、图像识别等)的实时性能。它表示系统每秒钟能够处理的图像或视频帧的数量。
asdfg1258963
·
2025-03-15 16:47
目标检测_ai
目标检测
人工智能
uniapp vue3项目用原生h5 audioContext实现
语音
文件倍速播放,可适应h5和安卓app
前言uniapp项目要做类似微信的聊天
语音
播放功能,可以切换
语音
,可以点击切换播放/停止播放状态,还可以倍速播放。
努力做大神
·
2025-03-15 10:33
uni-app
android
音频倍速播放
吴恩达机器学习笔记复盘(二)监督学习和无监督学习
语音
识别,输入音频剪辑,输出文本记录。机器翻译,输入一种语言文本,输出其他语言的相应翻译。在线广告,输入广告和用户信息,预测用户是否点击广告,为公司带来大量
wgc2k
·
2025-03-15 09:21
机器学习
机器学习
笔记
学习
cv君独家视角 | AI内幕系列七:EfficientViT模型:基于多尺度线性注意力模块,实现高效的高分辨率密集预测
通过一系列精心策划的文章,我们将带您深入了解AI的各个领域,从计算机视觉到文本
语音
等多模态领域,从基础理论到前沿技术,从行业应用到未来趋势。
cv君
·
2025-03-15 09:19
cv君独家视角
AI内幕系列
原创项目级实战项目
深度学习与计算机视觉精品
1024程序员节
EfficientViT
高分辨率密集预测任务
高分辨率视觉模型
Transformer
人工智能
计算机视觉
MySQL慢SQL优化方案详解:从诊断到根治的完整指南
用户跳出率增加52%核心业务转化率下降29%系统稳定性危机连接池耗尽风险提升4.8倍主从同步延迟突破10秒阈值磁盘IO利用率长期超90%运维成本飙升DBA故障处理时间增加65%硬件扩容频率提高3倍夜间
告警
量激增
jiajia651304
·
2025-03-15 05:44
mysql
sql
ffmpeg
Python中用SpeechRecognition库和 vosk模型来识别
语音
Python中的SpeechRecognition库是一个比较好用的
语音
识别模块,提供了将
语音
识别成文字的方法,支持中文识别。
老菜鸟YDZ
·
2025-03-15 04:01
菜鸟学python
python
开发语言
语音识别
人工智能
xcode
pjsip dtmf发送和接收(pjsua)
交互式
语音
应答(IVR)系统DTMF广泛用于IVR系统,用户
小gpt&
·
2025-03-15 00:00
Pjsip
音视频
qt
c++
云原生周刊:基于 KubeSphere LuBan 架构打造DeepSeek 插件
开源项目推荐KubeAIKubeAI是一个K8s上的AI推理操作器,旨在简化在生产环境中部署和管理大型语言模型(LLM)、向量嵌入和
语音
处理等机器学习模型。
·
2025-03-14 22:37
云计算
人工智能概念
近邻算法深度学习是实现这一目标的工具,模仿人脑,使用多层神经网络进行学习算法:多层感知器、卷积神经网络、循环神经网络、长短期记忆网络大模型指参数量巨大的深度学习模型人工智能应用:自然语言处理、图像识别与生成、
语音
识别
zhangpeng455547940
·
2025-03-14 19:13
计算机
人工智能
机器学习(二) 本文(2.5万字) | KNN算法原理及Python复现 |
三要素三机器学习中标准化四KNN分类预测规则五KNN回归预测规则六KNN算法实现方式七KDTree7.1构造KDtree7.2KDtree查找最近邻八KNN特点九KNN算法实现案例一案例二1.机器学习2.深度学习与
目标检测
小酒馆燃着灯
·
2025-03-14 19:11
机器学习
算法
k近邻算法
基于分组 NMS 的检测模型后处理改进
引言在
目标检测
任务中,后处理阶段的非极大值抑制(Non-MaximumSuppression,NMS)是至关重要的一环,主要用于去除高度重叠的冗余预测框。
Lunar*
·
2025-03-14 15:11
目标检测
算法与优化
目标检测
深度学习
python
DeepSeek 与其他 AI 模型的对比:优势与特色分析
多模态能力:DeepSeek支持多种输入和输出形式,如图像和
语音
。行业适配性:DeepSeek提供了针对不同行业的优化方案。三、与BERT系列的对比生成能力:Dee
CarlowZJ
·
2025-03-14 14:00
人工智能
DeepSeek
工程化与框架系列(30)--前端日志系统实现
日志系统概述前端日志系统主要包括以下方面:日志收集:用户行为、性能指标、错误信息等日志处理:过滤、格式化、压缩等日志存储:本地存储、远程上传等日志分析:统计分析、可视化展示等实时监控:
告警
、通知等日志系统实现日志管理器
一进制ᅟᅠ
·
2025-03-14 13:28
前端工程化与框架
前端
状态模式
3.13 YOLO V3
今天的内容为YOLO-V3YOLO系列-YOLO-V3,最大的改进就是网络结构,使其更适合小
目标检测
。-特征做得更细致,融入多持续特征图信息来预测不同规格物体。
不要不开心了
·
2025-03-14 11:44
机器学习
pytorch
深度学习
在Android Studio中通过CMake实现交叉编译生成动态so文件
aux_source_directoryinclude_directorieslink_directoriesadd_librarytarget_link_libraries将CMake配置文件依赖到Gradle中交叉编译生成动态库参考NDK工具链最近项目上需要将微信
语音
H.ZWei
·
2025-03-14 08:52
Android
NDK
android
studio
android
Android
NDK
CMake
动态so文件
交叉编译
uinapp前端技术带动陪玩软件市场,
语音
陪玩系统源码开发打造你自己的市场
此外,陪玩软件还提供了如
语音
互动、礼物打赏,在线接单,社交直播等功能,方便玩家畅玩游戏。跨平台开发:uniapp支持一次开发,多端发布,包括iOS、Android、Web以及各种小程序等平台。
·
2025-03-14 04:41
前端后端小程序数据库服务器
【自学笔记】讯飞星火基础知识点总览-持续更新
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录讯飞星火基础知识点总览一、讯飞星火简介二、核心功能1.
语音
识别2.自然语言处理3.知识图谱4.星火API三、基础概念1.AI模型2
Long_poem
·
2025-03-14 02:08
笔记
基于YOLOv5的车牌识别系统:从数据集到UI界面的实现
车牌识别系统通常由图像处理、字符识别、
目标检测
等多种技术组成。近年来,随着深度学习技术的飞速发展,基于卷积神经网络(CNN)的
目标检测
算法,如YOLO(YouOn
深度学习&目标检测实战项目
·
2025-03-14 01:33
YOLOv5实战项目
YOLO
ui
分类
数据挖掘
目标跟踪
EasyRTC实现基于WebRTC技术实现的即时通信类应用
WebRTC简介WebRTC,名称源自网页即时通信(英语:WebReal-TimeCommunication)的缩写,是一个支持网页浏览器进行实时
语音
对话或视频对话的API。
xiejiashu
·
2025-03-13 15:24
WEBRTC
EasyRTC
WebRTC
RTC直播
视频会议技术
视频通话技术
点云从入门到精通技术详解100篇-基于激光雷达点云的三维
目标检测
目录前言图像
目标检测
算法研究现状点云
目标检测
算法研究现状基于投影图的方法基于体素的方法基于点云的多模态融合方法2地面点云滤波及神经网络2.1
目标检测
数据集及采集设备2.1.1KITTI数据集2.1.2车载激光雷达
格图素书
·
2025-03-13 13:08
目标检测
人工智能
计算机视觉
图像识别技术与应用
第一节课这节课了解了这门专业的就业职位:工资是怎么样的岗位职责和任职要求看到了人类工业文明的演变了解了人工智能的研究、开发、模拟、延伸、理论、方法和技术看到了生活方式的转变比如智能
语音
闹钟控制系统、自动驾驶和人脸识别考勤智能购物
超帅的好吧
·
2025-03-13 13:36
笔记
【YOLOv11[基础]】
目标检测
OD | 导出ONNX模型 | ONN模型推理以及检测结果可视化 | python
本文将导出YOLO11.pt模型对应的ONNX模型,并且使用ONNX模型推理以及结果的可视化。话不多说,先看看效果图吧!!!目录一导出ONNX模型二推理及检测结果可视化1代码2效果图
Jackilina_Stone
·
2025-03-13 12:02
【改进】YOLO系列
人工智能
python
计算机视觉
YOLO
深度学习
目标检测
YOLO系列模型从v1到v10的演进
文章目录引言YOLOv1:开创单阶段
目标检测
先河发布时间与背景核心创新模型架构训练策略与优化YOLOv2:提升精度与速度的平衡发布时间与背景核心创新模型架构训练策略与优化YOLOv3:多尺度检测与残差连接发布时间与背景核心创新模型架构训练策略与优化
剑走偏锋o.O
·
2025-03-13 11:25
YOLO
目标跟踪
人工智能
图像识别技术与应用课后总结(18)
YOLO-V3的改进点网络结构:相比之前版本,YOLO-V3的网络结构进行了优化,使其更适合小
目标检测
。特征处理:对特征的处理更加细致,通过融入多持续特征图信息来预测不同规格的物体。
一元钱面包
·
2025-03-13 11:20
人工智能
有哪些好用的AI视频加工创作网站
-网址:https://www.synthesia.io2.Fliki-特点:文本转视频,AI
语音
配音,内置数百万素材库。-适用:快速将
皮皮虾1234
·
2025-03-13 10:11
人工智能
华为HCIE笔试(一)
以下关于统一运维管理平台ManageOne中
告警
监控功能的描述,错误的是哪一项?
初级飞行员
·
2025-03-13 08:56
云计算
华为
云计算
YOLOv8改进策略【注意力机制篇】| EMA 即插即用模块,提高远距离建模依赖(含C2f二次创新)
一、本文介绍本文记录的是基于EMA模块的YOLOv8
目标检测
改进方法研究。EMA认为跨维度交互有助于通道或空间注意力预测,并且解决了现有注意力机制在提取深度视觉表示时可能带来的维度缩减问题。
Limiiiing
·
2025-03-13 06:14
YOLOv8改进专栏
YOLO
计算机视觉
深度学习
目标检测
YOLOv5改进:在C3块不同位置添加EMA注意力机制,有效提升计算机视觉性能
计算机视觉中的
目标检测
是一个重要的任务,而YOLOv5是目前广泛应用的一种高效
目标检测
算法。
UksApps
·
2025-03-13 06:13
YOLO
计算机视觉
深度学习
基于 DeepSeek 的自动化运维(适合企业降本增效)
基于DeepSeek的自动化运维解决方案DeepSeek凭借其强大的AI能力(如自然语言处理、时序预测、异常检测),可显著提升运维效率,实现从监控
告警
到故障自愈的全流程自动化。
Real Man★
·
2025-03-13 03:47
运维
自动化
【Python】构建智能
语音
助手:使用Python实现
语音
识别与合成的全面指南
随着人工智能技术的迅猛发展,
语音
助手已成为人们日常生活中不可或缺的一部分。从智能手机到智能家居设备,
语音
交互提供了便捷高效的人机交互方式。
蒙娜丽宁
·
2025-03-13 02:41
Python杂谈
python
语音识别
开发语言
【Prometheus】prometheus 架构介绍
AlertManager在prometheus中,支持基于PromQL创建
告警
规则,如
Learn Forever
·
2025-03-12 19:54
Prometheus
架构
运维
docker
声音克隆一键本地化部署 GPT-SoVITS
文章目录GPT-SoVITS介绍1:GPT-SoVITS安装2:GPT-SoVITS使用2.1人声伴奏分离,去混响去延时工具2.2
语音
切分工具2.3
语音
降噪工具2.4中文批量离线ASR工具2.5
语音
文本校对标注工具
博客胡
·
2025-03-12 18:48
gpt
AI视频生成工具清单(附网址与免费说明)
AI视频生成工具清单(附网址与免费说明)1.Synthesia网址:https://www.synthesia.io是否免费:免费试用(生成视频带水印)核心功能:✅120+AI虚拟主播✅支持70种语言
语音
合成
远方2.0
·
2025-03-12 18:46
人工智能
音视频
实现一个超轻量级实例分割网络的思路
文章目录前言一、基本思路二、picodet三、yolact三、picodet+yolact总结前言在某些工业领域,由于成本问题算力有限,只能实时跑一些超轻量级网络,拿
目标检测
来说,例如yolo-fast
CV工程师小朱
·
2025-03-12 17:45
深度学习笔记
深度学习应用
实例分割
yolact
picodet
深度学习
如何提升OmniParser V2的小元素识别率——YOLOv8 增加 P2 层的性能变化解析
YOLOv8增加P2层通过牺牲部分计算效率换取了小
目标检测
性能的显著提升,尤其适用于高分辨率、小目标密集的场景。
AI-AIGC-7744423
·
2025-03-12 14:22
目标跟踪
人工智能
计算机视觉
用OpenCV写个视频播放器可还行?(Python版)
引言提到OpenCV,大家首先想到的可能是图像处理、
目标检测
,但你是否想过——用OpenCV实现一个带进度条、倍速播放、暂停功能的视频播放器?
程序员Linc
·
2025-03-12 12:41
计算机视觉
opencv
音视频
python
Phi-4-multimodal:图、文、音频统一的多模态大模型架构、训练方法、数据细节
Phi-4-Multimodal是一种参数高效的多模态模型,通过LoRA适配器和模式特定路由器实现文本、视觉和
语音
/音频的无缝集成。
余俊晖
·
2025-03-12 12:40
大语言模型
多模态
LLM
多模态
AI:230-YOLOv8与RT-DETR的完美结合 | 重塑
目标检测
技术的前沿【保姆级教程】
正在不断更新中~文章目录YOLOv8与RT-DETR的完美结合|重塑
目标检测
一键难忘
·
2025-03-12 12:09
精通AI实战千例专栏合集
人工智能
YOLO
目标检测
YOLOv8与RT-DETR
51-53 CVPR 2024 | DriveWorld:通过自动驾驶世界模型进行 4D 预训练场景理解 (含模型数据流梳理)
DriveWorld在UniAD的基础上又有所成长,提升了自动驾驶
目标检测
、目标追踪、3D占用、运动预测及规划的性能,后期扩大数据集和调整骨干网络大小应该会
深圳季连AIgraphX
·
2025-03-12 08:43
aiXpilot
智驾大模型1
自动驾驶
人工智能
AIGC
stable
diffusion
计算机视觉
智慧城市
情感识别(Emotion Recognition)
情感识别(EmotionRecognition)是通过分析人类的多模态数据(如面部表情、
语音
、文本等)来识别和理解其情感状态的技术。它在人机交互、心理健康、市场分析等领域有广泛应用。
路野yue
·
2025-03-12 08:10
人工智能
自然语言处理
RK3568笔记六十八:Yolov11
目标检测
部署测试
若该文为原创文章,转载请注明原文出处。看到yolov11出了,山水无移大佬测试通过,跟个风测试一下效果。使用的是正点原子的ATK-DLRK3568开发板。这里不训练自己的模型了,使用官方模型测试。一、环境搭建1、下载源码ultralytics/ultralytics:UltralyticsYOLO112、创建虚拟环境condacreate-nyolov11_envpython=3.83、激活con
殷忆枫
·
2025-03-12 04:07
RK3568学习笔记
笔记
YOLO
【AI深度学习网络】Transformer时代,RNN(循环神经网络)为何仍是时序建模的“秘密武器”?
循环神经网络(RecurrentNeuralNetwork,RNN)是一种专门处理序列数据(如文本、
语音
、时间序列)的深度学习模型。
arbboter
·
2025-03-12 02:18
人工智能
rnn
人工智能
深度学习
循环神经网络
记忆
序列数据
循环连接
深度解析短视频开源项目 MoneyPrinterTurbo 使用教程
它提供了一整套完整的工作流,结合了图像处理、文本转
语音
(TTS)、视频编辑等功能,帮助用户快速制作符合社交媒体平台(如TikTok、InstagramReels、YouTubeShorts)要求的短视频
非著名架构师
·
2025-03-12 02:47
音视频
MoneyPrinter
旋翼机自主着陆-主要技术难点
搜索阶段:远距离:目标为几个像素,并且淹没在环境里完全没有任何目标或目标偶尔出现,如何进行导航中远距离目标部分容易被遮挡,如何进行
目标检测
在光线条件较差的环境下,
目标检测
出现误判和无法工作的情况近距离目标在视场中占据较大部分
兜兜有糖_DC
·
2025-03-12 02:17
位姿测量
无人机
智能控制
UAV
landing
自动
计算机视觉
深度学习
算法
多模态大模型:技术原理与实战 模型压缩实战
ZenandtheArtofComputerProgramming关键词:多模态大模型,技术原理,模型压缩,实战,TensorFlow,PyTorch,模型压缩方法,应用场景1.背景介绍1.1问题的由来随着人工智能技术的飞速发展,多模态大模型在图像识别、
语音
识别
AGI大模型与大数据研究院
·
2025-03-12 01:16
DeepSeek
R1
&
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
基于PyTorch的深度学习——机器学习1
近些年,随着深度学习的发展,分类除传统的二分类、多分类、多标签分类之外,也出现了一些新内容,如
目标检测
、目标识别、图像分割等监督学习的重要内容半监督学习是监督学习与无监督学习相结合的一种学习方法。
Wis4e
·
2025-03-12 00:31
深度学习
机器学习
pytorch
2025年工业智能对讲机有多智能?数据采集+AI不在话下!
但传统设备仅能实现基础
语音
传输的局限性,已难以满足现代工业对效率与智能化的需求。
AORO_BEIDOU
·
2025-03-11 22:18
人工智能
信息与通信
智能手机
安全
网络
esp32手把手DIY AI小智
语音
助手教程 (三) 配置ESP32设备 Wi-Fi连接网络
esp32手把手DIYAI小智
语音
助手教程(三)配置ESP32设备Wi-Fi连接网络1.WI-FI网络配置1)启动设备在bin固件下载/烧录后,将设备保持接通电源,按下开发板上的RST按钮复位重启设备(
代码简单说
·
2025-03-11 22:44
智能硬件/物联网开发实战
ai小智
语音助手
ai小智配网
ai小智教程
智能硬件
esp32语音助手
diy语音助手
【花雕动手做】基于ESP32S3和通义千问大模型AI
语音
聊天机器人
开源项目1、核心功能:该项目利用ESP32S3开发板,结合通义千问大模型,实现了一个AI
语音
聊天机器人。用户可以通过
语音
与机器人进行交互,机器人能够理解用户的
语音
指令并给出相应的
语音
回答。
驴友花雕
·
2025-03-11 22:44
人工智能
机器人
嵌入式硬件
单片机
c++
基于ESP32S3
通义千问AI语音聊天机器人
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他