E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
目标检测语音告警
【保姆级视频教程(二)】YOLOv12训练数据集构建:标签格式转换-划分-YAML 配置 避坑指南 | 小白也能轻松玩转
目标检测
!
【2025全站首发】YOLOv12训练数据集构建:标签格式转换-划分-YAML配置避坑指南|小白也能轻松玩转
目标检测
!
一只云卷云舒
·
2025-02-27 21:03
YOLOv12保姆级通关教程
YOLO
目标检测
人工智能
Ultralytics
数据集
YOLOv12
小白教程
DCMNet一种用于
目标检测
的轻量级骨干结构模型详解及代码复现
模型背景在深度学习技术快速发展的背景下,
目标检测
领域取得了显著进展。
清风AI
·
2025-02-27 21:03
深度学习算法详解及代码复现
深度学习
机器学习
计算机视觉
人工智能
算法
目标检测
DeepSeek全栈接入指南:从零到生产环境的深度实践
其核心能力体现在:1.1.1多模态智能引擎自然语言处理:支持文本生成(NLG)、语义理解(NLU)、情感分析等计算机视觉:提供图像分类、
目标检测
、OCR识别等CV能力
语音
交互:包含
语音
识别(ASR)、
语音
合成
量子纠缠BUG
·
2025-02-27 21:30
DeepSeek部署
AI
DeepSeek
人工智能
深度学习
机器学习
uniapp开发微信小程序时实现文字转
语音
播报 播报时一个字展示一个字 并有暂停
语音
的功能
{{isPlaying?'暂停':'播放'}}{{displayedText}}varplugin=requirePlugin("WechatSI")exportdefault{data(){return{text:'需要展示的文字',displayedText:'',isPlaying:false,index:0,intervalId:null,audioContext:null,plugin:
朱留坤
·
2025-02-27 19:13
uni-app
微信小程序
小程序
GitHub开源数字人项目汇总(2025版)
大家好,今日分享以下是的"GitHub开源数字人项目",涵盖图像生成、
语音
驱动、直播带货及实时对话等核心功能,按技术方向分类整理的关键信息:一、图像与动态生成类OneShotOneTalk功能:单张图像生成全身动态数字人
xinxiyinhe
·
2025-02-27 18:30
人工智能
虚拟数字人
开源
github
VIT(Vision Transformer)【超详细 pytorch实现
这种全局建模能力在处理需要长距离依赖的任务(如图像分类、
目标检测
)时表现更好。全流程图像预处理+分块图像尺寸标准化,如(224
周玄九
·
2025-02-27 17:54
计算机视觉
transformer
深度学习
人工智能
说话人识别系统原理
简单来说,说话人识别系统就像是一位“
语音
侦探”,能够通过分析
语音
中的独特特征,精准地判断出说话者的身份。
醉心编码
·
2025-02-27 16:14
人工智能基础
编程基础
技术类
人工智能
说话人识别
语音识别
长文本切割实现流式调用文本合成
语音
长文本切割实现流式调用文本合成
语音
下面是一个文本合成音频的接口文档快速TTS音频构造接口文档请求地址:http://52.83.113.111:13679/Say/api/ra请求方式:postxmlraw
岁月的眸
·
2025-02-27 07:07
人工智能
Go语言
人工智能
goland
基于matlab的帧间差法进行视频
目标检测
系统
基于视频序列的运动
目标检测
,一直以来都是机器视觉、智能监控系统、视频跟踪系统等领域的研究重点,是整个计算机视觉的研究难点之一。
挂科边缘
·
2025-02-27 06:01
MATLAB项目实战
matlab
人工智能
计算机视觉
计算机视觉:经典数据格式(VOC、YOLO、COCO)解析与转换(附代码)
CNN)基本概念(一)第三章:计算机视觉:卷积神经网络(CNN)基本概念(二)第四章:搭建一个经典的LeNet5神经网络(附代码)第五章:计算机视觉:神经网络实战之手势识别(附代码)第六章:计算机视觉:
目标检测
从简单到容易
全栈你个大西瓜
·
2025-02-27 05:57
人工智能
计算机视觉
YOLO
目标跟踪
人工智能
数据标注
目标检测
COCO
深度学习的前沿与挑战:从基础到最新进展
.卷积神经网络(CNN)2.循环神经网络(RNN)3.生成对抗网络(GAN)4.变分自编码器(VAE)5.自注意力机制与Transformer深度学习的应用1.计算机视觉2.自然语言处理(NLP)3.
语音
识别与合成
Jason_Orton
·
2025-02-27 03:09
深度学习
人工智能
数据挖掘
机器学习
python系列&deep_study系列:使用python操作麦克风录制讲话,实时
语音
识别转换为文字
使用python操作麦克风录制讲话,实时
语音
识别转换为文字使用python操作麦克风录制讲话,实时
语音
识别转换为文字项目步骤VoskPyaudio完整代码使用python操作麦克风录制讲话,实时
语音
识别转换为文字在这个项目中
坦笑&&life
·
2025-02-27 02:57
AI系列
python
语音识别
xcode
大模型之二十七-
语音
识别Whisper实例浅析
Whisper简介Whisper是OpenAI于2022年9月开源的一个多语种识别模型,目前支持99种语言,是目前性能最好的开源多语种识别ASR大模型,第一版版使用了68万小时标注好的语料预训练模型,而large-v3的标注数据超过了500万小时,其paper中并没透露使用语料的详细来源,估计是爬了一些版权数据,在Huggingface上提到模型有很强的泛化能力,能够在未经特定训练的情况下处理新的
shichaog
·
2025-02-27 01:55
神经网络&人工智能
语音识别
whisper
人工智能
使用Python和Vosk库实现
语音
识别
使用Python和Vosk库实现
语音
识别在人工智能和机器学习领域,
语音
识别技术正变得越来越重要。Python作为一种强大的编程语言,拥有丰富的库和框架,可以方便地实现
语音
识别功能。
车载testing
·
2025-02-27 01:22
python
语音识别
开发语言
Python+whisper/vosk实现
语音
识别
Whisper-large-v3-turbo模型二、vosk1、Vosk介绍2、vosk安装3、使用vosk三、总结一、Whisper1、Whisper介绍Whisper是一个由OpenAI开发的人工智能
语音
识别模型
唯余木叶下弦声
·
2025-02-27 01:50
python
whisper
语音识别
人工智能
RK3568笔记七十八:PCM转WAV
一、简介最近看到Deepseek大模型,网上也有很多使用ESP32的小智智能
语音
功能,所以想在RK3568上实现类型的功能。
殷忆枫
·
2025-02-27 00:48
RK3568学习笔记
笔记
pcm
深度学习:从神经网络到智能应用
无论是
语音
识别、图像识别,还是自动驾驶、自然语言处理,深度学习都在推动着技术的发展和行业的变革。那
Jason_Orton
·
2025-02-27 00:43
深度学习
神经网络
人工智能
机器学习
【
目标检测
JP】番茄植株叶片病害数据集4280张8类病害YOLO+VOC(含增强)
【
目标检测
JP】番茄植株叶片病害数据集4280张8类病害YOLO+VOC(含增强)数据集格式:VOC格式+YOLO格式压缩包内含:3个文件夹,分别存储图片、xml、txt文件JPEGImages文件夹中
不会仰游的河马君
·
2025-02-26 23:07
数据集
目标检测
YOLO
番茄叶片病害
基于 YOLO 进行车道线检测与
目标检测
算法研究及开发的一般步骤
基于深度学习的车道线检测与
目标检测
在自动驾驶等领域有着重要应用,使用YOLO(YouOnlyLookOnce)进行开发是一种常见且高效的方式。
pk_xz123456
·
2025-02-26 23:37
python
算法
深度学习
YOLO
目标检测
算法
全市场大模型分类及对比分析报告
大模型凭借其强大的计算能力和海量数据处理能力,在自然语言处理(NLP)、计算机视觉(CV)、
语音
识别等领域取得了显著成果。
早退的程序员
·
2025-02-26 13:53
分类
数据挖掘
人工智能
【物联网项目】基于ESP8266设计的家庭灯光与火情智能监测系统(完整工程资料源码等)
主要模块如HC-SR501人体红外传感器模块、光敏电阻传感器模块、火焰传感器模块、LD3320
语音
识别模块、DHT11温湿度传感器模块等。使用Arduino开发软件进行烧录程序
阿齐Archie
·
2025-02-26 13:20
单片机项目合集
单片机
嵌入式硬件
stm32
毕业设计
毕设
物联网
机器学习安全核心算法全景解析
一、数据安全防护算法1.对抗样本防御算法名称核心思想2024年最新进展典型应用场景TRADES鲁棒性-准确性权衡优化Facebook提出自监督TRADES改进版自动驾驶
目标检测
JacobianSVD输入
金外飞176
·
2025-02-26 12:44
网络空间安全
机器学习
安全
算法
脑洞打开话题:deepseek这么火,什么时候能完全代替人类?
以下是关于AI何时可能完全代替人类的一些分析和思考:1.技术层面的限制尽管AI在某些特定任务上已经超越了人类(如图像识别、
语音
识别、围棋等),但要完全代替人类,AI需要在以下几个方面取得突破:通用人工智能
噔噔噔噔@
·
2025-02-26 10:29
网络
动态视觉SLAM的亿点点思考(含20项最新开源代码链接)[上篇]
现有的模板基本就是使用
目标检测
或者语义分割网络剔除动态特征点,然后用几何一致性做进一步的验证。笔者最近也在思考突破口,
3D视觉工坊
·
2025-02-26 05:57
3D视觉从入门到精通
人工智能
Apache Pinpoint工具介绍
其核心功能包括:链路可视化:展示服务间调用关系(调用树、耗时分布)性能分析:定位慢请求、异常错误根源依赖分析:统计服务间流量占比自动化监控:集成Prometheus、Grafana实时
告警
二、
程序员的世界你不懂
·
2025-02-26 05:55
效率工具提升
apache
python
语音
转文本中文——DeepSpeech
DeepSpeech简介与音频转文本实践DeepSpeech是由Mozilla开发的一种开源
语音
识别引擎,基于深度学习技术,采用端到端架构,可以高效地将
语音
转换为文本。
drebander
·
2025-02-26 00:51
python
开发语言
DeepSpeech
[C++]使用纯opencv部署yolov12
目标检测
onnx模型
yolov12官方框架:sunsmarterjie/yolov12【算法介绍】在C++中使用纯OpenCV部署YOLOv12进行
目标检测
是一项具有挑战性的任务,因为YOLOv12通常是用PyTorch等深度学习框架实现的
FL1623863129
·
2025-02-25 23:18
深度学习
c++
opencv
YOLO
目标检测
进化史:从R-CNN到YOLOv11,技术的狂飙之路
一、引言在计算机视觉领域中,
目标检测
是一项至关重要的任务,它旨在识别图像或视频中感兴趣的目标物体,并确定它们的位置。
目标检测
技术的应用广泛,涵盖了自动驾驶、安防监控、智能机器人、图像编辑等多个领域。
紫雾凌寒
·
2025-02-25 17:32
AI
炼金厂
#
机器学习算法
#
深度学习
深度学习
计算机视觉
python
目标检测
YOLO
cnn
人工智能
【2025最新】ChatGPT国内直连中文版镜像网站
两者对比项目官网镜像支付手段国际支付国内支付封禁策略网站检测,可能随时封禁采用更灵活的绕过策略,不易封禁价格每月140元订阅费用+每年70元虚拟卡一个月低至19.99元随用性需要固定订阅灵活选择,满足多种需求
语音
功能必须下载
J19109690198
·
2025-02-25 16:29
chatgpt
人工智能
论文笔记
gpt
AI写作
图像配准的方法
比如计算机视觉中的景物匹配和飞行器定位系统中的地图匹配,依据其完成的主要功能而被称为
目标检测
与定位,根据其所采用的算法称之为图像相关等等。
wangtaohappy
·
2025-02-25 14:12
高压输电线故障检测数据集 YOLO 格式
数据集介绍高压输电线故障检测数据集是一个专为电力行业AI模型训练设计的高质量数据集,支持YOLO格式的方框标注,适用于
目标检测
任务。数据集特点图像数量:1912张高质量图像,涵盖多种场景和光照条件。
幽络源小助理
·
2025-02-25 12:27
幽络源资料分享
人工智能
机器学习
深度学习
实战分享:如何基于源码开发一款优质的陪玩系统H5小程序APP公众号
功能需求:根据目标用户群体的需求,确定陪玩系统的核心功能,如实时
语音
互动、直播间与聊天室、
·
2025-02-25 11:00
AI生成内容带来的核心挑战引发人机共治的必要提前
一、AI生成内容带来的核心挑战信息真实性危机斯坦福研究显示,AI生成虚假信息的速度是人类创作的6倍,如近期AI伪造的"拜登紧急状态"
语音
导致金融市场波动医疗领域已出现AI生成的伪科学内容,某健康论坛中23%
临水逸
·
2025-02-25 05:08
人工智能
Deepseek 在电饭煲上应用会带来哪些影响?
例如,用户可以通过
语音
或触控界面直接与电饭煲交互,输入烹饪需求,电饭煲通过联网搜索或内置算法快速生成最佳烹饪方案并执行。这种智能化的控制方式能够提升用户体验,使烹饪过程更加便捷和高效。个性化推荐与优
百态老人
·
2025-02-25 05:03
人工智能
笔记
大数据
android开发适配深色模式,手机不支持深色模式,如何用软件解决深色模式的问题?(附有系统全局深色模式实现方法...
本帖最后由巷子口的你于2020-8-807:57编辑1.92允许通过设置为助手应用来饮捷切频深色模式(设置入口一般为系统默认应用-助手和
语音
输人,MIU需要设置为
语音
助手)提醒:稳定模式一股不用开启,OPPO
weixin_39755853
·
2025-02-25 03:19
android开发适配深色模式
神经网络与深度学习入门:理解ANN、CNN和RNN
无论是智能手机的
语音
助手,还是推荐系统,背后都有一项核心技术在支撑,那就是神经网络与深度学习。今天,我们就来聊一聊这个听起来高大上的话题,其实它也没那么难懂!什么是神经网络?
shandianfk_com
·
2025-02-25 03:49
ChatGPT
AI
神经网络
深度学习
cnn
python 实现信号高通、低通、带通滤波处理代码,并画出滤波后的时域频域图
FIR滤波器常用于
语音
信号的低通、带通和高通滤波,特别是在需要无失真、稳定的频率响应和易于设计的情况下。FIR高通、低通、带通滤波:高通滤波:保留高频信号,衰减低频信号。低通滤波:保留低频
luthane
·
2025-02-25 00:03
python
开发语言
HarmonyOS Next智能相册应用中的AI识图与
语音
识别实战
本文旨在深入探讨基于华为鸿蒙HarmonyOSNext系统(截止目前API12)构建智能相册应用中AI识图与
语音
识别技术的实战应用,基于实际开发经验进行总结。
·
2025-02-24 23:19
harmonyos
YOLOv12:以注意力为中心的物体检测
相比以往的YOLO模型,YOLOv12摒弃了传统基于卷积神经网络(CNN)的结构,采用了全新的方法,融合了自注意力机制和高效的网络架构优化,提供了一个高精度、低延迟的实时
目标检测
模型。
那雨倾城
·
2025-02-24 23:21
PiscTrace
YOLO
机器学习
目标检测
深度学习
图像处理
docker安装Open WebUI详解-遇到的坑OSError: We couldn‘t connect to ‘https://huggingface.co‘ to load this file
OpenWebUI的功能丰富,包括代码高亮、数学公式支持、网页浏览、预设提示词、本地RAG集成、对话标记、模型下载、聊天记录查看以及
语音
支持等。
坚定信念,勇往无前
·
2025-02-24 22:16
AI
docker
容器
运维
cap4:YoloV5的TensorRT部署指南(python版)
CUDA环境安装cap2:1000分类的ResNet的TensorRT部署指南(python版)cap3:自定义数据集训练ResNet的TensorRT部署指南(python版)cap4:YoloV5
目标检测
任务的
我是一个对称矩阵
·
2025-02-24 21:14
TensorRT全流程部署指南
YOLO
python
人工智能
TensorRT
模型部署
模型蒸馏:让 AI 模型 “轻装上阵”,开启无限可能
无论是手机上精准的
语音
助手,还是购物平台个性化的推荐系统,又或是医疗领域辅助诊断的智能工具,大模型都展现出了令人惊叹的能力。然而,这位“超级智者”却有着不为人知的烦恼。
东锋1.3
·
2025-02-24 21:39
人工智能
人工智能
模型蒸馏
在 Centos7 上部署 ASP.NET 8.0 + YOLOv11 的踩坑实录
本文将详细记录我在CentOS7上部署ASP.NET8.0结合YOLOv11
目标检测
项目过程中遇到的问题及解决方案,旨在为有类似需求的开发者提供参考。
桑榆肖物
·
2025-02-24 20:03
ASP.NET
运维
asp.net
YOLO
后端
【带你 langchain 双排系列教程】0. 走进大模型与 LangChain 的奇妙世界
它们正在改变着我们的生活和工作方式,从智能聊天机器人到自动文本生成,从图像识别到
语音
助手,大模型的应用无处不在。而LangChain作为构建大模型应用的强大框架,为我们打开了通往这一奇妙世界的大门。
夜里慢慢行456
·
2025-02-24 18:50
双排人工智能
python
langchain
是时候解决
告警
事件数据孤岛问题了
大家有没有发现,随着公司发展,慢慢引入了越来越多的监控、可观测性的系统,云上的、云下的,开源的、商业的,通用的、特定产品的,导致
告警
事件分散在非常多的地方,形成一个一个的数据孤岛。
·
2025-02-24 14:58
监控告警告警风暴
live2d + edge-tts 优雅的实现数字人讲话 ~
后来了解了live2d技术,常在博客网页上见到的看板娘就是live2d技术实现的~说下demo的技术实现,核心采用live2d的模型[含有开口说话的动作]+文本转
语音
接口1、文本转
语音
接口这个接口采用前面分享过的
RoronoaV587
·
2025-02-24 14:20
python
人工智能
文本转语音
数字人
live2d
AI知识架构之AIGC
文本方面,如文章写作、对话生成;图像领域,包括绘画、设计图生成;音频上,可进行音乐创作、
语音
合成;视频方面,则
heardlover
·
2025-02-24 13:17
AI学习
人工智能
AIGC
架构
自然语言处理
举世无双
语音
合成系统 VITS 发展历程(2024.3 PAVITS)
VITS经典项目:FaceBook开源,1000+语言,mms-meta/MMSwenet社区,onnx和android,wenet-e2e/wetts手写模型,huakunyang/SummerTTS30+语言,rhasspy/piperVITS流式推理:
u013250861
·
2025-02-24 13:10
#
语音
如何使用智能化RFID管控系统,对涉密物品进行安全有效的管理?
载体管控系统主要采用RFID射频识别及物联网技术,通过本系统为载体确定唯一标识,借助智能存储柜、流转柜、通道门等智能终端管控设备,对载体注册、使用、存储、流转等环节进行管控,从而实现对载体分类、载体存取、
告警
长老的二向箔
·
2025-02-24 08:38
安全
适用于呼叫中心质检的离线ASR模型
以下是适用于中文呼叫中心质检的离线
语音
转文字(STT)模型及工具,根据性能、中文支持、部署灵活性等维度整理:1.开源模型与框架1.1WeNet(出门问问&西北大学)特点:端到端
语音
识别框架,专为中文优化
狂爱代码的码农
·
2025-02-24 08:07
VOIP那些事
容器
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他