E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
多模态三维目标检测
GPT-4o mini小型模型具备卓越的文本智能和
多模态
推理能力
GPT-4omini在学术基准测试中,无论是在文本智能还是
多模态
推理方面,都超越了GPT-3.5Turbo和其他小型模型,并支持与GPT-4o相同的语言范围。
FlowUs息流使用宝典
·
2025-03-19 14:55
GPT-4o
mini
vLLM本地部署Mistral-Small 3.1+全方位测试
多模态
大模型!超越Gemma3.1,最适合企业项目的大模型!中文OCR能力也不弱
这款由法国AI实验室MistralAI开发的开源
多模态
模型,以其卓越的性能和灵活性,为开发者、企业和研究人员带来了全新的可能性。
AI超元域
·
2025-03-19 12:14
ocr
人工智能
ai
AI编程
aigc
Dyn-VQA:含1452动态问题的视觉问答数据集,需灵活提供知识检索方案,查询、工具与检索时间皆可变。
数据集地址:Dyn-VQA|
多模态
检索数据集|自然语言处理数据集一、研究背景:在
多模态
大型语言模型(MLLMs)中,解
·
2025-03-19 11:09
数据集
Trae智能协作AI编程工具IDE:如何在MacBook Pro下载、安装和配置使用Trae?
双向智能增强:AI不仅提供代码补全,更能理解上下文主动建议架构优化方案自然语言编程:支持"用Python写一个带JWT验证的FastAPI用户系统"式开发实时协作画布:可视化呈现AI生成的代码逻辑,支持
多模态
·
2025-03-19 11:34
DeepSeek高能低耗AI创作突破
DeepSeek系列产品通过670亿参数混合专家架构,构建起覆盖学术研究、内容创作与编程开发的
多模态
解决方案。
智能计算研究中心
·
2025-03-19 11:06
其他
OSWorld:开启
多模态
智能体的真实计算机环境革命
OSWorld:开启
多模态
智能体的真实计算机环境革命在人工智能技术突飞猛进的今天,
多模态
智能体正逐步突破实验室的限制,试图融入人类的日常工作场景。
几道之旅
·
2025-03-19 08:32
人工智能
智能体及数字员工
人工智能
手机零部件
三维
光学测量解决方案
在手机设计、质量检测中,无论是手机中框还是屏幕,利用
三维
光学测量技术,有助于优化从原型和模具构建、首件检验报告到装配分析等环节的质量控制,并有效节省检测时间,快速推进新产品上市。另外
yy229382036
·
2025-03-19 05:05
人工智能
3d
光学成像
算法
[RA-L 2023] Coco-LIC:基于非均匀 B 样条的连续时间紧密耦合 LiDAR-惯性-相机里程计
这段代码是一个基于C++的均匀B样条(UniformB-spline)实现,专门用于表示SE(3)变换(即
三维
空间中的刚体变换,包括旋转和平移)。
十年一梦实验室
·
2025-03-19 04:56
c++
RAG 在
多模态
数据处理中的应用探索:结合图像与文本生成
目录引言
多模态
数据处理的挑战与需求数据异质性与融合难题多样化应用场景的需求RAG在图像与文本生成中的应用架构图像检索与文本生成协同跨模态特征融合与生成关键技术与实现细节图像特征提取与表示文本检索与语义理解跨模态生成模型训练应用案例分析智能设计辅助医疗影像报告生成结论引言随着信息技术的飞速发展
hy098543
·
2025-03-18 22:40
AIGC
MM-RAIT:
多模态
检索增强生成(RAG)的认知革命
多模态
检索增强生成(RAG)领域迎来了一项里程碑式的突破——MM-RAIT框架通过“评估-训练”双轮驱动,显著提升了主流视觉语言模型的RAG性能,增幅达27%至34%。
花生糖@
·
2025-03-18 20:58
AIGC学习资料库
人工智能
深度学习
机器学习
RAG
AI知识库
模型上新!体验文心大模型4.5卓越性能,文心快码邀您探索
即日起,用户可以在文心快码BaiduComate的【Chat】功能中,选择切换至ERNIE-4.5-8K-Preview,体验这一新一代原生
多模态
大模型的卓越性能。
·
2025-03-18 18:07
前端后端java人工智能程序员
【pytorch(cuda)】基于DQN算法的无人机
三维
城市空间航线规划(Python代码实现)
本文目录如下:目录⛳️赠与读者1概述一、研究背景与意义二、DQN算法概述三、基于DQN的无人机
三维
航线规划方法1.环境建模2.状态与动作定义3.奖励函数设计4.深度神经网络训练5.航线规划四、研究挑战与展望
wlz249
·
2025-03-18 16:28
python
pytorch
算法
VLLM专题(三十五)—
多模态
数据处理
为了在vLLM中实现各种优化,例如分块预填充和前缀缓存,我们使用BaseMultiModalProcessor来提供占位符特征标记(例如)与
多模态
输入(例如原始输入图像)之间的对应关系,基于HF处理器的输出
AI专题精讲
·
2025-03-18 16:56
大模型专题系列
人工智能
| 小白也能轻松玩转
目标检测
!
|小白也能轻松玩转
目标检测
!
一只云卷云舒
·
2025-03-18 16:56
YOLOv12保姆级通关教程
YOLO
YOLOv12
flash
attention
GPU
计算能力
算力
yolov8的第一次实验报告
1.实验概述实验名称:占道经营
目标检测
模型实验目标:提高模型的精确率(Precision)和召回率(Recall),使其接近1。
算法宇宙
·
2025-03-18 16:55
YOLO
人工智能
计算机视觉
DeepSeek重构产业生态:餐饮、金融与短视频的智能跃迁
引言:智能时代的产业共振在数字技术浪潮席卷全球的当下,DeepSeek作为人工智能领域的重要参与者,正以其强大的算法能力和
多模态
交互特性,深度渗透至餐饮、金融、短视频等民生关键领域。
放逐者-保持本心,方可放逐
·
2025-03-18 15:19
其他
重构
金融
YOLOv8 的简介 及C#中如何简单应用YOLOv8
YOLOv8是YOLO(YouOnlyLookOnce)系列中的最新版本,是一种用于
目标检测
和图像分割的深度学习模型。YOLO模型以其快速和准确的
目标检测
性能而著称,广泛应用于实时应用程序中。
码上有潜
·
2025-03-18 14:46
YOLOv8
YOLO
BioDeepAV:一个
多模态
基准数据集,包含超过1600个深度伪造视频,用于评估深度伪造检测器在面对未知生成器时的性能。
2024-11-29,由罗马尼亚布加勒斯特大学创建BioDeepAV数据集,它专门设计来评估最先进的深度伪造检测器在面对未见过的深度伪造生成器时的泛化能力,这对于提高检测器的鲁棒性和适应性具有重要意义。一、研究背景:随着生成模型的快速发展,深度伪造内容的逼真度不断提高,人们越来越难以在线检测出被操纵的媒体内容,从而容易受到各种诈骗的欺骗。这不仅对个人隐私构成威胁,也对社会信任和民主构成挑战。目前遇
·
2025-03-18 13:27
数据集
Yolov11
目标检测
(ultralytics)
Yolov11
目标检测
(ultralytics)1.克隆仓库2.安装环境依赖3.训练、验证、推理以及onnx模型导出1.克隆仓库从官网下载Yolov11到本地。
@M_J_Y@
·
2025-03-18 13:02
目标检测
YOLO
目标检测
人工智能
3D 射线方程学习
三维
射线方程是描述一个从某点出发,并沿某个方向延伸的线段的方程。一、射线1.射线方程的基本形式在
三维
空间中,射线方程可以用参数化的方式表示为:P(t)是射线上的点,在任意参数t处的位置。
码农客栈_V13427279549
·
2025-03-18 12:51
算法
3d
算法
python实现dem输出
三维
模型_使用DEM生成3D模型(补完)
DataMark--------中国地球空间数据交换格式-格网数据交换格式(CNSDTF-RAS或CNSDTF-DEM)的标志。基本部分,不可缺省。Version--------该空间数据交换格式的版本号,如1.0。基本部分,不可缺省。Unit--------坐标单位,K表示公里,M表示米,D表示以度为单位的经纬度,S表示以度分秒表示的经纬度(此时坐标格式为DDDMMSS.SSSS,DDD为度,M
不行我不能睡
·
2025-03-18 11:45
使用 labelImg 制作YOLO系列
目标检测
数据集(
文章转载自K同学,谨防原文失效可参考link1和link2和link3LabelImg介绍LabelImg支持文件夹的导入,在标完一张后,在左侧选择NextImage就可以切换到下一张继续了。输出格式部分,目前LabelImg支持YOLO和PascalVOC2种格式,前者标签文件后缀是.txt件,而后者标签文件后缀是.xml件。标签保存在对应的labels文件夹下,与images中的图片文件名一一
2401_89791028
·
2025-03-18 10:40
YOLO
目标检测
人工智能
SMT贴片加工核心技术突破与实践
本文围绕精密点胶工艺优化、
三维
堆叠焊接技术突破、全自动光学检测系统(AOI)部署等核心环节展开系统性分析,重点探讨工艺参数调优、异形元件焊接精度控制、缺陷检测算法升级等具体技术路径。
安德胜SMT贴片
·
2025-03-18 08:47
其他
单目3d重建DUSt3R 笔记
目录DUSt3R
三维
重建报错RecursionError:maximumrecursiondepthexceededincomparison报错numpy.core.multiarrayfailedtoimport
AI算法网奇
·
2025-03-18 07:07
3D视觉
人工智能
LLaVA-Mini用一个视觉Token革新
多模态
大模型
欢迎关注,获取最新人工智能动态和技术,有时会发布相关技术教程。也可留言想要跟踪哪些技术动态。往期Agent文章参考:Owl小白教程一键启动Manus开源|Owl最新版小白教程,一键启动,五大更新Owl技术解析:Manus开源复刻框架OWL,测评和使用教程来了!Manus核心技术:Manus|核心技术被曝光?你知道它使用了哪些工具吗?针对deepseek的api:Manus开源|owl针对使用dee
SGG_CV
·
2025-03-18 05:18
paper
agent
python
人工智能
DeepSeek在智慧物流管控中的全场景落地方案
一、智慧物流核心痛点与DeepSeek解决方案矩阵物流环节行业痛点DeepSeek技术方案价值增益仓储管理库存预测误差率>30%
多模态
时空预测模型库存周转率↑40%运输调度车辆空驶率35%强化学习动态调度引擎运输成本
猴的哥儿
·
2025-03-18 04:47
笔记
大数据
交通物流
python
数据仓库
微服务
探索DeepSeek:前端开发者不可错过的新一代AI技术实践指南
作为覆盖语言、代码、视觉的
多模态
技术矩阵,DeepSeek不仅实现了与ChatGPT相媲美的能力,还通过强化学习驱动的架构创新,解决了大模型落地中的成本与效率瓶颈。
formerlyai
·
2025-03-18 02:21
人工智能
前端
【
多模态
处理篇五】【DeepSeek文档解析:PDF/Word智能处理引擎】
你知道吗?全球每天产生的PDF文档超过10亿份,但90%的上班族还在用复制粘贴的笨办法处理文档!DeepSeek文档解析引擎就像给你的电脑装上了"文档翻译官",能把PDF/Word里的文字、表格、公式甚至排版样式都变成AI能理解的"语言"。举个真实场景:法务小姐姐用这个工具处理200页的英文合同时,5分钟就能提取出关键条款、风险点、履约时间线,效率直接翻10倍!一、核心技术解析:文档处理的"庖丁解
再见孙悟空_
·
2025-03-18 01:48
「2025
DeepSeek技术全景实战」
web安全
notion
人工智能
DeepSeek
DeepSeek文档
DeepSeek解析文档
DeepSeek
PDF
宇树激光雷达L1上手测试
因为工作中低成本
三维
空间扫描的需求,在同事偶尔推荐下知道了宇树L1这款激光雷达,不得不说小巧的设计,0.05m的最小测距距离,360°*90°的FOV,以及最最最重要的1600多的价格无一不打动我。
力特高
·
2025-03-18 00:39
linux
自动驾驶
机器人
自动化
ChatGPT推理模型&通用模型大解析!
以下是ChatGPT的所有模型及其分类介绍:通用模型GPT-4:OpenAI的旗舰模型,是一个大型
多模态
模型,能够比以前的模型更准确地解决困难问题,具有更广泛的通用知识和先进的推理能力。
即兴小索奇
·
2025-03-18 00:38
ChatGPT&
AI
人工智能
chatgpt
基于多向量检索器的
多模态
RAG实现:用于表格、文本和图像
这些cookbooks还提出了一些将
多模态
LLM与多向量检索器配对以解锁图像上的RAG的想法。
lichunericli
·
2025-03-17 21:44
人工智能
自然语言处理
YOLOv8 改进:添加 GAM 注意力机制
YOLOv8改进:添加GAM注意力机制引言在
目标检测
领域,YOLO(YouOnlyLookOnce)网络因其速度和准确性被广泛应用。
鱼弦
·
2025-03-17 16:14
人工智能时代
YOLO
Cesium:开源的
三维
地球可视化引擎
简介:Cesium是一款开源的
三维
地球可视化引擎,为开发者和用户提供了强大且易于使用的工具,用于创建令人惊叹的虚拟地球场景。它基于WebGL技术,能够在现代的Web浏览器上运行,并支持各种平台和设备。
ZD1
·
2025-03-17 16:13
信息可视化
Cesium在
三维
模型中的应用
Cesium在
三维
模型中的应用Cesium简介Cesium介绍Cesium是一个跨平台,跨浏览器的展示
三维
地球和地图的javascript库Cesium使用WebGL来进行硬件加速图形,使用时不需要任何插件支持
IT邦少
·
2025-03-17 16:09
前端
贴图
Cesium-
三维
地球可视化应用
什么是CesiumJS?CesiumJS是一个强大的开源JavaScript库,用于构建高性能的3D地图和地球可视化应用。无论你是从事地理信息系统(GIS)开发、数据可视化,还是需要展示空间数据,CesiumJS都能提供灵活的解决方案。它以WebGL为核心,专注于大规模地理空间数据的实时渲染。CesiumJS是Cesium平台的核心部分,与Cesiumion等服务无缝集成,支持从数据管理到可视化的
程序员_三木
·
2025-03-17 16:38
Web3d
webgl
Three.js
Cesium实时建筑物
三维
可视化与地理信息系统(GIS)
近年来,随着科技的不断发展,地理信息系统(GIS)和
三维
可视化技术在城市规划、建筑设计和地理空间分析中扮演着越来越重要的角色。
OvzStream
·
2025-03-17 15:05
GIS
ST-Align:一个包含430万训练样本,涵盖了15种细粒度
多模态
数据集
2025-01-15,由北航大学、合肥工业大学、中科院信息工程研究所和美团等机构联合创建介绍了一种名为LLaVA-ST的
多模态
大型语言模型。
·
2025-03-17 15:12
数据集
【北上广深杭大厂AI算法面试题】计算机视觉篇...详解
目标检测
中的多尺度训练和测试?
【北上广深杭大厂AI算法面试题】计算机视觉篇…详解
目标检测
中的多尺度训练和测试?【北上广深杭大厂AI算法面试题】计算机视觉篇…详解
目标检测
中的多尺度训练和测试?
努力毕业的小土博^_^
·
2025-03-17 14:53
AI算法题库
人工智能
计算机视觉
算法
深度学习
神经网络
目标检测
AI大模型学习路线:从入门到精通的完整指南【2025最新】
它们不仅在自然语言处理(NLP)任务中表现卓越,还在计算机视觉、
多模态
交互等领域展现出巨大潜力。
AI大模型-大飞
·
2025-03-17 10:27
人工智能
学习
大模型
LLM
AI
程序员
大模型学习
Google Gemini 大模型技术架构剖析
▼最近直播超级多,预约保你有收获近期直播:《从原理到实践教你做出一个Gemini/ChatGPT》—1—Gemini技术架构剖析Google新的
多模态
模型家族Gemini,它在文本、图像、音频、视频等方面具有卓越的能力
musicml
·
2025-03-17 08:15
人工智能
展望 AIGC 前景:通义万相 2.1 与蓝耘智算平台共筑 AI 生产力高地
作为该领域的革命性技术代表,通义万相2.1凭借其开源特性、
多模态
生成能力和技术突破,成为全球视频生成模型的标杆。
accurater
·
2025-03-17 07:07
AIGC
人工智能
神经网络
深度学习
文心一言提前免费,高性能大模型全面入局该咋看?
文心大模型4.5作为首个原生
多模态
大模型,在
多模态
理解、文本和逻辑推理能力上的显著提升,使其在多项测试中表现优于GPT4.5,这体现了百度在AI技术研发上的深厚积累。同时,文心大模型X1作为深度思
江瀚视野
·
2025-03-17 07:06
人工智能
机器人
从0到1构建AI深度学习视频分析系统--基于YOLO
目标检测
的动作序列检查系统:(2)消息队列与消息中间件
文章大纲原始视频队列Python内存视频缓存优化方案(4GB以内)一、核心参数设计二、内存管理实现三、性能优化策略四、内存占用验证五、高级优化技巧六、部署建议检测结果队列YOLO检测结果队列技术方案一、技术选型矩阵二、核心实现代码三、性能优化策略四、可视化方案对比五、部署建议逻辑判定队列时间片图论时间序列大模型引入参考文献原始视频队列想要在单机内存中缓存1-5分钟的视频片段,python技术栈的话
shiter
·
2025-03-17 06:58
人工智能系统解决方案与技术架构
人工智能
深度学习
音视频
YOLOv5+UI界面在车辆检测中的应用与实现
近年来,深度学习技术的突破,特别是卷积神经网络(CNN)的崛起,使得
目标检测
技术取得了显著进展。
深度学习&目标检测实战项目
·
2025-03-16 23:03
YOLOv5实战项目
YOLO
ui
分类
数据挖掘
目标跟踪
人工智能
DeepSeek:技术教育领域的AI变革者——从理论到实践的全面解析
DeepSeek作为国产开源大模型的代表,凭借其推理能力、
多模态
支持与低成本部署的特性,正在为技术教育带来突破性解决方案。
量子纠缠BUG
·
2025-03-16 23:03
DeepSeek
DeepSeek部署
AI
人工智能
python
一周热点:微软攻克语音输入、文本输出难题-Phi-4-multimodal
微软Phi-4-multimodal模型是人工智能领域的一个重要进展,它标志着微软在
多模态
人工智能技术上的突破。
数据分析能量站
·
2025-03-16 22:57
机器学习
人工智能
YOLO优化之扫描融合模块(SimVSS Block)
研究背景在自动驾驶技术快速发展的背景下,
目标检测
作为其核心组成部分面临着严峻挑战。驾驶场景中目标尺度和大小的巨大差异,以及视觉特征不显著且易受噪声干扰的问题,对辅助驾驶系统的安全性构成了潜在威胁。
清风AI
·
2025-03-16 19:00
人工智能
计算机视觉
YOLO
目标检测
深度学习
目标跟踪
大模型巅峰对决:DeepSeek vs GPT-4/Claude/PaLM-2 全面对比与核心差异揭秘
喜欢可以到主页订阅专栏目录技术架构对比性能表现与基准测试
多模态
与多语言能力推理效率与成本分析开源生态与行业适配应用场景与案例研究未来发展与技术趋势代码实现与调用示例1.技术架构对比DeepSeek:动态稀疏激活的混合专家系统
accurater
·
2025-03-16 16:40
机器学习
科技
人工智能
TRAE与Cursor最佳实践指南(截至2025年3月)
多模态
输入:上传设计草图或错误截图,结合自然语言描述需求,提升代码生成精准度(例如电商页面开发可直接上传原型图)。版本控制:利用“历史会话回溯”功能快速回退到指定版本,避免代码修改失控。
xinxiyinhe
·
2025-03-16 11:05
AI编程
人工智能
python
AI编程
人工智能
python
深入探究YOLO系列的骨干网路
深入探究YOLO系列的骨干网路YOLO系列是
目标检测
领域中非常知名的算法。其通过将整个图像作为输入,并且直接在图像上通过一个单独的神经网络输出每个检测框的类别预测和边界框信息。
编码实践
·
2025-03-16 10:59
YOLO
深度学习
计算机视觉
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他