E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
多模态三维目标检测
Minimax 开源的 4 百万超长上下文模型
该系列包含基础语言大模型MiniMax-Text-01和视觉
多模态
大模型MiniMax-VL-01。MiniMax作为大模型六小强(或六小虎)企业之一,其推出的这一系列模型有着诸多独特之处。
百态老人
·
2025-01-22 14:26
人工智能
大数据
笔记
汽车和工业用激光雷达行业分析
激光雷达通过脉冲激光照射目标并用传感器测量反射脉冲返回时间来测量目标距离,能够生成高分辨率的地图和
三维
模型。
LPiling
·
2025-01-22 13:16
汽车
自动驾驶
人工智能
【深度学习基础】线性神经网络 | softmax回归的简洁实现
深度学习在计算机视觉、自然语言处理、
多模态
数据
Francek Chen
·
2025-01-22 11:34
PyTorch深度学习
深度学习
神经网络
回归
softmax
人工智能
第十九周:SSD(Single Shot MultiBox Detector)
Abstract1引言2SSD框架2.1设计理念2.2训练2.3预测3创新与不足总结参考摘要本篇博客介绍了SSD(SingleShotMultiBoxDetector),这是一种基于全卷积网络的单阶段
目标检测
模型
L-含光承影
·
2025-01-22 10:52
目标跟踪
人工智能
计算机视觉
AIGC视频生成模型:Meta的Emu Video模型
优质专栏回顾:机器学习笔记深度学习笔记
多模态
论文笔记AIGC—图像文章目录论文摘要引言相关工作文本到图像(T2I)扩散模型视频生成/预测文本到视频(T2V)生成分解生成方法预备知识EmuVideo生成步骤图
好评笔记
·
2025-01-22 10:21
#
Meta
AIGC-视频
AIGC
机器学习
人工智能
transformer
论文阅读
深度学习
面试
字节跳动发布全新 AI 编程工具 Trae,近屿智能培养 AIGC 专业人才
它整合了GPT-4o和Claude-3.5-Sonnet等顶级AI模型,支持
多模态
输入,能够迅速响应
OJAC近屿智能
·
2025-01-22 09:20
人工智能
AIGC
近屿智能
ai
清华和哈工大把大模型量化做到了1比特,把世界顶尖
多模态
大模型开源大模型量化个人电脑运行!机器人领域首个开源视觉-语言操作大模型,激发开源VLMs更大潜能,视 Mamba速度提升2.8倍,内存能省87%
清华和哈工大把大模型量化做到了1比特,把世界顶尖
多模态
大模型开源大模型量化个人电脑运行!机器人领域首个开源视觉-语言操作大模型,激发开源VLMs更大潜能,视Mamba速度提升2.8倍,内存能省87%。
代码讲故事
·
2025-01-22 05:45
机器人智慧之心
Mamba
机器人
量化
大模型
开源
视觉
VLMs
【YOLOv8改进 - 检测头】 RT-DETR检测头,解决传统
目标检测
器中非极大值抑制(NMS)所带来的速度和准确性之间的平衡问题
YOLO
目标检测
创新改进与实战案例专栏专栏目录:YOLO有效改进系列及项目实战目录包含卷积,主干注意力,检测头等创新机制以及各种
目标检测
分割项目实战案例专栏链接:YOLO基础解析+创新改进+实战案例介绍摘要
YOLO大师
·
2025-01-22 05:14
YOLO
人工智能
论文阅读
目标检测
yolov8
【机器学习】
多模态
AI——融合多种数据源的智能系统
多模态
AI(MultimodalAI)通过结合多种数据源(如文本、图像、音频等)来提升模型的智能和表现,适用于多样化的应用场景,如自动驾驶、医疗诊断、跨语言翻译等。
2的n次方_
·
2025-01-22 04:09
人工智能
DETRs with Collaborative Hybrid Assignments Training论文阅读与代码
关键词:协作混合分配训练【
目标检测
】Co-DETR:ATSS+FasterRCNN+DETR协作的先进检测器(ICCV2023)-CSDN博客摘要:在这篇论文中,作者观察到在DETR中将过少的Query
分享总结快乐
·
2025-01-22 04:38
论文阅读
月之暗面今日发布k1.5
多模态
思考模型
月之暗面k1.5
多模态
思考模型的问世一、月之暗面k1.5
多模态
思考模型介绍2025年1月20日,月之暗面发布了k1.5
多模态
思考模型。
百态老人
·
2025-01-22 01:51
笔记
人工智能
解锁辅助驾驶新境界:基于昇腾 AI 异构计算架构 CANN 的应用探秘
倔强的石头的gitee主页⏩文章专栏:《AI大模型》期待您的关注目录一、引言二、CANN是什么1.异构计算与人工智能的关系2.CANN的定义和作用3.CANN的技术优势三、基于CANN的辅助驾驶AI应用原理1.
目标检测
算法
倔强的石头_
·
2025-01-21 19:25
AIGC
人工智能
架构
AI大模型:开启智能革命新纪元
尽管业界对大模型的定义尚未统一,但通常指的是基于Transformer框架的大型语言模型,广义上也包括了
多模态
大模型,如涉及语言、声音、图像、视频等,技术
洋洋科创星球
·
2025-01-21 17:09
AI项目管理赋能实战
人工智能
科技早报|OpenAI的人工智能模型销售收入超过微软类似业务;荣耀中国区CMO辟谣将采用麒麟芯片 | 最新快讯
与此前的版本相比,新模型在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、
多模态
能力等七大能力上都有提升。例如,讯飞星火可以根据用户的语言描述,结合空间和常识推断描述对象所在的位置。
最新科技快讯
·
2025-01-21 16:34
科技
人工智能
microsoft
YOLOv10全网最新创新点改进系列:YOLOv10融合SwinTransformer模块,分辨率每层变成一半,而通道数变成两倍,有效提升小
目标检测
效果!
YOLOv10全网最新创新点改进系列:YOLOv10融合SwinTransformer模块,分辨率每层变成一半,而通道数变成两倍,有效提升小
目标检测
效果!所有改进代码均经过实验测试跑通!
AI棒棒牛
·
2025-01-21 16:02
YOLO
目标检测
人工智能
模型改进
yolov10
创新
sci写作
中科曙光C/C++研发工程师二面
CNN在图像识别、
目标检测
和图像生成等领域取得了巨大成功。具体来说,CNN的模型结构包括输入层、卷积层、激活函数、池化层、全连接层和输出层。输入层接收图像数据,并将其转换为
TrustZone_
·
2025-01-21 16:31
ARM/Linux嵌入式面试
c语言
c++
开发语言
第01章 14 VTK数据集(DataSet)的类型
在VTK(VisualizationToolkit)中,数据类型(DataTypes)主要用于表示不同类型的数据集(DataSets),这些数据集可以是几何和拓扑信息的组合,用于描述
三维
空间中的对象。
捕鲸叉
·
2025-01-21 15:20
VTK编程学习
VTK
Docker 实战教程之从入门到提高 (五)
在
多模态
模型的架构上,ChatGPT的绘图能力主要依赖以下几个核心组件:跨模态编码器(Cross-ModalEncoder):跨模态编码器的作用是将文本和图像的特征进行对齐。
·
2025-01-21 12:15
火山引擎数据飞轮2.0:聚焦Data+AI,驱动企业数智化转型
近期,火山引擎数智平台技术和产品专家受邀出席DataFun首届“数据与人工智能解决方案大会”,围绕数据飞轮2.0模式,及Data+AI领域热门话题ChatBI、
多模态
数据湖展开分享。
·
2025-01-21 11:43
大数据
3dsMax:虚拟现实与360度全景渲染技术教程_2024-07-15_18-03-08.Tex
3dsMax:虚拟现实与360度全景渲染技术教程3dsMax与虚拟现实的基础知识3dsMax软件概述3dsMax,由Autodesk公司开发,是一款广泛应用于
三维
建模、动画、渲染和视觉效果的软件。
chenjj4003
·
2025-01-21 10:36
游戏开发
3dsmax
vr
材质
贴图
中间件
android
AIGC视频生成国产之光:ByteDance的PixelDance模型
优质专栏回顾:机器学习笔记深度学习笔记
多模态
论文笔记AIGC—图像文章目录论文摘要引言输入训练和推理时的数据处理总结相关工作视频生成长视频生成方法模型架构
好评笔记
·
2025-01-21 08:48
AIGC-视频
补档
AIGC
计算机视觉
人工智能
深度学习
机器学习
论文阅读
面试
亮相AICon,火山引擎边缘云揭秘边缘AI Agent探索与实践
火山引擎边缘智能技术负责人谢皓受邀出席大会,以《AIAgent在边缘云的探索与实践》为主题,与全球AI领域的资深专家,共同深入探讨大模型落地、具身智能、
多模态
大模型、AIAgent等前沿技术如何推动行业变革
·
2025-01-21 07:39
边缘计算智能硬件ai开发
RT-DETR改进策略【Neck】| PRCV 2023,SBA(Selective Boundary Aggregation):特征融合模块,描绘物体轮廓重新校准物体位置,解决边界模糊问题
一、本文介绍本文主要利用DuAT中的SBA模块优化RT-DETR的
目标检测
网络模型。
Limiiiing
·
2025-01-21 04:46
RT-DETR改进专栏
人工智能
计算机视觉
深度学习
RT-DETR
AI 2025:技术飞跃与应用鸿沟——AI代码生成器引领未来?
大型语言模型(LLM)的能力显著提升,成本大幅下降,
多模态
应用成为主流。然而,令人担忧的是,技术进步与实际应用普及之间存在着巨大的鸿沟。“智能体”等概念被热炒,但实际应用却远未达到预期。
·
2025-01-21 03:33
前端
国自然青年项目|基于
多模态
影像组学的乳腺癌分子分型预测研究|基金申请·25-01-20
项目聚焦乳腺癌分子分型预测,综合运用
多模态
组学数据、影像组学技术和深度学习技术。研究内容包括跨模态医学图像分割、
多模态
特征提取与融合、模型设计与系统研发。
罗小罗同学
·
2025-01-21 01:34
基金申请
医学人工智能
人工智能
国自然
YOLOv8改进,YOLOv8检测头融合DiverseBranchBlock,并添加小
目标检测
层(四头检测),适合
目标检测
、分割等
摘要一种卷积神经网络(ConvNet)的通用构建模块,以在不增加推理时间成本的情况下提高性能。该模块被命名为多样分支块(DiverseBranchBlock,DBB),通过结合不同尺度和复杂度的多样分支来丰富特征空间,包括卷积序列、多尺度卷积和平均池化,从而增强单个卷积的表示能力。在训练后,DBB可以等效地转换为一个单独的卷积层以进行部署。与新型ConvNet架构的进步不同,DBB在保持宏观架构的
挂科边缘
·
2025-01-20 23:49
YOLOv8改进
YOLO
目标检测
人工智能
计算机视觉
深度学习
OpenBayes 一周速览|微软 Phi-4 发布,降低更多成本实现高效推理;Terra 时空数据集上线
公共资源速递5个数据集:Terra
多模态
时空数据集ChineseCouplets中文对联数据集AqueousSolubility无机化合物数据集HumanLikeDPODataset大模型对话微调数据集
·
2025-01-20 23:55
使用
多模态
大模型转换 office 文档
现在各家的
多模态
大模型都在不断降价,1块钱都能处理几百张图片,不少提供商还每日提供免费额度,所以使用
多模态
大模型转换office文档成为一个廉价而简单的解决方案。技术方案这里介绍的是使用
·
2025-01-20 23:53
人工智能图像识别
【YOLOv8改进】 YOLOv8 更换骨干网络之 GhostNet :通过低成本操作获得更多特征 (论文笔记+引入代码)
YOLO
目标检测
创新改进与实战案例专栏专栏目录:YOLO有效改进系列及项目实战目录包含卷积,主干注意力,检测头等创新机制以及各种
目标检测
分割项目实战案例专栏链接:YOLO基础解析+创新改进+实战案例介绍摘要在嵌入式设备上部署卷积神经网络
YOLO大师
·
2025-01-20 22:47
YOLO
论文阅读
OpenBayes 一周速览|微软 Phi-4 发布,降低更多成本实现高效推理;Terra 时空数据集上线
公共资源速递5个数据集:Terra
多模态
时空数据集ChineseCouplets中文对联数据集AqueousSolubility无机化合物数据集HumanLikeDPODataset大模型对话微调数据集
·
2025-01-20 22:08
直播预告丨精度优于AlphaFold,基于深度学习实现生物大分子及其互作的
三维
结构预测
1月15日19:00准时开播,HyperAI超神经有幸邀请到了南开大学统计与数据科学学院教授郑伟,他本次分享的主题是「AlphaFold3王座未稳,来自学术界的反超:基于深度学习的生物大分子及其互作的
三维
结构预测
·
2025-01-20 18:28
Web
三维
CAD绘制一个窗户模型
前言本文使用mxcad3d在网页中创建一个简单的
三维
窗户模型,mxcad3d提供了丰富的
三维
建模功能和便捷的API,使得创建各种
三维
模型变得简单方便,最终效果如下图:环境搭建和入门首先学习mxcad的基本使用方法
·
2025-01-20 17:18
多模态
视觉语言模型
文章目录1.
多模态
大模型概述1.1模型范式1.2训练范式2.BLIP3.BLIP24.LLaVa&LLaVA1.55.QwenVL5.1模型结构5.2训练过程6.参考1.
多模态
大模型概述1.1模型范式1
funNLPer
·
2025-01-20 16:48
计算机视觉
语言模型
人工智能
自然语言处理
多模态
YOLOv9改进,YOLOv9检测头融合,适合
目标检测
、分割任务
摘要空间注意力已广泛应用于提升卷积神经网络(CNN)的性能,但它存在一定的局限性。作者提出了一个新的视角,认为空间注意力机制本质上解决了卷积核参数共享的问题。然而,空间注意力生成的注意力图信息对于大尺寸卷积核来说是不足够的。因此,提出了一种新型的注意力机制——感受野注意力(RFA)。现有的空间注意力机制,如卷积块注意力模块(CBAM)和协调注意力(CA),仅关注空间特征,未能完全解决卷积核参数共享
挂科边缘
·
2025-01-20 15:37
YOLOv9改进
目标检测
人工智能
计算机视觉
YOLO
YOLOv8改进,YOLOv8检测头融合RFAConv卷积,并添加小
目标检测
层(四头检测),适合
目标检测
、分割等
摘要空间注意力已广泛应用于提升卷积神经网络(CNN)的性能,但它存在一定的局限性。作者提出了一个新的视角,认为空间注意力机制本质上解决了卷积核参数共享的问题。然而,空间注意力生成的注意力图信息对于大尺寸卷积核来说是不足够的。因此,提出了一种新型的注意力机制——感受野注意力(RFA)。现有的空间注意力机制,如卷积块注意力模块(CBAM)和协调注意力(CA),仅关注空间特征,未能完全解决卷积核参数共享
挂科边缘
·
2025-01-20 15:36
YOLOv8改进
YOLO
目标检测
人工智能
计算机视觉
深度学习
基于YOLOv5、YOLOv8和YOLOv10的自助售货机商品检测:深度学习实践与应用
近年来,基于深度学习的
目标检测
算法,特别是YOLO(YouOnlyLookOnce)系列模
2025年数学建模美赛
·
2025-01-20 14:26
YOLO
深度学习
人工智能
目标跟踪
目标检测
【论文投稿】探秘计算机视觉算法:开启智能视觉新时代
目录引言一、计算机视觉算法基石:图像基础与预处理二、特征提取:视觉信息的精华萃取三、
目标检测
:从图像中精准定位目标四、图像分类:识别图像所属类别五、语义分割:理解图像的像素级语义六、计算机视觉算法前沿趋势与挑战引言在当今数字化浪潮中
小周不想卷
·
2025-01-20 13:11
艾思科蓝学术会议投稿
计算机视觉
ORB-SLAM2:四、 地图点、关键帧、图结构】
4.1地图点4.1.1什么是地图点地图点(MapPoint)是SLAM系统中用来表示环境中
三维
特征点的抽象概念。这些点是通过相机观测和三角测量得到的,是地图构建的基础。
KeyPan
·
2025-01-20 13:07
ORB-SLAM2
计算机视觉
人工智能
机器学习
深度学习
算法
基于区块链技术的超级账本(Hyperledger) - 从理论到实战
在
多模态
模型的架构上,ChatGPT的绘图能力主要依赖以下几个核心组件:跨模态编码器(Cross-ModalEncoder):跨模态编码器的作用是将文本和图像的特征进行对齐。
·
2025-01-20 12:25
什么是
多模态
机器学习:跨感知融合的智能前沿
在人工智能的广阔天地里,
多模态
机器学习(MultimodalMachineLearning)作为一项前沿技术,正逐步解锁人机交互和信息理解的新境界。
非凡暖阳
·
2025-01-20 12:01
人工智能
神经网络
使用Llama 3.2-Vision
多模态
LLM与您的图像聊天
介绍将视觉能力与大型语言模型(LLMs)结合的
多模态
LLM(MLLM)正在通过
多模态
LLM革命性地改变计算机视觉领域。这些模型结合了文本和视觉输入,展示了在图像理解和推理方面的出色能力。
AI程序猿人
·
2025-01-20 12:01
llama
transformer
pytorch
深度学习
大模型应用
人工智能
大模型
3d系统误差分析
系统标定重投影误差预估在计算机视觉和
三维
重建领域中,评估一个相机系统标定精度的重要指标。通过比较真实的
三维
点在图像中的投影位置与标定模型计算出的投影位置之间的差异,来衡量标定的准确性。
Ai智享
·
2025-01-20 07:16
结构光
3d
数码相机
计算机视觉
基于Damo-YOLO和DyHead检测头的YOLOv8优化:多尺度
目标检测
的创新方案【YOLOv8】
专栏订阅地址:https://blog.csdn.net/mrdeam/category_12804295.html文章目录基于Damo-YOLO和DyHead检测头的YOLOv8优化:多尺度
目标检测
的创新方案
步入烟尘
·
2025-01-20 05:58
YOLO系列创新涨点超专栏
YOLO
目标检测
人工智能
YOLOv8
YOLOv8与Transformer:探索
目标检测
的新架构
YOLOv8与Transformer:探索
目标检测
的新架构关键词:
目标检测
,深度学习,YOLOv8,Transformer,计算机视觉,卷积神经网络摘要:
目标检测
是计算机视觉领域的一项重要任务,其目标是从图像或视频中识别和定位特定对象
AI架构设计之禅
·
2025-01-20 05:23
AI大模型应用入门实战与进阶
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
实战千问2大模型第五天——VLLM 运行 Qwen2-VL-7B(
多模态
)
一、简介VLLM是一种高效的深度学习推理库,通过PagedAttention算法有效管理大语言模型的注意力内存,其特点包括24倍的吞吐提升和3.5倍的TGI性能,无需修改模型结构,专门设计用于加速大规模语言模型(LLM)的推理过程。它通过优化显存管理、支持大模型的批处理推理以及减少不必要的内存占用,来提高多GPU环境下的推理速度和效率。VLLM的核心特点包括:显存高效性:VLLM能够动态管理显存,
学术菜鸟小晨
·
2025-01-20 02:50
千问
多模型
qwen2
vl
计算机视觉与深度学习:使用深度学习训练基于视觉的车辆检测器(MATLAB源码-Faster R-CNN)
其中,
目标检测
是计算机视觉中的一项关键技术,它旨在识别并定位图像中的多个目标对象。车辆检测作为
目标检测
的一个重要应用,在自动驾驶、智能交通系统等领域有着广泛的应用前景。
ZhShy23
·
2025-01-20 00:04
javascript
深度学习
YOLOv10改进,YOLOv10检测头融合RepConv卷积,添加小
目标检测
层(四头检测)+CA注意机制,全网首发
摘要作者提出了一种简单而强大的卷积神经网络架构,其推理阶段采用与VGG类似的网络体结构,仅由一堆3x3卷积和ReLU组成,而训练阶段的模型具有多分支拓扑。这种训练阶段和推理阶段架构的解耦通过结构重参数化技术实现,因此我们将该模型命名为RepVGG。#理论介绍RepConv通过将多个卷积操作合并成一个卷积操作来优化计算的。首先在训练过程中使用多种操作(如多个卷积层、跳跃连接等)来提高模型的表达能力和
挂科边缘
·
2025-01-19 22:42
YOLOv10改进
YOLO
目标检测
人工智能
计算机视觉
YOLOv11改进,YOLOv11检测头融合RepConv卷积,并添加小
目标检测
层(四头检测),适合
目标检测
、分割等任务
摘要作者提出了一种简单而强大的卷积神经网络架构,其推理阶段采用与VGG类似的网络体结构,仅由一堆3x3卷积和ReLU组成,而训练阶段的模型具有多分支拓扑。这种训练阶段和推理阶段架构的解耦通过结构重参数化技术实现,因此我们将该模型命名为RepVGG。#理论介绍RepConv通过将多个卷积操作合并成一个卷积操作来优化计算的。首先在训练过程中使用多种操作(如多个卷积层、跳跃连接等)来提高模型的表达能力和
挂科边缘
·
2025-01-19 21:01
YOLOv8改进
YOLO
目标检测
人工智能
计算机视觉
工业场景将成为AI大模型的重要战场!零基础入门AI大模型,看这篇就够了!
前言2024年,各大公司推出强大理解能力的
多模态
大模型,将引领人工智能(AI)技术创新和应用,工业场景将成为
多模态
大模型的最佳实践场地。
大模型扬叔
·
2025-01-19 20:29
人工智能
工业多模态大模型
2025年01月19日Github流行趋势
15826今日star数:959项目维护者:yiranyyu,iceflame89,yaoyuanTHU,LDLINGLINGLING,tc-mb项目简介:MiniCPM-o2.6:一个适用于视觉、语音和
多模态
直播的
油泼辣子多加
·
2025-01-19 18:38
GitHub每日趋势
github
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他