E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
多模态增强学习
51-11
多模态
论文串讲—VLMo 论文精读
VLMo:UnifiedVision-LanguagePre-TrainingwithMixture-of-Modality-Experts(NeurIPS2022)VLMo是一种
多模态
Transformer
深圳季连AIgraphX
·
2024-02-07 13:59
AutoGPT
自动驾驶大模型
自动驾驶
transformer
gpt-3
智慧城市
迁移学习
算法
51-10
多模态
论文串讲—ALBEF 论文精读
今天我们就来过一下
多模态
的串讲,其实之前,我们也讲了很多工作了,比如说CLIP,还有ViLT,以及CLIP的那么多后续工作。
深圳季连AIgraphX
·
2024-02-07 13:29
AutoGPT
自动驾驶大模型
自动驾驶
智慧城市
transformer
gpt-3
迁移学习
MoE-LLaVA:具有高效缩放和
多模态
专业知识的大型视觉语言模型
大型视觉语言模型(LVLMs)在图像识别、视觉问题回答和
多模态
交互方面提供了无与伦比的能力。MoE-LLaVA利用了“专家混合”策略融合视觉和语言数据,实现对多媒体内容的复杂理解和交互。
deephub
·
2024-02-07 11:01
语言模型
人工智能
深度学习
混合专家模型
眸思MouSi:“听见世界” — 用
多模态
大模型点亮盲人生活
文章目录1.Introduction1.1APP细节展示2.Demo2.1论文链接2.2联系方式3.Experiment3.1多专家的结合是否有效?3.2如何更好的将多专家整合在一起?Reference让盲人听见世界,复旦眸思大模型打破视觉界限,用科技点亮新生活1.Introduction在这个世界上,视力是探索万物之美、与有灵万物互动的重要感官。而在中国,约有1700多万视力障碍者,相当于每10
猛码Memmat
·
2024-02-06 23:33
prompt
生活
人工智能
多模态
人文
CodeFuse-VLM 开源,支持
多模态
多任务预训练/微调
CodeFuse-MFT-VLM项目地址:https://github.com/codefuse-ai/CodeFuse-MFT-VLMCodeFuse-VLM-14B模型地址:CodeFuse-VLM-14BCodeFuse-VLM框架简介随着huggingface开源社区的不断更新,会有更多的visionencoder和LLM底座发布,这些visionencoder和LLM底座都有各自的强项,
CodeFuse
·
2024-02-06 22:37
AIGC
人工智能
语言模型
开源
ai编程
【
多模态
MLLMs+图像编辑】MGIE:苹果开源基于指令和大语言模型的图片编辑神器(24.02.03开源)
项目主页:https://mllm-ie.github.io/论文:基于指令和
多模态
大语言模型图片编辑2309.GuidingInstruction-basedImageEditingviaMultimodalLargeLanguageModels
曾小蛙
·
2024-02-06 20:52
AIGC
生成式人工智能
多模态MLLM
语言模型
人工智能
MGIE
LLaVA
大模型 AI Agent 详细介绍
这些AI代理利用了大规模的语言模型(如GPT-3、BERT、T5等)或其他类型的模型(如图像识别模型、
多模态
模型等)来模拟人类行为和决策过程。
人生万事须自为,跬步江山即寥廓。
·
2024-02-06 13:19
机器学习人工智能
人工智能
机器学习
chatgpt
gpt-3
多模态
对比语言图像预训练CLIP:打破语言与视觉的界限,具备零样本能力
多模态
对比语言图像预训练CLIP:打破语言与视觉的界限,具备零样本能力。一种基于
多模态
(图像、文本)对比训练的神经网络。
代码讲故事
·
2024-02-06 10:30
机器人智慧之心
人工智能
计算机视觉
深度学习
CLIP
多模态
NLP
对比训练
音乐数据集+大模型相关(一)
MusicCapsYouTube8M-MusicTextClipsMusicNetFMAMTG-JamendoMagnaTagATune音乐模型介绍简介MUSICGEN:mate新推出的音乐生成模型2023MusicLM:用文本生成高保真音频音乐llark音乐
多模态
大模型参考音乐数据集介绍下图来自
万年枝
·
2024-02-06 06:29
论文合集
人工智能
CVPR2023|Learning Instance-Level Representation for Large-Scale Multi-Modal Pretraining in Ecommerce
Multi-ModalPretrainingObjectives4.TransfertoDowntasks转换到下游任务实验预训练数据集实验细节在下游任务上的Evaluationconclusion摘要本文旨在建立一个通用的
多模态
基础模型
万年枝
·
2024-02-06 06:59
论文合集
人工智能
文心一言4.0API接入指南
概述文心一言是百度打造出来的人工智能大语言模型,具备跨模态、跨语言的深度语义理解与生成能力,文心一言有五大能力,文学创作、商业文案创作、数理逻辑推算、中文理解、
多模态
生成,其在搜索问答、内容创作生成、智能办公等众多领域都有更广阔的想象空间
小小晓晓阳
·
2024-02-05 20:37
LLM
文心一言
人工智能
gpt
每周AI新闻(2024年第5周)ChatGPT等多应用登陆 Vision Pro | 字节Coze国内版上线等
FireflyAI登陆VisionProOpenAI发布了新的ChatGPTApp,允许AppleVisionPro用户与GPT-4Turbo模型进行自然语言交互,利用VisionOS操作系统的先进功能,支持
多模态
陌北有棵树
·
2024-02-05 20:30
AI
人工智能
chatgpt
AI
OpenAI
Coze
CVPR 2023: Leapfrog Diffusion Model for Stochastic Trajectory Prediction
我们使用以下6个分类标准对本文的研究选题进行分析:1.扩散模型类型:标准扩散模型蛙跳扩散模型(LED)其他扩散模型变体2.预测类型:确定性vs.随机性个体vs.群体3.数据模态:单变量(仅位置数据)
多模态
结构化文摘
·
2024-02-05 15:47
人工智能
机器学习
安全
性能
6个国内可用的chat大模型
同时,它的
多模态
能力可以生成各种图片和图表等视觉内容,丰富了用户的内容表达方式。情感陪伴:该应用
go2coding
·
2024-02-05 15:44
AI智能工具
人工智能
Google聊天机器人Bard计划更名为Gemini并推出新功能;12 个 RAG 痛点和建议
GeminiAdvanced还将引入新功能和独家特性,如增强的
多模态
go2coding
·
2024-02-05 15:42
AI日报
机器人
bard
眼动和脑电
多模态
数据融合分析
眼动和脑电
多模态
数据融合分析本文参考网址:http://www2.hu-berlin.de/eyetracking-eeg/tutorial.html本文首发在个人博客(7988888.xyz)今天为大家介绍
多模态
数据分析
陈锐CR
·
2024-02-05 07:00
大模型日报-20240202
文章目录企业如何使用开源LLM:16个案例
多模态
LLM多到看不过来?先看这26个SOTA模型吧伯克利开源高质量大型机器人操控基准,面对复杂自主操控任务不再犯难市值登顶全球!
程序无涯海
·
2024-02-05 03:33
大模型资讯篇
AI
AIGC
大模型
日报
chatgpt
ai日报
大模型日报-20240204
还学会了跨应用操作代谢数据集上四项指标达94%~98%,西南交大团队开发多尺度图神经网络框架,助力药物研发A16Z最新AI洞察|2023年是AI视频元年,2024年还有这些难题需要解决比肩GPT-4,商汤日日新大幅升级4.0,
多模态
能力领先一步年龄两岁
程序无涯海
·
2024-02-05 03:30
大模型资讯篇
AI
AIGC
chatgpt
GPT
大模型
人工智能
Q-Bench:一种用于低级别视觉通用基础模型的基准测试
1.引言
多模态
大语言模型(Multi-modalityLargeLanguageModels,后续简称
多模态
大模型)能够提供强大的通用级别视觉感知/理解能力,甚至可以通过自然语言与人类进行无缝对话和互动
AI算法-图哥
·
2024-02-05 01:56
--
图像质量评价
人工智能
图像质量评估
计算机视觉
图像处理
深度学习
深度学习实验-3d医学图像分割
本实验数据集为
多模态
腹部分割数据集(AMOS),一个大规模,多样性的,收集自真实临床场景下的腹部多器官分割基准数据。本实验在百度飞桨平台上采用nnU-N
桶的奇妙冒险
·
2024-02-04 17:30
深度学习
3d
人工智能
今日arXiv最热NLP大模型论文:像人一样浏览网页执行任务,腾讯AI lab发布
多模态
端到端Agent
Agent的发展成为了LLM发展的一个热点。只需通过简单指令,Agent帮你完成从输入内容、浏览网页、选择事项、点击、返回等一系列需要执行多步,才能完成的与网页交互的复杂任务。比如给定任务:“搜索Apple商店,了解iPad智能保护壳SmartFolio的配件,并查看最近的自提点位置(邮政编码90038)。”下图演示Agent如何按照在线方式逐步与Apple网站进行交互,完成任务。在最后的屏幕截图
夕小瑶
·
2024-02-04 16:35
人工智能
自然语言处理
今日arXiv最热NLP大模型论文:像人一样浏览网页执行任务,腾讯AI lab发布
多模态
端到端Agent
Agent的发展成为了LLM发展的一个热点。只需通过简单指令,Agent帮你完成从输入内容、浏览网页、选择事项、点击、返回等一系列需要执行多步,才能完成的与网页交互的复杂任务。比如给定任务:“搜索Apple商店,了解iPad智能保护壳SmartFolio的配件,并查看最近的自提点位置(邮政编码90038)。”下图演示Agent如何按照在线方式逐步与Apple网站进行交互,完成任务。在最后的屏幕截
夕小瑶
·
2024-02-04 16:04
人工智能
自然语言处理
“微考”在数学课中的应用。
增强学习
数学的兴趣。针对平时单元测的间隔时间长,而且试卷不能及时反馈这些不足。我在数学学科中采用了“微考”。具体操作过程是去一定数目的题,可以是计算题,可以是应用题。还可以是平常的易错题。
韩静_340c
·
2024-02-04 14:17
INDEMIND双目惯性模组运行实时ORB-SLAM3教程
现在实验室视觉SLAM已经不够满足,所以需要
多模态
融合,正巧购入高翔博士推荐的INDEMIND双目惯性模组,根据官方例程在中使用ROS接入ORB-SLAM3,这回有SDK及ORB-SLAM3安装过程中的各种常见性问题解决方法及安装细节
极客范儿
·
2024-02-04 10:01
ORB-SLAM
━═━═━◥
MR
◤━═━═━
ORB-SLAM3
INDEMIND
ROS
ubuntu
20.04
imu
第六届
多模态
脑网络数据处理班(直播:2023.6.15~6.25)
茗创科技专注于脑科学数据处理,涵盖(EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS)等,欢迎留言讨论及转发推荐,也欢迎了解茗创科技的脑电课程,数据处理服务及脑科学工作站销售业务,可添加我们的工程师(微信号MCKJ-zhouyi或17373158786)咨询。★课程简介★脑网络(cerebralnetwork)定义为:大脑空间位置不同的皮质区域通过结构或功能联系整合起来形成的网络模式。
茗创科技
·
2024-02-04 08:00
AI新工具(20240202) OmniLMM-面向图文理解的开源
多模态
大模型;MusicFX是谷歌推出创造音乐的平台
OmniLMM-面向图文理解的开源
多模态
大模型OmniLMM是一系列面向图文理解的开源
多模态
大模型,接受图像和文本输入,并提供高质量的文本输出。
go2coding
·
2024-02-04 07:19
AI智能工具
人工智能
【2023地理设计组一等奖】
多模态
地理空间数据支持下的城市洪涝灾害韧性评价
作品介绍1作品背景近几年,城市化进程的加快和全球气候变暖导致气候系统不稳定,极端天气事件的发生频率逐渐上升[1]。据统计,洪涝灾害是最常见、最广泛和最具破坏性的自然灾害之一[2]。2021年7月,河南地区发生历史罕见特大暴雨,造成严重的洪涝灾害,而在2023年7月,强降雨导致河北地区遭受洪涝灾害。在洪涝灾害日益严峻的情况下,对洪涝灾害的研究是提升城市韧性的基础[3,4]。城市洪涝灾害韧性是指城市系
sky J
·
2024-02-03 21:27
案例分享
人工智能
媒体AI解决方案
贴合媒体业务流程提供智能生产、
多模态
内容结构化、智能编解码、审核等丰富智能应用,贴合行业“采编存管播发”场景。
公有云服务商
·
2024-02-03 17:52
人工智能
媒体
腾讯云
阿里云
aws
京东云
最新AI系统ChatGPT网站H5系统源码,支持Midjourney绘画局部编辑重绘,GPT语音对话+ChatFile文档对话总结+DALL-E3文生图
已支持GPT语音对话、GPT-4-Turbo模型、DALL-E3文生图、GPT-4-1106-Preview
多模态
模型。支持GPT-4图
白云如幻
·
2024-02-03 12:28
人工智能
软件源码
ChatGPT
人工智能
chatgpt
语音识别
midjourney
AI作画
周红伟:人类进入大模型时代,All in AI,未来大模型 10 大趋势
7、2024年
多模态
会成为大模型标准。8、2024AIGC将会替代70%的主播。9、大模型人形机器人将成为主流。10、大模型重新发明电力。
AI周红伟
·
2024-02-03 09:48
AIGC
chatgpt
人工智能
周红伟:人类进入大模型时代,All in AI,未来大模型 10 大趋势
7、2024年
多模态
会成为大模型标准。8、2024AIGC将会替代70%的主播。9、大模型人形机器人将成为主流。10、大模型重新发明电力。
AI周红伟
·
2024-02-03 09:48
AIGC
chatgpt
大模型
联合语言和视觉的力量,复旦团队发布全新多专家融合视觉-语言大模型
基于新架构的眸思将擅长图文匹配、光学字符识别(OCR)和图像分割等多种经典视觉任务的专家巧妙地融为一体,显著地提高了
多模态
大模型在
多模态
对话中传统视觉任务上的表现效果。
PaperWeekly
·
2024-02-03 09:46
人工智能
大模型应用开发-实用开源项目汇总
大模型相关目录大模型,包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、
多模态
等大模型应用开发内容从0起步,扬帆起航。
写代码的中青年
·
2024-02-03 09:32
大模型
人工智能
chatgpt
文心一言
2023-04-10
单细胞和空间多组学的方法和应用原创夏天图灵基因2023-04-1011:52发表于江苏收录于合集#前沿生物大数据分析撰文:夏天IF=59.581推荐度:⭐⭐⭐⭐⭐亮点:1、文章主要介绍了单细胞和空间多组学技术(也称为
多模态
组学方法
图灵基因
·
2024-02-03 02:37
开放式人工智能:聚焦OpenAI的发展历程
的里程碑事件研究成果及突破组织结构与模式的转变与微软的合作OpenAI的主要产品与技术GPT系列GPT-1GPT-2GPT-3GPT-3.5GPT-4GPT-4的创新及其对人工智能应用的潜在影响更高效的自然语言处理
多模态
学习平台智能数据分析个性化医疗和
kadog
·
2024-02-02 21:11
By
GPT
人工智能
科技
深度学习
其他
认真学习宣传贯彻党的二十大精神的重大意义
充分认清学习宣传贯彻党的二十大精神的重要意义,切实
增强学习
宣传贯彻的政治自觉和行动自觉,切实把思想和行动统一到党的二十大精神上来,统一到县委、县政府关于学习宣传贯彻党的二十大精神决策部署上来。
5fa36d997408
·
2024-02-02 16:05
图像复原的天花板在哪里?SUPIR:开创性结合文本引导先验和模型规模扩大
通过利用
多模态
技术和先进的生成先验,SUPIR在智能和逼真的图像复原方面取得了重大进展。作为SUPIR中的关键催化剂,模型的扩大规模显著增强了其能力,并展示了图像复原的新潜力。
AI生成未来
·
2024-02-02 09:03
AIGC
人工智能
深度学习
计算机视觉
图像复原
第七届
多模态
脑网络数据处理班(训练营:2023.10.5~10.21)
茗创科技专注于脑科学数据处理,涵盖(EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS)等,欢迎留言讨论及转发推荐,也欢迎了解茗创科技的脑电课程,数据处理服务及脑科学工作站销售业务,可添加我们的工程师(微信号MCKJ-zhouyi或17373158786)咨询。★课程简介★脑网络(cerebralnetwork)定义为:大脑空间位置不同的皮质区域通过结构或功能联系整合起来形成的网络模式。
茗创科技
·
2024-02-02 08:52
多模态
融合新方向!21篇2024年最新顶会论文汇总!(附PDF)
在人工智能领域,
多模态
融合正迅速成为研究的热点,它涉及到将不同类型的数据,如文本、图像、音频等,整合到一个统一的模型中,以实现更丰富和深入的理解。
AI热心分享家
·
2024-02-02 02:38
人工智能
机器学习
深度学习
腾讯发表
多模态
大模型最新综述,从26个主流大模型看
多模态
效果提升关键方法
在大规模语言模型(LLMs)通往通用人工智能(AGI)的道路中,从传统的单一的“语言模态”扩展到“图像”、“语音”等等的“
多模态
”必然是大模型进化的必经之路。
夕小瑶
·
2024-02-01 22:28
人工智能
初识大模型
1大模型定义:“大模型”全称为大型语言模型(LLM),,狭义上指基于深度学习算法进行训练的自然语言处理(NLP)模型,主要应用于自然语言理解和生成等领域,广义上还包括机器视觉(CV)大模型、
多模态
大模型等
一刀道人
·
2024-02-01 18:14
大模型
大模型
ECCV 2022 | 基于数据转移的细粒度场景图生成
©作者|张傲单位|新加坡国立大学研究方向|
多模态
学习宣传一下我们在ECCV2022Oral(2accept,1weakaccept)的论文“Fine-GrainedSceneGraphGenerationwithDataTransfer
PaperWeekly
·
2024-02-01 15:12
机器学习
人工智能
深度学习
计算机视觉
神经网络
微软开源
多模态
模型LLaVA-1.5
随着OpenAI发布GPT-4V后,
多模态
功能逐渐成为主流,并涌现出了MiniGPT-4、LLaVA等卓越
多模态
开源模型。
RPA中国
·
2024-02-01 10:27
人工智能
OpenVoice文本转语音大模型原理
IVC使用户能够灵活定制生成的声音,在各种真实世界应用中展现了巨大的价值,如媒体内容创作、定制聊天机器人以及人与计算机或大型语言模型之间的
多模态
交互。原理IVC
MaxCode-1
·
2024-02-01 07:52
搭建本地gpt
chatgpt
openvoice
语音识别
阿里巴巴
多模态
模型Qwen-VL刚迎来升级更新,就被网友逮去装进了ComfyUI里面
Qwen-VL-Plus显著提升了细节和文本识别能力,支持超高像素分辨率图像,性能卓越。而Qwen-VL-Max更进一步,拥有高级视觉感知和认知理解,在复杂任务中表现最优。厉害的是,这两款技术还能识别Gif图。这在业界尚属首例,突显其实用性。其实就是通义千问,Qwen-VL是一种大规模视觉语言模型,由阿里云于2024年1月26日推出。该模型的升级版Qwen-VL-Max拥有更强的视觉推理能力和中文
喜好儿网
·
2024-02-01 05:24
交互
人工智能
搜索引擎
aigc
小红书
多模态
团队建立新「扩散模型」:解码脑电波,高清还原人眼所见
近些年,研究人员们对探索大脑如何解读视觉信息,并试图还原出原始图像一直孜孜不倦。去年一篇被CVPR录用的论文,通过扩散模型重建视觉影像,给出了非常炸裂的效果——AI不光通过脑电波知道你看到了什么,并且帮你画了出来。第一行:人眼所见画面,第二行:AI重现的画面简而言之,AI利用fMRI信号(全称为功能性核磁共振成像)+DiffusionModel,就能一定程度上实现「读脑术」
小红书技术REDtech
·
2024-02-01 02:11
人工智能
计算机视觉
深度学习
AAAI
CV
脑机接口
扩散模型
【机器学习高级实践】历时一年终于把因果推断与机器学习讲明白了
而最新更新的GPT-4更是实现了大型
多模态
模型的飞跃式提升,它能够同时接受图像和文本的输入,并输出正确的文本回复。在本文中,将大家比较关注的机器学习领域新兴分支,因果推断进行简要的介绍。
陈橘又青
·
2024-02-01 02:05
人工智能
机器学习
人工智能
因果推断
自然语言处理
StoryGPT-V——可以生成漫画故事的
多模态
大模型
前言目前,大型模型在复杂故事可视化任务方面依然面临着重大挑战。这是因为此类任务需要对框架描述中的代词(例如He、她、他们、他们)进行解析,即在分辨率和确保跨帧的角色和背景融合方面进行详细解剖。尽管存在这些挑战,新兴的大语言模型(LLM)表现出强大的推理能力,能够通过模糊的参考和广泛的序列导航。为了应对这些挑战,引入了一种被称为Storygpt-V的模型,它充分利用了隐扩散模型(LDM)和LLM的优
知来者逆
·
2024-02-01 01:27
智能算法
人工智能
计算机视觉
深度学习
多模态
生成漫画
AI人工智能可以怎么应用?——GPT4v图文识别问答功能
大家可以通过收藏网页www.woka.chat直接进行访问,也可通过关注公众号实现微信端使用~GPT-4Turbo的识图问答功能是GPT4
多模态
能力中的其中一种,表现为可接受图片作为输入方式并围绕图片进行多轮问答
俊524
·
2024-02-01 01:02
人工智能
chatgpt
ai
人工智能作画
gpt
midjourney
ai绘画
多模态
语义检索 | 基于 MetaSpore 快速部署 HuggingFace 预训练模型
首先,附上Github链接MetaSpore:https://github.com/meta-soul/MetaSpore,可搜索公众号元灵数智,在底部菜单了解我们-用户交流获取官方技术交流群二维码,进群与业内大佬进行技术交流。随着深度学习技术在计算机视觉、自然语言处理、语音理解等领域不断取得创新性突破,越来越多的非结构化数据被机器进行感知、理解和加工。这些进展主要得益于深度学习的强大表征学习能力
momo_cb59
·
2024-01-31 22:11
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他