本期为TechBeat人工智能社区第519期线上Talk!
北京时间8月3日(周四)20:00,华南理工大学—林炜丰的Talk已准时在TechBeat人工智能社区开播!
他与大家分享的主题是: “视觉基础模型-尺度卷积调制遇上Transformer”,他介绍了一种新的基础模型SMT(Scale-Aware Modulation Transformer),它以更低的参数量(params)和计算量(flops)取得了大幅性能的提升。
主题:视觉基础模型-尺度卷积调制遇上Transformer
嘉宾:华南理工大学 林炜丰
时间:北京时间 8月3日(周四)20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/
点击下方链接,一键预约TALK!
TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。https://www.techbeat.net/talk-info?id=797
近年来,基于Transformer和CNN的视觉基础模型取得巨大成功。有许多研究进一步地将Transformer结构与CNN架构结合,设计出了更为高效的hybrid CNN-Transformer Network,但它们的精度仍然不尽如意。本文介绍了一种新的基础模型SMT(Scale-Aware Modulation Transformer),它以更低的参数量(params)和计算量(flops)取得了大幅性能的提升。
1. 研究背景
2. 研究动机和出发点
3. 模型架构
4. 实验结果
5. 总结与展望
论文链接:
https://arxiv.org/abs/2307.08579
https://github.com/AFeng-x/SMT
https://zhuanlan.zhihu.com/p/642582425
在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
林炜丰
华南理工大学
林炜丰,华南理工大学在读研究生,目前也在阿里云智能进行科研实习。主要研究方向包括计算机视觉,图文多模态,生成模型等。
个人主页:
https://www.techbeat.net/grzytrkj?id=3148
关于TechBeat人工智能社区
▼
TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区