Talk | 上海交通大学官同坤:识别任意文本,隐式注意力与字符间蒸馏在文本识别中的应用

Talk | 上海交通大学官同坤:识别任意文本,隐式注意力与字符间蒸馏在文本识别中的应用_第1张图片

本期为TechBeat人工智能社区525线上Talk!

北京时间8月23(周三)20:00上海交通大学博士生—官同坤的Talk已准时在TechBeat人工智能社区开播!

他与大家分享的主题是: 隐式注意力与字符间蒸馏在文本识别中的应用,分享了识别任意文本的技术方案,并探究了基于自监督的字形注意力与字符间蒸馏的文本识别技术。

Talk·信息

主题:隐式注意力与字符间蒸馏在文本识别中的应用

嘉宾:上海交通大学博士生—官同坤

时间:北京时间 8月24日(周四)20:00

地点:TechBeat人工智能社区

TechBeat

点击下方链接,即可观看视频!

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。https://www.techbeat.net/talk-info?id=803

Talk·介绍

文字作为社会交流的媒介,广泛地存在于我们的日常生活场景中。OCR作为计算机视觉中的一项基础任务之一,在这些场景中都有广泛应用,如识别文档、latex公式、工件序列号、文本logo等,同时也对跨模态、大模型等众多任务起到重要支撑作用。近年来,随着用户需求的不断提升,面对大量训练数据的标注压力,借助蒸馏、半监督学习等技术手段,探索训练方式的突破,已成为研究者们探讨的重要方向。

Talk大纲

  1. 探讨识别任意文本的技术方案 

  2. 探讨基于自监督的字形注意力的文字识别技术

  3. 探讨基于自监督字符间蒸馏的文本识别技术

Talk·预习资料

Talk | 上海交通大学官同坤:识别任意文本,隐式注意力与字符间蒸馏在文本识别中的应用_第2张图片

论文链接:

https://arxiv.org/pdf/2203.03382.pdf

Talk | 上海交通大学官同坤:识别任意文本,隐式注意力与字符间蒸馏在文本识别中的应用_第3张图片

论文链接:

https://arxiv.org/pdf/2211.00288.pdf

https://zhuanlan.zhihu.com/p/644350078

https://www.techbeat.net/article-info?id=5152

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

Talk | 上海交通大学官同坤:识别任意文本,隐式注意力与字符间蒸馏在文本识别中的应用_第4张图片

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦! 

Talk·嘉宾介绍

Talk | 上海交通大学官同坤:识别任意文本,隐式注意力与字符间蒸馏在文本识别中的应用_第5张图片

官同坤

上海交通大学博士生

官同坤,上海交通大学人工智能研究院一年级博士生,主要从事于文本检测和文本识别的研究,目前以第一作者分别在TCSVT,CVPR,ICCV发表一篇文章。

个人主页: 

https://www.techbeat.net/grzytrkj?id=33466


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

你可能感兴趣的:(每周Talk上架,计算机视觉,文本识别,ocr)