本期为TechBeat人工智能社区第525期线上Talk!
北京时间8月23日(周三)20:00,上海交通大学博士生—官同坤的Talk已准时在TechBeat人工智能社区开播!
他与大家分享的主题是: “隐式注意力与字符间蒸馏在文本识别中的应用”,分享了识别任意文本的技术方案,并探究了基于自监督的字形注意力与字符间蒸馏的文本识别技术。
主题:隐式注意力与字符间蒸馏在文本识别中的应用
嘉宾:上海交通大学博士生—官同坤
时间:北京时间 8月24日(周四)20:00
地点:TechBeat人工智能社区
TechBeat
点击下方链接,即可观看视频!
TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。https://www.techbeat.net/talk-info?id=803
文字作为社会交流的媒介,广泛地存在于我们的日常生活场景中。OCR作为计算机视觉中的一项基础任务之一,在这些场景中都有广泛应用,如识别文档、latex公式、工件序列号、文本logo等,同时也对跨模态、大模型等众多任务起到重要支撑作用。近年来,随着用户需求的不断提升,面对大量训练数据的标注压力,借助蒸馏、半监督学习等技术手段,探索训练方式的突破,已成为研究者们探讨的重要方向。
探讨识别任意文本的技术方案
探讨基于自监督的字形注意力的文字识别技术
探讨基于自监督字符间蒸馏的文本识别技术
论文链接:
https://arxiv.org/pdf/2203.03382.pdf
论文链接:
https://arxiv.org/pdf/2211.00288.pdf
https://zhuanlan.zhihu.com/p/644350078
https://www.techbeat.net/article-info?id=5152
在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
官同坤
上海交通大学博士生
官同坤,上海交通大学人工智能研究院一年级博士生,主要从事于文本检测和文本识别的研究,目前以第一作者分别在TCSVT,CVPR,ICCV发表一篇文章。
个人主页:
https://www.techbeat.net/grzytrkj?id=33466
▼
TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区