Datawhale 零基础入门CV赛事-Task3 字符识别模型

使用CNN去搭建一个简单的字符识别模型,最简单的就是几个卷积层加一个全连接层进行分类,分类的话貌似多一些用ResNet,因为这个题目已经分割好了,所以不需要进行分割,如果需要分割的话,用U-Net好像多一些,最近查资料Mask R-CNN好像也很火的样子,检测就上YOLO。如果没有提前给出框的话,就需要提前检测出来在进行识别了,或者先分割再识别也可以?

你可能感兴趣的:(Datawhale 零基础入门CV赛事-Task3 字符识别模型)