文本检测及识别小组周报

1 Huang L的工作

https://blog.csdn.net/qq_44950283/article/details/127739829

OCR小组会议纪要 2022/11/12

任意形状文本检测
1、特征提取:输入图片通过共享卷积得到共享特征Fs
2、边界建议模型使用Fs,得到先验特征Fp(包括分类图、距离场图、方向场图)
3、通过Fp得到粗边界
4、在粗边界上选取N个控制点,提取它们的特征构成特征矩阵NxC,
5、特征矩阵X输入到边界变形模型进行特征学习和边界迭代

需解决的问题
1、p点怎么找到?参照物是哪一个,分类图怎么用
2、猜想p点是在文本框中线上的点
3、方向场和距离场是怎么来的?具体指什么
4、有了p点怎么找到边界点Bp?Bp怎么得到?
5、是否是监督学习?

后期工作:
1、p、Bp的确定是论文创新还是用的已有的技术直接得到
2、去看引用了本文的论文,看动机和理念,这篇论文还有哪些缺点不足,本文和引文的
区别,回过头反思自己没有想通的点,然后去找创新点。
3、看代码不要抓全部,要理清楚函数之间的逻辑关系,看函数名理解函数具体是看什么的
4、不能总去关注细节,论文的理念和动机很重要。

猜想:
1、粗边界的确定是通过已有的算法找到还是创新
2、将边界的中轴线当成p点,然后去找方向和距离场,最后去膨胀和变形

你可能感兴趣的:(周报,人工智能,深度学习)