【OCR软件进化史】文字、表格、公式图片识别并与ChatGPT交互

第1年

由于日常工作需要大量的文本处理,身为一个全栈pythoner是绝不允许手动复制粘贴。

于是,在2021年,封装了第1版的文字、表格、公式图片识别工具(第1版):

【OCR软件进化史】文字、表格、公式图片识别并与ChatGPT交互_第1张图片

第1版做的比较粗糙,就是封装了百度的OCR接口,用户需要自己申请相关的KEY。

第2年

2022年,后面学而思的接口更新,也就百度的还算稳定。顺便提一下,文字、表格的识别准确度,百度是远超国内其他互联网公司。这一点我在2019年经过半年的时间求证、验证。

【OCR软件进化史】文字、表格、公式图片识别并与ChatGPT交互_第2张图片

第2版取消了百度OCR的接口,对用户来说,多一步设置,路径就增加一步。

同时,可以看到这个时期的版本已经集成了umi-OCR、QQ截图离线版、CAD转dxf。

第3年

2023年5月左右,笔者已经用上CHatGPT,觉得这是个机会,这个时候还没有GPTS。于是,将上述Win桌面平台exe应用转到网页端(第3版):

【OCR软件进化史】文字、表格、公式图片识别并与ChatGPT交互_第3张图片

【OCR软件进化史】文字、表格、公式图片识别并与ChatGPT交互_第4张图片

“随机码”从公众号获取,改为通过GPT页面端自动提取。

【OCR软件进化史】文字、表格、公式图片识别并与ChatGPT交互_第5张图片

以上,就是这个软件的进化史,截止2024-2-1,国内仍没有类似功能的GPTS。

你可能感兴趣的:(07_其他总结,ocr)