OCR:光学字符识别技术

OCR:光学字符识别技术

　　所谓OCR （Optical Character Recognition光学字符识别）技术，是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。

　　由于OCR是一门与识别率拔河的技术，因此如何除错或利用辅助信息提高识别正确率，是OCR最重要的课题，ICR（Intelligent Character Recognition）的名词也因此而产生。而根据文字资料存在的媒体介质不同，及取得这些资料的方式不同，就衍生出各式各样、各种不同的应用。

OCR的发展

　　要谈OCR的发展，早在60、70年代，世界各国就开始有OCR的研究，而研究的初期，多以文字的识别方法研究为主，且识别的文字仅为0至9的数字。以同样拥有方块文字的日本为例，1960年左右开始研究OCR的基本识别理论，初期以数字为对象，直至1965至1970年之间开始有一些简单的产品，如印刷文字的邮政编码识别系统，识别邮件上的邮政编码，帮助邮局作区域分信的作业；也因此至今邮政编码一直是各国所倡导的地址书写方式。

　　OCR可以说是一种不确定的技术研究，正确率就像是一个无穷趋近函数，知道其趋近值，却只能靠近而无法达到，永远在与100%作拉锯战。因为其牵扯的因素太多了，书写者的习惯或文件印刷品质、扫描仪的扫描品质、识别的方法、学习及测试的样本……等等，多少都会影响其正确率，也因此， OCR的产品除了需有一个强有力的识别核心外，产品的操作使用方便性、所提供的除错功能及方法，亦是决定产品好坏的重要因素。

　　一个OCR识别系统，其目的很简单，只是要把影像作一个转换，使影像内的图形继续保存、有表格则表格内资料及影像内的文字，一律变成计算机文字，使能达到影像资料的储存量减少、识别出的文字可再使用及分析，当然也可节省因键盘输入的人力与时间。

　　从影像到结果输出，须经过影像输入、影像前处理、文字特征抽取、比对识别、最后经人工校正将认错的文字更正，将结果输出。

影像输入：

　　欲经过OCR处理的标的物须透过光学仪器，如影像扫描仪、传真机或任何摄影器材，将影像转入计算机。科技的进步，扫描仪等的输入装置已制作的愈来愈精致，轻薄短小、品质也高，对OCR有相当大的帮助，扫描仪的分辨率使影像更清晰、扫除速度更增进OCR处理的效率。

　　影像前处理：影像前处理是OCR系统中，须解决问题最多的一个模块，从得到一个不是黑就是白的二值化影像，或灰阶、彩色的影像，到独立出一个个的文字影像的过程，都属于影像前处理。包含了影像正规化、去除噪声、影像矫正等的影像处理，及图文分析、文字行与字分离的文件前处理。在影像处理方面，在学理及技术方面都已达成熟阶段，因此在市面上或网站上有不少可用的链接库；在文件前处理方面，则凭各家本领了；影像须先将图片、表格及文字区域分离出来，甚至可将文章的编排方向、文章的提纲及内容主体区分开，而文字的大小及文字的字体亦可如原始文件一样的判断出来。

　　文字特征抽取：单以识别率而言，特征抽取可说是 OCR的核心，用什么特征、怎么抽取，直接影响识别的好坏，也所以在OCR研究初期，特征抽取的研究报告特别的多。而特征可说是识别的筹码，简易的区分可分为两类：一为统计的特征，如文字区域内的黑/白点数比，当文字区分成好几个区域时，这一个个区域黑/白点数比之联合，就成了空间的一个数值向量，在比对时，基本的数学理论就足以应付了。而另一类特征为结构的特征，如文字影像细线化后，取得字的笔划端点、交叉点之数量及位置，或以笔划段为特征，配合特殊的比对方法，进行比对，市面上的线上手写输入软件的识别方法多以此种结构的方法为主。

　　对比数据库：当输入文字算完特征后，不管是用统计或结构的特征，都须有一比对数据库或特征数据库来进行比对，数据库的内容应包含所有欲识别的字集文字，根据与输入文字一样的特征抽取方法所得的特征群组。

对比识别：

　　这是可充分发挥数学运算理论的一个模块，根据不同的特征特性，选用不同的数学距离函数，较有名的比对方法有，欧式空间的比对方法、松弛比对法（Relaxation）、动态程序比对法（Dynamic Programming，DP），以及类神经网络的数据库建立及比对、HMM（Hidden Markov Model）…等著名的方法，为了使识别的结果更稳定，也有所谓的专家系统（Experts System）被提出，利用各种特征比对方法的相异互补性，使识别出的结果，其信心度特别的高。

　　字词后处理：由于OCR的识别率并无法达到百分之百，或想加强比对的正确性及信心值，一些除错或甚至帮忙更正的功能，也成为OCR系统中必要的一个模块。字词后处理就是一例，利用比对后的识别文字与其可能的相似候选字群中，根据前后的识别文字找出最合乎逻辑的词，做更正的功能。

　　字词数据库：为字词后处理所建立的词库。

人工校正：

　　OCR最后的关卡，在此之前，使用者可能只是拿支鼠标，跟着软件设计的节奏操作或仅是观看，而在此有可能须特别花使用者的精神及时间，去更正甚至找寻可能是OCR出错的地方。一个好的OCR软件，除了有一个稳定的影像处理及识别核心，以降低错误率外，人工校正的操作流程及其功能，亦影响OCR的处理效率，因此，文字影像与识别文字的对照，及其屏幕信息摆放的位置、还有每一识别文字的候选字功能、拒认字的功能、及字词后处理后特意标示出可能有问题的字词，都是为使用者设计尽量少使用键盘的一种功能，当然，不是说系统没显示出的文字就一定正确，就像完全由键盘输入的工作人员也会有出错的时候，这时要重新校正一次或能允许些许的错，就完全看使用单位的需求了。

结果输出：

　　其实输出是件简单的事，但却须看使用者用OCR到底为了什么？有人只要文本文件作部份文字的再使用之用，所以只要一般的文字文件、有人要漂漂亮亮的和输入文件一模一样，所以有原文重现的功能、有人注重表格内的文字，所以要和Excel等软件结合。无论怎么变化，都只是输出档案格式的变化而已。如果需要还原成原文一样格式，则在识别后，需要人工排版，耗时耗力。中文OCR

中文OCR

　　光学符号识别技术是一种汉字文稿的自动输入方式，它通过光学扫描仪和计算机的配合，经OCR软件将图像数据进行运算分类后，将图像数据转化为计算机内码，可以极大减轻数据录入工作的强度，提高数据录入的速度。

　　文献资料的数字化录入，一般分为：

　　1、纯图像方式。

　　2、目录文本、正文图像方式。

　　3、全文本方式。

　　4、全文索引方式。文本方式和图像方式的混合体。

　　我国在OCR技术方面的研究工作起步较晚，在70年代才开始对数字、英文字母及符号的识别进行研究，70年代末开始进行汉字识别的研究，到1986年汉字识别的研究进入一个实质性的阶段，不少研究单位相继推出了中文OCR产品.

　　我国目前使用的文本型OCR软件主要有清华文通TH-OCR、北信BI-OCR、中自ICR、沈阳自动化所SY-OCR、北京曙光公司NI-OCR（已被中自汉王并购）等，匹配的扫描仪则使用市面上的平板扫描仪。

ＯＣＲ衡量标准

　　衡量一个OCR系统性能好坏的主要指标有：拒识率、误识率、识别速度、用户界面的友好性，产品的稳定性，易用性及可行性等方面。

ＯＣＲ工作原理

　　识别过程:

　　书本级：中文，英文；简体，繁体；

　　版式级：竖排，横排；有无分栏；

　　行切分

　　字切分

　　识别：真正的OCR识别过程，图像信息还原成文本信息

　　后处理：人工干预，主要集中在前四个阶段。

　　识别精度可以达到99%

OCR识别率决定因素

　　1.图片的质量，一般建议150dpi以上

　　2.颜色，一般对彩色识别很差，黑白的图片较高，因此建议ocr的为黑白tif格式

　　3.最重要的就是字体，如果是手写识别率很低。

　　国内OCR识别简体差错率为万分之三，如果要求更高的精度需要投入更大的人工干预。繁体识别由于繁体字库的不统一性（民国时期的字库和现在繁体字库不统一），导致识别困难，在人工干预下，精度能达到90%以上（图文清晰情况下）。

　　OCR是计算机输入技术的一种，它通过模式识别将文字的图像文件转化为可编辑的文本文件，彻底改变了计算机纸介质资料输入的概念。只要用扫描仪将文本图像输入计算机，就可转化为可修改的文本文件，这比手工输入速度快了几十倍。随着OCR技术的广泛应用，它正逐渐被人们所知晓。国际软件巨头微软在研发XP系统的时候，就意识到OCR的市场需求，在发布的Office 2003中全面配装了TH-OCR(北京文通信息技术有限公司开发）;硬件方面的领袖企业英特尔公司也确定TH-OCR为MMX技术支持项目。

　　近期，一些大公司意识到OCR的好处，开始在自己的产品中捆绑OCR技术。Google已经启动OCR软件的开发工作，在它的招聘启示中这样写道：“Google currently "reads" almost every web page in the world. Come help us read all the printed material as well!”(Google现在已经能够“阅读”世界上几乎所有网页，你的到来将让Google阅读所有印刷信息!)。随着google启动OCR开发工作，OCR应用进入了全面爆发时代。

　　无论是让计算机对文字进行排版输出，还是要让计算机认识它看到文字，所有这一切都是为我们生活服务。信息化和数字化的进程，让我们不再安于用十指敲击键盘来输入数据。人们希望能将时间和精力投入到更具创造性的工作中去，因而希望计算机等辅助设备能更具智慧。OCR(Optical Character Recognition，光学字符识别)技术就是其中的一项，跟打印技术相对，它是让计算机认字的一种技术，这远比打印复杂得多。

　　经济竞争带来更多的商务活动，每个活动上名片都是必不可少的主角，名片的管理产品也应运而生，名片识别管理工具同样也是以OCR技术为核心的产品。通过名片识别工具将名片进行扫描、识别、分类，不仅能够导入手机、PDA等，而且还能为名片信息进行备份，不用担心遗失。文通e-card就是一款优秀的名片识别管理产品，OCR技术能把商务生活打理得有条不紊，节约更多的时间。现在，几乎所有的扫描仪和一体机上都配装OCR软件，比如HP、UNISCAN、EPSON、CANON、 LENOVO等扫描仪厂商捆绑的就是文通TH-OCR。

OCR:牛津、剑桥和RSA考试局　

　　OCR：Oxford Cambridge and RSA Examinations，中文全称“牛津、剑桥和RSA考试局”，隶属剑桥大学“评估小组”。每年约有300万人参加“OCR”组织的A-level课程考试。目前不考虑在中国发展。

OCR的“单元报告”的三大特色

课程作业报告（Coursework）

　　课程作业是以解决现实生活中的一个具体问题为情境，要求学生完成的一项系统设计。

　　报告中开头列出的几个“需要注意的问题”，体现出OCR认真严谨的工作态度及人性化的评价理念。比如：

　　（1）“评注”：要求教师在评分时在得分点说明得分的原因，以便OCR了解是否真正掌握了评分标准；

　　（2）“评分标准”：要求学校必须严格遵照OCR制定的评分标准来判分，不许自拟标准，以免影响考生成绩；

　　（3）“通信与交流”：强调教师评分时，一定要给考生一定的“通信与交流”方面的情感态度分，有的教师在这方面判分太过苛刻，这是不合适的。

　　而报告的核心内容则是以五大评估目标（Assessment Object，缩写为AO）为依据对课程作业中逐个知识点得分情况的分析，这五项目标既是评判分数的准绳又是分析评估结果的依据。目标具体内容为：

　　AO1：通过ICT的学习，适当运用所学知识、技能及理解能力处理某些事件。

　　AO2：分析、设计、完成、测试、评估、证明人们使用的信息通讯系统，加深对于广泛应用ICT的影响的理解。

　　AO3：理性分析自身和他人使用ICT的过程和方法。

　　AO4：讨论、评论ICT广泛应用的影响。

　　AO5：在不断使用ICT的过程中，考虑信息的社会、经济、政治、法律、民族、道德的影响及其安全性。

　　现以Assesment Object 2[z1] （AO2）为例：

　　表1 考生AO2得分情况[3]

AO2得分点	考生得分情况
分析	作为整个课程作业的关键，考生在这一步完成得非常出色，他们准确地把握住了任务的目的及设计的焦点问题
设计、完成、测试	此处分为两个得分等级，较低等级的考生是仅能够分析任务，并且完成一个ICT系统；而较高等级的考生在完成任务的过程中，还为自己的设计加以说明，譬如为何对设计作如此的改变，为何这部分设计保留而放弃另外一部分等等；同时OCR指出一些学校在此处给分过于慷慨，OCR会针对这部分给考生成绩做出调整
评价、实施、效果	整个作业得分最少的点，考生没有体现出ICT相对其他信息处理方式的独特优势，也没有证明何时使用及为何使用ICT是完成任务的最佳方式
说明	要求考生有一个作业说明，即说明系统的使用对象、系统的主要功能等，目的在于督促学生养成良好的设计习惯

　对于“课程作业”这种高度开放的评价模式，为了避免评分的主观性和欠科学性，OCR在评分标准中从整体评价目的到具体各项评价指标的权重、分值等都作了严格的要求和详细的阐述，力图达到主观题的客观化，有力的加强了评价的可观察性和可测量性。

　　那么，在评估报告中，再结合考试的实际情况给予更充分的说明和例证，将评分标准中抽象的数字及说明形象化，一方面可以帮助教师更加准确的把握评分标准的思想，从而提高以后判分的质量，保证考试的公平性；另一方面相当于提供了一份课程作业指导文件，帮助师生进一步解读课程作业所考察的主题和内容，以期阅读报告后教师能够在以后的教学中调整教学思路并给学生提供更有针对性的指导和训练，学生能够发现自己的长处与不足，以免在以后的作业中无所适从或放任自流。

　　在我国，信息技术课是一门基于活动和实践的课程，“课程作业”这种质的评价方式对于全面考察信息素养水平也是极其重要的。但是在高考、会考这些高利害的考试中，由于社会文化背景，学校所面对的压力，课程和试题发展的不成熟以及这种评价方式自身的特点，建议在总结性评价中对采用“课程作业”的方式仍然持谨慎态度。

“笔试基础卷报告”及“笔试高级卷报告”

　　“笔试基础卷报告”和“笔试高级卷报告”分别就试卷中每道题目考生的回答情况作了详细分析，本文选取2007年基础卷的第2题为例说明报告的内容，该题旨在考察考生如何思考并评论ICT对社会生活的影响（AO4）。

　　原题为：Wordsworth牙科诊所通过e-mail和短信息的方式与病人进行交流。

　　（a）什么设备可以接受短信息？

　　（b）说出一种对病人来说，这种短信息预约提醒的好处？

　　（c）说出两种对Wordsworth牙科诊所来说，使用e-mail与病人交流的好处？

　　（d）说出两种在没有e-mail和短信息的情况下，可以与病人沟通的方式。

　　表2 第2题答题情况分析[4]

题号	考生答题情况
2（a）	很好，但是有些考生只是简单的回答“电话”，而没有准确的指出是“移动电话”
2（b）	尚可，许多考生仅是将问题换了一种表述的方式来作为回答，这是不能得分的
2（c）	不太好，大多考生审题不清，是从病人的角度回答问题，而不是从牙科诊所的角度；有的考生只用了“快速”、“简单”等一个单词就完成了回答，没有陈述理由，显得答案过于单薄，且缺乏说服力；还有的考生只是回答了使用e-mail的好处，而没有与牙科诊所相结合
2（d）	尚可

　报告结合试题，指出考生要么由于没有使用正确的专业词汇；要么因为曲解题意、审题不清，导致答题的角度错误；要么因为回答过于简单而扣分或得不到满分，所以提醒学校应在平时注意加强训练考生答题的完整及专业用语的规范等。这种针对具体题目的分析，将考生存在的问题清晰地呈现给阅读者，具有较强的说服力。

单元成绩门槛表(Grade Thresholds)

　　表3 各单元的等级分数门槛表

单元	满分	A*	A	B	C	D	E	F	G	U
试卷1基础	Raw	40	-	-	-	37	32	27	23	19	0
UMS	55	-	-	-	48	40	32	24	16	0
试卷1高级	Raw	40	39	35	31	28	23	20	-	-	0
UMS	80	-	64	56	48	40	-	-	-	0
课程作业	Raw	64	60	51	42	34	28	23	18	13	0
UMS	120	-	96	84	72	60	48	36	24	0
扩充课程作业	Raw	64	60	51	42	34	28	23	18	13	0
UMS	120		96	84	72	60	48	36	24	0
试卷2基础	Raw	55	-	-	-	37	31	25	19	13	0
UMS	55	-	-	-	48	40	32	24	16	0
试卷2高级	Raw	80	54	47	40	33	25	21	-	-	0
UMS	80		64	56	48	40	-	-	-	0

　这张表公布了每个单元的成绩等级划分标准，此门槛是依据每年学生各个单元的试卷成绩整体情况计算、权衡得出的，因而每年的门槛成绩都会略有改动。由于笔试试卷１与笔试试卷２的卷面原始分值不同，所以将试卷１的分数以试卷２的总分为标准折算成标准分，这样方能确保考生所得分数是在同一个标准下得出的，从而保证了考试的公平与公正。

　　而OCR给学生打出的最终等级成绩，是按照每个单元占总成绩相对比重的不同为每个单元赋予一定的权重，然后根据各个单元的权重，利用科学的数据合并方法进行数据合并而得出的。

　　在新课程背景下，一直倡导改革传统的量化评价方法，而注重质的评价，所以具有相对稳定内涵的等级评定法也是我国信息技术课比较推崇的评价方法。但是从几个已经采用等级评定法的实验区所公布的方案来看，主要有以下两个问题：一是划分的等级过于简单，有的地区分为优秀、良好、及格和不及格，还有的地区分为A—D四个等级，这样的划分过于粗略，无法相对准确的表明学生的能力水平；二是各地区事先公布的等级门槛随意性太大，更降低了它的权威性。英国的“等级分数门槛表”，是在了解了同年考生的考试整体情况以后再计算出门槛成绩，这样保证了每年考试成绩的相对参考价值，使学生成绩不会因为各年试题的难易程度的不同而出现大的波动，而我国目前的做法太过简单，不具说服力。英国的报告让我们看到了等级评定法规范、严谨的一面。

　　这篇“单元报告”对此次会考作了较透彻的评析，沿袭了英国信息通信技术课总结性评价人文气息浓厚的风格，语言中肯、易懂且以鼓励为主，分析深入、到位并用实例佐证。它主要目的是通过总结和剖析考试的结果，发现问题，以期能帮助教师进一步理解教学大纲、改进教学，并为教师了解评估方案的实施、评分标准的应用等方面提供有针对性的指导。所以报告内容紧紧围绕着五大评估目标逐步深入，从概括到具体多层次、多角度的呈现了考试中发现的问题。

"OCR”在英汉词典中的解释

　　OCRKK: []DJ: []abbr.1. =Optical Character Reader 光学字符辨识机ocrabbr.1. =optical character reader 光学字符阅读器2. =optical character recognition 光学文字(字符)辨识

AI人工智能领域知识图谱在深度学习中的应用拓展
AI人工智能领域知识图谱在深度学习中的应用拓展关键词：知识图谱、深度学习、神经网络、图嵌入、知识表示学习、推理机制、应用场景摘要：本文深入探讨了知识图谱与深度学习的融合应用，系统性地分析了知识图谱在深度学习中的关键技术路径和应用场景。文章首先介绍了知识图谱的基本概念和表示方法，然后详细阐述了知识图谱与深度学习结合的多种技术路线，包括图神经网络、知识嵌入和推理机制等。接着通过具体案例展示了知识图谱增
团队研发文化和价值观建设与传承 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
团队研发文化和价值观建设与传承1.背景介绍在现代软件开发中，技术的进步和工具的更新固然重要，但团队的研发文化和价值观同样不可忽视。一个高效的团队不仅需要技术上的卓越，还需要在文化和价值观上有一致的认同和传承。本文将深入探讨如何在团队中建立和传承研发文化和价值观，帮助团队在技术和文化上共同进步。2.核心概念与联系2.1研发文化研发文化是指团队在软件开发过程中所遵循的行为准则、工作习惯和价值观。它包括
【C++】C++的虚析构函数
C++的虚析构函数1.语法规则：2.用途：3.原理：示例代码：4.下面解释为什么基类未定义为析构函数时，析构子类(派生类)对象也能把基类对象析构的原因4.1核心原理：编译器自动生成的析构函数调用链4.1.1对象构造与析构的镜像对称原则4.1.2编译器在派生类析构函数中插入隐式代码4.2底层机制分步解析4.3技术细节说明4.3.1.this指针调整4.3.2.继承链处理4.3.3.与虚函数无关1.语
前端React和Vue框架的区别
React和Vue作为前端Web开发的两大主流框架，虽然都用于构建用户界面，但在设计理念、语法风格、生态系统等方面存在显著差异。以下从多个维度对比两者的核心区别，帮助你在技术选型时做出更合适的决策。一、设计理念与架构1.数据流控制React：强制单向数据流（One-WayDataFlow），状态变化只能通过父组件→子组件传递，如需反向通信（如子组件修改父组件状态），需通过回调函数实现。复杂应用中需
演练纪实丨同创永益同天支持三家银行灾备切换演练圆满完成数字韧性前端
2025年6月22日，同创永益单日同时支持河南农商联合银行、苏州农商银行、昆山农商银行组织开展2025年灾备切换演练圆满完成。其中共涉及44套关键业务系统，700余个节点，成功率100%，且全部满足恢复指标要求。同创永益于同日成功支持三家银行完成灾备切换演练，充分彰显了企业卓越的交付能力与技术底蕴。此次演练中，最显著的突破在于支持某行银行灾备切换演练时，将灾备技术切换的时间从原本的5分钟压缩至1分
Unity团结引擎实战：鸿蒙游戏开发全指南编号:0517 鸿蒙 harmonyos5.0 unity 华为鸿蒙
鸿蒙游戏开发实战：Unity团结引擎适配指南与代码示例文/技术探索随着鸿蒙生态的快速扩张，Unity游戏向鸿蒙OS（OpenHarmony）的迁移已成为开发者新需求。本文将基于Unity团结引擎（专为鸿蒙定制的Unity分支），详解适配流程并提供可运行的代码示例。一、团结引擎：鸿蒙原生适配的核心工具Unity中国推出的团结引擎（基于Unity2022LTS定制）是当前唯一官方支持的鸿蒙适配方案，其
HarmonyOS实战：打造极简HEventBus事件通知 IT小码哥丶 HarmonyOS harmonyos
前言事件通知在日常开发中十分重要，不同页面之间的事件通信都会用到事件通知，作为Android开发的小伙伴相信都用过EventBus，LiveDataEventBus等事件通信工具。鸿蒙开发中也同样需要一个页面之间通信等工具，本篇文章教你在鸿蒙开发中如何实现一个HEventBus，建议点赞收藏！需求分析全局只存在唯一实例。支持事件注册，反注册。支持一次发送，多处接收。技术实现单例实现在鸿蒙中使用创建
HarmonyOS实战：List拖拽位置交换的多种实现方式 IT小码哥丶 HarmonyOS list 数据结构 harmonyos android 华为
背景在最近日常工作中，遇到需要实现拖拽列表中的元素进行位置交换的需求。第一时间翻看了鸿蒙官方文档，发现官方只给Grid提供了Item交换位置的实现方式，然而List并没有提供，于是需要自己动手去实现。本篇文章详细介绍了两种不同的方式去实现List的位置交换。技术实现方式一使用列表的手势事件实现位置交换。先实现List的onItemDragStart方法。该方法表示拖拽列表元素时触发。.onItem
借助职星学院企业培训系统，推动企业人才发展 github_staredu 大数据学习
在企业的发展进程中，人才是核心竞争力。如何培养和发展人才，成为企业面临的重要课题。职星学院企业培训系统为企业提供了一套全面、高效的人才培养解决方案，通过其强大的功能，推动企业人才的持续发展。职星学院的课程管理功能助力企业打造知识共享平台。企业可以将内部的优秀经验、技术知识等转化为课程资源，存储在系统中，实现知识的沉淀和传承。同时，企业还可以引入外部优质课程，拓宽员工的知识面和视野。课程的更新和维护
职星学院企业培训系统：引领线上培训新风尚
随着互联网技术的飞速发展和企业对员工培训需求的日益增长，线上培训系统逐渐成为企业提升员工能力、推动业务发展的重要工具。职星学院企业培训系统，作为一款集高效性、灵活性、个性化于一体的线上培训平台，正引领着线上培训的新风尚。一、系统概述职星学院企业培训系统是一个专为企业设计的在线教育平台，旨在满足企业对员工培训多样化、个性化的需求。系统支持跨平台访问，包括网页、移动端应用等，确保员工能够随时随地开展学
鸿蒙应用AR开发：增强现实技术实现方案操作系统内核探秘操作系统内核揭秘 OS harmonyos ar 华为 ai
鸿蒙应用AR开发：增强现实技术实现方案关键词：鸿蒙系统、AR开发、增强现实、ARKit、ARCore、3D渲染、计算机视觉摘要：本文将深入探讨如何在鸿蒙操作系统上开发增强现实(AR)应用。我们将从AR技术的基本原理讲起，逐步深入到鸿蒙AR开发框架的具体实现，包括3D模型渲染、空间定位、手势识别等核心技术。文章将提供完整的代码示例和实战项目，帮助开发者快速掌握鸿蒙AR应用开发的核心技能。背景介绍目的
【2025最新】AI大模型项目实战教程大揭秘！超详细攻略，手把手带你飞，记得收藏！大模型教程人工智能产品经理大模型大模型教程大数据大模型学习程序员
一、大模型开发整理流程1.1、什么是大模型开发我们将开发以大语言模型为功能核心、通过大语言模型的强大理解能力和生成能力、结合特殊的数据或业务逻辑来提供独特功能的应用称为大模型开发。开发大模型相关应用，其技术核心点虽然在大语言模型上，但一般通过调用API或开源模型来实现核心的理解与生成，通过PromptEnginnering来实现大语言模型的控制，因此，虽然大模型是深度学习领域的集大成之作，大模型开
Linux运维需要学多久？学习方式有哪些？老男孩IT教育 linux 运维
Linux运维工程师是一个融合多学科的综合性技术岗位，除了掌握相关技术之外，还需要具备沟通、销售、管理等非技术能力，因此也给运维工程师提供了非常广阔的发展空间。那么Linux运维工程师要学多久?以下是详细的内容介绍。Linux运维工程师要学多久?Linux运维工程师学习周期需结合学习方式来决定，不同的学习方式，周期是不同的。现在学习Linux运维技术分为两种情况。一种是自学，如果选择自学的话，学习
第二十五节：Linux 运维职业规划与学习路径指南厚衣服_3 Linux基本操作详解运维 linux 学习
第二十五节：Linux运维职业规划与学习路径指南随着云计算、容器化、自动化运维的快速发展，Linux运维工程师已经成为技术岗位中的重要角色之一。要想在运维领域长期发展，不仅要掌握扎实的基础技能，更要有清晰的职业规划和学习路径。一、Linux运维职业方向概览职业方向技术关键词基础运维工程师Linux、Shell、网络、服务部署、安全配置自动化运维/DevOpsAnsible、Docker、Jenki
AR技术：开启工业维修新纪元，赋能效率与精准 Teamhelper_AR ar
在当今数字化浪潮的推动下，增强现实（AR）技术正以前所未有的速度改变着工业维修领域的面貌。从能源勘探到工业制造，从新能源运维到医疗手术，AR技术的应用不仅极大地提高了工作效率，还为专业人员提供了前所未有的精准支持。本文将深入探讨AR技术如何解决工业维修中的难题，并展望其在未来的发展趋势。引言：AR技术，工业维修的新引擎2025年，增强现实（AR）技术已从科幻概念蜕变为驱动产业升级的核心引擎。全球A
深入理解AI技术与实践：如何贡献代码 Wurenyu957 人工智能
在现代AI技术的开发过程中，贡献代码是推动项目发展、提升技术能力的重要方式。在这篇文章中，我们将结合AI技术实践，深入探讨如何有效地为开源项目贡献代码，尤其是那些使用AI模型的项目。技术背景介绍AI技术的迅猛发展得益于开源社区的共享和协作。诸如TensorFlow、PyTorch等开源框架，极大地降低了AI模型开发的门槛。与此同时，越来越多的项目通过GitHub等平台开放源码，接受来自全球开发者的
后端开发工程师（.Net方向） Flora051 求职招聘
5年以上，23-30k职位描述：工作内容：1、负责相应产品模块的需求分析、框架设计和编码工作；2、分析项目需求，能给出良好的解决方案，并协助其他人员完成开发及调试工作；3、Codereview，编写单元测试，高质量完成功能；4、持续关注新的技术，选择适合的技术持续迭代改进产品。任职资格：1.计算机相关专业，必须本科及以上学历，5年以上.net研发经验(core3年以上)；2.有医疗健康开发经验者优
Oracle 递归 + Decode + 分组函数实现复杂树形统计进阶(第二课) AI、少年郎数据库 ORACLE 分组求和自动递归树形数据统计
在上篇文章基础上，我们进一步解决层级数据递归汇总问题——让上级部门的统计结果自动包含所有下级部门数据（含多级子部门），并新增请假天数大于3天的统计维度。通过递归CTE、DECODE函数与分组函数的深度结合，实现真正意义上的树形结构数据聚合。一、业务需求升级：层级汇总与新增统计维度核心目标递归汇总：上级部门数据包含所有直属/非直属下级部门数据（如集团总部需汇总技术研发部、产品运营部及其子部门数据）新
基于django+Spark+大数据+爬虫技术的国漫推荐与可视化平台设计和实现(源码+论文+部署讲解等) 阿勇学长大数据项目实战案例 Java精品毕业设计实例 Python数据可视化项目案例大数据 django spark 国漫推荐与可视化平台毕业设计 Java
博主介绍：✌全网粉丝50W+,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等
大模型之提示词工程十指令——结合认知科学与高效学习法的AI协作指南 SEVEN-YEARS 学习人工智能
1.费曼学习法：用“教学”倒逼模型理解复杂概念原理：通过模拟教学场景，迫使模型深入理解知识本质。指令示例：“请用‘小学数学老师’的身份，向孩子解释区块链的基本原理。”输出：“区块链就像一个透明的记账本，每个人都可以看到上面的记录。比如你和同学一起买零食，大家轮流在本子上记录谁买了什么，这样没有人能偷偷修改记录。”应用场景：技术概念简化、跨领域知识迁移、科普内容生成。2.帕累托法则：聚焦关键20%的
无铅压电陶瓷研究进展：技术突破与产业升级路径莱歌数字数字化转型 #职场经验 #结构热设计科技热设计 CAE 散热能源
作者简介：科技自媒体优质创作者个人主页：莱歌数字-CSDN博客公众号：莱歌数字个人微信：yanshanYH211、985硕士，职场15年+从事结构设计、热设计、售前、产品设计、项目管理等工作，涉足消费电子、新能源、医疗设备、制药信息化、核工业等领域涵盖新能源车载与非车载系统、医疗设备软硬件、智能工厂等业务，带领团队进行多个0-1的产品开发，并推广到多个企业客户现场落地实施。专题课程Flotherm
文本生成新纪元：解锁大模型的企业级应用密码
数字化浪潮席卷各行业的当下，文本生成技术正经历着翻天覆地的变革，这场变革的幕后功臣正是大模型。今天，咱们就来深入探讨大模型在文本生成领域的奥秘，看看它如何赋能企业，又该怎样规避风险，实现价值最大化。技术跃迁：从笨拙规则到智能生成回首往昔，文本生成依靠规则模板与关键字替换，虽能实现基础自动化，却如机械舞者，动作生硬、缺乏灵动。业务稍有变动，规则需全面重构，耗时费力。随着N-gram等统计机器学习方法
邮科千兆2光8电工业级交换机在高温环境中的可靠性实践邮科工业交换机定制网络安全
工业物联网场景里，网络设备稳定性关乎生产系统连续性，冶金、能源、交通等高温作业环境，工业交换机需经受75℃以上高温考验。本文以邮科千兆2光8电工业交换机为例，结合测试数据与应用案例，解析其高温环境下技术适配性与可靠性保障机制。一、高温对工业交换机的技术挑战工业现场高温对交换机影响多维。钢铁企业冷轧车间实测，环境温度超60℃，普通商用交换机散热不足，芯片温度飙升至95℃，数据包丢失率从0.03%增至
软件外包：行业现状、挑战与机遇 MicroTeamers kafka 科技数据分析
在数字化浪潮席卷全球的今天，软件外包已成为企业在信息技术领域发展的重要战略选择。软件外包是指企业将软件项目中的部分或全部工作委托给专业的外部软件服务提供商完成的一种业务模式。这种模式在过去几十年间得到了迅猛发展，其背后有着深刻的经济和技术动因。从行业现状来看，全球软件外包市场规模持续扩大。一方面，对于许多企业，尤其是中小型企业而言，自行组建完整的软件开发团队面临着高昂的人力成本、设备成本以及管理成
领域驱动设计核心解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Dubbo与Zookeeper核心解析 Java开发廖志伟 Java场景面试宝典 Dubbo Service Discovery Distributed Systems
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
【有源码】基于爬虫+python的美食数据分析与可视化flask热门美食推荐系统的设计与实现 Q2643365023 Python 大数据 python 爬虫计算机毕设选题毕业设计源码计算机毕设项目数据分析美食推荐系统
注意：该项目只展示部分功能，如需了解，文末咨询即可。本文目录1.开发环境2系统设计2.1设计背景2.2设计内容3系统展示3.1功能展示视频3.2系统页面4更多推荐5部分功能代码1.开发环境开发语言：Python采用技术：flask、爬虫数据库：MySQL开发环境：PyCharm2系统设计2.1设计背景在现代社会中，人们对美食的兴趣和需求日益增长。互联网和社交媒体的普及使得各种美食信息、评论和推荐变
利用H5为小程序领域增添新活力小程序开发2020 小程序开发宝典小程序 ai
利用H5为小程序领域增添新活力关键词：H5技术、小程序开发、跨平台架构、WebView通信、动态内容渲染、性能优化、全栈开发摘要：本文深入探讨如何通过HTML5（H5）技术提升小程序开发效率与用户体验。从技术架构对比到核心通信机制，结合具体代码案例解析H5与小程序的深度融合方案。通过WebView嵌入、JSSDK扩展、动态模板渲染等技术手段，实现跨平台代码复用、复杂交互组件开发和实时内容更新。同时
ShardingSphere 架构解析 Java开发廖志伟 Java场景面试宝典 ShardingSphere Distributed Database Database Middleware
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
自然语言处理(NLP)中的文本生成控制技术 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据自然语言处理 easyui 人工智能 ai
自然语言处理(NLP)中的文本生成控制技术关键词：文本生成、可控生成、语言模型、Prompt工程、解码策略、条件控制、评估指标摘要：本文深入探讨自然语言处理中文本生成控制技术的最新进展。我们将从基础概念出发，系统分析各种控制方法的原理和实现，包括Prompt设计、解码策略优化、条件控制机制等核心内容。文章将结合数学模型、算法实现和实际案例，全面展示如何实现高质量、可控的文本生成，并探讨该领域面临的
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1

OCR:光学字符识别技术

OCR的发展

影像输入：

对比识别：

人工校正：

结果输出：

中文OCR

ＯＣＲ衡量标准

ＯＣＲ工作原理

OCR识别率决定因素

OCR:牛津、剑桥和RSA考试局

OCR的“单元报告”的三大特色

课程作业报告（Coursework）

“笔试基础卷报告”及“笔试高级卷报告”

单元成绩门槛表(Grade Thresholds)

"OCR”在英汉词典中的解释

你可能感兴趣的:(技术)

OCR:牛津、剑桥和RSA考试局