爱奇艺技术

OCR技术在爱奇艺的应用实践及演进

随着人工智能的热度上升，图像识别这一细分领域也渐渐被人们所关注。在很多公司的业务中，有很多需要对图片进行识别的需求。为了帮助业务实现对这些图片、文档的识别和结构化，业界进行了一系列的实践和探索，最终确定了一些可行的方法，总结了在实践过程中可能遇到的问题和难点。

为了更好地了解OCR技术在爱奇艺的应用实践，最近，InfoQ“大咖说”栏目邀请爱奇艺智能平台部助理研究员——Harlon 进行了一场直播分享，结合目前的业务需求，为我们陈述了爱奇艺在探索OCR技术发展过程中遇到的痛点和难点，以及识别技术的一些细节，以下是采访实录。

嘉宾：Harlon

InfoQ：您好，非常开心有机会采访您，您方便简单介绍下过去几年 OCR 技术的整体发展吗？大致可以从哪几个维度来看？

Harlon：随着互联网的发展和智能设备的普及，图像以及视频的产生速度大大加快，图像文字中包含的丰富的语义信息，也在人机交互中扮演着重要角色，从图像中提取文字的技术，也就是 OCR 技术得到了越来越多的关注。随着深度学习的发展，OCR 技术从基于传统的图像处理和机器学习转到了以深度学习为主，其主要包含如下两个步骤：

一是文字检测，用于检测图像中的文字位置，一般以矩形或四边形来表示，区别于常规的物体检测，文本行具有长短不一、长宽比例范围大，而且方向性较强的特点，也较易受到复杂背景的影响；

二是文字识别，输入是文本检测得到的文本行图像，输出为图像对应的文本信息。传统的文字识别方法可以分为字符分割和单字符识别两个步骤，现在的文本识别算法大都是基于序列到序列的网络，一个网络里面可以同时进行分割和识别，这样做的好处是大大减少了数据标注量。另外，由于同时训练分割和识别算法，算法性能也得到了大幅提升，我们可以从以下几个方面来看 OCR 技术的发展：

首先是文字检测部分，借鉴物体检测技术的发展，文字检测技术也从检测单行、较规则的文字发展到了检测任意方向文本，典型算法包括：CTPN、EAST、PMTD、DB 等；文字检测的方法主要分为基于检测框和基于 Mask 两个大类，基于检测框的文本检测，其思路是先利用若干 Anchor 产生大量候选文本框，再经过 NMS 得到最终结果；基于 Mask 的文本检测，其思路是通过分割网络进行像素级别的语义分割，再通过后处理得到文本框，由于后处理比较复杂，这个步骤会直接影响基于 Mask 文本检测算法的性能。

其次是文字识别，主要有两类方法：一种是基于 CTC 的 CRNN；另一种是基于注意力机制的编码器 - 解码器结构，两类方法的流程非常相似，主要包括图像预处理、特征提取、序列建模、字符预测四个流程。

具体来说，CRNN 采用的是 CNN 加 RNN 的结构来提取基本特征，损失函数采用 CTC loss，CTC 最早应用在语音识别中，能够在不分割输入数据的条件下解决序列的预测问题，也就是输入一串语音信号，不需要做分割就可以直接输出语音信号对应的文本，CTC 最大的特点是输入和输出都是一个序列，移植到 OCR 领域以后，基于 CTC 的 CRNN 算法也取得了很好的效果。至于注意力机制模型，主要是编码器 - 解码器结构，文字识别算法解决的核心问题是将长度不匹配的图像特征和文本序列对应起来，编码器 - 解码器这种结构非常适用于解决这个问题，加入 Attention 模块以后，可以自动寻找到需要预测的文本区域，将注意力集中在图像中需要识别的字符附近，显著提升模型准确性。

然后是端到端 OCR，上面讲到的文本检测和文本识别都是串行流程，也就是文本检测完毕以后再进行文本识别。不同于这两个步骤分开进行的模式，端到端 OCR 是将文本检测和文本识别联合起来训练，共享特征提取网络，然后在训练阶段输入训练图像，以及对应的文本框信息和文本内容，损失函数定义为文本检测和文本识别误差的加权和，通过这种方式希望能达到联合优化的目的，预测阶段相当于少了一次特征提取的操作，预测阶段的资源开销也会更少。从实际效果来看，由于两个任务也就是检测和识别的特性不同，整个端到端算法的训练收敛难度会比较大。

最后就是基于 OCR 的信息提取技术，传统的 OCR 技术只解决了从图像中提取文字的需求，但是类似票据识别等场景，除了识别文字外，也需要识别文字之间的关系，判断哪些文字属于预打印的内容，哪些文字属于填写的内容，只有掌握了文字之间的对应关系，后续的业务才能顺利开展，这种基于 OCR 的信息提取技术对 OCR 的业务应用起到了很大的推动作用，近年来的研究也是比较多的。

InfoQ：您方便聊聊目前 OCR 技术在工业界的主流应用有哪些？技术层面还存在哪些瓶颈？

Harlon：OCR 在工业界一直有很多应用场景，最著名的例子就是 LeCun 为美国邮政系统设计的支票号码识别算法，这个数据集后面演化成了 MNIST 公开数据集，可以说这是所有深度学习人员接触到的最早示例，基本上所有框架都会拿该数据集作为最初的学习。

早期，由于算法性能受限，OCR 主要是应用在特定场景下的文字识别，比如车牌识别、扫描文档识别以及银行卡卡号识别。整体来说场景是可控的，输入的图像质量相对来说也比较好。随着硬件条件的提升以及算法的发展，现在的 OCR 技术越来越多被应用于像网络图片文字识别、自然场景文字识别等通用领域。

现在，OCR 技术在业界有了很多应用，包括在线视频、在线教育以及智能交通分析等多个领域，只不过应用点可能并不相同，在线教育最核心的应用点是拍照搜题，拍照搜题的核心是需要 OCR 识别用户算法的题目；对于在线视频，因为影视剧的视频较多，需要识别视频里面的文字信息，提供给业务做应用。现在的 OCR 技术主要是根据具体任务设计的专用算法，对不同语种或者不同类型的文字识别效果差异很大，所以提升 OCR 技术的通用能力以及泛化能力是一个需要探索的问题。另外，像小样本或者无监督条件下的 OCR 算法现在的研究也比较少。最后，利用 NLP 以及单字符标注信息提升 OCR 算法的整体性能也是一个没有完全解决的问题。

InfoQ：过去一年，OCR 领域也出现了不少开源项目，对开发者选型而言，您认为可以从哪几个层面考虑？

Harlon：事实上，深度学习本身就有很多框架可以选择，比如 PyTorch、Tensorflow 还有最近开源的 Paddle OCR。在 OCR 领域，同样有很多开源项目可以选择。对开发者而言，需要从自身需求出发进行选型，如果是科研目的，那么 PyTorch、Tensorflow 更加适合，二者提供了众多基础模块，还有很多项目及实践经验可以参考，便于大家复现论文，实践新的思路；如果是其他目的，我觉得可以考虑 Paddle OCR 框架，因为其提供了一整套 OCR 工具库，比如仿真数据生成、模型训练、测试以及模型调优等，包括最近又开源了一些 OCR 标注工具，提供了部署服务相关的接口，Paddle OCR 提供了很多经典算法的开源模型，工程人员可以快速实验各种模型，并用自己的数据微调模型，非常利于模型快速选型。

另外，我觉得 Paddle OCR 框架还有两个比较好的地方：一是该项目由百度开源，对中国的开发人员来说，直接用中文沟通更加便利；二是 Paddle OCR 有专门的人员负责更新文档和代码，用微信群进行沟通，我觉得对于专业的 OCR 人员来说，这是一个不错的选择。

最后，不同的 OCR 模型有不同的特点，就选型而言，开发者需要明确分析自己的任务特点，只有搞清楚业务特点，才能找到最合适的算法。

InfoQ：Paddle OCR 也是一个非常轻量级的框架，实现这样一个框架的难度大概是什么？

Harlon：从算法角度来说，如果要实现一个轻量级的框架有很多手段，比如选择一些轻量化的模型，另外可能针对模型里面的具体层调小参数或者进行量化，这样或许可以很轻易的得到一个轻量化的模型，但是怎么让轻量化的模型达到比较好的效果是一条比较漫长的道路。

InfoQ：您方便介绍下爱奇艺内部主要有哪些场景应用到了 OCR 技术？用来解决哪些问题？

Harlon：OCR 技术在爱奇艺内部得到了非常广泛的应用，对爱奇艺来说，影视剧是核心资产，但视频属于非结构化数据，不利于应用，如何更好地利用视频？为此，我们上线了智能台词分析功能，该功能以 OCR 为基础，可以实时提取影视剧、综艺等节目中的台词信息。

智能台词分析用于提取影视剧视频中的台词信息。同时，会利用 NLP 算法处理识别出来的台词，将用户可能感兴趣的信息提取出来作为标签数据，这些标签数据可以和其他视频信息构成视频的原始数据，然后提供给搜索或者推荐业务使用。

与此同时，我们还在扩大台词智能分析的业务范围，比如提供曲目板识别，广告权益识别、片尾检测等功能。另外一个应用场景就是视频文本 OCR，主要用于识别视频中出现的英文、数字、繁体中文、简体中文等文本，算法可以很好的适配复杂背景，精准识别视频画面中出现的关键文字，为视频分析提供更多数据。

除了上述两大应用外，我们还有一些专用 OCR，用于识别身份证、银行卡以及新闻标题等，这些 OCR 构成了我们的基本算法，被广泛应用于各个业务，既能提高员工效率，也可以改善用户体验。

InfoQ：您方便聊聊爱奇艺是什么时候开始打造 OCR 技术体系的？到现在经过了哪些阶段，有哪些重要的时间节点？每个阶段主要用于解决哪些问题？

Harlon：事实上，OCR 算法一直是爱奇艺算法体系中的重要一环，主要经历了三个发展阶段：第一个阶段是基础阶段，主要完善 OCR 算法对基础业务的支持，比如图文分析、智能台词分析、新闻拆条等，这个阶段我们开发了多种 OCR 基础算法，提高编辑人员的效率。重要的时间点是 2017 年，这一年，我们结合爱奇艺自身影视剧库存量较大的特点推出了业内第一个台词搜剧功能，实现的主要功能是用户可输入感兴趣的台词信息搜索对应的视频点位，该功能的推出极大丰富了用户体验，同时让视频搜索更加便捷。

第二个阶段是发展阶段，主要优化算法速度。随着 OCR 业务的发展，我们整个后台需要处理的视频和图像数据量成倍增长，OCR 算法开始出现瓶颈，主要体现在随着数据量的增加，硬件资源消耗巨大，这个阶段基于成本等各方考量，我们使用了多种方法优化算法性能，包括替换轻量化网络、采用新的模型等，让算法运行速度更快，资源消耗量更少；工程层面，我们同样做了很多优化，包括优化算法的处理流程，合并冗余步骤，加入更多进程...... 通过一系列优化，智能台词分析的性能大大提升，40 分钟的影视剧视频只需要 5 分钟就可以完成台词识别，这个速度还是比较可观的，同时大大降低了对硬件的依赖程度。

最后一个阶段是优化阶段，我们从各方面优化算法的性能指标，并且扩大应用范围。横向来看，我们扩大业务的支持范围，挖掘更多业务的使用点，比如将智能台词分析服务从仅识别影视剧扩展到识别综艺节目等。从实践来看，这个阶段为业务方带来了更多便利。

纵向来看，随着场景的扩大以及业务的增长，算法需要更强的泛化能力，因为业务增长以后，算法看到的数据类型越来越多样，如果泛化性能不强，有可能就会出现很多 Bad Case。因此，我们后续开发了很多辅助算法，包括语种分类算法、竖向文字识别算法等，通过此丰富了整个 OCR 算法矩阵，并将相关算法集成到了爱奇艺的奇观中，可以解决用户不同层次获取信息的需求，欢迎大家体验。

InfoQ：在这个过程中，爱奇艺主要用到了哪些算法和模型？效果如何？

Harlon：我们会根据不同的应用场景使用不同的算法和模型，然后对模型结构进行优化和改进，文字检测算法包括 CTPN、EAST、PMTD 等，CTPN 的特点是只能检测水平文字，而且对长文本和短文本都有很好的检测效果，不容易发生长文本丢失的现象，特别适合于影视剧的台词检测，但是 CTPN 对单个台词的检测效果不太稳定，可能会存在漏检的情况。

PMTD 其实是一个基于 Mask RCNN 的文本检测方法，可以预测整个文本的 Mask，通过 Mask 推测包含文本的四边形区域，这样就可以兼容横向、纵向、倾斜文本的检测，适用范围较广，但是对密集倾斜文本会发生文本区域检测混乱的情况。

DB 是去年推出的算法，基于分割检测，它在论文中提出了一个叫做 DB 的模块，也就是可微分模块，通过该模块替代分割的后处理部分，而且可以设定自适应阈值来提升网络性能，因为其把繁琐的后处理直接用 DB 模块来替代，相当于网络直接可以运行，DB 算法在水平以及倾斜文本检测上都可以达到很好的性能。

接下来介绍文字识别部分，现在主流的方法都是基于序列到序列的，比如 CRNN，或者基于注意力机制的编码器 - 解码器网络，相比传统的单字符识别算法，这两种方法都是以文本行为单位进行训练，最大的特点就是不需要单字符的标注信息，可以大大提升标注效率，而且将字符识别与字符分割同时放在一个网络中训练，大大提升了算法性能。对于粘连情况比较严重的文本行，效果是非常好的。从实践来看，以上两种文本识别方法的效果是相当的，注意力机制模型的特点就是对英文、数字以及长文本的识别效果较好，CRNN 解码很快且对中文识别效果较好。

InfoQ：我们都知道，识别率是衡量 OCR 识别是否精准的重要条件，你们是如何提升识别率的？其中的难点是什么？目前的准确率是多少？

Harlon：首先介绍下 OCR 算法的整体评价指标：文字检测算法使用的评价指标类似于物体检测，根据 IOU 来判断检测框和标注框的重复程度得到召回率和准确率；文字识别算法使用的评价指标是整行识别率，也就是识别的文本串跟标注文本串完全一样才认为是正确的。

在算法研发的过程中，我们发现图像中的文本样式、字体、文本方向、语种、背景复杂多样，这些都给 OCR 技术带来了很大挑战。此外，不同场景的文本特点不同，如果为每个业务单独开发一套算法，重复的工作量也非常大。基于此，我们构建了 OCR 解决方案，根据不同的业务特点进行微调，我们也配套开发了 OCR 技术模块，比如文本仿真模块，训练、测试模块以及数据清洗模块。

针对不同的业务场景，我们会选择合适的算法。以智能台词分析为例，我们选择的是对中文识别效果较好的 CRNN 模型。在影视剧特别是综艺节目中，经常会出现不常见的字体及文字特效，比如《青春有你》、《热血新说唱》等节目会使用活泼且有个性的字体，我们开发了文本仿真引擎用以模拟各种文本的特效，包括台词常见的阴影、描边、发光体等效果，以及收集了 150 多种常用字体，用来生成各种样式的仿真台词，最终生成了千万级别的仿真数据用于强化模型的泛化能力。在下一阶段的训练中，我们又加入了一定量真实数据一起训练，这样得到的模型更加适用真实场景。最后，我们针对特殊情形做了很多优化，比如在双语电影的台词识别方面，由于英文台词的字符数量比中文台词多很多，如果强行使用一个识别模型的话，整个模型解码时对英文识别会出现预测长度偏小进而导致字符丢失的现象，针对这种情况，我们单独开发了语种检测算法，用于区分中文台词和英文台词，以及单独的英文识别算法，这样就可以保证整个台词识别算法的效果。

通过上述一系列优化，我们的台词智能分析服务在中文台词、英文台词上都得到了较优水平。同时，我们会根据算法的特点进行一些针对性优化，比如上述提到的 PMTD 算法，对比较密集的倾斜文本行检测效果不太好，通过实验发现这是由于生成的训练数据不准确导致的，因为倾斜的文本行虽然标注的时候是一个倾斜的四边形，但是最后训练的时候会转换成矩形，导致面积扩大，如果倾斜行文本行过密，矩形区域里面就会包含另外一个文本行，这样的训练效果是非常不好的，在这种情况下，我们通过限制倾斜文本行的长度以及对过长的倾斜文本行进行分段解决了这个问题，最后达到了比较好的效果。

InfoQ：接下来，爱奇艺还将做哪些事情提高 OCR 技术的整体效果？

Harlon：未来的规划主要包括几个方面：一是视频中的文本识别和跟踪，爱奇艺本身有大量的视频数据，这些数据具有数据量大、时序性强的特点，如何在保证算法实时性的同时利用这些特点优化 OCR 算法的性能是值得关注的。

二是结合 NLP 技术优化整个 OCR 算法的性能。图像中的大部分文字都有很强的语义信息，如何结合 NLP 优化 OCR 算法对易错样本的识别效果。

三是 OCR 算法移植到手机端。随着爱奇艺业务的增长，整个 OCR 算法需要处理的数据量越来越大，如果将 OCR 算法移植到手机端，能缓解整个后台服务的压力，同时可以为用户带来更好的体验。

QA 部分

端到端的 OCR 框架有哪些注意事项？有什么可以参考的吗？

答：端到端的 OCR 框架，可以同时完成文字检测和文字识别，需要注意：文字检测和文字识别属于两个问题，训练过程中，需要保证共享的特征同时适用于两个算法才行，但是同时训练这两个任务，会导致 loss 震荡，整个网络不收敛，因此一般的步骤是先训练一个任务，稳定以后再把另一个任务加进去；参考：FOTS。

对于添加了水印或印章的图片，是否有比较好的识别方式？

答：如果水印比较好去除，建议先去除水印，否则，可以生成一些带水印或印章的仿真样本，用于模型训练，能加强模型对这种图片的识别效果；

east 文本监测的优缺点有哪些？

答：优点：速度较快、支持任意方向文本检测；缺点：相比最新的一些方法，性能有差距，对倾斜文字的检测效果不太好

方便分享下模糊文本的识别吗？

答：造成模糊样本的原因有很多，比如本身的拍照环境较差导致样本模糊等，可以用算法生成一部分模糊样本，将其与清晰样本结合起来进行训练。需要注意的是模糊样本的模糊程度，如果过于模糊可能文本信息已经没有了，此时用来进行训练可能就是脏数据了，这种情况是需要避免的。另外，模糊样本和清晰样本的比例需要掌握好，如果模糊样本过多会影响模型对清晰样本的识别效果。

从 0 到 1 搭建 OCR 有哪些坑可以绕开？

答：1）字符集：确定任务需要的字符集，生成仿真样本时，查看字体是否包含所有需要的字符集，生成仿真样本后，对样本进行抽查；根据任务判断字符集中是否需要加入空格这个字符；2）标注数据：根据任务需要确定标注规则，比如：基于单词的检测方法，需要将空格两侧的单词分开标注；整行文字检测方法，可以将包含空格的整行文字一起标注；3）优化方法：多尝试优化方法，选择对当前任务最优的方法；4）标注样本数量：检测算法对样本的需求量较低，识别算法由于字符数较多，需要更多的样本；

嘉宾介绍：

Harlon，爱奇艺智能平台部助理研究员，来自爱奇艺智能平台部 AI 服务组，从事 OCR 算法、视频内容分析、智能审核等研发工作。

end

也许你还想看\

效能篇 | APP的自动化录制回放系统全云化处理新体验\

i技术会 | 如何用AI挖掘和生成视频广告点位\

扫一扫下方二维码，更多精彩内容陪伴你！

本文授权转载自《InfoQ》作者｜钰莹\

UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
2020-04-12每天三百字之连接与替代冷眼看潮
不知道是不是好为人师，有时候还真想和别人分享一下我对某些现象的看法或者解释。人类社会不断发展进步的过程，就是不断连接与替代的过程。人类发现了火并应用火以后，告别了茹毛饮血的野兽般的原始生活（火烧、烹饪替代了生食）人类用石器代替了完全手工，工具的使用使人类进步一大步。类似这样的替代还有很多，随着科技的发展，有更多的原始的事物被替代，代之以更高效、更先进的技术。在近现代，汽车替代了马车，高速公路和铁路
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
CX8836：小体积大功率升降压方案推荐（附Demo设计指南）诚芯微科技社交电子
CX8836是一颗同步四开关单向升降压控制器，在4.5V-40V宽输入电压范围内稳定工作，持续负载电流10A，能够在输入高于或低于输出电压时稳定调节输出电压，可适用于USBPD快充、车载充电器、HUB、汽车启停系统、工业PC电源等多种升降压应用场合，为大功率TYPE-CPD车载充电器提供最优解决方案。提供CX8836Demo测试、CX8836样品申请及CX8836方案开发技术支持。CX8836同升
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
2019-11-04复盘——飞来山上千寻塔，闻说鸡鸣见日升。那一叶秋
1、大盘篇先上老图，看习惯了，也就知道走势了图1上证指数日线图还是那张老图，自己可以在自己的相关软件上画出来，快变盘了。2、个股篇未加仓、未减仓。分析量能的时候，突然发现这么一个东西：“放量突破年线，缩量回调。”合众科技日线图其实，最近的N只个股，在技术分析上，都到了变盘的临界时候。结合这么久的走势，特别是ZJH不断放开IPO的申请，本质上说是融资难度变大，或者说是为企业的融资开创便利。但现在市场
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构
聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标
教育用心灵温暖心灵
@陈春丽长期学习班冯倩。今天一早就听到说高职合并，取消中专教育的教育信息。感觉是虽然知道，再听还是吓一跳。国家重视职业教育为何还要取消中专技术学校的教育？再听高中就要进行技术教育了，一部分人学习好继续努力学习考大学，一部分人在高中就可以进行职业教育接受职业教育了还要中专技术教育学校干什么呢！a有些职业教育学校转型升级快，不是孩子上完给找工作，而是学校帮孩子创业，我觉得是不错的方向！新闻新你得实时更
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
EIO国际确定性的交易（3/10）资管，资金委托安全吗？古城鹏哥
大家可能都知道资金托管，账户是自己开，钱在自己的账户上，密码是由自己掌控，别人提不走你账户的资金，每天可以看下到自己的账户，也可以看到交易流水。现金只能提到自己的银行卡中。账户由技术人员或操作人员，或者是机构团队帮你操作账户，产生盈利和收入，以获得的利润来分配盈利，技术强硬和做的时间久了过硬技术团队，会保证你的资金本金，不会让你的本金亏损的按照一定比例分配收入。所以在这个过程当中一定要看清楚技术的
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
【六】阿伟开始搭建Kafka学习环境能源恒观中间件学习 kafka spring
阿伟开始搭建Kafka学习环境概述上一篇文章阿伟学习了Kafka的核心概念，并且把市面上流行的消息中间件特性进行了梳理和对比，方便大家在学习过程中进行对比学习，最后梳理了一些Kafka使用中经常遇到的Kafka难题以及解决思路，经过上一篇的学习我相信大家对Kafka有了初步的认识，本篇将继续学习Kafka。一、安装和配置学习一项技术首先要搭建一套服务，而Kafka的运行主要需要部署jdk、zook
提高教师信息素养，提高道德与法治课教学效益长白159宋彦红
提高教师信息素养，提高道德与法治课教学效益随着经济和社会的发展，信息技术已经运用到课堂教学中，为课堂教学展示了一个崭新的天地。的确，信息技术形象、生动、直观性强，能够将课本中的一些抽想的概念直接展示在学生面前，从而调动学生的眼、耳、脑，让他们兴奋起来，变被动学习为主动学习，充分发挥教师的教育引导作用，创造一个可以使学生积极参与的场景。在制作、使用信息技术的实践过程中，本文拟就教师提升信息素养的必要
ExpRe[25] bash外的其它shell：zsh和fish tritone ExpRe bash linux ubuntu shell
文章目录zsh基础配置实用特性插件`autojump`语法高亮自动补全fish优点缺点时效性本篇撰写时间为2021.12.15，由于计算机技术日新月异，博客中所有内容都有时效和版本限制，具体做法不一定总行得通，链接可能改动失效，各种软件的用法可能有修改。但是其中透露的思想往往是值得学习的。本篇前置：ExpRe[10]Ubuntu[2]准备神秘软件、备份恢复软件https://www.cnblogs
TDengine 签约前晨汽车，解锁智能出行的无限潜力涛思数据（TDengine） tdengine 汽车大数据
在全球汽车产业转型升级的背景下，智能网联和新能源技术正迅速成为商用车行业的重要发展方向。随着市场对环保和智能化需求的日益增强，企业必须在技术创新和数据管理上不断突破，以满足客户对高效、安全和智能出行的期待。在这一背景下，前晨汽车凭借其在新能源智能商用车领域的前瞻性布局和技术实力，成为行业中的佼佼者。前晨汽车采用整车数据采集和全车数据打通策略，能够实时将数据推送至APP端客户。然而，这导致整体写入和
你可能遗漏的一些C#/.NET/.NET Core知识点追逐时光者 C#.NET DotNetGuide编程指南 c#.net .netcore microsoft
前言在这个快速发展的技术世界中，时常会有一些重要的知识点、信息或细节被忽略或遗漏。《C#/.NET/.NETCore拾遗补漏》专栏我们将探讨一些可能被忽略或遗漏的重要知识点、信息或细节，以帮助大家更全面地了解这些技术栈的特性和发展方向。拾遗补漏GitHub开源地址https://github.com/YSGStudyHards/DotNetGuide/blob/main/docs/DotNet/D
【从浅识到熟知Linux】Linux发展史 Jammingpro 从浅学到熟知Linux linux 运维服务器
归属专栏：从浅学到熟知Linux个人主页：Jammingpro每日努力一点点，技术变化看得见文章前言：本篇文章记录Linux发展的历史，因在介绍Linux过程中涉及的其他操作系统及人物，本文对相关内容也有所介绍。文章目录Unix发展史Linux发展史开源Linux官网企业应用情况发行版本在学习Linux前，我们可能都会问Linux从哪里来？它是如何发展的。但在介绍Linux之前，需要先介绍一下Un
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =

OCR技术在爱奇艺的应用实践及演进

你可能感兴趣的:(ocr,技术,爱奇艺)