GoAI

OCR文字识别技术总结（二）

导读：在上一章中，我们对OCR的概念、发展历程等做了详细解读，并介绍了几种OCR识别方法，本章将继续针对OCR文字识别进行详细讨论，通过不同的OCR分类识别数据集进一步介绍常用的几种OCR算法，对比传统OCR与深度学习OCR。首先是传统OCR识别方法，下面内容将从我国OCR研究历程开始展开。这篇文章将对OCR技术进行分类描述，

本系列目录：

1️⃣OCR系列第一章：OCR文字识别技术总结（一）
2️⃣OCR系列第二章：OCR文字识别技术总结（二）
3️⃣OCR系列第三章：OCR文字识别技术总结（三）
4️⃣OCR系列第四章：OCR文字识别技术总结（四）

一、我国OCR发展过程：

我国的印刷体汉字识别研究是从上世纪70年代末起步的，至今己有近三十年的发展历史，大致可以分成如下三个阶段:

1.探索阶段(1979一1985)

在对数字、英文、符号识别研究的基础上，自上世纪70年代末，国内就有少数单位的研究人员对汉字识别方法进行了探索，发表了一些论文，研制了少量模拟识别软件和系统。这个阶段漫长，成果不多，但是却孕育了下一个阶段的丰硕果实。

2.研制阶段(1986~1988)

1986年初到1988年底，这三年是汉字识别技术研究的高潮期，也是印刷体汉字识别技术研究的丰收期。总共有11个单位进行了14次印刷体汉字识别的成果鉴定，这些系统对样张识别能达到高指标:可以识别宋体、仿宋体、黑体、楷体，识别的字数最多可达6763个，字号从3号到5号，识别率高达99.5%以上，识别速度在286微机条件下能够达到10~14字/秒，但对真实文本识别率大大下降，这是由于以上系统对印刷体文字形状变化(如文字模糊、笔划粘连、断笔等)的适应性和抗干扰性比较差造成的。但是这三年研制的识别系统为印刷体汉字识别系统的实用化打下了基础，是识别系统从研制到实用化必经的过程。

3.实用阶段(1989一至今)

印刷体汉字识别自1986年掀起高潮以来，清华大学电子工程系、中国科学院计算所智能中心等多家单位分别研制并开发出了实用化的印刷体汉字识别系统。目前，印刷体汉字识别技术的研究热点已经从单纯的文字识别转移到了表格的自动识别与录入，图文混排和多语种混排的版面分析、版面理解和版面恢复，名片识别，金融票据识别和古籍识别等内容上。紫光文通推出的名片识别系统、身份证识别系统(e验通)和“慧视”屏幕文字图像识别系统等等新的识别系统的出现，标志着印刷体汉字识别技术的应用领域得到了广阔的扩展。

国家高技术研究发展“863”计划、国家重点科技攻关计划、国家自然科学基金和军事基础研究基金都对印刷体汉字识别这一研究课题予以极大的重视和大力的支持。目前，印刷体汉字识别和联机手写汉字识别走向实用化，其技术水平和当前世界最高水平并驾齐驱。

总结： 以上第一部分介绍我国OCR发展历程，从过程中可以发现，我国的光学字符识别研究相对国外起步较晚，但是发展十分迅速。从早期简单的单体识别发展到多种字体混合排列的多体识别，从中文印刷材料的识别发展到中英文混排印刷材料的双语言识别，目前各个系统都可以支持简、繁体汉字的识别，同时支持中，英，韩等多国文字的识别系统，对于简单版面可以进行效的定量分析，同时汉字识别率已经可以达到98%以上，以下第二部分将从不同字体展开对OCR技术描述。

OCR数据集分类

按输入方式分类

1.印刷体文字

2.手写体文字（由扫描仪输入/由手写板输入）
按识别字符集分类

1.英文，中文，日文，韩文等

2.中文及少数民族语言，常用各种字体

常规的OCR文字识别处理的过程包括：

1、图像输入、预处理：二值化图片、噪声去除、倾斜较正；

2、版面分析：把页面分为横排文本、竖排文本、表格、图片等不同区域，帮助字符切割、识别OCR；

3、设置语种：选择需要什么OCR语种的引擎程序；

4、输出结果：输出OCR识别结果为原版原样的优质文件；

二、传统印刷体文字识别

OCR技术的兴起便是从印刷体识别开始的，印刷体识别的成功为后来手写体的发展奠定了坚实的基础。印刷体识别的主要流程大致分为以下几个部分：图像预处理；版面处理；图像切分；特征提取、匹配及模型训练、匹配；识别后处理。

2.1 图像预处理

输入文本经过扫描仪进入计算机后，由于纸张的厚薄、光洁度和印刷质量都会造成文字畸变，产生断笔、粘连和污点等干扰，所以在进行文字识别之前，要对带有噪声的文字图像进行处理。由于这种处理工作是在文字识别之前，所以被称为预处理。预处理一般包括灰度化、二值化，倾斜检测与校正，行、字切分，平滑，规范化等等。

2.1.1灰度化

通过外设采集的图像通常为彩色图像，彩色图像会夹杂一些干扰信息，灰度化处理的主要目的就是滤除这些信息，灰度化的实质其实就是将原本由三维描述的像素点，映射为一维描述的像素点。转换的方式和规则有很多，在这里不详细介绍。

2.1.2 二值化

经过灰度处理的彩色图像还需经过二值化处理将文字与背景进一步分离开，所谓二值化，就是将灰度值(或者彩色值)图像信号转化成只有黑(l)和白(0)的二值图像信号。二值化效果的好坏，会直接影响灰度文本图像的识别率。二值化方法大致可以分为局部阈值二值化和整体阈值二值化。目前使用较多的日本学者大津提出的“大津法”

2.1.3倾斜校正

印刷体文本资料大多是由平行于页面边缘的水平(或者垂直)的文本行(或者列)组成的，即倾斜角度为零度。然而在文本页面扫描过程中，不论是手工扫描还是机器扫描，都不可避免地会出现图像倾斜现象。而倾斜的文档图像对后期的字符分割、识别和图像压缩等工作将产生很大影响。为了保证后续处理的正确性，文本图像进行倾斜检测和校正是十分必要的。

文本图像的倾斜校正分为手动校正和自动校正两种。手动校正，是指识别系统提供某种人机交互手段，实现文本图像的倾斜校正。自动校正，是指由计算机自动分析文本图像的版面特征，估计图像的倾斜角度，并根据倾斜角度对文本图像进行校正。

文本图像的倾斜检测方法有许多种，主要可以划分为以下五类:基于投影图的方法，基于Houhg变换的方法，基于交叉相关性的方法，基于Fourier变换的方法和基于最近邻聚类方法。

1.最简单的基于投影图的方法是将文本图像沿不同方向进行投影。当投影方向和文字行方向一致时，文字行在投影图上的峰值最大，并且投影图存在明显的峰谷，此时的投影方向就是倾斜角度。

2.Huogh变换也是一种最常用的倾斜检测方法，它是利用Hough变换的特性，将图像中的前景像素映射到极坐标空间，通过统计极坐标空间各点的累加值得到文档图像的倾斜角度。

3.Fourier变换的方法是利用页面倾角对应于使Fourier空间密度最大的方向角的特性，将文档图像的所有像素点进行Fourier变换。这种方法的计算量非常大，目前很少采用。

4.基于最近邻聚类方法，取文本图像的某个子区域中字符连通域的中心点作为特征点，利用基线上的点的连续性，计算出对应的文本行的方向角，从而得到整个页面的倾斜角。

三、手写体文字识别

手写体识别较印刷体识别难度较高，而在手写体识别中脱机手写体识别难度又比联机手写体识别高。这也是脱机手写体识别还未成功应用的主要原因。

联机手写体文字识别又被称为实时(或者在线)手写体识别，即:人在书写文字的同时，机器根据所书写文字的笔划、笔顺等特征进行识别。联机手写体文字识别是依靠电磁式或压电式等手写输入板来完成的，当用户使用光笔在输入板上写字的时候，光笔在板上的运动轨迹(板上的坐标)会被转化为一系列的电信号，这些电信号能够串行地输入到计算机中，从这些电信号我们可以比较容易地抽取笔划和笔顺的信息，从而进行文字识别。

脱机手写体文字识别又被称为离线手写体文字识别:由书写者预先将文字写在纸上，然后通过扫描仪转换成文字图像，再由计算机识别成相应文字。由于每个人书写习惯的不同，所以脱机手写体文字的类型是多种多样的，而且既便同一个人在不同情况下写出来的文字也会有变化，这些都给脱机手写体文字识别带来了巨大的困难。

脱机手写体文字识别处理流程和技术手段大致和印刷体识别相似，但是由于手写体随意性较大，因此对文字图像的行列切分、字切分带来了较大的困难，根据文种不同，切分的方法也有所不同，例如：在手写体蒙古文字中内蒙古大学的研究学者采用了一种基于字符外接多边形的寻找切分点的字切分算法，取得了不错的切分效果。

联机手写体识别的处理流程，主要是利用笔划顺序作为序列模型，加上字符结构特征、笔顺方向特征、笔画数量特征作为空间模型，的组合式模型，完成识别任务。

总结： 从上部分可以看出，传统的OCR识别主要基于图像处理（二值化、连通域分析、投影分析等）和统计机器学习（Adaboot、SVM），提取图片上的文本内容；用到的计算机视觉算法库主要有OpenCV、Halcon、VisionPro等，出于开源、多语言支持和方便易用的考虑，我们通常采用OpenCV进行开发。

四、OCR识别效果影响因素

1．图片：质量通常建议150dpi以上

建议扫描仪分辨率设置为300DPI规格的参数；手机拍照的话建议摄像头像素为500万像素以上的摄像头；

2．颜色：通常对彩色识别不好，黑白的图片较高

常规的传统的OCR识别要求为白底黑字或者浅底黑字；如果是彩色背景图片的文字则需要特殊的OCR识别程序，比如文通视频文字识别系统；

3．字体：

目前全世界范围内的OCR技术都是针对“宋体印刷字”的字形做识别库的,若是是手写识别率低。

4．程序：

好的OCR程序遇到好的图片，识别效果才会优秀；在这里推荐北京文通科技推出的OCR程序，包括OCR-SDK开发包产品、OCR技术识别文档APP产品等等。

记住：数据本身质量+数据预处理很重要！

传统OCR与深度学习OCR比较

传统OCR文字识别方法：基于图像处理（二值化、投影分析）和统计机器学习SVM等提取图片文本内容，使用OpenCV等。

Opencv可以参考我的这篇文章：https://blog.csdn.net/qq_36816848/article/details/123805173

基于深度学习的OCR文字识别方法：利用卷积神经网络自动提取图像特征且提取的特征鲁棒性更强、识别效果更好，因此近几年的ocr文字识别方法一般都基于深度学习实现。

五、深度学习OCR识别方法

深度学习介绍

计算机视觉是利用摄像机和电脑代替人眼，使得计算机拥有类似于人类的对目标进行检测、识别、理解、跟踪、判别决策的功能。计算机视觉的应用包括文字识别、图片分类、目标检测和图像质量评价等方向。

总结：深度学习的出现打破了传统机器学习主要依赖于人工进行特征，而在深度学习无需人们手动进行特征提取，由机器⾃动提取的很大程度上解决数据集处理过程的不便。以下对深度学习优缺点进行总结。

深度学习资料可参考我的这篇文章：https://blog.csdn.net/qq_36816848/article/details/122286610

卷积神经网络CNN

总结：此处CNN不做过多介绍，只需记住其两个重点：局部连接+权重共享
具体学习资料可以参考我的这几篇博客：https://blog.csdn.net/qq_36816848/article/details/121576741

1. CRNN+CTC

CRNN论文翻译：

CRNN论文翻译——中英文对照

CRNN介绍：

近几年来，CRNN在计算机视觉文本识别领域取得不错成果。CRNN是一种卷积循环神经网络结构，用于解决基于图像的序列识别问题，特别是场景文字识别问题。CRNN网络实现了不定长验证结合CNN和RNN网络结构，使用双向LSTM循环网络进行时序训练，并在最后引入CTC损失函数来实现端对端的不定长序列识别，

CRNN总结

CRNN网络结构包含三部分，从下到上依次为：
1.卷积层，使用深度CNN，对输入图像提取特征。
2.循环层，使用双向RNN（BLSTM）对特征序列进预测，输出预测标签（真实值）分布。
3.转录层，使用 CTC 损失，把从循环层获取的一系列
标签分布转换成最终的标签序列。

1.卷积层

卷积：提取图像特征池化：为了降维减少计算量

CRNN卷积层由标准的CNN模型中的卷积层和最大池化层组成，自动提取出输入图像的特征序列。与普通CNN网络不同的是，CRNN在训练之前，先把输入图像缩放到相同高度（图像宽度维持原样），论文中使用的高度值是32。

论文中该CNN结构输出的特征图大小为，若输入图片高度为32，宽度为100，则特征图的大小为（1， 24，
512）。这个结果可以认为图片从左到右被分割成了24块，每块大小的特征维度为512。
提取的特征序列中的向量是从特征图上从左到右按照顺序生成的，每个特征向量表示了图像上一定宽度上的特征，论文中使用的这个宽度是1,就是单个像素。特别强调序列的顺序是因为在之后的循环层中，先后顺序是LSTM训练中的一个重要参考量。

2.循环层
转录就是 RNN 对每个像素的预测转换为标签序列的过程。

CRNN的循环层由一个双向LSTM循环神经网络构成，预测特征序列中的每一个特征向量的标签分布（真实结果的概率列表），循环层的误差被反向传播，最后会转换成特征序列，再把特征序列反馈到卷积层，这个转换操作由论文中定义的“Map-to-Sequence”自定义网络层完成，作为卷积层和循环层之间连接的桥梁。

LSTM原理参考：LSTM原理介绍_GoAl的博客-CSDN博客

CRNN完整网络结构图：

从整个网络中可以看出，卷积层是由一系列的卷积、最大池化、批量归一化等操作组成，由标准的CNN模型中的卷积层和最大池化层组成，结构类似于VGG网络。

CRNN模型计算公式：

CRNN模型计算详细流程：

总结：CRNN文字识别方法在我的这篇文章中进行了详细介绍，可以供大家参考：https://blog.csdn.net/qq_36816848/article/details/121723891

2. CRNN+Attention(ASTER)

ASTER方法概述本文方法主要解决不规则排列文字的文字识别问题，论文为之前CVPR206的paper（Robust Scene Text
Recognition with Automatic Rectification，方法简称为RARE）的改进版。

主要思路

针对不规则文字，先矫正成正常线性排列的文字，再识别；
整合矫正网络和识别网络成为一个端到端网络来训练；
矫正网络使用STN，识别网络用经典的sequence to sequence + attention

方法框架和流程

方法ASTER全称为Attentional Scene TExt Recognizer with Flexible Rectification，包括两个模块，一个用来矫正（rectification network），另一个用来识别（recognition work），如下图所示。

模型结构总览

整体的模型架构以下三块：

TPS(Thin-Plate-Spline)：分为localization network和grid sampler，前者用于回归出控制点，后者用于在原图上进行网格采样；

encoder：卷积神经网络用的是resnet，语言模型使用的是BiLSTM，需要说明的是在后续的DTRB论文中语言模型会单独拆分出来，在这里还是和原论文保持一致；

decoder：使用的是基于bahdanau attention的decoder，这里用了两个LSTM decoder。一个从左到右，一个从右到左，进行双向的解码。

特征提取层

本文的特征提取层跟FAN一致，都是先经过resnet，然后经过双向的LSTM，最终得到形状为(B, W, C)的三维特征向量，其中B代表batch size, W是time steps，C是channels.比如说根据原文，当输入大小为(32, 100)时，输出就是(B, 25, 512)

总结：

ASTER在一般attention based的encoder-decoder基础上，加上了TPS作为矫正模块，可以部分缓解由于弯曲文字导致的识别不准确问题。后续也有不少论文是沿着这个方向进行改进的，比如说MORAN、ESIR等等。

CRNN+Attention详细学习可参考我的这篇文章：
https://blog.csdn.net/qq_36816848/article/details/123014991

总结：以上内容主要介绍传统OCR文字识别方法和基于深度学习OCR主流的两种文字识别方法，后续将继续对其进行补充，此章未完待续！

ATF：givc3的中断初始化配置流程 TrustZone_ #ARM中断 ATF arm开发 GIC ATF
前言前段时间不是在整gicv2吗？这个确实太老了。资料很少，但是gicv3的蛮多的，这里找到了一篇关于gicv3的中断的blog，我们一起来学习一下，相信通过前辈的文章一定有所收获，核心内存的内容链接我放在了文末。ATF在bl31中提供了GICv3驱动加载、bl31的中断处理、异常等级切换时中断路由信息配置以及GICv3相关的电源管理功能，由于电源管理功能与中断处理流程关联不大，在本文中不做详细分
【ARMv8 异常模型入门及渐进7 - GIC及安全中断介绍】主公讲 ARM #ARM64 System Exception 安全 arm linux
请阅读【嵌入式开发学习必备专栏Cache|MMU|AMBABUS|CoreSight|Trace32|CoreLink|GCC|CSH|Armv8/v9系统异常分析】文章目录1.1GIC(generalinterruptcontroller)介绍1.1.1GIC-V21.1.2GIC-V31.1.3GICv3中断分类1.1.4GICv3组成1.1.4.1Distributor详述1.1.4.2Re
AI Prompt 设计指南：从基础构建到高质量生成的全面解析网罗开发 AI 大模型人工智能 OpenAI 深度学习
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
用Ingress生成route，如何让生成route的insecureEdgeTerminationPolicy 的值为Allow RedCong Openshift k8s 云原生 kubernetes 云原生 openshift
对于此功能当前还没有实现，相关的新功能添加的Jiraticket如下：Annotatetheingresstocreatetheroutewiththespec.tls.insecureEdgeTerminationPolicysettoAllow目前已经实现的功能为termination，insecureEdgeTerminationPolicy目前未实现。apiVersion:networki
实现列表拖拽排序功能，可新增，可删除，拖住排序，draggable，dragstart，dragend，dragover，利用好这几个事件，完美实现拖拽功能 Sherry Tian javascript javascript 前端
你好呀，我是爱编程的Sherry，很高兴在这里遇见你！我是一名拥有十多年开发经验的前端工程师。这一路走来，面对困难时也曾感到迷茫，凭借不懈的努力和坚持，重新找到了前进的方向。我的人生格言是——认准方向，坚持不懈，你终将迎来辉煌！欢迎关注我，我将在这里分享工作中积累的经验和心得，希望我的分享能够给你带来帮助。文章目录前言效果展示功能说明新增：删除：拖拽排序：关键点：代码实现html（结构）css（样
【精选】基于RFCBAMConv与YOLOv8优化的杂草分割系统农业智能检测平台、深度学习图像分割与注意力机制融合杂草智能识别与分类系统、深度学习目标分割优化改、进型YOLOv8杂草图像分割系统程序员阿龙深度学习实战案例 Python精选毕业设计 YOLO 感受野注意力卷积图像分割与分类智能农业图像分析农业智能检测系统农作物生长环境监测
博主介绍：✌我是阿龙，一名专注于Java技术领域的程序员，全网拥有10W+粉丝。作为CSDN特邀作者、博客专家、新星计划导师，我在计算机毕业设计开发方面积累了丰富的经验。同时，我也是掘金、华为云、阿里云、InfoQ等平台的优质作者。通过长期分享和实战指导，我致力于帮助更多学生完成毕业项目和技术提升。技术范围：我熟悉的技术领域涵盖SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nod
公交智能调度系统的功能主要有哪些 yu_zheng5163 人工智能大数据
一、实时监控公交智能调度系统通过安装在公交车上的GPS设备，实时获取车辆的位置、速度、行驶方向等信息。系统将这些数据与公交线路、乘客需求等信息进行比对，以判断车辆是否按照预定路线行驶。如果发现异常情况，系统会立即发出指令，调整车辆行驶路线或停车。二、路线规划公交智能调度系统具备强大的路线规划功能。系统会根据实时交通状况、乘客需求、车辆位置等信息，为每辆公交车规划最佳行驶路线。同时，系统还会根据天气
NAS(Neural Architecture Search) 神经结构搜索 hxxjxw
Neuralarchitecturesearch(NAS)，神经结构搜索，是强化学习的一个重要应用方向，也是AutoML的一个非常火的研究方向.NAS的原理是给定一个称为搜索空间的候选神经网络结构集合，用某种策略从中搜索出最优网络结构
RTDETR融合[WACV 2024]的MetaSeg中的gmb模块今天炼丹了吗 RT-DETR涨点改进专栏 RT-DETR
RT-DETR使用教程：RT-DETR使用教程RT-DETR改进汇总贴：RT-DETR更新汇总贴《MetaSeg:MetaFormer-basedGlobalContexts-awareNetworkforEfficientSemanticSegmentation》一、模块介绍论文链接：https://arxiv.org/abs/2408.07576代码链接：https://github.com/
1.16学习总结 2401_89561082 学习
今天完成了P3395：路障。本题考查深搜，所以需要定义结构体，调用bfs函数从（1，1）开始进行深搜，，向四个方向进行扩展，每扩展一次就按顺序放下路障，深搜完判断是否到达终点，到达舒畅Yes，反之输出No，需要注意的是有多组数据，所以对每组数据深搜前要先对路障，路障坐标，队列初始化。#include#includeintm,head,tail;intbook[1001][1001];intnext
Redis动态热点数据缓存策略设计冰糖心158 redis 缓存 redis spring
Redis动态热点数据缓存策略设计1.热点数据识别机制1.1计数器方式@ServicepublicclassHotDataCounter{@AutowiredprivateRedisTemplateredisTemplate;//访问计数publicvoidincrementCounter(Stringkey){StringcountKey="counter:"+key;redisTemplate
MyBatis-增删改查操作&一些细节！！！525 mybatis java 数据库 mybatis spring boot
目录删除新增修改查询小结：删除功能需求：根据ID删除用户信息SQL：deletefromuserwhereid=5;Mapper接口方法（注意这里不是实现类）：/***根据id删除*/@Delete("deletefromuserwhereid=#{id}")publicvoiddeleteById(Integerid);编写单元测试方法进行测试@TestpublicvoidtestDeleteB
Java - 文字识别；示例代码基于SpringAI和国产大模型沈询-阿里 microsoft 机器学习人工智能后端
文字识别在Java开发中的应用在Java开发中，将图像中的文字进行识别能力被广泛应用于多种场景，比如自动审核图片内容、商品搜索分析等。过去，这类需求主要通过OCR（光学字符识别）技术来实现，但其对于复杂图像的处理效果往往不尽人意。如今，随着大模型技术的发展，利用这些先进的AI模型进行文字识别成为可能，不仅大大提升了识别精度和速度，还能更好地理解图像中的复杂信息，为用户提供更加准确可靠的服务。本文采
用python解决潍坊期末概率填空题可以证明. python 开发语言
题目：一个点从数轴的原点开始运动，通过投掷骰子决定运动方向：若出现1，4面之一时，向负方向移动1个单位；若出现2，3，5，6面之一时，向正方向移动2个单位，（1）投掷1次骰子，该点位置的平均值为（）（2）投掷6次骰子后，概率大于的点的位置存在的最小区间为（）答案：1，[3,9]importrandom#投掷骰子的模拟defroll_dice():returnrandom.randint(1,6)#
报错解决：undefined symbol: _ZN15TracebackLoggerC1EPKc, version libcudnn_ops_infer.so.8 打工人你好 python
搭建resemble-enhance这个项目的过程中，在Ubuntu20.04的机器上跑，报错如下：undefinedsymbol:_ZN15TracebackLoggerC1EPKc,versionlibcudnn_ops_infer.so.8这个错误是在NVIDIAGPU上使用PyTorch2.1.2和cuDNN12.1时使用torch.nn.Conv2d时出现符号查找错误，这意味着PyTor
6. NLP自然语言处理（Natural Language Processing）啊波次得饿佛哥 AI人工智能自然语言处理人工智能
自然语言是指人类日常使用的语言，如中文、英语、法语等。自然语言处理是人工智能（AI）领域中的一个重要分支，它结合了计算机科学、语言学和统计学的方法，通过算法对文本和语音进行分析，使计算机能够理解、解释和生成自然语言。随着深度学习技术的发展，NLP在文本分类、机器翻译、情感分析、对话系统等任务中取得了显著进展，推动了人工智能技术在多个领域的广泛应用。自然语言处理的核心任务涉及如何使计算机理解和处理语
人工智能在医疗领域的应用人工智能
人工智能在医疗领域的应用前景广阔。医疗机器人是其中之一，如智能假肢、外骨骼等可修复受损身体，IBM的达・芬奇手术系统等则能承担手术或医疗保健功能.智能药物研发借助深度学习技术，可快速准确挖掘筛选化合物或生物，缩短新药研发周期、降低成本、提高成功率，在心血管药、抗肿瘤药等研发中已取得突破.智能诊疗让计算机学习专家医疗知识，模拟思维和诊断推理，给出可靠诊断与治疗方案.智能影像识别可对医学影像进行图像识
【LeetCode】路径总和 III Seal^_^ 编程专栏 #LeetCode‌leetcode 算法二叉树数据结构 C语言
【LeetCode】路径总和IIITheBegin点点关注，收藏不迷路给定一个二叉树的根节点root，和一个整数targetSum，求该二叉树里节点值之和等于targetSum的路径的数目。路径不需要从根节点开始，也不需要在叶子节点结束，但是路径方向必须是向下的（只能从父节点到子节点）。示例1：输入：root=[10,5,-3,3,2,null,11,3,-2,null,1],targetSum=
深度学习每周学习总结R4（LSTM-实现糖尿病探索与预测）大地之灯每周深度学习总结深度学习学习 lstm 人工智能算法
本文为365天深度学习训练营中的学习记录博客R6中的内容，为了便于自己整理总结起名为R4原作者：K同学啊|接辅导、项目定制目录0.总结1.LSTM介绍LSTM的基本组成部分如何理解与应用LSTM2.数据预处理3.数据集构建4.定义模型5.初始化模型及优化器6.训练函数7.测试函数8.训练过程9.模型评估0.总结数据导入及处理部分：在PyTorch中，我们通常先将NumPy数组转换为torch.Te
应急救援路径规划中的蚁群算法与路径评价研究【附代码】拉勾科研工作室算法
数据科学与大数据专业|数据分析与模型构建|数据驱动决策✨专业领域：数据挖掘与清洗大数据处理与存储技术机器学习与深度学习模型数据可视化与报告生成分布式计算与云计算数据安全与隐私保护擅长工具：Python/R/Matlab数据分析与建模Hadoop/Spark大数据处理平台SQL数据库管理与优化Tableau/PowerBI数据可视化工具TensorFlow/PyTorch深度学习框架✅具体问题可以私
荣耀CEO赵明：端侧AI使能硬件普惠大众是责无旁贷的使命 ggtdfgfdg 人工智能
荣耀100图片6月26日，在上海世界移动通信大会(以下简称“MWC上海”)上，荣耀终端有限公司CEO赵明发表《AI共生时代，智能终端终将以人为中心赋能》主题演讲，首次向外界展示了两大突破性端侧AI创新：AI离焦护眼技术和AI换脸检测技术，对智能终端厂商如何用AI赋能个人给出最新思路。同时，赵明宣布荣耀MagicV3是集强大和轻薄于一身的里程碑意义产品，将再次挑战折叠轻薄新高度。“通过端侧AI使能硬
智创 AI 新视界 -- AIGC 背后的深度学习魔法：从原理到实践青云交 #智创 AI 新视界 #AIGC 1024程序员节 AIGC 人工智能文本生成图像生成未来展望深度学习
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
API接口设计的未来趋势：探索技术方向与实践方案
摘要随着技术的发展，API接口设计从最初的单一请求响应模式逐渐演化为多样化的架构模式和高效的传输协议。从REST到GraphQL，从API网关到服务网格，API接口设计正向着更高效、更安全、更可扩展的方向发展。本文将探讨未来API设计的新趋势，深入分析API网关和服务网格的应用场景及技术优势，并通过ArkUI和ArkTS实现简单的API交互示例。引言API（ApplicationProgrammi
2024 中国技术先锋年度评选正式启动！6 大奖项即将揭晓
前言中国技术先锋年度评选已走过十多个年头。从最早的TopWriter评选，到中国技术品牌影响力企业的揭晓，再到5年前首次推出的中国开源先锋33人评选，我们始终密切关注着数字经济的蓬勃发展。这些企业和个人为推动数字化、信息化和智能化进程作出了巨大贡献。面对不断变化的外部环境，他们深耕行业，信仰技术的力量，勇于创新，坚定践行技术理想。他们是改变世界方向的探索者，也是引领未来的技术先锋。SegmentF
论文高级GPT指令推荐 MaximusCoder gpt 网络人工智能
一、科研选题与方向确认二、文献综述与整理一、科研选题与方向确认头脑风暴选题指令：Brainstormpotentialresearchtopicswithin[你的研究领域],focusingonareaswithlimitedexistingresearchandsignificantpotentialimpact.Foreachtopic,provideaconciseexplanationo
大量美国网民涌入小红书；英伟达CEO黄仁勋本周将赴京沪深；小米澎湃OS发版提速 | 极客头条极客日报小红书小米澎湃OS 英伟达
「极客头条」——技术人员的新闻圈！CSDN的读者朋友们好，「极客头条」来啦，快来看今天都有哪些值得我们技术人关注的重要新闻吧。整理|苏宓出品|CSDN（ID：CSDNnews）一分钟速览新闻点！大量美国网民纷纷注册小红书，阿里美团饿了么等互联网公司争先在小红书招揽用户陶琳：特斯拉所有一线员工都可以上大学，不设门槛余承东回应智界系列方向盘轻：R7汽车支持随速助力转向，速度越快方向盘越重寒武纪：预计2
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动李蕾1229
为促进我校教师专业发展，发挥骨干教师的引领带头作用，11月6日下午，我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动。图片发自App会议由教师发展处李蕾主任主持，首先，由范校长宣读新老教师结对名单及双方承担职责。随后，两位新调入教师陈玉萍、莫正杰分别和他们的师傅鲍元美、刘召彬老师签订了师徒结对协议书。图片发自App图片发自App师徒拥抱、握手。有了师傅就有了目标有了方向，相信两位新教师在师
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag