吨吨不打野

PaddleOCR数字仪表识别——4. pipeline

写给自己：服务器上启动时，jupyter notebook和streamlit都要切换到py37的环境下启动

1. 考虑pipeline

我现在是只弄好了一个文字识别模型，需要调用现有的文字检测模型，来确定文字区域，把区域图片输入到文字识别模型中。

其实文档写得很清楚了，看看就知道了,主要有两个。
PaddleOCR中文说明文档

4.1 方式1 直接使用PaddleOCR包

前提：
安装whl包
pip安装

pip install paddleocr

不进行这步就会导致4.1.1的报错

参考paddleocr package使用说明。重点是：

单独执行检测这个部分

from paddleocr import PaddleOCR, draw_ocr
ocr = PaddleOCR() # need to run only once to download and load model into memory
img_path = 'PaddleOCR/doc/imgs/11.jpg'
result = ocr.ocr(img_path, rec=False)
for line in result:
    print(line)

# 显示结果
from PIL import Image

image = Image.open(img_path).convert('RGB')
im_show = draw_ocr(image, result, txts=None, scores=None, font_path='/path/to/PaddleOCR/doc/simfang.ttf')
im_show = Image.fromarray(im_show)
im_show.save('result.jpg')

4.1.1 报错 cannot import name ‘draw_ocr’ from ‘paddleocr’

这是因为之前的安装都是安装配置paddlepaddle环境，以及直接git上clone了PaddleOCR这个目录，但是并没有直接

pip install paddleocr

但是安装后，streamlit中依然报错，（右侧菜单栏选择 clear cache 没啥反应）

# 命令行输入
streamlit cache clear

显示已经清理完缓存了

切换到其他的jupyter文件中使用，显示可以import。

搜索paddleOCR和谷歌都没有发现相关的问题，应该是streamlit缓存的问题。。。重启下服务器和浏览器好了

重启后依然报错，将引用方式改为

import paddleocr
ocr = paddleocr.PaddleOCR()
im_show = paddleocr.draw_ocr(image, result, txts=None, scores=None, font_path='/path/to/PaddleOCR/doc/simfang.ttf')

出现新的错误如4.1.2 但是依然没有解决

查看 PaddleOCR文件夹下的 paddleocr.py文件，里面确实没有draw_ocr这个函数。

4.1.1.1 问题原因

问题所在

jupyter文件里可以正确引用是因为，在PaddleOCR文件夹外面，所以不会直接索引同级目录下的paddleocr，而负责streamlit的python脚本为了方便调用放在了PaddleOCR文件夹下，存在一个同名的paddleocr.py文件，所以需要明确修改引用的paddleocr的位置。

打印sys.path看一下(可以看到，第一个就是paddleOCR这个文件夹，也就是最先索引到的就是 PaddleOC文件夹下那个paddleocr.py文件（没有draw_ocr函数的）)

4.1.1.2 解决问题

这里就涉及到python导入模块搜索路径的优先级问题，参考：

关于Python导入模块的搜索路径以及优先级问题（Search path for python import module ）
Python引用自定义模块优先级
修改python搜索路径优先级有些复杂，考虑使用别的方式来实现。

直接把python脚本从PaddleOCR目录中移出去，就好了，记得把模型推理代码的路径也改了就好了。

4.1.1.3 隐患

我记得在进行checkpoint模型推理的时候，我就曾经把文件放在PaddleOCR文件夹外面，同时修改了代码里的模型推理执行路径，但是会报错。
但是很奇怪，在进行inference模型推理时，把文件放在外面修改路径就不会报错。

checkpoint模型报错（想要不报错就得把python脚本放到PaddleOCR文件夹里）：

os.system("python3 ./PaddleOCR/tools/infer_rec.py -c ./PaddleOCR/configs/rec/rec_icdar15_train.yml -o Global.checkpoints=./PaddleOCR/output/rec_CRNN/best_accuracy Global.infer_img=test.jpg 2>&1 | tee result.log")

X 4.1.2 ‘Namespace’ object has no attribute ‘use_pdserving’

根据相关的issue

Github-issue AttributeError: ‘Namespace’ object has no attribute ‘use_pdserving’
/home/PaddleOCR/ppocr/utils/ppocr_keys_v1.txt读取出错
之前安装的是 paddleOCR1.0.0版本，现在已经是1.1.0了。。。。

4.2 方式2 基于Python预测引擎推理

4.2.1 识别模型转inference模型

参考基于Python预测引擎推理可知：

inference 模型（fluid.io.save_inference_model保存的模型）一般是模型训练完成后保存的固化模型，多用于预测部署。
训练过程中保存的模型是checkpoints模型，保存的是模型的参数，多用于恢复训练等。
与checkpoints模型相比，inference 模型会额外保存模型的结构信息，在预测部署、加速推理上性能优越，灵活方便，适合与实际系统集成
所以最好把模型转成inference比较好。

与上面的一致，使用的模型是rec_mv3_none_bilstm_ctc，配置文件是rec_icdar15_train.yml，所以转换
识别模型转inference模型与检测的方式(直接从模型评估/推理的部分把命令行的config部分和checkpoint部分复制过来就好了)相同，如下：

# -c后面设置训练算法的yml配置文件
# -o配置可选参数
# Global.checkpoints参数设置待转换的训练模型地址，不用添加文件后缀.pdmodel，.pdopt或.pdparams。
# Global.save_inference_dir参数设置转换的模型将保存的地址。
python3 tools/export_model.py -c configs/rec/rec_icdar15_train.yml  -o Global.checkpoints=output/rec_CRNN/best_accuracy Global.save_inference_dir=./inference/rec_crnn/
# 默认PaddleOCR文件夹下没有inference的，./就是当前执行目录啊

运行结果如下：

转换成功后，在目录下有两个文件：

/inference/rec_crnn/
  └─  model     识别inference模型的program文件
  └─  params    识别inference模型的参数文件

4.2.2 基于CTC损失的识别模型推理

使用的模型是rec_mv3_none_bilstm_ctc，所以可以确定使用的ctc损失。。。或者翻翻上面的内容，确定是这个

参考 基于CTC损失的识别模型推理部分，第一步也是执行转换为inference模型（这步如果上面已经执行过则可以跳过，和上面一样的）
注意：如果训练时修改了文本的字典，在使用inference模型预测时，需要通过–rec_char_dict_path指定使用的字典路径

# 第一步
# -c后面设置训练算法的yml配置文件
# Global.checkpoints参数设置待转换的训练模型地址，不用添加文件后缀.pdmodel，.pdopt或.pdparams。
# Global.save_inference_dir参数设置转换的模型将保存的地址。

python3 tools/export_model.py -c configs/rec/rec_icdar15_train.yml  -o Global.checkpoints=output/rec_CRNN/best_accuracy Global.save_inference_dir=./inference/rec_crnn/

# 第二步
python3 tools/infer/predict_rec.py 
--image_dir="./test.jpg" 
--rec_model_dir="./inference/rec_crnn/"  #上一步转换后inference模型保存的地方
--rec_image_shape="3, 32, 200"  # 配置文件里也有
--rec_char_type="ch"  #这个要和自己配置文件里写得一样
--rec_char_dict_path="./ppocr/utils/num_dict.txt" # 配置文件里也有 都一致就好了

python3 tools/infer/predict_rec.py --image_dir="./test.jpg" --rec_model_dir="./inference/rec_crnn/" --rec_image_shape="3, 32, 200" --rec_char_type="ch" --rec_char_dict_path="./ppocr/utils/num_dict.txt"

执行结果（确实快了很多）：

然后也在streamlit上把这个模型执行命令换一下，确实执行的快了很多。

4.3 paddle保存模型的方式

关于Paddle保存模型方式的介绍，详细参见：分类预测框架

Paddle 的模型保存有多种不同的形式，大体可分为两类：

persistable 模型（fluid.save_persistabels保存的模型）一般做为模型的 checkpoint，可以加载后重新训练。persistable 模型保存的是零散的权重文件，每个文件代表模型中的一个 Variable，这些零散的文件不包含结构信息，需要结合模型的结构一起使用。
```
	resnet50-vd-persistable/
├── bn2a_branch1_mean
├── bn2a_branch1_offset
├── bn2a_branch1_scale
├── bn2a_branch1_variance
├── bn2a_branch2a_mean
├── bn2a_branch2a_offset
├── bn2a_branch2a_scale
├── ...
└── res5c_branch2c_weights
```
inference 模型（fluid.io.save_inference_model保存的模型）一般是模型训练完成后保存的固化模型，用于预测部署。与 persistable 模型相比，inference 模型会额外保存模型的结构信息，用于配合权重文件构成完整的模型。如下所示，model 中保存的即为模型的结构信息。
```
resnet50-vd-persistable/
├── bn2a_branch1_mean
├── bn2a_branch1_offset
├── bn2a_branch1_scale
├── bn2a_branch1_variance
├── bn2a_branch2a_mean
├── bn2a_branch2a_offset
├── bn2a_branch2a_scale
├── ...
├── res5c_branch2c_weights
└── model
```

为了方便起见，paddle 在保存 inference 模型的时候也可以将所有的权重文件保存成一个params文件，如下所示：

resnet50-vd
├── model
└── params

4.4 调整输出结果

4.4.1输入汉字区域，依然匹配到数字输出的问题

存在问题：

直接使用paddleocr这个wheel的文字检测模型，得到文字框范围很大。
检测模型会把所有的文字区域检测出来，但是识别模型只有10个数字，而且这个置信度还很高？？？所以有些英文都会被分配到中文

看一下，./PaddleOCR/tools/infer_rec.py看一下执行推理的文件是怎么写的，前面都是配置文件，后面有if else的地方是关键，我是用的ctc损失。

有一行代码：score = np.mean(probs[valid_ind, ind[valid_ind]])

4.5 小数点和非数字字符识别问题

4.5.1 小数点干扰

小数点会造成一定的干扰

4.5.2 非数字字符

这里采取了一个比较歪门邪道/很死的一个方法，只看最大的框

因为在实际现场放置摄像头的时候，肯定是设置一个框（就好像支付宝那些软件拍身份证一样，让实物靠近程序设置的那个框），争取让要识别的部分占摄像头画面的最大部分，所以这里只识别检测出的最大的框。
面积最大（最开始考虑的是宽最大。。。）

4.5.2.1 np.argpartition()函数

参考：

1.How do I get indices of N maximum values in a NumPy array?
2.A fast way to find the largest N elements in an numpy array

numpy从1.8开始，除了有找到最大值的值和索引的 max/argmax之外，还提供了找到前n大的值和索引 partition/argpartition ，函数说明

alist=[10,7,20,19,8,20]
nplist=np.array(alist)
ind = np.argpartition(nplist, -4)
# ind的值为：
> array([1, 4, 0, 3, 2, 5])
# 按照值从小到大的顺序返回 对应索引  7,8,10,19,20,20

ind = np.argpartition(nplist, -4)[-4:]
# 这样就返回了最大的四个数的索引

函数参数说明：

numpy.argpartition(a, kth, axis=-1, kind='introselect', order=None)[source]
a 要排序的array
kth 整数或者整数序列 
分区依据的元素索引。 第k个元素将处于其最终排序位置，所有较小的元素将在其之前移动，而所有较大的元素将在其后面移动。 分区中所有元素的顺序是不确定的。 如果提供了第k个序列，它将立即将它们全部划分到其排序位置。
kind{
     ‘introselect’}, 可选参数  
选择算法。 默认值为“ introselect”

此外，根据参考2中的一个回答，

argpartition进行的是部分排序，花费的时间是 O(n)而不是O(n)*log(n)

此外，还有另一个人给出了numpy和其他库相比，完成同样功能所花费时间的比较

所以，以后再遇到这个问题，就直接用numpy的argpartition就好了

4.5.2.2 返回列表中top n值对应索引

这里涉及到一个找到top n大元素索引的问题，大致代码：

def findMaxBox(rsList,num):
    """
    rsList 文字检测的结果 列表形式返回的每个框的四个点的坐标
    [[37.0, 2.0], [102.0, 2.0], [102.0, 32.0], [37.0, 32.0]]
    num top几大的框
    只比较高度（长度没有什么比较的价值 说明不了问题）
    可以自己改为面积最大
    """
    height=[]
    for i in rsList:
        oneHeight=i[2][1]-i[0][1]
        height.append(oneHeight)
    # height列表里的索引序号和 rsList的索引序号一致
    nplist=np.array(height)
	ind = np.argpartition(nplist, num*(-1))[num*(-1):]
	return rsList[ind]

4.6 改进方向

4.6.1 预处理

根据PaddleOCR课程直播视频中的讲解，对于模型的使用其实有预处理后处理这些步骤的，所以可以看看相关代码中是怎么处理的

参考：百度AI社区帖子——LED 显示屏数字识别

所以之前担心的本来底图就有数字的问题其实可以直接通过预处理处理掉，不会输入模型对模型造成干扰。

4.6.1.1 边缘提取提取文字

大致的代码

# 训练时模型接受的数据size是 [3,32,200]
import cv2
image = cv2.imread("2.png")

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blurred = cv2.GaussianBlur(gray, (5, 5), 0)
edged = cv2.Canny(blurred, 50, 200, 255)
# 由于streamlit只接受RGB/BGR的图像，所以转完之后还要转回去
color=cv2.cvtColor(edged,cv2.COLOR_GRAY2BGR)

# 进行颜色反转，使前景色黑色 背景白色
reverse=cv2.bitwise_not(edged)
color=cv2.cvtColor(reverse,cv2.COLOR_GRAY2BGR)

使用的训练数据大部分是前景色（文字的颜色）比背景色要深，这里换一下，把背景换成白色，字换成黑色好了。
参考：OpenCV之bitwise_and、bitwise_not等图像基本运算及掩膜

颜色反转后，效果果然好了很多（果然模型是完全遵循你给的训练数据的，所以测试的时候，尽量把测试数据也要往训练数据的样子里靠啊）

但是对于有些图，效果就不好（所以边缘提取还是针对那种图片边缘很清晰的，这种有干扰的就不太好使）

4.6.1.2 不进行边缘提取

上面的图，文字都是边缘，里面是空心的。。。。但是输入模型训练的图都是上面这样的。
所以不能进行边缘提取，要把图中的文字区域变成实心的
参考的:

Recognizing digits with OpenCV and Python
使用opencv进行数字识别

图片预处理部分的代码和说明，详见另一个博客 PaddleOCR数字仪表识别——图像预处理(python)

4.6.1.3 结论

所以PaddleOCR其实也就是直接训练，测试的时候也没有对图片进行预处理，所以还是要自己写预处理部分。

对于文字带背光，屏幕不发光的数字表，使用Osrtu效果会好
但是对于文字不发光，背景发光的数字表，直接输入原图的数字区域会更好
时刻牢记自己训练模型的数据长啥样。尽量让输入模型的测试数据和那个靠近就可以

4.6.2 数据

造出来的数据和实际检测的数据还是差的挺多的，还是要找一些不一样的数据。
虽然预处理之后输入模型的都是灰度图
关于数据部分的更新，已经更新到
OCR数字仪表识别——2.数据合成（制作假数据）及真实数据收集
这个博文里了

4.6.3 换模型

刚好发现有个数字表图片：上面都是宋体，第一次训练的时候没有训练到

重新产一次图片，重新训练，换个精度更高的模型。这个问题毕竟有小数点，比较复杂。

使用数码管字体和宋体查看小数点后，可以知道，数码管字体的小数点不会占一整格，而宋体字体的小数点会占一整格。所以小数点占位是根据字体的，而不是随便放的

检测模型：PaddleOCR自带的；识别模型：CRNN + ctc rec_mv3_none_bilstm_ctc 骨干网络 MobileNetV3
可以考虑使用其他模型，比如https://github.com/YCG09/chinese_ocr 文本检测：CTPN 文本识别：DenseNet + CTC

换个模型，步骤参考之前的博客PaddleOCR数字仪表识别——3.paddleocr迁移学习步骤重新来一遍。之前那个写的太乱了，重写了一个，参考

4.6.4 其他

4.6.4.1 模型转换

inference模型比checkpoint模型快

4.6.4.2 PIL Image和Opencv转换

尽量减少图片写入磁盘的操作，很费时（我的代码是使用PIL操作了crop，然后save之后再使用opencv imread 修改后确实快了一些）
根据Python PIL | Image.crop() method

根据PIL.Image.open和cv2.imread的比较与相互转换

 # PIL Image转换成OpenCV格式
img = Image.open(imagePath)
plt.imshow(img)
img = cv2.cvtColor(np.asarray(img), cv2.COLOR_RGB2BGR)

# OpenCV图片转换为PIL image
img = cv2.imread(imagePath)
img2 = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))

4.6.4.3 命令行输出重定向到变量

减少写入和读取日志的时间（由于调用推理语句是命令行完成的，所以导致结果也是直接打印在命令行中，前期是使用输出重定向 > 把输出结果不仅输出到命令行，还输出到一个文本文件中，然后再去文本文件里读取内容）
一开始以为无法实现的，搜索了一波，感谢大佬
python 调用系统命令，并将输出重定向,输出其结果至文件或者字符串变量
python 将命令行执行的屏幕输出赋值到out变量
Pipe subprocess standard output to a variable [duplicate]
Store output of subprocess.Popen call in a string

所以是可以实现的，我的代码也从原来的读写文件log变成，弄到变量里。节省了读写磁盘的时间

# 以前
import os
os.system('''python3 ./PaddleOCR/tools/infer/predict_rec.py --image_dir="./recoginze.jpg" --rec_model_dir="./PaddleOCR/inference/rec_crnn/" --rec_image_shape="3, 32, 200" --rec_char_type="ch" --rec_char_dict_path="./PaddleOCR/ppocr/utils/num_dict.txt" 2>&1 | tee result.log''')
resultLines=[]
with open('result.log','r') as f:
	resultLines=f.readlines()
	rs=resultLines[1].split(':')[-1]
	time=resultLines[2].split(':')[-1]
	predict_rs=rs.split(',')[0][2:][:-1]
	p=rs.split(',')[1][:-2]
	st.text('预测结果为：'+str(predict_rs))
	st.text("置信度为："+str(p))
	st.text("推理时间(s)："+str(time))

现在

或者

（run方法是 Popen和communicate二者的结合，参见4.6.4.4关于subprocess中三个方法的区别）
注意：一定要加如 shell=True，不然会报错传入的不是字符串或者是文件路径

这里第一项 python3是命令其余都是这个命令的参数

4.6.4.4 subprocess说明

关于subprocess，网上大多数都是转自Python模块整理(三)：子进程模块subprocess

除了Popen方法，还有一个call方法，还有个run，三者区别：

What is the difference between subprocess.popen and subprocess.run
What’s the difference between Python’s subprocess.call and subprocess.run
run方法返回了一个 CompletedProcess对象实例 https://docs.python.org/3/library/subprocess.html

HarmonyOS Next 企业级分布式办公应用实战：构建高效协同的办公新生态 lyc233333 harmonyos 分布式华为
在数字化办公浪潮汹涌的当下，企业对于高效、便捷且协同性强的办公应用需求愈发迫切。华为鸿蒙HarmonyOSNext系统凭借其先进的分布式技术，为打造创新型企业级分布式办公应用提供了坚实的基础。本文将基于实际开发经验，深入剖析如何利用HarmonyOSNext构建企业级分布式办公应用，涵盖从需求分析到系统架构搭建，再到核心功能实现以及性能优化等关键环节。一、办公应用需求与系统架构搭建（一）企业级分布
新建react native项目都失败，创建出来的都是.xcodeproj，而不是.xcworkspace，如何解决？？ bug菌¹ 全栈Bug调优(实战版)react native react.js javascript
本文收录于《全栈Bug调优(实战版)》专栏，主要记录项目实战过程中所遇到的Bug或因后果及提供真实有效的解决方案，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！全文目录：问题描述解决方案1.确保正确设置代理源（如果你在国内）2.手动安装CocoaPods依赖3.检查你的Ruby和CocoaPods环境4.尝试清理并重建项目5.查
计算机视觉技术探索：美颜SDK如何利用深度学习优化美颜、滤镜功能？美狐美颜sdk 美颜SDK 美颜API 直播美颜SDK 计算机视觉深度学习直播美颜SDK 美颜sdk 第三方美颜sdk 美颜api
时下，计算机视觉+深度学习正在重塑美颜技术，通过智能人脸检测、AI滤镜、深度美肤、实时优化等方式，让美颜效果更加自然、精准、个性化。那么，美颜SDK如何结合深度学习来优化美颜和滤镜功能？本文将深入解析AI在美颜技术中的应用，并探讨其未来发展趋势。一、深度学习如何赋能美颜SDK？1.AI人脸检测与关键点识别：精准捕捉五官在美颜过程中，首先需要精准检测人脸位置和五官特征点，确保美颜效果不会失真。深度学
对MCP工作流的一些个人认知持续学习的老赵人工智能
最近在学习MCP系统，虽尚未深入掌握，但已对其工作原理有了初步认识，在此分享下学习收获。MCP是一套能实现客户端、多种服务与大模型协同工作的系统，能处理任务请求并及时反馈。其工作流程如下：一、获取并更新服务使用方法（一）收集整理使用方法MCP正常运行依赖于对各类服务使用方法的了解，这要靠已在系统注册且可识别的功能模块。一旦有新模块注册或旧模块更新，系统会自动检测并获取其使用方法信息。MCP订阅服务
知汇云创myBuilder产品发布 #六脉神剑低代码
【入门初级篇】产品介绍v2·前言Hello，大家好，今天给大家介绍一下myBuilder渐进式低代码IDE软件。·产品定位与版本规划myBuilder是一款面向B端数字化领域的低代码开发工具、集成开发环境，具备高效、灵活的使用特点，设计的初心是让B端数字化变得更简单。myBuilder的主要开发套件以及基础功能，我们有专门的培训课程详细讲解，这里先不展开介绍，相信通过我们的教学视频讲解您会逐一发现
硅谷企业的大数据平台架构什么样？看看Twitter、Airbnb、Uber的实践大数据v 分布式数据库大数据编程语言 hadoop
导读：本文分析一下典型硅谷互联网企业的大数据平台架构。作者：彭锋宋文欣孙浩峰来源：大数据DT（ID：hzdashuju）01Twitter的大数据平台架构Twitter是最早一批推进数字化运营的硅谷企业之一，其公司运营和产品迭代的很多功能是由其底层的大数据平台提供的。图7-2所示为Twitter大数据平台的基本示意图。▲图7-2Twitter大数据平台架构Twitter的大数据平台开发比较早，很多
商品详情中除了价格和库存，还有哪些重要信息？数据小爬虫@ 大数据
在获取商品详情时，除了价格和库存，还有许多其他重要信息可以帮助我们更全面地了解商品。这些信息对于市场调研、数据分析、商品比较以及用户体验优化等都非常有价值。以下是一些常见的商品详情字段及其重要性：1.商品名称（Name）重要性：商品名称是用户识别商品的关键信息，也是搜索引擎优化（SEO）的重要部分。应用场景：用于展示商品、搜索优化、分类整理等。2.商品描述（Description）重要性：详细的商
实现物流行业数字化、智能化管理的新型模式的智慧物流开源了 AI服务老曹开源能源人工智能云计算安全
智慧物流视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，从而大大减少企业级应用约95%的开发成本。构建基于Ai技术的安全监管平台，可逐步实现智能化巡检，针对安全事故隐患进行有效监控预警，降低安全违规行为发生率，节省人工监管成本。用户只需在界面上进行简单的操作，就可以实现全视频的接入及
全流程数字化管理的智慧物流开源了 AI服务老曹开源科技生活人工智能自动化
智慧物流视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，从而大大减少企业级应用约95%的开发成本。构建基于Ai技术的安全监管平台，可逐步实现智能化巡检，针对安全事故隐患进行有效监控预警，降低安全违规行为发生率，节省人工监管成本。用户只需在界面上进行简单的操作，就可以实现全视频的接入及
车牌识别技术揭秘：如何用 C# 实现自动车牌识别系统威哥说编程 c#开发语言
车牌识别（LicensePlateRecognition，LPR）是一项计算机视觉技术，用于自动识别车辆的车牌号码。在实际应用中，车牌识别技术被广泛用于停车场管理、交通监控和安防系统等领域。实现车牌识别系统的关键步骤包括图像预处理、车牌检测、字符分割、字符识别等。C#中可以通过结合OpenCV、EmguCV、TesseractOCR等工具来实现车牌识别系统。一、所需工具和库EmguCV：这是一个封
PXI/PXIe控制器 4Link架构 16GB带宽兼容主流PXIe机箱设计文件原理图&PCB FPGA源码可直 FjtKvOwLaGa fpga开发架构
PXI/PXIe控制器4Link架构16GB带宽兼容主流PXIe机箱设计文件！！！原理图&PCBFPGA源码可直接制板PXI和PXIe技术在现代仪器仪表领域中扮演着重要角色。其中，PXI（PCIeXtensionsforInstrumentation）是一种基于PCI总线的测试和测量平台，而PXIe则是对PXI进行扩展和增强的新一代标准。在PXI和PXIe平台中，控制器是关键组件之一，而PXIPX
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析快撑死的鱼 Python算法精解 python 深度学习开发语言
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析在人工智能的众多应用领域中，手写数字识别是一项经典且具有重要实际应用价值的任务。随着深度学习技术的飞速发展，通过构建和训练神经网络模型，手写数字识别的精度已经可以达到99%以上。本文将以Python为主要编程语言，结合深度学习的核心技术，详细解析手写数字识别的实现过程，并探讨如何进一步优化模型以提高
【Java学习日记6】：字面量的分类与使用小蛋6g Java学习日记 java 开发语言
一、字面量的定义与作用字面量是程序中直接书写的数据值，无需通过变量或计算获取。它用于表示固定的值，如数字、字符、布尔值等，例如：数字100、字符串"Hello"、字符'A'等。字面量告诉编译器数据的类型和值。字面量就是告诉程序员:数据在程序中的书写格式.---二、字面量的分类Java中的字面量按数据类型可分为以下六类：类型说明示例整数类型不带小数点的数字123,-456小数类型带小数点的数字3.1
使用Three.js渲染器创建炫酷3D场景 Front_Yue 3D技术实践指南 javascript three.js 3d
引言在当今数字化的时代，3D图形技术正以其独特的魅力在各个领域掀起波澜。从影视制作到游戏开发，从虚拟现实到网页交互，3D场景以其强烈的视觉冲击力和沉浸式的体验，成为了吸引用户、传达信息的重要手段。而Three.js，作为一款功能强大且广受欢迎的JavaScript3D库，为我们提供了便捷、高效的途径来创建令人炫目的3D场景。本文将深入探讨使用Three.js渲染器创建炫酷3D场景的方方面面，带领读
动物识别系统代码python_动物识别系统__代码 weixin_39812065 动物识别系统代码python
1动物识别专家系统动物识别专家系统是流行的专家系统实验模型，它用产生式规则来表示知识，共15条规则、可以识别七种动物，这些规则既少又简单，可以改造他们，也可以加进新的规则，还可以用来识别其他东西的新规则来取代这些规则。动物识别15条规则的中文表示是：规则1：如果：动物有毛发则：该动物是哺乳动物规则2：如果：动物有奶则：该单位是哺乳动物规则3:如果：该动物有羽毛则：该动物是鸟规则4：如果：动物会飞，
动物识别系统代码python_动物识别系统代码 weixin_39862794 动物识别系统代码python
简易动物识别专家系统源代码（调试无错！）#includevoidbirds(){inta;printf("**************************************\n");printf("1.长腿，长脖子，黑色，不会飞。\n");printf("2.不会飞，会游泳，黑色.\n");printf("3.善飞\n");printf("4.无上述特征\n");printf("****
DNS污染：网络世界的“隐形劫持”与防御 dns劫持dns网络安全
在互联网的底层架构中，DNS（域名系统）如同数字世界的“导航员”，将用户输入的域名翻译成机器可读的IP地址。然而，DNS污染（DNSPoisoning）正像一场无声的“地址篡改”危机，威胁着全球网络的安全与稳定。本文将深入拆解DNS污染的技术原理、现实危害及应对策略，帮助个人与企业构建安全防线。一、DNS污染的本质：一场“地址簿”的篡改DNS污染，指攻击者通过技术手段向DNS服务器注入虚假的域名解
python动物识别系统(仅有识别功能) OnlySecondS
''@Time:2022/03/298:39@Author:11863@File:AIS_main.py@software:PyCharm'''rules={}#以字典形式存储#读取文件defreadRules():rulesFile=open("rules.txt","r",encoding='utf-8')forlineinrulesFile:#按行读取line=line.replace('I
云原生技术的风口来了！！ Real Man★ 云原生
云原生技术（Cloud-NativeTechnologies）是一种基于云计算架构设计和运行应用程序的方法，旨在充分利用云计算的弹性、可扩展性和敏捷性。它的核心思想是通过容器化、微服务、DevOps和持续交付等技术，构建高效、可靠且易于维护的应用系统。未来，云原生技术将继续演进，成为企业数字化转型的核心驱动力。云原生技术的核心组件容器化（Containerization）：使用容器（如Docker
视频管理平台：应急安全生产的坚实护盾智联视频超融合平台音视频安全人工智能视频编解码网络协议
在应急安全生产中，视频管理平台作为现代科技的重要组成部分，发挥着不可替代的作用。它不仅能够实时监测生产环境，还能在事故发生时提供关键信息，帮助企业快速响应、降低损失。以下是视频管理平台在应急安全生产中的具体作用：一、实时监控与风险预警1、全方位监控：通过部署高清摄像头，覆盖生产车间、仓库、设备区等关键区域，实现无死角监控，确保安全隐患无处遁形。2、智能分析：结合AI算法，自动识别异常行为（如人员违
如何通过Python实现自动化任务：从入门到实践小弟有话说1.0 python 自动化开发语言
在当今快节奏的数字化时代，自动化技术正逐渐成为提高工作效率的利器。无论是处理重复性任务，还是管理复杂的工作流程，自动化都能为我们节省大量时间和精力。本文将以Python为例，带你从零开始学习如何实现自动化任务，并通过一个实际案例展示其强大功能。一、为什么选择Python实现自动化？Python作为一种简单易学、功能强大的编程语言，已经成为自动化领域的首选工具。以下是Python在自动化中的几大优势
【ol-cesium】OpenLayers与Cesium的二三维联动不爱赖床的懒虫笔记前端 vue cesium openlayers 二三维联动
OpenLayers与Cesium的二三维联动本文主要介绍OpenLayers与Cesium二三维联动的实现过程，以及在实现的过程中所遇到的问题以及解决方法。研究二三维联动的动机是需要开发基于GeoServer地图服务器的地理场景可视化系统，其中涉及到对服务器中地理数据的展示与交互部分，同时在三维场景中展示数字高程与地表影像信息。地理场景可视化系统我后续也会站看介绍，感兴趣的读者可以关注我后续的博
FPGA基带平台射频数据处理装置及验证系统设计与方法 BE东欲
本文还有配套的精品资源，点击获取简介：FPGA在射频数据处理领域拥有灵活性和高性能，广泛用于通信、雷达、卫星导航等。本资料包重点介绍FPGA基带平台在数字信号处理中的应用，包括调制解调、滤波和FFT等任务。涵盖射频数据处理装置结构，验证系统设计和实施，以及相关工具的使用方法。为学习者提供实践经验和理论知识，助力开发高效可靠的通信系统。1.FPGA在射频数据处理中的应用数字信号处理（DSP）是现代电
基于FPGA的3U机箱温度采集板PT100，应用于轨道交通/电力储能等深圳信迈主板定制专家轨道交通 NXP+FPGA X86+FPGA fpga开发 arm开发架构人工智能
板卡简介：本板为温度采集板（PT100），对目标进行测温，然后将温度转换成处理器可识别的电流信号。性能规格：电源：DC5V，DC±15V4线制PT100：7路（标称测温范围-50℃~200℃，对应调理后电流4~20mA，精度±0.5℃）3线制PT100：1路（标称测温范围-50℃~200℃，对应调理后电流4~20mA，精度±0.5℃）尺寸：220mm*100mm*1.6mm重量：0.155kg工作
Pyhton 基础 368. python python 开发语言
初识PythonPython是一种解释型语言Python使用缩进对齐组织代码执行，所以没有缩进的代码，都会在载入时自动执行数据类型：整形int无限大浮点型float小数复数complex由实数和虚数组成Python中有6个标准的数据类型：Number(数字)String(字符串)List(列表)Tuple(元组)Sets(集合)Dictionart(字典)其中不可变得数据：Number(数字)St
用Python修改Word文档字体
在数字化办公场景中，Word文档作为主流文件格式承载着大量商务文书与学术资料。传统手动调整字体格式的操作模式存在显著局限性：当面对批量文档处理、动态内容生成或企业级模板维护时，逐一手工修改不仅效率低下，更难以保障格式规范的统一性。通过Python实现文档字体的程序化控制，能够有效构建自动化处理流程，在确保排版精准度的同时，显著提升文档批量化操作能力。本文将介绍如何使用Python修改Word文档段
Ark-TS 语言：鸿蒙生态的高效开发利器，让我们用大白话说一说 harmonyos-next
Ark-TS（华为专门为鸿蒙系统——就是华为自己的手机、平板、智能设备操作系统——设计的编程语言，基于TypeScript，一种比普通JavaScript更严格、能减少错误的语言）是鸿蒙应用开发的主力工具。它就像给开发者配备了一套趁手的工具包，让写代码又快又稳。简单来说，Ark-TS有几个厉害的地方：静态类型检查（写代码时必须给变量指定类型，比如数字、文字，这样电脑能在运行前就发现类型错误，避免程
《深入剖析鸿蒙生态原生应用：一次开发多端部署的技术革新》人工智能深度学习
在数字化时代飞速发展的浪潮中，鸿蒙生态以其独特的技术理念和强大的创新能力，为开发者和用户带来了全新的体验。其中，“一次开发多端部署”作为鸿蒙生态原生应用开发的核心技术之一，不仅是技术上的重大突破，更是对未来应用开发模式的一次深刻变革。鸿蒙生态：全场景时代的新引擎鸿蒙操作系统自诞生以来，就肩负着连接万物、构建全场景智能生态的使命。在传统的应用开发模式下，开发者需要针对不同的终端设备，如手机、平板、电
通过ITIL4课程助力业务创新，提升IT服务管理 - ITIL认证 itil
在全球数字化转型的浪潮中，IT服务管理（ITSM）已成为每个企业不可或缺的核心组成部分。无论是优化现有IT流程，还是推动技术创新，ITIL4（InformationTechnologyInfrastructureLibrary4）都为企业提供了一套完整的最佳实践框架。通过ITIL4，企业能够提升服务质量，降低运营成本，并推动业务增长。对于个人而言，掌握ITIL4框架不仅能提升技术能力，还能助力其职
10.2 如何解决从复杂 PDF 文件中提取数据的问题？墨染辉大语言模型 pdf
10.2如何解决从复杂PDF文件中提取数据的问题？解决方案：嵌入式表格检索解释：嵌入式表格检索是一种专门针对从复杂PDF文件中的表格提取数据的技术。它结合了表格识别、解析和语义理解，使得从复杂结构的表格中检索信息成为可能。具体步骤：表格检测和识别：目标：在PDF页面中准确地定位和识别表格区域。方法：使用计算机视觉和深度学习技术，如卷积神经网络（CNN）或其他先进的图像处理算法。效果：能够检测出页面
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><