YXLiii

CTW数据集使用

笔者在使用CTW数据集进行街景文字检测与识别，为了让自己更好地理解，将使用过程记录下来，包含原作者的文档说明和笔者使用过程中遇到的问题及解决方案。笔者也是初学者，不保证完全正确，可能存在疏漏或者问题，欢迎批评指正。另文章未完，会继续更新。

数据准备
- 文件内容介绍
- 下载图像和注释
- 数据分割
文字识别
- 分类网络框架
- 训练网络
- - 数据训练前处理
  - 运行train.py
端到端文字检测与识别
- 架构
- - 训练步骤
  - - 编译Darknet并下载预训练模型
    - 设置类别数目
    - 裁剪图像生成meta 文件

数据准备

下载图像和注释数据链接: https://ctwdataset.github.io/.
git工程链接: https://github.com/yuantailing/ctw-baseline.
注意：所有代码运行环境要求尽量满足python>=3.4
下载git工程时，科学上网（挂梯子）会更快一些。
如果使用git命令下载git工程，需要先下载git并安装。参考链接: https://blog.csdn.net/Andone_hsx/article/details/87937329.

文件内容介绍

tutorial/: 教程，也是本文的参考来源
data/: 图像（images）和注释（annotations）数据，需要下载解压放到此文件夹中
prepare/: 准备数据集拆分
classification/: 使用tensorflow分类的baseline,也就是文字识别，将每个字看成一类，因此文字识别也是分类问题
detection/: 使用YOLOv2进行文字检测，这是一个端到端的文字检测和识别模型
judge/: 评估测试结果，并绘制结果和统计数据
pythonapi/: api用于遍历注释，评估结果，或用于通用用途
cppapi/: 更快地实现检测AP评估
codalab/: 在CodaLab(我们的评估服务器)上运行
ssd/: 使用SSD的检测方法

以上的大多数文件夹中都包含一下文件
/settings.py: 配置图像目录、注释的文件路径，以及每个步骤的专用配置
/products/: 存放临时文件、日志、中间结果、最终结果
/pythonapi: 一个指向pythonapi/的符号链接，以便更方便地使用Python API

大多数代码使用python语言，少量使用C++，Shell等。
我没有用过Shell，百度了一下：Shell 是一个用 C 语言编写的程序，它是用户使用 Linux 的桥梁。Shell 既是一种命令语言，又是一种程序设计语言。Shell 是指一种应用程序，这个应用程序提供了一个界面，用户通过这个界面访问操作系统内核的服务。业界所说的 shell 通常都是指 shell 脚本，但读者朋友要知道，shell 和 shell script 是两个不同的概念。

所有的代码，应该在子文件夹下运行。
教程中所给运行代码示例，应该是在linux系统中运行，Windows的话，就打开cmd，先使用cd命令到文件所在的文件夹下，再使用“python3 文件名.py ”运行文件。
所有的代码不会在CTW根文件夹之外创建新的文件。

安装需求

git>=1
Python>=3.4
Jupyter notebook>=5.0
gcc>=5 安装教程链接: http://www.manongjc.com/article/23844.html.
g++>=5
CUDA driver
CUDA toolkit>=8.0
CUDNN>=6.0
OpenCV>=3.0 我的版本是4.5.2
以下可直接使用“pip install 库名称”命令安装
Jinja2
matplotlib 我的版本是3.1.0
opencv-python
scikit-image
scipy
six
tensorflow-gpu>=1.4.0rc0

硬件需求
RAM >= 32GB
GPU memory >= 12 GB
Hard Disk free space >= 200 GB
CPU logical cores >= 8
Network connection
我没有这么好的硬件，不知道能不能跑起来啊

下载图像和注释

下载图像和注释数据链接: https://ctwdataset.github.io/.
下载后

解压图像文件，放在$CTW_ROOT/data/all_images文件夹下，我下载的每一个压缩包解压都显示文件损坏，但还是有图像可以用的，暂时没管。
下载注释文件，解压放在$CTW_ROOT/data/annotations/downloads下。
为了测试和分析本地代码，可以使用验证集和测试集测试，运行/prepare/fake_testing_set.py。
运行报找不到pythonapi模型的错误，原因是没有将该目录设置为环境变量，解决方案：右键make_directory as–>sources path或sources root。
建文件夹TRAIN+VAL ( $CTW_ROOT/data/images/trainval/) TEST($ CTW_ROOT/data/images/test/) set

数据分割

将数据分割成四部分：

训练集（75%）
数据格式：
每张图像包含若干个lines，每个lines包含若干个文字示例（character instances），每个文字示例包含：对应的文字，文字框，6个属性（遮挡属性、复杂背景属性、扭曲属性、凸起属性、艺术字属性和手写属性）。
需要注意，仅标注出了图像中的全部中文，非中文只有部分标注，因此只适用于中文检测和识别。
验证集（5%）
与训练集一样
文字识别测试集（10%）
这里的数据集中，图像和注释中的文字框是可用的，但是对应中文、属性是不可用的。
To evaluate your results on testing set, please visit our evaluation server.
端到端文字检测与识别测试集（10%）
只有图像是可输入的数据。

文字识别

代码主要在classification文件夹下。

分类网络框架

原作者使用Tensorflow训练网络，笔者打算使用pytorch
对每个字：
1、裁剪
2、随意调整饱和度、亮度、对比度
3、随意仿射变换
4、标准化
5、输入大小调整
6、输入训练网络

训练网络

数据训练前处理

1、setting.py文件内可以修改最终结果的类型数据，当前1000的含义是我们只考虑最常见的1000个字符类别的识别。我们放弃承认其他类别，这必然导致这些类别的失败。

在import settings时，发现settings下标红色波浪线，原因是没有将该目录设置为环境变量，解决方案：右键make_directory as–>sources path或sources root。

2、decide_cates.py 对字出现的频率进行排序，并保存在products/cates.json。
3、create_pkl.py 对文字区域进行裁剪，并且有四边形框调整，保存在products/*.pkl
4、在这里报了许多错误，主要是因为我下载的数据集压缩包损坏，解压出来缺失了很多图片。
解决方案：在读取文件之前，加入一个判断文件是否存在的命令，load_train函数修改以后如下所示。

    def load_train(i):
        if i % 100 == 0:
            print('trainval', i, '/', len(lines))
        anno = json.loads(lines[i].strip())
        image_path = Path(os.path.join(settings.TRAINVAL_IMAGE_DIR, anno['file_name']))
        if image_path.exists():
            image = imageio.imread(image_path)
            assert image.shape == (anno['height'], anno['width'], 3)
            for char in anno_tools.each_char(anno):
                if not char['is_chinese']:
                    continue
                cropped = crop(image, char['adjusted_bbox'])
                train[i].append([cropped, char['text']])

load_test函数同样：

    def load_test(i):
        if i % 100 == 0:
            print('test', i, '/', len(lines))
        anno = json.loads(lines[i].strip())
        image_path = Path(os.path.join(settings.TRAINVAL_IMAGE_DIR, anno['file_name']))
        if image_path.exists():
            image = misc.imread(image_path)
            assert image.shape == (anno['height'], anno['width'], 3)
            for char in anno['proposals']:
                cropped = crop(image, char['adjusted_bbox'])
                test[i].append([cropped, None])

运行train.py

1、文件中集成了多个网络模型，根据自己的需要，可以在classification/train.py中修改cfgs，笔者使用的是inception_v4，不用修改原程序，只需要在运行的时候指定模型名称就可以了。
2、脚本输出会存放在classification/products/下，并且会需要较长的时间。作者给出了时间参考：
Time cost estimation (NVIDIA GTX TITAN X):
alexnet_v2: 0.2 sec / step, 6 hours in total
resnet_v2_152: 1.2 sec / step, 33 hours in total
others: 1.0 sec / step, 28 hours in total
3、训练后可以查看/classification/products/train_logs_alexnet_v2/的训练日志，作者给出了查看代码：

tensorboard --logdir=../classification/products/train_logs_alexnet_v2/

4、作者给的一些建议
如果training step变得越来越慢(例如，> 2 sec / step)，你可以按Ctrl+C来中断它，执行sudo sh -c "echo 3 >/proc/sys/vm/drop_caches"来删除缓存，然后重新运行train.py。它将自动从最近的检查点恢复训练。

我们每1200秒保存一次检查点，这个神奇的数字在classification/train.py中的cfg_common中的save_interval_secs中设置。不要将它与其他内存密集型应用程序一起运行。

如果你得到一个CUDNN_STATUS_BAD_PARAM错误，你可以在classification/train.py中关闭per_process_gpu_memory_fraction。

在培训resnet_v2_152时，tensorflow可能同时运行training step和summary step，导致run out of memory (OOM)。你可以在classification/train.py的cfgs中设置save_summaries_secs为无穷大(例如999999)来禁用总结步骤。

您可以从源代码更新TensorFlow-Slim，但请保留我们定制的修改slim/train_image_classifier.py和slim/eval_image_classifier.py。

5、我在运行的时候又又又又报错了

主程序第一行 “sys.argv[1]”报错，参考链接: https://www.cnblogs.com/aland-1415/p/6613449.html.
所以这个程序需要关掉在命令行中运行

!cd ../classification && python3 train.py inception_v4

事实上，我在运行的时候，需要把python3 改成python来运行，用python3没有反应。

然后又报了没有inception_v4模型
原作者提供了模型检查点文件的下载网站，我也下了inception_v4的检查点，但不知道怎么用，需要学习一下。
在nets文件夹中，作者提供了各网络的架构，只要从nets文件夹讲inception_v4 import进来即可。
又报了AssertionError，是断言错误，逐渐看不懂，于是分析一下整个代码，还是没能明白问题在哪。
module ‘tensorflow’ has no attribute ‘contrib’，参考链接: https://www.codenong.com/cs106147741/.
Could not load dynamic library ‘cudart64_110.dll’; dlerror: cudart64_110.dll not found
解决方案，重新安装了tensorflow-gpu参考链接: https://blog.csdn.net/FriendshipTang/article/details/113573114.
下载cudart64.110.dll文件，参考链接: https://blog.csdn.net/weixin_43786241/article/details/109203995.
[TensorFlow] 运行报错——Ignore above cudart dlerror if you do not have a GPU set up on your machine.
报错原因：cuda、cudnn、tensorflow版本问题，不能乱装。电脑好久之前装的cuda，都不记得版本了，tensorflow安装的时候没太在意版本，导致现在出错了。新手注意电脑的GPU、CUDA、CUDNN、tensorflow版本都是需要对应的。
解决方案：
1、查看CUDA版本
nvcc --version

2、TensorFlow-GPU与CUDA cudnn Python版本关系：
链接: https://tensorflow.google.cn/install/source_windows?hl=en#gpu.

笔者这里对应的tensorflow直接安装tensorflow_gpu-1.15.0，因为之前也报了 ‘tensorflow’ has no attribute 'contrib’错误，说是tensorflow2没有contrib包，所以还是安装tensorflow1方便。
如果已经安装过tensorflow，需要将之前的卸载

pip uninstall tensorflow-gpu

并且找到安装包的位置，我的在E:\anaconda3\Lib\site-packages下，将有关tensorflow和tensorboard的文件夹删除。再重新安装

pip install tensorflow-gpu==1.14.0

报了FutureWarning: Passing (type, 1) or ‘1type’ as a synonym of type is deprecated;错误，经查询是numpy版本错误，应该降低numpy版本，我又查找了numpy和tensorflow对应的版本，我应该安装1.16.0版本。

查询当前numpy版本
在python中输入

import numpy
numpy.__version__

输出显示我当前的版本是1.18.5
重装代码

pip install -U -i https://pypi.tuna.tsinghua.edu.cn/simple numpy==版本

U 是重装
i https://pypi.tuna.tsinghua.edu.cn/simple 是使用清华镜像

报错“list index out of range”，问题出在语句
cfg_model = list(filter(lambda o: o['model_name'] == model_name, cfgs))[0]
翻来覆去看也没发现什么问题这句，我没有耐心了，先看端到端文字检测与识别。

端到端文字检测与识别

架构

使用的是YOLOv2网络，这次是设置输出1001类，前一千个常见文字和一个其他类。

训练步骤

编译Darknet并下载预训练模型

这里很迷惑，不明白为什么突然讲起了darknet，看了教程很久，最后百度了一下darknet才知道，原来darknet是一个小众的深度学习框架，而且是基于YOLO的框架。我知识面有限，对深度学习的框架认识仅限于pytorch、tensorflow、caffe、keras，所以耽误很长时间。

该框架还是有一些独有的优点：
1.易于安装：在makefile里面选择自己需要的附加项（cuda，cudnn，opencv等）直接make即可，几分钟完成安装；
2.没有任何依赖项：整个框架都用C语言进行编写，可以不依赖任何库，连opencv作者都编写了可以对其进行替代的函数；
3.结构明晰，源代码查看、修改方便：其框架的基础文件都在src文件夹，而定义的一些检测、分类函数则在example文件夹，可根据需要直接对源代码进行查看和修改；
4.友好python接口：虽然darknet使用c语言进行编写，但是也提供了python的接口，通过python函数，能够使用python直接对训练好的.weight格式的模型进行调用；
5.易于移植：该框架部署到机器本地十分简单，且可以根据机器情况，使用cpu和gpu，特别是检测识别任务的本地端部署，darknet会显得异常方便。

这里对darknet的介绍参考链接，可以说是超级详细: https://blog.csdn.net/u010122972/article/details/83541978.
Darknet yolov3 Makefile文件解析链接: https://blog.csdn.net/u012435142/article/details/82957892.

初始化git子模块，这里意思是在当前git项目中使用darknet模块，将darknet模块称为子模块（submodule），可以将darknet仓库当作当前ctw仓库的一个子目录。可以手动下载darknet项目，下载地址在$CTW_ROOT/.gitmodules中，下载后放在detection/darknet文件夹下。
下载后编译
这里需要用到gcc 和g++，确保已经安装，打开cmd，更改目录到detection/darknet，试运行make -j8。
此处如果报错“不是内部或外部命令…”，可以查看自己的gcc和g++的环境变量是否配置正确，并在bin文件夹下寻找make编译程序文件。
例如我安装gcc后，在mingw64/bin文件夹下，发现编译程序的文件名是mingw32-make,因此将命令改为
mingw32-make -j8
原作者使用的是make。make是Linux下的一个命令工具，是一个解释makefile中指令的命令工具。它可以简化编译过程里面所下达的指令，当执行 make 时，make 会在当前的目录下搜寻 Makefile (or makefile) 这个文本文件，执行对应的操作。make 会自动的判别原始码是否经过变动了，而自动更新执行档。

预训练的yolov2权重下载链接: https://ctwdataset.github.io/.

设置类别数目

python3 decide_cates.py

可在setting.py中设置输出最常见的1000个类别，保存至products/cates.json中。

裁剪图像生成meta 文件

Canvas资源宝典：全面探索HTML5 Canvas技术支然苹
Canvas资源宝典：全面探索HTML5Canvas技术awesome-canvasAcuratedlistofawesomeHTML5Canvaswithexamples,relatedarticlesandposts.项目地址:https://gitcode.com/gh_mirrors/aw/awesome-canvas一、项目介绍项目概述awesome-canvas是由RaphaëlMor
探索创新：CanvasParticles - 点燃你的网页动态效果柏赢安Simona
探索创新：CanvasParticles-点燃你的网页动态效果去发现同类优质开源项目:https://gitcode.com/是一个开源的JavaScript库，专注于在HTML5Canvas上创建引人入胜的粒子动画效果。如果你是Web开发者，正在寻找一种方法为你的网站增添独特的视觉吸引力，那么这个项目绝对值得你深入了解。项目简介CanvasParticles提供了一套简洁而强大的API，让你能够
探索Coco-Web：一款强大的H5创作工具岑晔含Dora
探索Coco-Web：一款强大的H5创作工具去发现同类优质开源项目:https://gitcode.com/是一个开源的、基于Web的H5（HTML5）创作平台，旨在让开发者和设计师能够轻松地创建互动式的内容和应用。通过其直观的界面和丰富的功能，无论你是编程高手还是初学者，都能够利用Coco-Web制作出富有吸引力的数字内容。技术分析Coco-Web基于现代Web技术构建，包括：React.js:
探索CoreHTML5Canvas：创作动态Web图形的新工具郁英忆
探索CoreHTML5Canvas：创作动态Web图形的新工具去发现同类优质开源项目:https://gitcode.com/是一个强大的JavaScript库，专为开发者设计，旨在简化和增强在Web上创建交互式和动画图形的能力。这个项目利用HTML5Canvas元素，提供了一个简洁且高效的API，让开发人员可以轻松地构建出丰富的2D渲染效果。技术分析HTML5Canvas是HTML5的一个重要特
Sijia_y的个人经历以及计算机行业发展 Sijia_y python
如今互联网发展的速度甚是快，以至于技术都在更新迭代。稍有不注意可能就会被淘汰甚至是替代。作为一名中专生，我的成绩也是很差。因为高中考不上的缘故，来到了江苏上学。计算机行业我了解的并不是很多，当时只是听说工资高，铁饭碗。我是一个很懒的人，也是很贪玩。并没有学习很高的兴趣。我接触编程语言，完全是因为我的朋友。因为他是自学C语言的，后面他参加比赛得奖了。我就觉得非常厉害。我就开始学习Python，学会一
selectdataset 发布2024最热门Top100数据集数据集
遇见数据集索引了国内外的大部分网站。首页有最新的数据集推荐：GitHub、HuggingFace、arXiv这些热门站点，都属于日级别的更新。这个站点是从搜索引擎方面去监控最新的数据集，大家如果有关注某个一个特点领域或话题的更新，可以关注这个站点：遇见数据集-让每个数据集都被发现，让每一次遇见都有价值。遇见数据集，领先的千万级数据集搜索引擎，实时追踪全球数据集，助力把握数据要素市场。https:/
为什么Python使用者远远大于perl perlpython
不认为两者的语法差异是造成如此局面的主要原因.perl的语法虽然比较特立独行,但也不是很难.总结如下原因:library(或者叫package)的使用如果是本语言原生的library,那没有问题.如果是需要调用外部函数/过程的package的话,那么就会有巨大的差异.python是预编译然后从pypi上下载python(pip)将package下载到本地然后解压后将package内容安装到不同的指
AI 问答系统实战：用 Python + Flask + LLM 打造你的智能对话机器人！ Leaton Lee 人工智能 python flask
开篇互动：你是否想拥属于自己的AI问答机器人？“你是否想过拥有一个可以随时为你解答问题、提供建议的AI助手？”随着大语言模型（LLM）的快速发展，打造一个智能问答系统已经成为可能！本文将手把手教你如何利用Python和Flask快速搭建一个属于自己的AI问答系统，并集成强大的语言模型（如OpenAI的GPT-3.5或HuggingFace的LLaMA）。无论是技术小白还是有一定经验的开发者，都能轻
高斯Splatting：3D 重建与新视图合成的综述三谷秋水人工智能机器学习计算机视觉计算机视觉人工智能深度学习
24年5月来自挪威大学的论文“GaussianSplatting:3DReconstructionandNovelViewSynthesis,aReview”。基于图像的3D重建是一项具有挑战性的任务，涉及从一组输入图像中推断出目标或场景的3D形状。基于学习的方法因其直接估计3D形状的能力而备受关注。这篇论文重点介绍3D重建的最新技术，包括生成新的、未见过的视图。高斯Splatting方法的最新发
golang中使用mysql事务彩色代码 Golang编程语言 MySQL数据库 mysql golang 数据库
在Go语言中，可以使用第三方库来处理MySQL事务。在示例中，我们将使用database/sql包与github.com/go-sql-driver/mysql驱动程序来连接和执行MySQL数据库操作。首先，确保你已经安装了相应的依赖库。你可以使用以下命令来安装它们：goget-udatabase/sqlgoget-ugithub.com/go-sql-driver/mysql接下来，我们将演示一
入坑 Python 全能实战小白训练营，470 集干货 12.9G 大揭秘！七七知享 Python python 开发语言 pandas numpy matplotlib java php
家人们，我最近挖到了一个Python学习的宝藏——Python全能实战小白训练营。整整470集，内容超丰富，资源包有12.9G，完全就是为咱们这些想系统学习Python的小白量身定制的。接下来就给大家好好唠唠。随着课程深入，会涉及到Python的各种高级特性，比如面向对象编程、模块与包的使用。在讲面向对象编程时，老师通过打造一个小型游戏角色系统，把类、对象、继承、多态这些抽象概念诠释得生动形象，让
PyCharm 对接 DeepSeek 大模型的详细操作流程程之编 pycharm ide python
以下是使用PyCharm对接DeepSeek大模型的详细操作流程，基于Python开发环境。假设你已具备DeepSeekAPI的访问权限（需提前申请APIKey）：步骤1：PyCharm环境准备创建新项目打开PyCharm→NewProject→选择纯Python项目→指定项目路径→创建虚拟环境（建议选Virtualenv）。安装依赖库打开终端（Terminal）执行以下命令：pipinstall
DeepSeek与剪映短视频创作指南 meisongqing 人工智能 DeepSeek 剪映
DeepSeek（深度求索）作为一家专注实现AGI的中国公司，其技术可能涉及AI文本生成、图像处理等领域，结合剪映的智能剪辑功能，可以大幅提升短视频创作效率。以下是结合两者优势的详细创作步骤：一、创意策划阶段AI灵感激发使用DeepSeek的AI文本生成功能，输入关键词（如"美食教程"、"科技科普"）获取创意方向生成10-20个标题备选（示例Prompt："生成10个吸引年轻人的美妆短视频标题"）
一学就会的深度学习基础指令及操作步骤（5）使用预训练模型小圆圆666 深度学习人工智能 python 卷积神经网络
文章目录使用预训练模型加载预训练模型图像加载与预处理预测使用预训练模型查看模型库和常用模型加载预训练模型fromtorchvision.modelsimportvgg16#VGG16模型架构的定义fromtorchvision.modelsimportVGG16_Weights#VGG16的预训练权重配置#loadtheVGG16network*pre-trained*ontheImageNetd
NTIRE比赛：技术前沿、国内企业表现与计算机视觉未来展望 AndrewHZ 深度学习新浪潮计算机视觉人工智能深度学习调研报告算法 NTIRE 画质算法
一、NTIRE比赛概述：图像恢复与增强领域的全球竞技场1.1NTIRE的定位与历史NTIRE（NewTrendsinImageRestorationandEnhancement）是计算机视觉领域最具影响力的国际赛事之一，聚焦于图像恢复与增强技术的前沿探索。自2017年首次举办以来，NTIRE每年与计算机视觉顶会CVPR联合召开，成为学术界与工业界技术实力的重要展示平台。其竞赛内容涵盖图像超分辨率、
量子计算如何颠覆能源优化领域：从理论到实践 Echo_Wish 人工智能前沿技术量子计算能源
量子计算如何颠覆能源优化领域：从理论到实践大家好，我是Echo_Wish，一个热爱探索前沿技术的人工智能与Python领域的技术分享者。今天，我们将深入探讨一个激动人心的话题——量子计算在能源优化中的应用。这不仅是科技领域的全新趋势，也可能为全人类的能源利用效率带来革命性突破。从理论模型到实际应用，量子计算已经在一些能源相关领域崭露头角，例如电网优化、可再生能源分配和物流节能规划。以下，让我们一步
Kibana 单机与集群部署教程闲人编程大数据集群部署教程大数据集群单机部署 Kibana 日志分析数据可视化
目录Kibana单机与集群部署教程第一部分：Kibana概述第二部分：Kibana单机部署教程1.安装Kibana1.1安装依赖项1.2下载和安装Kibana1.3启动Kibana2.单机案例代码实现（Python）3.常见问题及解决方法3.1无法启动Kibana服务3.2Kibana无法连接到Elasticsearch第三部分：Kibana集群部署教程1.配置集群节点1.1配置Elasticse
卷积神经网络（笔记01）天行者@ cnn 人工智能深度学习
视觉处理三大任务：分类、目标检测、图像分割CNN网络主要有三部分构成：卷积层（ConvolutionalLayer）、池化层（PoolingLayer）和激活函数一、解释卷积层中的偏置项是什么，并讨论在神经网络中引入偏置项的好处。在卷积神经网络（CNN）的卷积层里，卷积操作本质上是输入数据与卷积核（滤波器）进行逐元素相乘再求和的过程。偏置项（Bias）是一个额外的可学习参数，对于每个卷积核而言，都
INCA二次开发GUI实例化智海行舟 python 个人开发
【摘要】本文基于ETASINCA二次开发实践，深入探讨如何构建完整的自动化测试GUI系统。通过Python语言结合COM接口技术，实现从软件架构设计到功能模块开发的完整闭环，为汽车电子领域工程师提供可复用的开发范式。一、INCA二次开发技术背景1.1行业应用需求在汽车电子开发领域，ETASINCA作为行业标准标定工具，其自动化测试需求日益增长。传统的手动操作模式存在以下痛点：重复性操作耗时严重（单
常用图像增强算法原理及 OpenCV C++ 实现埃菲尔铁塔_CV算法 opencv 计算机视觉人工智能 c++算法机器学习
一、引言图像增强是数字图像处理中的一个重要分支，其目的是改善图像的视觉效果，突出图像中的重要信息，或者将图像转换为更适合人或机器分析处理的形式。在实际应用中，图像增强技术广泛应用于医学影像、遥感图像、安防监控等领域。本文将详细介绍常用的图像增强算法原理，并给出基于OpenCVC++库的实现代码。二、图像增强算法分类图像增强算法可以分为空间域增强和频域增强两大类。空间域增强是直接对图像的像素值进行操
如何通过API用Python获取北向资金流向数据？量化问财量化软件 QMT 量化交易 Python 量化炒股 PTrade QMT 量化交易量化软件 deepseek
推荐阅读：《【最全攻略】免费的量化软件有哪些？券商的交易接口怎么获取？》如何通过API用Python获取北向资金流向数据？北向资金指的是通过沪港通和深港通渠道，从香港市场流入A股市场的资金。对于投资者来说，了解北向资金流向对于把握市场趋势和投资决策具有重要意义。本文将介绍如何通过API用Python获取北向资金流向数据。理解北向资金流向数据北向资金流向数据主要包括以下几个方面：资金流入量：指通过沪
likeadmin 安装与使用指南强和毓Hadley
likeadmin安装与使用指南项目地址:https://gitcode.com/gh_mirrors/li/likeadmin目录结构及介绍在克隆或下载likeadmin项目后，你会看到以下主要目录：admin:存放所有后端管理相关的代码。controller:控制器目录，负责处理HTTP请求。model:数据模型目录，用于数据库操作。service:服务层目录，提供业务逻辑。frontend:
go执行java -jar 完成DSA私钥解析并签名 DavidSoCool java jar golang
起因，最近使用go对接百度联盟api需要使用到DSA私钥完成签名过程，在百度提供的代码示例里面没有go代码的支持，示例中仅有php、python2和3、java的代码，网上找了半天发现go中对DSA私钥解析支持不友好，然后决定使用在java中完成签名计算过程，生成可执行jar后由外部传入参数获取签名数据。百度联盟api文档说明：1）权限开通后，登录百度联盟媒体平台（union.baidu.com）
【30天玩转python】项目实战：从零开始开发一个Python项目爱技术的小伙子 30天玩转python linux 运维服务器
项目实战：从零开始开发一个Python项目在学习Python的过程中，开发一个完整的项目是非常重要的实战练习。它不仅能够帮助你巩固所学的知识，还能提高实际编程能力。本文将带领你从零开始开发一个Python项目，介绍从项目规划、环境搭建、代码实现到项目发布的完整过程。我们将以一个简单的“任务管理系统”为例，逐步讲解如何构建、测试和优化这个项目。1.项目规划1.1项目简介我们将开发一个基于命令行的任务
Python从0到100（七十六）：计算机视觉-直方图和自适应直方图均衡化是Dream呀 python 计算机视觉开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
python递推法_如何使用Python递归函数中的递推？热茶走 python递推法
我们大家都知道，一个函数可能存在多种不同的用法，很少是有函数只针对一个方式，那么基于一种函数，我们肯定要了解多个方式，今日针对递归函数里的递推内容给大家介绍哦~递归是什么？是指函数/过程/子程序在运行过程序中直接或间接调用自身而产生的重入现象。下面是个人理解：递归就是在函数内部调用自己的函数被称之为递归。实例：#直接调用自己：deffunc:print('fromfunc')funcFunc#间接
python递推式_Python 递推式构造列表(List Comprehensions) man One python递推式
你需要构造一个新的列表,列表中的元素是从一个已知列表中的元素计算而得到的.比如你要创建一个列表,里面的元素是另一个列表中的元素加23后得到的.使用递推式构造列表是最理想的方法:thenewlist=[x+23forxintheoldlist]如果你希望用一个列表中大于5的元素构造一个新的列表,使用递推式也是很方便的:thenewlist=[xforxintheoldlistifx>5]如果你希望将
Dash 简介 tankusa dash
Dash是一个基于Python的开源框架，专门用于构建数据分析和数据可视化的Web应用程序。Dash由Plotly团队开发，旨在帮助数据分析师、数据科学家和开发人员快速创建交互式的、基于数据的Web应用，而无需深入掌握前端技术（如HTML、CSS和JavaScript）。Dash的核心优势在于其简单易用性和强大的功能。通过Dash，用户可以使用纯Python代码来构建复杂的Web应用，而无需编写繁
云原生Serverless平台：无服务器计算的架构革命桂月二二云原生 serverless 架构
引言：从虚拟机到函数即服务(FaaS)AWSLambda每天处理数十万亿次请求，阿里巴巴函数计算支撑双十一亿级事件触发。KnativeServing实现秒级自动扩缩至零，Vercel边缘函数网络响应时间跌破50ms。CNCFOpenFaaS在GitHub斩获25k星，AzureFunctions支持毫秒级计费精度，GoogleCloudRun冷启动优化至200ms内。全球500强企业70%采用Se
视频下载插件：yt-dlp 小怪兽长大啦 python
Yt-dlp插件使用下载方法方法一：Python插件下载使用pip工具安装即可:pipinstallyt-dlp.Python已经配置过环境变量，下载yt-dlp时不需要配置。方法二：直接下载EXE可执行文件网上下载yt-dlp应用程序：https://github.com/yt-dlp/yt-dlp/releases配置环境变量。常用使用命令（配置好环境变量后，控制台下输入命令即可）直接下载视频
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，