实现一个文字识别（图片转文字）工具

00 前言

最近做ppt，看到有些图片中的文字内容很好，一张一张地码字很累还很费时间。就想着有空做一个文字识别的小工具，方便办公流程。在网上查了一下资料，百度智能云提供了文字识别的接口，可以直接调用，挺方便的。于是就做了一个小工具，和大家分享一下制作过程。

01 准备

01 -1 虚拟环境

本文所用版本是python3.8.2，新版的python都自带一个创建虚拟环境模块。新建一个工作目录名叫Image2Text。

mkdir Image2Text     //也可以直接用鼠标右键创建文件夹
cd Image2Text        //进入项目文件夹
python -m venv venv     //创建虚拟环境，第一个venv是包名，第二个是创建虚环境名字（可以用项目名）

然后在venv文件夹下我们看到如下的目录，虚拟环境激活后才能使用，激活的脚本在Scripts里面。

于是，我们进到Scripts文件夹里面，执行激活脚本。使用activate激活（使用deactivate.bat 退出）。

01 -2 安装依赖

其中PySide2是做界面的。baidu-aip 是调用的百度的文字识别接口，是主要功能。

 pip3 install PySide2
 pip install baidu-aip

注：之前使用pyQt5出现了qt.qpa.plugin: Could not find the Qt platform plugin "windows"这个问题，然后用pip3 install PySide2下载PySide2，并修改了路径。

01 -3 图片识别SDK

根据百度的文本识别SDK介绍（https://ai.baidu.com/ai-doc/OCR/Dk3h7yf8m），我们需要注册百度智能云的账户，并在安全中心获取API_KEY(对应百度智能云的“Access Key ID”）和SECRET_KEY(对应百度智能云的“Access Key Secret”）。

02 开始

02-1 调用接口测试

百度文本识别的接口很丰富，有通用文本识别、包含位置信息的文本识别、驾照识别等等。我这里面用的是通用的文本识别，首先，新建一个orc_util.py文件引用接口并说明认证信息。

from aip import AipOcr
# 添加认证信息，这里面的api密钥和secret密钥可以去百度智能云免费申请
APP_ID = ''
API_KEY = 'd7a50f1938xxxxxxxxxx5277a51e23'
SECRET_KEY = 'e6ca46bdxxxxxxxxxxxx053cf288b'

然后，我们定义一个获取图片的方法。

def get_ocr_str(file_path, origin_format=True):
    """
    获取图片比特流
    :param file_path: 图片路径
    :return: 函数get_ocr_str_from_bytes（）的结果
    """
    with open(file_path, 'rb') as fp:
        file_bytes = fp.read()
    return get_ocr_str_from_bytes(file_bytes, origin_format)

然后定义一个转换方法，设置options参数（不检测文本方向，语言模式为中英文），实例化一个AipOcr类，调用basicGeneral()接口。通用文字识别的请求参数见表1，通用文字识别的返回参数见表2。

def get_ocr_str_from_bytes(file_bytes, origin_format=True):
    """
    图片转文字
    :param file_bytes: 图片的字节
    :return: result_str
    """
    options = {
        'detect_direction': 'false',
        'language_type': 'CHN_ENG',
    }
    ocr = AipOcr(APP_ID, API_KEY, SECRET_KEY)
    result_dict = ocr.basicGeneral(file_bytes, options)
    if origin_format:
        result_str = '\n'.join([entity['words'] for entity in result_dict['words_result']])
    else:
        result_str = ''.join([entity['words'] for entity in result_dict['words_result']])
    return result_str

表1 通用文字识别，请求参数
参数名称	是否必选	类型	可选值范围	默认值	说明
image	是	string			图像数据，base64编码，要求base64编码后大小不超过4M，最短边至少15px，最长边最大4096px,支持jpg/png/bmp格式
url	是	string			图片完整URL，URL长度不超过1024字节，URL对应的图片base64编码后大小不超过4M，最短边至少15px，最长边最大4096px,支持jpg/png/bmp格式，当image字段存在时url字段失效
language_type	否	string	CHN_ENG ENG POR FRE GER ITA SPA RUS JAP KOR	CHN_ENG	识别语言类型，默认为CHN_ENG。可选值包括： - CHN_ENG：中英文混合； - ENG：英文； - POR：葡萄牙语； - FRE：法语； - GER：德语； - ITA：意大利语； - SPA：西班牙语； - RUS：俄语； - JAP：日语； - KOR：韩语；
detect_direction	否	string	true false	false	是否检测图像朝向，默认不检测，即：false。朝向是指输入图像是正常方向、逆时针旋转90/180/270度。可选值包括: - true：检测朝向； - false：不检测朝向。
detect_language	否	string	true false	false	是否检测语言，默认不检测。当前支持（中文、英语、日语、韩语）
probability	否	string	true false		是否返回识别结果中每一行的置信度

表2 通用文字识别，返回参数
字段	必选	类型	说明
direction	否	number	图像方向，当detect_direction=true时存在。 - -1:未定义， - 0:正向， - 1: 逆时针90度， - 2:逆时针180度， - 3:逆时针270度
log_id	是	number	唯一的log id，用于问题定位
words_result_num	是	number	识别结果数，表示words_result的元素个数
words_result	是	array	定位和识别结果数组
+words	否	string	识别结果字符串
probability	否	object	行置信度信息；如果输入参数 probability = true 则输出
+average	否	number	行置信度平均值
+variance	否	number	行置信度方差
+min	否	number	行置信度最小值

然后，定义主函数开始测试吧。

if __name__ == '__main__':
    IMAGE_PATH = "test.jpg"
    print(get_ocr_str(IMAGE_PATH))

我们的测试图是这样的，测试的时候直接截的cmd命令行的报错信息，命名为test然后保存在当前的目录下。

cmd命令行运行结果如下，我们可以看到识别结果还是不错的，并且还保留了原格式。emm, 那么开始做界面吧。

02-2 界面编写

ok，我们要开始编写界面了, 我这边使用的是PySide2，打算后期再美化一下。也可以使用python自带的tkinter。好了，我们新建一个MainUi.py文件。同样，引入需要的包，设置一个全局的资源变量（等待转换时的图标）。

中间遇到过一个问题，最开始运行MainUi.py文件的时候，提示找不到Qt插件，也就是qt.qpa.plugin: Could not find the Qt platform plugin "windows"这个问题，然后找到了如下的解决方式。

import sys
import PySide2
import os
'''
#添加PySide2路径,为了解决qt.qpa.plugin: Could not find the Qt platform plugin "windows"这个问题；
#也可以修改文件"C:\Applications\WinPython-64bit-3.6.3.0Qt5\python-3.6.3.amd64\Lib\site-packages\PySide2_init_.py" ，作者用的是WinPython ，
    dirname = os.path.dirname(__file__)
    plugin_path = os.path.join(dirname, 'plugins', 'platforms')
    os.environ['QT_QPA_PLATFORM_PLUGIN_PATH'] = plugin_path
'''
dirname = os.path.dirname(PySide2.__file__)
plugin_path = os.path.join(dirname, 'plugins', 'platforms')
os.environ['QT_QPA_PLATFORM_PLUGIN_PATH'] = plugin_path
import ocr_util
import threading
from PySide2 import QtWidgets
from PySide2.QtCore import Signal,Slot
from PySide2.QtGui import QMovie,QPixmap,QIcon

#设置资源变量
LOADING_GIF_URL = './asset/file.png'

然后定义一个类，设置一个信号量，用于连接返回的识别结果，并显示到文本框中。

class MainUi(QtWidgets.QMainWindow):
    signal_response = Signal(str)

    def __init__(self):
        super().__init__()
        self.init_ui()

定义一个初始化方法，添加两个布局，一个用来放文本框，一个用来放按钮，截取图片功能没有实现哦，打算后面做的。

def init_ui(self):
        #初始化一个窗口,主界面采用固定大小，网格布局
        self.setMinimumSize(800,500)
        self.main_widget = QtWidgets.QWidget()  # 创建窗口主部件
        self.main_layout = QtWidgets.QGridLayout()  # 创建主部件的网格布局
        self.main_widget.setLayout(self.main_layout)  # 设置窗口主部件布局为网格布局
        
        #添加上下两个widget，布局用
        self.up_widget = QtWidgets.QWidget()  # 创建部件
        self.up_widget.setObjectName('up_widget')
        self.up_layout = QtWidgets.QGridLayout()  # 创建部件的网格布局层
        self.up_widget.setLayout(self.up_layout) # 设置部件布局为网格
        self.down_widget = QtWidgets.QWidget() 
        self.down_widget.setObjectName('down_widget')
        self.down_layout = QtWidgets.QGridLayout()
        self.down_widget.setLayout(self.down_layout) 
        #添加上下两个widget到主部件中
        self.main_layout.addWidget(self.up_widget,0,0,6,8) # 上侧部件在第0行第0列，占4行8列
        self.main_layout.addWidget(self.down_widget,6,0,2,8) # 下侧部件在第6行第0列，占2行8列
        self.setCentralWidget(self.main_widget) # 设置窗口主部件
        
        #添加图片按钮和截取图片按钮
        self.add_pic = QtWidgets.QPushButton("添加图片")
        self.add_pic.setObjectName('add_pic')
        self.add_pic.clicked.connect(self.on_add_pic_clicked)#连接点击事件
        self.cap_pic = QtWidgets.QPushButton("截取图片")
        self.cap_pic.setObjectName('cap_pic')
        #添加按钮到下widget中
        self.down_layout.addWidget(self.add_pic,6,1,1,1)
        self.down_layout.addWidget(self.cap_pic,6,5,1,1)
        
        #添加文本框用来显示识别的文字
        self.textEdit = QtWidgets.QTextEdit('说明：图片格式要求不超过4M，最短边至少15px，最长边最大4096px，支持jpg/png/bmp格式')
        self.textEdit.setReadOnly(True)#文本框设为不可编辑
        self.up_layout.addWidget(self.textEdit,0,0,6,8)
        self.init_loading_gif()
        self.signal_response.connect(self.__slot_http_response)#连接信号和槽函数，将结果显示在文本框中

由于文字识别的时候还是有2秒左右的检测时间的，所以添加了一个等待的图片，发现用.png格式的图片就可以显示，用.gif格式的文件就不能显示，很奇怪。

 def init_loading_gif(self):
        """
        初始化loading动画
        :return:
        """
        gif = QMovie(LOADING_GIF_URL)
        gif.start()
        x, y = 275, 110
        self.loadingLabel = QtWidgets.QLabel(self)
        self.loadingLabel.setMovie(gif)
        self.loadingLabel.adjustSize()
        self.loadingLabel.setGeometry(x, y, self.loadingLabel.width(), self.loadingLabel.height())
        self.loadingLabel.setVisible(False)

点击按钮事件，打开文件对话框，获取文件路径，然后清空文本框内容，准备显示识别结果，并调用run_ocr_async()方法。

    @Slot()
    def on_add_pic_clicked(self):#点击添加图片
        dialog = QtWidgets.QFileDialog()#生成文件对话框对象
        dialog.setFileMode(QtWidgets.QFileDialog.AnyFile)#设置文件过滤器，这里是任意文件，设置参考https://www.jianshu.com/p/4b297a825a04
        file_urls = dialog.getOpenFileNames()[0]#获取文件名称
        if len(file_urls) > 0:
            self.textEdit.clear()
        for img_full_path in file_urls:
            if img_full_path is None or img_full_path == '':
                continue
            with open(img_full_path, 'rb') as fp:
                file_bytes = fp.read()
            self.run_ocr_async(file_bytes)

等待的时候让等待的图片显示出来，然后调用我们之前编写的图片识别函数返回信号量，并将信号量传递给槽函数，显示在文本框中。

    def run_ocr_async(self, image_bytes):
        self.loadingLabel.setVisible(True)
        threading.Thread(target=self.job_ocr, args=(image_bytes,)).start()

    def job_ocr(self, image_bytes):
        result = ''
        try:
            result = ocr_util.get_ocr_str_from_bytes(image_bytes)
        finally:
            self.signal_response.emit(result)

    @Slot(str)
    def __slot_http_response(self, result):
        self.textEdit.append(result)
        self.textEdit.setReadOnly(False)#文本框设为可编辑
        self.loadingLabel.setVisible(False)

MainUi类定义好了，开始编写main函数，并使用。

def main():
    app = QtWidgets.QApplication(sys.argv)
    gui = MainUi()
    gui.show()
    sys.exit(app.exec_())

if __name__ == '__main__':
    main()

02-3 完成

运行一下，看看成果吧。

打开文件。

ok,识别文字显示的也不错。后期界面功能再完善一下就好了。

03 未解决的问题

添加等待动画的时候，发现用.png格式的图片就可以显示，用.gif格式的文件就不能显示，很奇怪。有了解的兄弟还望赐教。

粒子爱心特效||轻松实现浪漫效果||完整代码 ClassmateJie 动画前端 html
关注微信公众号「ClassmateJie」有完整代码以及更多惊喜等待你的发现。简介/效果展示你是否曾经想过，在特殊的日子里给你的爱人一个惊喜？或者在朋友的生日派对上，给他们展示一个充满爱意的特效？今天，我要分享一个我亲身试验过的方法，让你轻松实现这个愿望。那就是——HTML粒子爱心特效代码。代码粒子爱心html,body{height:100%;padding:0;margin:0;backgro
PDF神器！Stirling-PDF，告别烦人会员！辣码甄源精品开源应用分享 pdf 开源软件
Stirling-PDF：告别付费，随心编辑与转换，PDF文件轻松驾驭-精选真开源，释放新价值。概览你或许面对这样的情况：需要合并几个PDF，或者需要将一份PDF文件拆分，又或者需要调整PDF中的页面顺序，但是，找到的线上工具要么广告满天飞，要么需要付费使用或者会员登录。Stirling-PD可以解决你的问题。Stirling-PDF是一个基于spring-boot开发的开源项目，旨在提供一个功能
探索开源性能监控的革新者——Matrix 辣码甄源精品开源应用分享 github 开源
Matrix：让性能监控变得简单而直观。-精选真开源，释放新价值。概览Matrix，作为腾讯微信团队推出的APM系统，以其轻量级和高度可定制性在开发者中获得了广泛的认可。它的核心优势在于能够以非侵入式的方式集成到现有的应用程序中，这意味着无需对现有代码进行大规模修改，即可实现对应用性能的全面监控。Matrix的设计哲学是简洁而高效，它通过直观的插件系统，允许开发者根据具体的监控需求，快速部署或更新
HTML粒子爱心 Want595 一只有趣的兔子 html 前端
目录写在前面完整代码代码分析系列文章写在最后写在前面教你用HTML语言实现粒子爱心动画的效果。HTML，全称为HyperTextMarkupLanguage，即超文本标记语言，是构建网页的基本markup语言，它通过一系列标签tags来定义网页内容的结构和样式，使文本、图像、视频等多媒体元素能够在网页上得以组织和展示。HTML文档由一系列元素组成，每个元素由开始标签、内容和结束标签构成，比如这是一
生活点滴第二百五十三章小鱼爱苹果
11月15日星期五晴今天，早上我到库房后，拿着线和工具先到楼上去。张佳鑫还没有到，我到20层先把那趟防火门的线给穿了。下来等着张佳鑫穿电井里面的线，但是他还没有来。我给他发消息问在哪里，没有立即回复过会儿才回复我，说马上到堵车。当时已经九点多了，我看样子把工具和线收拾藏起来。一会儿他到我还要下去，就提前下去。到地下室接到张师给大电话说64号楼处理问题人在二十八层，人家顺便把线给带上。让我拿半盘线上
CSS中的align-content属性：实现垂直居中的新方式芭拉拉小魔仙 css css 前端
引言在CSS的漫长发展历程中，垂直居中一直是一个令人头疼的问题。不过，好消息是，到了2024年，CSS终于引入了一种新的方式来实现垂直居中，那就是使用align-content属性。本文将详细介绍align-content的使用方式，并对比之前常见的垂直居中方法，帮助你更好地理解和应用这一新特性。align-content属性简介在CSS中，align-content属性原本主要用在Flexbox
初探Mpvue的组件、样式机制 weixin_33912246 javascript 前端 ViewUI
序言实现了一个简单的demo之后呢，Eknow君这一节会通过小程序API来实现几个小功能。主要从mpvue的组件、语法以及小程序的相关API完善。mpvue的组件上一节，我们可以了解到mpvue基本支持vue组件的所有特性，不遵守这些特性并不会错误，我们只是了能够开发良好的代码，编写高质量的代码可以说是程序员的一道分水岭吧。回到正题哈，mpvue在很大程度上都支持vue组件与小程序的原生组件的,但
python的图像阈值化处理及算法对比 yava_free 计算机视觉人工智能 python
一.阈值化（注：该部分参考作者的论文《基于苗族服饰的图像锐化和边缘提取技术研究》）图像的二值化或阈值化（Binarization）旨在提取图像中的目标物体，将背景以及噪声区分开来。通常会设定一个阈值T，通过T将图像的像素划分为两类：大于T的像素群和小于T的像素群。灰度转换处理后的图像中，每个像素都只有一个灰度值，其大小表示明暗程度。二值化处理可以将图像中的像素划分为两类颜色，常用的二值化算法如公式
用kotlin和realm实现Notepad 瑶瑶_2930
UI设计参考了这份开源代码(https://github.com/lguipeng/Notes)，自己挑选了一些布局和修改了颜色。下面对这些layout做一点笔记。
gitignore文件—iOS m_miao_m
gitignore说明:在使用git的过程中，一般我们总会有些文件无需纳入git的管理，也不希望它们总出现在未跟踪文件列表，这些文件通常是日志文件、临时文件、编译产生的中间文件、工具自动生成的文件等等。此时我们可以创建一个名为.gitignore的文件，列出要忽略的文件模式，Git会根据这些模式规则来判断是否将文件添加到版本控制中。gitignore的使用：【注意⚠️在项目开始就创建.gitign
使用css3的动画属性@keyframes创建小说轮播图 Wiktok 前端模板制作 css html5 css3 前端框架 ui
最近一直在琢磨做一个小说网站模板，在寻找灵感时发现一个很好的小说展示效果-小说三维轮播，如下图所示：这种小说轮播展示方法不仅美观而且节省页面空间，那么他到底怎么实现的呢？由于本人是一个小白，所以去网上查了一下，但是很遗憾，没找到相关方法。通过页面元素检查，发现他应该使用的是css的媒体属性@media并结合js的相关功能，应该挺复杂的，那么我们能不能用一种相对简单的方法实现它呢？答案是有。通过cs
Android 10.0 开机广播发送流程分析安卓兼职framework应用工程师 android 10.0 Rom定制化高级进阶 android 开机广播开机广播发送流程开机流程开机广播流程
1.前言在10.0的系统rom定制化开发中，对于在实现开启自启动app实现的功能开发中，所以就需要了解开机广播具体的发送流程，从而来完善实现接收到开机广播，然后自启动app的功能，接下来看下自启动app的功能实现2.开机广播发送流程分析的核心类frameworks/base/services/core/java/com/android/server/am/UserController.javafr
理解 HarmonyOS 中的网格布局：综合指南神码兄弟 HarmonyOS学习 harmonyos 鸿蒙华为
网格布局是创建响应式和结构化用户界面的强大工具。通过将界面划分为由行和列组成的单元格，网格可以精确控制组件的分布和对齐。这使得它们成为各种应用程序（例如图库、日历和计算器）的理想选择。在HarmonyOS中，ArkUI提供了用于构建网格布局的Grid容器和GridItem组件。Grid组件用于定义网格的结构，而GridItem组件指定每个单元格内的内容。HarmonyOS网格支持条件渲染、循环渲染
Quartus网盘资源下载与安装附图文安装教程学习天使Alice fpga开发学习
如大家所了解的，Quartus是一种FPGA设计软件（相信理工科的小伙伴，很多都接触或学习过FPGA），旨在为数字电路设计师提供一个高效、便捷的开发环境。它可以帮助用户完成数字逻辑电路的设计、仿真、综合和布局，以及与外围设备进行通信和控制。Quartus支持多种编程语言，包括VHDL、Verilog等，并具有丰富的功能和工具库，可满足不同级别、不同规模的数字电路设计需求。收藏的Quartus安装包
计算机毕业设计之基于Python的旅游景点评论内容分析与研究微信bishe58 课程设计 spring boot python 信息可视化
旅游景点评论内容分析与研究是一个涉及文本挖掘、情感分析和数据可视化等多领域技术的复杂过程。本研究以Python编程语言为基础，首先收集了来自不同旅游平台的用户评论数据。通过运用自然语言处理（NLP）技术，清洗并预处理了这些数据，以便于后续分析。随后，采用情感分析方法来识别和量化评论中的主观态度和情绪倾向，从而判断游客的整体满意度。此外，还运用词云、主题建模等手段来探索游客评论中的关键词汇和讨论主题
深入探究 npm cache 命令：用途与实践指南杨哥带你写代码 npm 前端 node.js
npm（NodePackageManager）是JavaScript编程语言的包管理器，广泛用于Node.js应用程序。它不仅用于管理项目中的依赖，还提供了一个强大的缓存机制来加速包的安装过程。npmcache命令是与npm缓存交互的命令行工具，它允许用户查看、清理和修复缓存。本文将详细介绍npmcache命令的用途和实践方法。npmcache命令概述npm的缓存是一个本地存储，用于保存已下载的包
Java中的基于规则的引擎（如Drools） ๑҉ 晴天 java java
在现代软件开发中，业务规则管理系统（BRMS）在处理复杂业务逻辑和规则方面变得愈发重要。Drools是一个强大的开源规则引擎，可以帮助开发者实现业务规则的管理和执行。这篇博客将详细介绍Drools的基本概念、优势、安装和使用方法，并通过一个示例展示如何在Java应用中集成Drools。什么是Drools？Drools是一个基于规则的引擎，使用一种声明性语言来定义复杂的业务规则。Drools提供了一
探索 Modbus 转 EtherCAT 协议网关于智慧生产线的实例钡铼技术物联网关网络服务器 linux 自动化 arm开发运维
高度自动化的制造业领域，智慧生产线控制对于提高生产效率、产品质量和降低成本起着至关重要的作用。Modbus转EtherCAT协议网关作为一种关键的技术手段，在实现不同协议设备之间的无缝集成和高效协同工作方面发挥着重要作用。一、智慧生产线控制的需求智慧生产线通常需要处理大量的实时数据，包括传感器采集的各种参数、设备状态信息以及控制指令的快速传输。同时，生产线中的设备可能来自不同的制造商，使用不同的通
java3-5年面试题——框架篇若久2023 java spring
-----Spring------1.springIOC的理解springioc指的是控制反转，IOC容器负责实例化、定位、配置应用程序中的对象及建立这些对象间的依赖。交由Spring容器统一进行管理，从而实现松耦合注入对象：构造方法注入、stter方法注入、接口注入2.spring是如何通过xml配置或者注解配置生成实例对象的？简单实列：将对象放入SpringIOC容器中。1.配置文件方式：ap
1.X Python基础-常用函数 iJaa Python
目录一、内置函数1.1类型比较-isinstance()二、其他函数2.1随机整数-random.randint()一、内置函数1.1类型比较-isinstance()描述用来判断一个对象是否是某个类型语法isinstance(object,classinfo)object：一个实例的对象classinfo：类型名（直接或间接的类名、以及基本类型，或者由类型名组成的元组）返回值：Bool类型（Tr
Matlab实现多传感器信息融合（D-S证据推论）冬天都会过去
D-S证据理论是对贝叶斯推理方法推广，主要是利用概率论中贝叶斯条件概率来进行的，贝叶斯条件概率需要知道先验概率。而D-S证据理论不需要知道先验概率，能够很好地表示“不确定”，被广泛用来处理不确定数据。（对来自多传感器数据的融合处理）适用于：信息融合、专家系统、情报分析、法律案件分析、多属性决策分析1、D-S证据理论知识介绍（1）四大定义基本概率分配、信任函数、似然函数、信任区间其中，函数m为识别框
高级java每日一道面试题-2024年8月28日-基础篇-ArrayList的底层工作原理? java我跟你拼了 java每日一道面试题 java spring ArrayList 数据结构基础篇
如果有遗漏,评论区告诉我进行补充面试官:ArrayList的底层工作原理?我回答:在Java高级面试中，了解ArrayList的底层工作原理是非常重要的，因为ArrayList是Java中最常用的数据结构之一。下面是ArrayList的底层工作原理的详细解释，包括其实现细节、扩容机制、线程安全性和性能特点等方面。1.数据结构ArrayList内部使用了一个Object类型的数组（Object[]e
ConcurrentHashMap扩容原理 | 存储流程 | 源码探究 VsunGoK java 源码探究 java 算法
新人写手，代码菜鸡；笔下生涩，诚惶诚恐。初试锋芒，尚显青涩；望君指点，愿受教诲。本篇文章将从源码的层面，探讨ConcurrentHashMap的存储流程以及扩容原理Java版本为JDK17，源代码可能与其他版本略有不同推荐阅读：HashMap实现原理、扩容机制一、构造函数1.1无参构造函数ConcurrentHashMap的无参构造函数是一个空方法publicConcurrentHashMap()
python爬虫521 PUTAOAO python 爬虫开发语言
爬虫521记录记录最近想学爬虫，尝试爬取自己账号下的文章标题做个词云csdn有反爬机制原理我就不说啦大家都写了看到大家结果是加cookie但是我加了还是521报错尝试再加了referer就成功了(╹▽╹)importmatplotlibimportrequestsfromwordcloudimportWordCloudimportmatplotlib.pyplotaspltimportjieba#
基于yolov8的绝缘子缺陷检测系统python源码+onnx模型+评估指标曲线+精美GUI界面 FL1623863129 深度学习 YOLO
【算法介绍】基于YOLOv8的绝缘子缺陷检测系统是一种利用先进深度学习技术的高效解决方案，旨在提升电力行业中输电线路的维护和监控水平。YOLOv8作为YOLO系列算法的最新版本，具备更高的检测速度和精度，特别适用于实时物体检测任务。该系统通过深入分析并标注绝缘子数据集，训练YOLOv8模型以精确识别输电线上的绝缘子及其缺陷状态。利用多尺度检测、FPN结构以及CSPDarknet网络等技术，YOLO
设计模式-桥接模式给自己一个 smile 设计模式设计模式桥接模式
概述现在有一个需求，需要创建不同的图形，并且每个图形都有可能会有不同的颜色。我们可以利用继承的方式来设计类的关系：我们可以发现有很多的类，假如我们再增加一个形状或再增加一种颜色，就需要创建更多的类。试想，在一个有多种可能会变化的维度的系统中，用继承方式会造成类爆炸，扩展起来不灵活。每次在一个维度上新增一个具体实现都要增加多个子类。为了更加灵活的设计系统，我们此时可以考虑使用桥接模式。定义将抽象与实
Unity项目增加字体裁剪 xiyouice unity 游戏引擎
因为项目里有字体裁剪缩小字体文件的需求，在网上搜索了一番。有个很靠谱的参考文章：https://www.cnblogs.com/yaukey/p/compare_fontsubsetgui_fontpruner_for_unity.html然后就使用了这篇文章里提到的FontPruner工具。下载之后就是文章置顶附件这样的jar包，放入工程里。需要编写脚本，根据表格工具导出的项目文本对应字体的tx
使用 Pandas 进行数据可视化：全面指南（六）小高要坚强 pandas 信息可视化 python 数据分析数据挖掘开发语言
在数据分析的过程中，数据的可视化是一个至关重要的环节。通过图形展示数据，不仅能够帮助我们直观地理解数据，还能够揭示数据背后的规律和趋势。Pandas作为Python生态系统中强大的数据分析库，不仅提供了数据处理和分析的功能，还内置了方便易用的可视化方法。本文将详细介绍Pandas中的数据可视化功能，帮助您充分利用Pandas的图形展示能力。一、数据的图形展示概述在Pandas中，DataFrame
深入解析Pandas的Series与DataFrame索引和切片操作（三）小高要坚强 pandas python 开发语言矩阵 numpy
Pandas库是Python中用于数据处理和分析的强大工具，它的核心数据结构包括Series和DataFrame。掌握Pandas的索引与切片操作是数据分析的基础，因为它们允许我们高效地访问、筛选和操作数据。本文将详细介绍Pandas中的Series和DataFrame的索引与切片方法，帮助你更好地理解和应用这些技巧。一、Series的索引与切片操作Series是一种一维数据结构，它类似于一列数据
《比较学》理论介绍韩妙第
《比较学》图片来自网络作者：韩妙第日期：2022年11月14日《比较学》理论介绍作者：韩妙第日期：2022年11月14日一．量化性何为量化？是否运用工具是人和动物的根本区别。量化指的是将比较对象蕴含的各种要素，通过测量、检测、论证、观察、引用和存储等手段获得的参数进行评价的方法。这是因为这些参数可以让人明确的感知比较对象的内涵信息，本体境况以及外延效应。从而在实践中能够做到有效的管理、有目的的运营
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name