Amo Xiang

2021年学习爬虫必须掌握的验证码识别技术

验证码是许多网站都采取的反爬虫机制，随着技术的发展，验证码出现了各种各样的形态。从一开始的几个数字，发展到随机添加几个英文字母以及混淆曲线、彩色斑点、滑动拼图等，形态越来越复杂。本篇博文将介绍如何使用 OCR 技术实现字符验证码的识别、如何使用第三方验证码识别平台识别验证码以及滑动拼图验证码的校验工作。

一、字符验证码

字符验证码的特点就是验证码中包含数字、字母或者掺杂着斑点与混淆曲线的图片验证码。识别此类验证码，首先需要找到验证码图片在网页 HTML 代码中的位置，然后将验证码下载，最后再通过 OCR 技术进行验证码的识别工作。

1.1 搭建 OCR 环境

Tesseract-OCR 是一个免费、开源的 OCR 引擎，通过该引擎可以识别图片中的验证码，搭建 OCR 的具体步骤如下：
(1) 点击此处打开 Tesseract-OCR下载地址，然后选择与自己操作系统匹配的版本（博主电脑为 Windows 64位操作系统)，如下图所示。

(2) Tesseract-OCR 文件下载完成后，默认安装即可。
(3) 找到 Tesseract-OCR 的安装路径（默认为 C:\Program Files\Tesseract-OCR\tessdata)，然后将安装路径添加至系统环境变量中，首先右键单击 此电脑 依次选择属性 ⇒ 高级系统设置 ⇒ 环境变量，然后在上面的用户变量中单击 新建，在弹出的 新建用户变量 窗口中设置变量名与变量值，如下图所示。

说明：Tesseract-OCR 环境变量配置完成以后，请重新启动 Pycharm 开发工具。

(4) 接下来需要安装 tesserocr 模块，安装命令如下：

pip install tesserocr  # 读者可自行添加镜像加快下载速度
如果使用的是 Anaconda 并在安装 tesserocr 模块时出现了错误，可以使用如下命令：
conda install -c simonflueckiger tesserocr

如果以上两种安装 tesserocr 模块的方式都遇到问题时，可以从下面百度网盘中下载 tesserocr-2.4.0-cp37-cp37m-win_amd64.whl，接着启动 命令提示符窗口，然后通过 pip install tesserocr-2.4.0-cp37-cp37m-win_amd64.whl 安装 tesserocr 模块。

链接：https://pan.baidu.com/s/1uE0BwOnGkxzzXjMqyKtCnA 
提取码：i19b 
复制这段内容后打开百度网盘手机App，操作更方便哦--来自百度网盘超级会员V6的分享

1.2 下载验证码图片

以下面地址对应的网页为例，下载网页中的验证码图片，具体步骤如下：

测试网页地址：https://so.gushiwen.cn/user/login.aspx?from=http://so.gushiwen.cn/user/collect.aspx

(1）使用浏览器打开测试网页的地址，将显示下图所示的字符验证码。

(2) 打开浏览器开发者工具，然后在 HTML 代码中获取验证码图片所在的位置，如下图所示。

(3) 对目标网页发送网络请求，并在返回的 HTML 代码中获取图片的下载地址，然后下载验证码图片。代码如下：

# -*- coding: UTF-8 -*-
"""
@author:AmoXiang
@file:1.download_pic.py
@time:2021/01/19
"""
import requests  # 导入网络请求模块
import urllib.request
from bs4 import BeautifulSoup  # 导入解析HTML的模块

headers = {
     
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) "
                  "AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36"}
# 发送网络请求
url = "https://so.gushiwen.cn/user/login.aspx?from=http://so.gushiwen.cn/user/collect.aspx"
response = requests.get(url=url, headers=headers)
html = BeautifulSoup(response.text, "lxml")
img_src = html.select("#imgCode")[0].attrs["src"]  # 解析图片src
# 组合验证码图片请求地址
img_url = "https://so.gushiwen.cn/" + img_src
# 下载并设置图片名称
urllib.request.urlretrieve(img_url, "code.png")

程序运行后项目文件夹中将自动生成下图所示的验证码图片。

1.3 识别验证码图片

验证码下载完成以后，如果没有安装 pillow 模块，需要通过 pip install pillow 命令安装一下，然后导入 tesserocr 与 Image 模块，再通过 Image.open() 方法打开验证码图片，接着通过 tesserocr.image_to_text() 函数识别图片中的验证码信息即可。示例代码如下：

# -*- coding: UTF-8 -*-
"""
@author:AmoXiang
@file:demo.py
@time:2021/01/19
"""

import tesserocr  # 导入tesserocr模块
from PIL import Image  # 导入图像处理模块

img = Image.open("code.png")  # 打开验证码图片
code = tesserocr.image_to_text(img)  # 将图片中的验证码转换为文本

print(f"验证码为: {code}")

博主重新生成了一张验证码图片，程序运行结果如下：

OCR 的识别技术虽然很强大，但是并不是所有的验证码都可以这么轻松地识别出来，例如下图所示的验证码中就会掺杂着许多干扰线条，那么在识别这样的验证码信息时，就需要对验证码图片进行相应的处理并识别。

如果直接通过 OCR 识别，识别结果将会受到干扰线的影响。下面通过 OCR 直接识别测试一下，识别代码与效果如下：

import tesserocr  # 导入tesserocr模块
from PIL import Image  # 导入图像处理模块

img = Image.open("code.png")  # 打开验证码图片
code = tesserocr.image_to_text(img)  # 将图片中的验证码转换为文本

print(f"验证码为: {code}")

程序运行结果如下：

通过以上测试可以发现，直接通过 OCR 技术识别后为空，遇到此类情况首先可以将彩色的验证码图片转换为灰度图片再测试一下。示例代码如下：

import tesserocr
from PIL import Image

img = Image.open("code.png")
img = img.convert("L")
t = 155
table = []
for i in range(256):
    if i < t:
        table.append(0)
    else:
        table.append(1)

img = img.point(table, "1")
img.show()
code = tesserocr.image_to_text(img)  # 将图片中的验证码转换为文本
print(f"验证码为: {code}")

程序运行后将自动显示下图所示二值化处理后的验证码图片。

控制台中所识别的验证码如下：

二、第三方验证码识别

虽然 OCR 可以识别验证码图片中的验证码信息，但是识别效率与准确度不高是 OCR 的缺点。所以使用第三方验证码识别平台是一个不错的选择，不仅可以解决验证码识别效率低的问题，还可以提高验证码识别的准确度。使用第三方平台识别验证码是非常简单的，平台提供了完善的 API 接口，根据平台对应的开发文档即可完成快速开发的需求，但每次验证码成功识别后平台会收取少量的费用。

验证码识别平台一般分为两种，分别是打码平台和 AI 开发者平台。打码平台主要是由在线人员进行验证码的识别工作，然后在较短的时间内返回结果。AI 开发者平台主要是由人工智能来进行识别，例如，百度 AI。

2.1 第三方打码平台中验证码识别过程

下面以打码平台为例，演示验证码识别的具体过程。

(1) 点击此处在浏览器中打开打码平台网页，并且单击首页的 用户注册 按钮，如下图所示。

(2) 然后在用户中心的页面中填写注册账号的基本信息，如下图所示。

说明：账号注册完成以后可以联系平台的客服人员，申请免费测试的题分。

(3) 账号注册完成以后，在网页的顶部导航栏中选择 开发文档，然后在常用开发语言示例下载中选择 Python 语言，如下图所示。

(4) 在 Python 语言 Demo下载页面中，查看注意事项，然后单击 点击这里下载 超链接即可下载示例代码，如下图所示。

(5) 平台提供的示例代码中，已经将所有需要用到的功能代码进行了封装处理，封装后的代码如下：

# -*- coding: UTF-8 -*-
"""
@author:AmoXiang
@file:2.chaojiying.py
@time:2021/01/19
"""
import requests  # 网络请求模块
from hashlib import md5  # 加密


class Chaojiying_Client(object):

    def __init__(self, username, password, soft_id):
        self.username = username  # 自己注册的账号
        password = password.encode('utf8')  # 自己注册的密码
        self.password = md5(password).hexdigest()
        self.soft_id = soft_id  # 软件ID
        self.base_params = {
       # 组合表单数据
            'user': self.username,
            'pass2': self.password,
            'softid': self.soft_id,
        }
        self.headers = {
       # 请求头信息
            'Connection': 'Keep-Alive',
            'User-Agent': 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0)',
        }

    def PostPic(self, im, codetype):
        """
        im: 图片字节
        codetype: 题目类型 参考 http://www.chaojiying.com/price.html
        """
        params = {
     
            'codetype': codetype,
        }
        params.update(self.base_params)  # 更新表单参数
        files = {
     'userfile': ('ccc.jpg', im)}  # 上传验证码图片
        r = requests.post('http://upload.chaojiying.net/Upload/Processing.php', data=params, files=files,
                          headers=self.headers)
        return r.json()  # 返回响应数据

    def ReportError(self, im_id):
        """
        im_id:报错题目的图片ID
        """
        params = {
     
            'id': im_id,
        }
        params.update(self.base_params)
        r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers)
        return r.json()

(6) 在已经确保用户名完成充值的情况下，填写必要参数，然后创建实例代码中的实例对象，实现验证码的识别工作。代码如下：

if __name__ == '__main__':
    # 用户中心>>软件ID 生成一个替换 96001
    chaojiying = Chaojiying_Client('超级鹰用户名', '超级鹰用户名的密码', '96001')
    im = open('a.jpg', 'rb').read()  # 本地图片文件路径 来替换 a.jpg 有时WIN系统须要//
    # 1902 验证码类型  官方网站>>价格体系 3.4+版 print 后要加()
    print(chaojiying.PostPic(im, 1902))

(7) 使用平台示例代码中所提供的验证码图片，运行以上示例代码，程序运行结果如下：

{'err_no': 0, 'err_str': 'OK', 'pic_id': '6129521154616800019',
 'pic_str': '7261', 'md5': 'cc4e43a6905b3a447436b273a3ea121b'}

说明：程序运行结果中 pic_str 所对应的值为返回的验证码识别信息。

在发送识别验证码的网络请求时，代码中的 1902 表示验证码类型，该平台支持所有的常用验证码类型点击此处可进行查询。

三、滑动拼图验证码

滑动拼图验证码是在滑动验证码的基础上增加了滑动距离的校验，用户需要将图形滑块滑动至主图空缺滑块的位置，才能通过校验。下面以测试地址对应的网页为例，实现滑动拼图验证码的自动校验，具体步骤如下：

测试网页地址如下：

http://sck.rjkflm.com:666/spider/jigsaw/

(1) 使用浏览器打开测试网页的地址，将显示如下图所示的滑动拼图验证码。

(2) 打开浏览器开发者工具，单击按钮滑块，然后在 HTML 代码中依次获取 按钮滑块/图形滑块 以及 空缺滑块 所对应的 HTML 代码标签所在的位置，如下图所示。

(3) 拖动按钮滑块，完成滑动拼图验证码的校验，此时将显示如下图所示的 HTML 代码。

滑动的距离 = 空缺滑块到左侧的距离 - 圆形滑块到左侧的距离
(4) 通过按钮滑块的 left 值可以确认需要滑动的距离，接下来只需要使用 selenium 框架模拟滑动的工作即可。实现代码如下：

# -*- coding: UTF-8 -*-
"""
@author:AmoXiang
@file:demo3.py
@time:2021/01/19
"""

from selenium import webdriver  # 导入webdriver
import re  # 导入正则模块

driver = webdriver.Chrome()  # 谷歌浏览器
driver.get('http://sck.rjkflm.com:666/spider/jigsaw/')  # 启动网页
swiper = driver.find_element_by_xpath(
    '/html/body/div/div[2]/div[2]/span[1]')  # 获取按钮滑块
action = webdriver.ActionChains(driver)  # 创建动作
action.click_and_hold(swiper).perform()  # 单击并保证不松开
# 滑动0距离,不松手，不执行该动作无法获取图形滑块left值
action.move_by_offset(0, 0).perform()
# 获取图形滑块样式
verify_style = driver.find_element_by_xpath(
    '/html/body/div/div[2]/div[1]/div[1]').get_attribute('style')
# 获取空缺滑块样式
verified_style = driver.find_element_by_xpath(
    '/html/body/div/div[2]/div[1]/div[2]').get_attribute('style')
# 获取空缺滑块left值
verified_left = float(re.findall('left: (.*?)px;', verified_style)[0])
# print(verified_left)
# 获取图形滑块left值
verify_left = float(re.findall('left: (.*?)px;', verify_style)[0])
# print(verify_left)
action.move_by_offset(verified_left - verify_left, 0)  # 滑动指定距离
action.release().perform()  # 松开鼠标

四、总结

感谢您阅读本篇博文，希望本文能成为您编程路上的领航者。祝您阅读愉快！

好书不厌读百回，熟读课思子自知。而我想要成为全场最靓的仔，就必须坚持通过学习来获取更多知识，用知识改变命运，用博客见证成长，用行动证明我在努力。
如果我的博客对你有帮助、如果你喜欢我的博客内容，请 点赞、评论、收藏 一键三连哦！听说点赞的人运气不会太差，每一天都会元气满满呦！如果实在要白嫖的话，那祝你开心每一天，欢迎常来我博客看看。
编码不易，大家的支持就是我坚持下去的动力。点赞后不要忘了 关注 我哦！

参加【2025年春季】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽子凯哥 web安全学习安全 CTF夺旗赛网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
参加【2025年春季】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽子凯哥 web安全学习安全 CTF夺旗赛网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
python json 用法云连山 python python json
JSON简介JSON（JavaScriptObjectNotation）是一种轻量级的数据交换格式。它基于JavaScript的一个子集，易于人阅读和编写，同时也易于机器解析和生成。在Python中，使用json模块来处理JSON数据。JSON支持的数据类型主要有对象（在Python中类似于字典）、数组（在Python中类似于列表）、字符串、数字、布尔值和null。将Python对象转换为JSON
基于Python的开源量化交易框架：构建你的量化投资策略 ShAutoit python 开发语言
量化投资是一种利用数学和统计模型来进行投资决策的方法，它将大量的金融数据与算法相结合，以识别交易机会并执行交易。Python作为一种功能强大且易于使用的编程语言，为开发和实施量化交易策略提供了很好的支持。本文将介绍基于Python的开源量化交易框架，帮助你构建自己的量化投资策略。数据获取和处理在量化投资中，数据是至关重要的。你需要获取和处理市场数据，包括股票价格、指数数据、财务数据等。在Pytho
python爬取自如网房源信息 2401_87368790 python 开发语言
本次爬取自如网房源信息所用到的知识点:requestsget请求lxml解析htmlXpathMongoDB存储正文分析目标站点url:http://hz.ziroom.com/z/nl/z3.html?p=2的p参数控制分页get请求获取单页源码--coding:utf-8--importrequestsimporttimefromrequests.exceptionsimportRequest
python的小技巧一 2401_87368790 python 开发语言
print(res)####一个数值的范围比较*常规的写法deftest_judge5(self):“”"判断一个值得的范围大小@return:“”"num=int(input(“请输入一个数字：”))ifnum>=0andnum>在判断字典的某一个key是否为空，可以用try…exception来实现>>>deftest_judge3(self):dict_data={“user_base”:{
Python演奏《起风了》 2401_86461228 python 数据库
代码：importctypesimportthreadingimporttimewinmm=ctypes.windll.winmmclassScale:Rest=0C8=108B7=107A7s=106A7=105G7s=104G7=103F7s=102F7=101E7=100D7s=99D7=98C7s=97C7=96B6=95A6s=94A6=93G6s=92G6=91F6s=90F6=89E
【Python】自动化神器PyAutoGUI —告别手动操作，一键模拟鼠标键盘，玩转微信及各种软件自动化墩墩分墩 Python python 自动化自动化脚本自动化测试 pyautogui
文章目录1.PyAutoGUI简介2.不同操作系统引入模块3.全局延迟和临时休眠4,自动防故障功能5.获取屏幕分辨率—用于定位，这是最关键的，找到要点击的位置（像素坐标）6.获取鼠标位置7.判断坐标是否在屏幕范围内：8.鼠标移动8.1.鼠标移动的基本操作8.2.鼠标移动效果-缓动/渐变（Tween/Easing）9.鼠标点击10.鼠标滚轮控制11.鼠标拖拽12.键盘控制13.消息弹窗函数14.屏幕
pygame下载 2401_86461228 pygame python
pygame下载先进入pygame官网下载与你python对应的版本，然后解压：https://www.pygame.org/download.shtml然后打开cmd命令输入pipinstallpygame等待执行结束，然后打开python输入代码importpygame再运行，入出现以下情况说明安装成功注：我的python是32位的
Python3【字符串】：文本操作的瑞士军刀李智 - 重庆 Python 精讲精练 -从入门到实战 python 开发语言经验分享编程实战趣味编程编程技巧
Python3【字符串】：文本操作的瑞士军刀内容简介本系列文章是为Python3学习者精心设计的一套全面、实用的学习指南，旨在帮助读者从基础入门到项目实战，全面提升编程能力。文章结构由5个版块组成，内容层层递进，逻辑清晰。基础速通：n个浓缩提炼的核心知识点，夯实编程基础；经典范例：10个贴近实际的应用场景，深入理解Python3的编程技巧和应用方法；避坑宝典：10个典型错误解析，提供解决方案，帮助
使用Python实现并行计算算法：效率提升的利器 Echo_Wish Python进阶 python 算法开发语言
在处理大规模数据和计算密集型任务时，单线程的处理方式往往显得力不从心。并行计算作为一种提升计算效率的重要手段，能够充分利用多核处理器的优势，加速任务的完成。Python作为一种灵活且功能强大的编程语言，提供了丰富的并行计算工具。本文将详细介绍如何使用Python实现并行计算算法，并通过具体代码示例展示其实现过程。项目概述本项目旨在通过Python实现一个并行计算算法，展示如何利用Python的多线
华为OD机试2024年E卷-分苹果[100分]（ Java | Python3 | C++ | C语言 | JsNode | Go ）实现100%通过率梅花C 华为OD题库华为od
题目描述A、B两个人把苹果分为两堆，A希望按照他的计算规则等分苹果Q，他的计算规则是按照二进制加法计算，并且不计算进位12+5=9(1100+0101=9)，B的计算规则是十进制加法，包括正常进位，B希望在满足A的情况下获取苹果重量最多。输入苹果的数量和每个苹果重量，输出满足A的情况下B获取的苹果总重量。如果无法满足A的要求，输出-1。数据范围1<=总苹果数量<=200001<=每个苹果重量<=1
python做并行计算_python做并行计算可以吗角动量不守恒 python做并行计算
python可以做并行计算，下面是相关介绍：一、概览ParallelPython是一个python模块，提供在SMP(具有多个处理器或多核的系统)和集群(通过网络连接的计算机)上并行执行python代码的机制。它轻巧，易于安装和与其他python软件集成。ParallelPython是一个用纯Python编写的开源和跨平台模块。二、特性在SMP和集群上并行执行python代码易于理解和实现基于Jo
7. 马科维茨资产组合模型+金融研报AI长文本智能体(Qwen-Long)增强方案（理论+Python实战） AI量金术师金融资产组合模型进化论人工智能金融 python 机器学习算法大数据线性回归
目录0.承前1.深度金融研报准备2.核心AI函数代码讲解2.1函数概述2.2输入参数2.3主要流程2.4异常处理2.5清理工作2.7get_ai_weights函数汇总3.汇总代码4.反思4.1不足之处4.2提升思路5.启后0.承前本篇博文是对前两篇文章，链接:5.马科维茨资产组合模型+政策意图AI金融智能体(Qwen-Max)增强方案（理论+Python实战）6.马科维茨资产组合模型+政策意图A
python字符串写入excel-python 将数据写入excel weixin_37988176
摘要链接：python第三方库——xlrd和xlwt操作Excel文件学习：http://blog.csdn.net/wangkai_123456/article/details/50457284python操作Excel读写(使用xlrd和xlrt)：http://blog.csdn.net/mr__fang/article/details/7089581Python中一般使用xlrd（exce
python并行计算 weixin_30894389
0.基础并行/发：multiprocessing/threading1.concurrent2.并发：asynico3.Ipython下的并行计算：使用ipyparallel库的IPython提供了前所未有的能力，将科学Python的探索能力与几乎即时访问多个计算核心相结合。系统可以直观地与本地或网络的计算节点集群进行交互，而不管集群的实现方式如何。这种易于交互使用帮助IPython和Python
Python并行计算：提高效率的利器 uote_e python java linux Python
在现代计算领域中，处理大规模数据和复杂计算任务是常见的挑战。为了应对这些挑战，一种常见的解决方案是利用并行计算技术。Python作为一种流行的编程语言，也提供了强大的工具和库来支持并行计算。本文将介绍Python中的并行计算概念和技术，并提供一些示例代码。并行计算简介并行计算是指同时执行多个计算任务，以提高计算效率。在传统的串行计算中，任务是按顺序依次执行的，而并行计算可以将任务分解成多个子任务，
Python pip安装、使用详解南山南北山北 Python语言 python pip 开发语言
1、Pythonpip简介pip是Python的软件包安装管理程序（你可以把它简单理解为类似Linux操作系统中的rpm/apt包管理工具），你可以使用pip从Python包索引和其他索引安装包。一般情况下，Python2.7/Python3.4以上版本默认自带安装了pip工具，当然，如果你的安装方式是如下3种之一，那么pip也会被自动安装：在虚拟环境中工作；使用从python.org下载的Pyt
PyQt6医疗多模态大语言模型（MLLM）实用系统框架构建初探（下.代码部分） Allen_LVyingbo 医疗高效编程研发 python 健康医疗 python pyqt 语言模型人工智能
医疗MLLM框架编程实现本医疗MLLM框架结合Python与PyQt6构建，旨在实现多模态医疗数据融合分析并提供可视化界面。下面从数据预处理、模型构建与训练、可视化界面开发、模型-界面通信与部署这几个关键部分详细介绍编程实现。6.1数据预处理在医疗MLLM框架中，多模态数据的预处理是非常关键的一步，它直接影响到后续模型的训练效果和性能。我们需要对医学影像、文本数据和音频数据分别进行预处理，以确保数
【Python】红旗超市线下缴电费用户数据分析及可视化（pandas+pyecharts）风度78 百度人工智能 python 机器学习数据分析
场景分析：一部分用户习惯在红旗超市线下进行缴电费，电力公司希望了解哪些用户喜欢到线下缴费，具体分布在哪里，才能有针对性地宣传掌上电力app引导用户体验更高效的线上缴费方式，提升用户满意度。需求分析：首先要拿到红旗超市线下缴费清单数据，对所有数据进行隐私化处理，数据预览如图所示：可以看出台区名称为本项目的核心字段，通过台区匹配到经纬度信息，然后利用经纬度信息进行线下缴费热力图展示。同时可以提供分析报
Python之JSON数据结构 CL.LIANG python基础 python json 数据结构
JSON数据结构介绍JSON（JavaScriptObjectNotation）优势：1.易于阅读和编写JSON的结构直观、简单，类似于键值对的形式，易于人类阅读和编写。与XML等数据格式相比，JSON的语法更简洁，没有复杂的标记符号。2.轻量化JSON格式相比其他数据格式（如XML），更简洁，没有多余的标记，数据体积较小，这使得数据传输更加高效，尤其是在网络应用中。3.与JavaScript天然
基于Python的天气数据可视化平台 q.q 1102255374 python 信息可视化开发语言
摘要：随着社会多元化的不断发展，天气数据问题不可被简单的理解为是科学问题，更多的是环境问题，可以直接影响到人民的日常生活，甚至对一个国家的政治经济带来影响，由此可见，天气预测是一项非常重要的行业。基于此，我们就需要开发一个可视化的、综合的、方便人们查看的项目。基于Python的天气数据可视化设计与实现，通过使用基于Python的网络爬虫技术,能在短时内提取有价值的信息数据。然后根据数据的形式进行整
华为OD机试E卷 --连续字母长度--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 java python 华为od javascript c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述给定一个字符串，只包含大写字母，求在包含同一字母的子串中，长度第k长的子串的长度，相同字母只取最长的那个子串。输入描述第一行有一个子串(1<长度<=100)，只包含大写字母。第二行为k的值输出描述输出连续出现次数第k多的字母的次数。用例输入AAAAHHHBBCDHHHH3输出
【Flask】以一种访问权限不允许的方式做了一个访问套接字的尝试。ERROR conda.cli.main_run:execute(49): `conda run python 1.py` fail HEX9CF Flask python flask conda
问题描述当尝试启动Flask程序时，出现了启动失败的情况。fromflaskimportFlaskapp=Flask(__name__)@app.route('index.php')defhello():return"Helloworld"if__name__=='__main__':app.run(host='127.0.0.1',port=80)并给出了如下错误提示：*ServingFlask
Python3 字典：解锁高效数据存储的钥匙李智 - 重庆 Python 精讲精练 -从入门到实战 python 经验分享编程实战趣味编程编程技巧
Python3字典：解锁高效数据存储的钥匙内容简介本系列文章是为Python3学习者精心设计的一套全面、实用的学习指南，旨在帮助读者从基础入门到项目实战，全面提升编程能力。文章结构由5个版块组成，内容层层递进，逻辑清晰。基础速通：n个浓缩提炼的核心知识点，夯实编程基础；经典范例：10个贴近实际的应用场景，深入理解Python3的编程技巧和应用方法；避坑宝典：10个典型错误解析，提供解决方案，帮助读
Python 深度学习实战：生成对抗网络 AI天才研究院深度学习实战 AI实战 AI大模型企业级应用开发实战大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍生成对抗网络（GenerativeAdversarialNetwork，GAN）是近年来较火热的深度学习模型之一，其在图像合成、视频生成、文本数据生成等领域均取得了不俗的效果。与传统的机器学习模型不同，GAN可以生成真实有效的数据，无需人工标注数据。它由两部分组成：生成器（Generator）和判别器（Discriminator）。生成器通过学习，根据噪声或随机变量（latentvar
(c/c++)——C++和python的异常处理想要躺平的一枚 C++python c语言 c++
目录一、C++的异常处理二、python的异常处理——自定义异常一、C++的异常处理C++中选择用throw来抛出异常，catch来捕捉异常和处理try{//可能发生异常的语句//throw异常对象}catch(类型1){//发生类型1异常时的处理代码}catch(类型2){//发生类型2异常时的处理代码}catch(...){//不管什么异常，都在这里统一处理。}throw抛出异常对象，异常对象
【自动化】使用PlayWright+代理IP实现多环境隔离青塬科技 Python
Playwright是由微软公司2020年初发布的新一代自动化测试工具，相较于目前最常用的Selenium，它仅用一个API即可自动执行Chromium、Firefox、WebKit等主流浏览器自动化操作。对各种开发语言也有非常好的支持。常用的NodeJs、Java、python都有支持，且有丰富的文档参考。Python环境下的安装使用1、安装依赖库pipinstallplaywright2、安装
python3.10运行moviepy失败 fendouweiqian Python python
运行异常：Nomodulenamed‘moviepy.editor’python版本为：3.10.12修复方案：pipuninstallmoviepypipinstallmoviepy==1.0.3
【Origin+Python】使用External Python批量出图代码参考2 kkkkkkkkk_1201 绘图 python 开发语言
目录前情提要进阶代码1批量绘制曲线图2曲线图设置3批量绘制相同设置的曲线图去除水印前情提要基础教程见链接:【Origin+Python】使用ExternalPython批量出图代码参考这里主要介绍一些进阶代码以及使用盗版origin要如何去除水印的方法！#############################################################进阶代码########
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后