梦子mengy7762

使用Python PIL库实现简单验证码的去噪处理

想要识别验证码，收集足够多的样本后，首先要做的就是对验证码原始图片进行处理，对验证码识别分类之前，一般包括：将彩色图片转换成灰度图、将灰度图二值化和去除噪点三个基本过程。这里仅以比较简单的验证码为例，介绍一下如何通过Python的PIL库对图片去噪处理。

首先看一下未经处理的验证码图片：

对图片处理主要使用了PIL库的Image类。

1、彩色图片转换成灰度图

首先使用Image的open方法打开上面的图片，可以得到一个PIL.Image.Image对象，之后就可以调用convert、filter、point和putpixel等方法来处理图片。

我们可以通过convert方法将上面的彩色图片转换成灰度图：

# encoding=utf8

from PIL import Image

def main():

image = Image.open('RandomPicture.png')

imgry = image.convert('L')

imgry.save('gray.png')

if __name__ == '__main__':

main()

注：想学习Python的小伙伴们

可以


领取从0到1完整学习资料 视频  精品书籍

一个月经典笔记和99道练习题及答案

运行结果：

通过保存的图片可以看出来，已经由原来的彩图变成了灰度图，或者也可以认为是黑白图。什么叫灰度图？我们知道彩色图片是由不同的颜色的像素组合到一起的，那灰度图可以类似的认为是由不同灰度值的像素组合在一起后呈现出来的。任何颜色都有红、绿、蓝三原色组成，假如原来某点的颜色为RGB(R，G，B)，那么，我们可以通过下面几种方法，将其转换为灰度：

1.浮点算法：Gray=R0.3+G0.59+B*0.11

2.整数方法：Gray=(R30+G59+B*11)/100

3.移位方法：Gray =(R76+G151+B*28)>>8;

4.平均值法：Gray=（R+G+B）/3;

5.仅取绿色：Gray=G；

通过上述任一种方法求得Gray后，将原来的RGB(R,G,B)中的R,G,B统一用Gray替换，形成新的颜色RGB(Gray,Gray,Gray)，用它替换原来的RGB(R,G,B)就是灰度图了。

用代码实现看一下：

# encoding=utf8

from PIL import Image

def main():

image = Image.open('RandomPicture.png')

print ('image mode: ', image.mode)

print (image.getpixel((0, 0)))

print ('-' * 40)

imgry = image.convert('L')

print ('imgry mode: ', imgry.mode)

print (imgry.getpixel((0, 0)))

if __name__ == '__main__':

main()

运行结果：

image mode: RGB

(234, 235, 236)

imgry mode: L

234

[Finished in 0.1s]

代码说明：

通过image.mode方法可以获得当前的PIL.Image.Image对象（也就是当前打开的图片）的mode值，而mode值表示图片的单位颜色是由RGB三个值组成的还是由灰度值组成的；

而getpixel可以获取某个像素的RGB值或者灰度值。我们知道图片是由许多像素组成的，每个像素在图片上都有一个对应的坐标x和y，而“(0, 0)”就表示该图片左上角顶点的像素。

由上面的结果我们可以知道，在将图片转换成灰度图之前，“(0, 0)”代表的像素的颜色是由RGB组成的：(21, 10, 26)；在通过concert将彩色图片转换成灰度后，“(0, 0)”代表的像素的颜色值就变成了一个值：“15”，通过打印imgry.mode我们也可以知道，此时图片已经变成了灰度图，它的每一个像素的颜色都变成了一个灰度值。

其实这时候我们也可以简单的计算一下，使用前面说的浮点算法将上面的(21, 10, 26)三个值带入计算：

210.3+100.59+26*0.11

15.059999999999999

结果显示确实由浮点算法将RGB值变成了灰度值。

2、灰度图二值化

我们已经得到了灰度图，接下来就是将灰度图二值化。所谓二值化就是将灰度图像转换成由黑白二色组成的图像。思路就是确定一个阈值，大于阈值的像素表示为白色，小于阈值的像素表示为黑色，以此将图片的像素（灰度值）划分为两部分：0和1，例如0代表黑色，1代表白色，然后我们就可以用一串0和1组成的数字来表示一张图片。

将灰度图二值化会用到point方法，它可以接收一个灰度转二值的映射table，具体原理暂时还没弄明白，代码实现过程是这样的：

# encoding=utf8

from PIL import Image

def get_bin_table(threshold=115):

'''

获取灰度转二值的映射table

0表示黑色,1表示白色

'''

table = []

for i in range(256):

  if i < threshold:

  table.append(0)

  else:

  table.append(1)

return table

def main():

image = Image.open('RandomPicture.png')

imgry = image.convert('L')

table = get_bin_table()

binary = imgry.point(table, '1')

binary.save('binary.png')

if __name__ == '__main__':

main()

运行结果：

通过结果不难看出，我们已经将最开始的彩色图由灰度图转变成了仅由黑白二色组成的图片，实现了二值化。这里需要说明的是，threshold参数值针对当前的验证码图片合适，该值需要根据验证码类型不同进行调试来确定。

然后我们再看看(0, 0)坐标代表的像素的颜色值是什么：

# encoding=utf8

from PIL import Image

def  get_bin_table(threshold=115):

'''

获取灰度转二值的映射table

0表示黑色,1表示白色

'''

table  = []

for i in range(256):

  if i < threshold:

    table.append(0)

  else:

  table.append(1)

return table

def main():

image = Image.open('RandomPicture.png')

print 'image  mode: ', image.mode

print image.getpixel((0, 0))

co =  image.getcolors()

print co

print '-' * 40

imgry =  image.convert('L')

print 'imgry mode: ', imgry.mode

print  imgry.getpixel((0, 0))

co = imgry.getcolors()

print co

print '-' *  40

table = get_bin_table()

binary = imgry.point(table, '1')

print  'binary mode: ', binary.mode

print binary.getpixel((0, 0))

co =  binary.getcolors()

print co

if __name__ == '__main__':

main()

运行结果：

image mode: RGB

(234, 235, 236)

None

imgry mode: L

234

[(1, 16), (1, 17), (3, 18), (3, 20), (3, 21), (2, 22), (3, 24), (2, 25), (1, 26), (3, 28), (1, 29), (6, 31), (15, 32), (136, 33), (193, 34), (115, 35), (52, 36), (25, 37), (24, 38), (16, 39), (7, 40), (4, 41), (3, 42), (4, 43), (2, 44), (4, 45), (4, 46), (2, 48), (4, 49), (2, 50), (4, 51), (4, 52), (2, 53), (11, 54), (18, 55), (21, 56), (71, 57), (61, 58), (24, 59), (15, 60), (17, 61), (11, 62), (8, 63), (11, 64), (8, 65), (10, 66), (6, 67), (4, 68), (5, 69), (9, 70), (7, 71), (11, 72), (11, 73), (6, 74), (16, 75), (22, 76), (15, 77), (19, 78), (12, 79), (16, 80), (11, 81), (17, 82), (24, 83), (29, 84), (18, 85), (35, 86), (18, 87), (22, 88), (23, 89), (25, 90), (19, 91), (21, 92), (19, 93), (29, 94), (25, 95), (20, 96), (17, 97), (15, 98), (16, 99), (24, 100), (21, 101), (14, 102), (23, 103), (20, 104), (15, 105), (15, 106), (12, 107), (16, 108), (19, 109), (18, 110), (10, 111), (15, 112), (16, 113), (31, 114), (16, 115), (21, 116), (15, 117), (15, 118), (19, 119), (15, 120), (14, 121), (23, 122), (17, 123), (17, 124), (17, 125), (10, 126), (19, 127), (18, 128), (10, 129), (11, 130), (9, 131), (13, 132), (21, 133), (12, 134), (18, 135), (15, 136), (9, 137), (20, 138), (20, 139), (15, 140), (21, 141), (30, 142), (30, 143), (35, 144), (35, 145), (122, 146), (43, 147), (36, 148), (32, 149), (21, 150), (37, 151), (30, 152), (45, 153), (33, 154), (31, 155), (37, 156), (37, 157), (37, 158), (33, 159), (51, 160), (64, 161), (47, 162), (32, 163), (39, 164), (48, 165), (51, 166), (55, 167), (126, 168), (64, 169), (217, 170), (263, 171), (85, 172), (44, 173), (39, 174), (44, 175), (38, 176), (60, 177), (43, 178), (54, 179), (47, 180), (64, 181), (55, 182), (56, 183), (44, 184), (66, 185), (64, 186), (56, 187), (66, 188), (68, 189), (86, 190), (108, 191), (93, 192), (112, 193), (83, 194), (67, 195), (68, 196), (75, 197), (65, 198), (69, 199), (70, 200), (88, 201), (111, 202), (71, 203), (74, 204), (83, 205), (73, 206), (94, 207), (119, 208), (92, 209), (114, 210), (89, 211), (87, 212), (96, 213), (106, 214), (85, 215), (82, 216), (103, 217), (106, 218), (99, 219), (140, 220), (134, 221), (126, 222), (114, 223), (137, 224), (140, 225), (137, 226), (148, 227), (137, 228), (126, 229), (118, 230), (135, 231), (137, 232), (120, 233), (187, 234), (168, 235), (226, 236), (358, 237), (354, 238), (288, 239), (194, 240), (201, 241), (219, 242), (245, 243), (250, 244), (303, 245), (303, 246), (389, 247), (412, 248), (569, 249), (792, 250), (1410, 251), (3198, 252), (5163, 253), (6040, 254), (2028, 255)]

binary mode: 1

[(1768, 0), (30998, 1)]

[Finished in 0.1s]

代码说明：

通过binary mode的值我们可以知道二值化后得到的图片的像素值由0或1表示，而且当前(0, 0)代表的像素值的为0，它代表黑色，通过上面的图片我们也可以知道，左上角顶点确实是黑色的。

上面的代码中我们还使用了getcolors方法，它用来返回像素信息，是一个含有元素的列表：[(该种像素的数量，(该种像素)),(…),…]，当该列表特别大的时候，它会返回None，这也是为什么上面彩色图片调用getcolors的时候会返回None。而[(503, 0), (1993, 1)]就表示我们得到的二值化黑白图片，由503个黑色像素点和1993个白色像素点组成。

通过binary.size我们可以得到二值化后的黑白图片的width和height值：(78, 32)，它就表示该图片由78X32个像素点组成，正好等于503+1993的和。(78, 32)也说明该图片横向上共有32行，每行有78个像素点。将由0和1表示的图片打印出来看一下：

# encoding=utf8

from PIL import Image

def get_bin_table(threshold=115):

    '''

    获取灰度转二值的映射table

    0表示黑色,1表示白色

    '''

    table = []

    for i in range(256):

        if i < threshold:

            table.append(0)

        else:

            table.append(1)

    return table

def main():

    image = Image.open('RandomPicture.png')

    imgry = image.convert('L')

    table = get_bin_table()

    binary = imgry.point(table, '1')

    width, height = binary.size

    lis = binary.getdata()    
    # 返回图片所有的像素值，要使用list()才能显示出具体数值

    lis = list(lis)

    start = 0

    step = width

    for i in range(height):

        for p in lis[start: start+step]:

            if p == 1:    # 将白色的点变成空格，方便人眼看

                p = ' '

            print p,

        print

        start += step

if __name__ == '__main__':

    main()

运行结果：

通过上面的结果已经大致可以看出该图片表示的就是“959c”。

3、去除噪点

由上面的结果也不难看出，除了表示“959c”的“0”，图片中还有其他的“0”代表的“噪点”，我们要尽可能的去除它们，方便后期的识别训练。

对于去除噪点代码实现：

# encoding=utf8

from PIL import Image

def sum_9_region_new(img, x, y):

'''确定噪点 '''

cur_pixel = img.getpixel((x, y))  # 当前像素点的值

width = img.width

height = img.height

if cur_pixel == 1:  # 如果当前点为白色区域,则不统计邻域值

  return 0

# 因当前图片的四周都有黑点，所以周围的黑点可以去除

if y < 3:  # 本例中，前两行的黑点都可以去除

  return 1

elif y > height - 3:  # 最下面两行

  return 1

else:  # y不在边界

  if x < 3:  # 前两列

  return 1

  elif x == width - 1:  # 右边非顶点

  return 1

  else:  # 具备9领域条件的

  sum = img.getpixel((x - 1, y - 1)) \

      + img.getpixel((x - 1, y)) \

      + img.getpixel((x - 1, y + 1)) \

      + img.getpixel((x, y - 1)) \

      + cur_pixel \

      + img.getpixel((x, y + 1)) \

      + img.getpixel((x + 1, y - 1)) \

      + img.getpixel((x + 1, y)) \

      + img.getpixel((x + 1, y + 1))

  return 9 - sum

def collect_noise_point(img):

'''收集所有的噪点'''

noise_point_list = []

for x in range(img.width):

  for y in range(img.height):

  res_9 = sum_9_region_new(img, x, y)

  if (0 < res_9 < 3) and img.getpixel((x, y)) == 0:  # 找到孤立点

    pos = (x, y)

    noise_point_list.append(pos)

return noise_point_list

def remove_noise_pixel(img, noise_point_list):

'''根据噪点的位置信息，消除二值图片的黑点噪声'''

for item in noise_point_list:

  img.putpixel((item[0], item[1]), 1)

def get_bin_table(threshold=115):

'''获取灰度转二值的映射table,0表示黑色,1表示白色'''

table = []

for i in range(256):

  if i < threshold:

  table.append(0)

  else:

  table.append(1)

return table

def main():

image = Image.open('RandomPicture.png')

imgry = image.convert('L')

table = get_bin_table()

binary = imgry.point(table, '1')

noise_point_list = collect_noise_point(binary)

remove_noise_pixel(binary, noise_point_list)

binary.save('finaly.png')

if __name__ == '__main__':

main()

运行结果：

通过截图可以知道，我们已经去除了图片四周的噪点以及一些孤立的噪点。

还要再说一句的就是，除了上面的步骤，我们还可以通过PIL的ImageEnhance,和ImageFilter对图片做其他处理（例如增加对比度、亮度、锐化等），这里就不举例说明了，因为不同的图片经过这些处理后，可能效果会不同。

释放 DeepSeek 的力量：像专家一样本地安装与探索！ guzhoumingyue AI python
要在本地运行DeepSeek，您需要遵循以下步骤。请确保您的计算机上已安装Python和Git，并且满足DeepSeek的依赖项。步骤1:安装依赖项安装Python和pip确保您已安装Python（建议使用Python3.6及以上版本）。您可以通过在终端/命令提示符中输入以下命令来检查Python是否已安装：bash复制代码python--version或者bash复制代码python3--ver
ffmpeg-python安装 neverayever 计算机 ffmpeg python linux
centos-ffmpeg-python安装安装ffmpeg一：下载并解压wgethttp://www.ffmpeg.org/releases/ffmpeg-4.2.tar.gztar-zxvfffmpeg-4.2.tar.gz若linux服务器没网，可以在windows上直接访问http://www.ffmpeg.org/releases/ffmpeg-4.2.tar.gz就可下载，然后上传至服
Python的那些事第二十七篇：Python中的“数据魔法师”NumPy 暮雨哀尘 Python的那些事 python numpy 开发语言数据分析算法数组索引
摘要在这篇幽默风趣的论文中，我们将深入探讨NumPy——Python中最强大的数值计算库之一。它不仅提供了高性能的多维数组对象，还让复杂的数学运算变得像吃冰淇淋一样简单。本文将通过生动的代码示例和幽默的比喻，带你领略NumPy的魔法世界，让你在欢笑中掌握这个强大的工具。一、引言：为什么NumPy是程序员的“超级英雄”？1.1NumPy的起源：从“数据苦力”到“数据魔法师”想象一下，你被困在一个全是
Python爬虫TLS dme. Python爬虫零基础入门爬虫 python
TLS指纹校验原理和绕过浏览器可以正常访问，但是用requests发送请求失败。后端是如何监测得呢？为什么浏览器可以返回结果，而requests模块不行呢？https://cn.investing.com/equities/amazon-com-inc-historical-data1.指纹校验案例1.1案例：ascii2dhttps://ascii2d.net/importrequestsres
python爬虫Selenium库详细教程_python爬虫之selenium库的使用详解嘻嘻哈哈学编程程序员 python 爬虫 selenium
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化学习资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！2.2访问页面2.3查找元素2.3.1单个元素下面
排序算法：冒泡排序（Python）娱乐不打烊丶排序算法算法数据结构
思路：大家一定都喝过汽水吧，汽水中常常有许多小小的气泡，往上飘，这是因为组成小气泡的二氧化碳比水要轻，所以小气泡才会一点一点的向上浮。而冒泡排序之所以叫冒泡排序，正是因为这种排序算法的每一个元素都可以向小气泡一样，根据自身大小，一点一点向着数组的一侧移动。一图解百惑，上图！那么，话不多说，上代码！defbubble_sort(input_list):#冒泡排序：每次循环，锁定一个最值，并朝着最大或
supervisord 命令介绍和使用案例 lisanmengmeng linux 命令工具系统运维 shell编程服务器 linux 运维
supervisord命令介绍和使用案例supervisord是一个用Python编写的进程管理工具，用于监控和管理Linux系统中的进程。它可以将普通的命令行进程转变为后台守护进程（daemon），并监控进程状态，在进程异常退出时自动重启。它通过fork/exec的方式把被管理的进程当作自己的子进程来启动。主要功能:进程管理：能够启动、停止、重启和关闭进程.自动重启：监控进程状态，并在进程崩溃时
ptython setup.py install 设置python包编译时的并行数 leo0308 基础知识 Python python pytorch3d
通过源码编译安装pytorch3d的时候，直接执行pythonsetup.pyinstall时，默认开的并行数很多，有10几个，直接导致机器卡死。通过设置下面的环境变量，可以设置较小的并行数，避免占用过多的资源。exportMAX_JOBS=4设置后，同时只有4个编译的进程。
python 自动化数据提取之正则表达式_python 正则提取(2) m0_60607245 程序员 python 学习面试
一、Python所有方向的学习路线Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。二、Python必备开发工具工具都帮大家整理好了，安装就可直接上手！三、最新Python学习笔记当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理
GUI编程（window系统→Linux系统）诚信爱国敬业友善心得 linux python gui
最近有个项目需要将windows系统的程序往Linux系统上面移植，由于之前程序没有考虑过多平台兼容的问题，导致部分功能不可用以下是对近期遇到的问题的总结，以及相应的解决方案和经验分享。1.Python模块安装与管理在Linux系统中，安装和管理Python模块时可能会遇到权限问题或依赖冲突。安装模块：使用pip安装模块时，建议使用--user选项，避免需要管理员权限：bash复制pipinsta
spring boot基于知识图谱的阿克苏市旅游管理系统python-计算机毕业设计 QQ1963288475 spring boot 知识图谱旅游 python vue.js django flask
目录功能和技术介绍具体实现截图开发核心技术：开发环境开发步骤编译运行核心代码部分展示系统设计详细视频演示可行性论证软件测试源码获取功能和技术介绍该系统基于浏览器的方式进行访问，采用springboot集成快速开发框架，前端使用vue方式，基于es5的语法，开发工具IntelliJIDEAx64，因为该开发工具，内嵌了Tomcat服务运行机制，可不用单独下载Tomcatserver服务器。由于考虑到
淘宝/天猫店铺订单数据导出、销售报表设计与数据分析指南不会玩技术的技术girl API 数据分析人工智能数据库
在电商运营中，订单数据是店铺运营的核心资产之一。通过对订单数据的导出、整理和分析，商家可以更好地了解销售情况、优化运营策略、提升客户满意度，并制定科学的业务决策。本文将详细介绍淘宝/天猫店铺订单数据的导出方法、销售报表的设计思路以及数据分析的实用技巧，帮助电商从业者高效管理店铺数据。一、订单数据导出（一）手动导出订单数据淘宝和天猫平台提供了手动导出订单的功能，适用于数据量较小或临时性需求的场景。商
Python从0到100（三十九）：数据提取之正则（文末免费送书）是Dream呀 python mysql 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
安心联车辆管理系统在汽车金融领域的应用安心联-车辆监控管理系统汽车金融人工智能
安心联车辆管理系统在汽车金融领域的应用主要体现在通过智能化监控与数据分析技术，提升金融风控能力、优化资产管理和降低运营风险。以下从核心功能、技术赋能和实际场景三个方面展开分析：一、核心功能适配金融场景车辆资产动态监控实时定位与电子围栏：系统基于北斗/GPS双模定位技术，可实时追踪车辆位置，并设置电子围栏限制车辆行驶区域。若车辆驶出授权范围（如贷款合同约定的使用区域），系统立即触发报警并留存轨迹证据
清华大学第四发《DeepSeek+DeepResearch 让科研像聊天一样简单》人工智能
当下科研领域，传统模式急需改变，清华大学第四版《DeepSeek+DeepResearch：让科研像聊天一样简单》全文一共86页，以下是文档的关键内容总结：一、智能组合优势DeepSeek与DeepResearch构建先进技术体系，有强大模型运算、智能数据处理和友好交互界面。模型在数据处理速度、精准度和泛化能力上远超传统模型。数据采集渠道广、处理快，能读取多种格式文件。数据分析深入，可视化直观，还
Python学习心得两大编程思想 lifegoesonwjl python 开发语言 pycharm 前端 c语言
一、两大编程思想：1.面向过程：功能上的封装典型代表：C语言2.面向对象：属性和行为上的封装典型代表：Python、Java二、面向过程与面向对象的异同点：1.区别：面向过程：事物比较简单，可用线性的思维去解决面向对象：事务比较复杂，使用简单的线性思维无法解决2.共同点：（1）面向过程和面向对象都是解决实际问题的一种思维方式；（2）二者相辅相成，并不是对立的；（3）解决复杂问题，通过面向对象方式便
Linux升级Anacodna并配置jupyterLab 伪_装环境部署 linux 服务器 Anaconda python jupyter
在使用Anaconda的过程中，随着项目和需求的发展，可能需要升级Anaconda的Base环境中的Python版本。本文将详细介绍如何安全地进行升级，包括步骤、代码示例与最终流程图。升级Python一、环境准备在进行任何升级之前，建议先检查当前的Python版本以及各个库的兼容性。我们可以通过以下命令检查当前的Python版本：condainfo你会看到类似以下的输出，其中包含了当前Python
【Linux】删除Conda虚拟环境不是伍壹 Linux linux conda 运维
1、查看当前系统的conda虚拟环境condainfo--envscondaenvlist2、创建虚拟的环境condacreate-n（你的环境名字）python=（你需要的版本号，如（3.7,3.8,3.10））3、查看安装了哪些包condalist4、删除虚拟环境condaremove-nname--all5、删除虚拟环境中的包condaremove--name$（需要删除的环境名字）$（需要
动态规划之背包问题--python版本我是小码搬运工 #python基础动态规划背包问题 python版本
动态规划之背包问题–python版本问题已知一个最大量的背包，给定一组给定固定价值和固定体积的物品，求在不超过最大值的前提下，能放入背包中的最大总价值。解题思路该问题是典型的动态规划问题，分为三种不同的类型（0-1背包问题、完全背包和多重背包问题）解题关键–状态转移表达式：B(k,C)=max(B(k−1,C),B(k−1,C−ci)+vi)B(k,C)=max(B(k-1,C),B(k-1,C-
Centos7 搭建 Jupyter + Nginx 服务某龙兄 python nginx linux centos
JupyterNotebook（此前被称为IPythonnotebook）是一个交互式笔记本，支持运行40多种编程语言。JupyterNotebook的本质是一个Web应用程序，便于创建和共享文学化程序文档，支持实时代码，数学方程，可视化和markdown。用途包括：数据清理和转换，数值模拟，统计建模，机器学习等等。本文讲述如何搭建Jupyter+Nginx服务,仅供学习与交流，请勿用于商业用途一
智能化工作流：探索顶尖工作流管理软件的核心优势团队协作工具
工作流管理软件是一种用于规划、执行和监控业务流程的软件应用程序。以下是关于工作流管理软件的详细介绍：一、定义与功能工作流管理软件旨在帮助团队和企业优化工作流程，提高工作效率。它通常包括任务分配、进度追踪、团队协作、自动化流程、数据分析等功能。通过这类软件，企业可以更好地管理内部流程，确保任务的顺利进行，并实时监控项目的进展情况。二、主要软件推荐板栗看板：可视化管理与团队协作的利器核心功能：板栗看板
动态规划之背包问题的Python实现名侦探debug Python 数据结构 python 数据结构动态规划求解
目录1.问题描述2.动态规划之网格法3.python实现1.问题描述题目来源于《算法图解》第9章练习题9.2，如下图所示。对于背包问题，通常的做法有列举法、贪婪算法和动态规划（1）列举法：列举出所有的可能情况，再选择最优解，但当情况很多时，这种算法复杂度很高（2）贪婪算法：在容量允许范围内，每次都拿剩余物品中价值最高的，贪婪算法能够快速解决复杂度很高的问题，但通常得到的是次优解，但就对这个题目而言
总结10个Python赚钱的接单平台兼职月入5000+ begefefsef 面试学习路线阿里巴巴 android 前端后端
前言“如果说当下什么编程语言最靠谱或者比较适合搞副业？”答案肯定100%是：Pythonpython是所有语法中最简单易上手的语言，不需要特别的的英语词汇量，逻辑思维也不需要很差就能上手。而且学会了之后就能编写代码爬取各种数据，制作各种图表，提升工作效率。而且还能利用业余时间接点私活，一个月轻松收入过万不是问题，这样的生活他不香吗？今天就给大家盘点几个基本入门接私活的资源，让你轻松学python，
大学生学完python靠几个接单网站兼职，实现经济独立「已注销」 python 开发语言
大学生学完python靠几个接单网站兼职，实现经济独立程序员就是当今时代的手艺人，程序员可以通过个人的技术来谋生。而在工作之余接私单可以作为一种创富的途径，受到程序员的广泛认可。说句实在话，现在这个时代，很多人仅靠主业顶多维持基本生活，想让自己、家人生活好一点很难。我接的私活并不算多，加起来也就几万左右，只能算一半，我想把一些经验分享出来，毕竟现在生活都不容易，能赚一点是一点。一、程序员接活、新手
Conda 常用命令全解析 melck conda
在Windows系统中，Conda是一款功能强大的包管理和环境管理工具，尤其对于数据分析、科学计算等场景有着重要的作用。本文将详细介绍Conda在Windows系统中的常用命令，帮助你高效地管理虚拟环境和软件包。一、环境管理命令1.1查看Conda版本conda--version该命令用于确认Conda是否成功安装以及查看其版本号。这对于确保Conda的兼容性和功能性非常重要。1.2创建新环境co
Python wifi 安装手机app yichengace python
目的当测试机数量越来越多时，测试包的安装会成为一个问题，用wifi安装来解决这个问题，并且用脚本语言来批量控制思路思路就是py调用pc端的adb命令，向手机发送请求，无线是因为，如果未来测试机越来越多，一台电脑的usb接口数量肯定不够准备工具python，adb，pycharm，测试用app，这里选择qq（https://qd.myapp.com/myapp/qqteam/AndroidQQ/mo
深度学习之目标检测的常用标注工具铭瑾熙人工智能机器学习深度学习深度学习目标检测目标跟踪
1LabelImgLabelImg是一款开源的图像标注工具，标签可用于分类和目标检测，它是用Python编写的，并使用Qt作为其图形界面，简单好用。注释以PASCALVOC格式保存为XML文件，这是ImageNet使用的格式。此外，它还支持COCO数据集格式。2labelmelabelme是一款开源的图像/视频标注工具，标签可用于目标检测、分割和分类。灵感是来自于MIT开源的一款标注工具Label
Python 舆论风向分析爬虫：全流程数据获取、清洗与情感剖析西攻城狮北 python 爬虫开发语言实战案例
引言在当今信息爆炸的时代，互联网上充斥着海量的用户言论和观点。了解舆论风向对于企业、政府机构以及研究者等具有重要的意义，可以帮助他们及时把握公众情绪、调整策略与决策。Python作为一种强大的编程语言，在数据爬取与分析方面具有得天独厚的优势，能够助力我们高效地实现舆情监测与深入剖析。一、环境搭建与目标确定1.环境搭建为了顺利完成爬虫与数据分析任务，首先需要确保你的开发环境已经安装了以下Python
PyCharm 集成 DeepSeek：本地运行 or API 直连？打造你的 AI 编程神器！ AI云极【AI智能系列】pycharm 人工智能 ide deepseek
在AI赋能编程的时代，如何让AI辅助写代码，提升开发效率？DeepSeek作为一款开源、强大、免费的AI编程助手，结合PyCharm，能够大幅提升Python编程体验。今天，我们就来详细讲解如何在PyCharm中接入DeepSeek，无论你想使用本地部署的DeepSeek，还是官方API版本，都能轻松实现！为什么选择DeepSeek+PyCharm？DeepSeekR1采用6710亿参数的MoE（
Python3.5源码分析-sys模块及site模块导入小屋子大侠 python Python分析 python源码
Python3源码分析本文环境python3.5.2。参考书籍>python官网Python3的sys模块初始化根据分析完成builtins初始化后，继续分析sys模块的初始化，继续分析_Py_InitializeEx_Private函数的执行，void_Py_InitializeEx_Private(intinstall_sigs,intinstall_importlib){...sysmod=
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc

使用Python PIL库实现简单验证码的去噪处理

你可能感兴趣的:(爬虫,数据分析,python,python,爬虫,elasticsearch)