最近准备用做个机器学习来识别验证码,但是缺少训练数据,于是从某网站上爬取验证码图片作为训练集来训练训练。
按下F12过后点那个箭头,选择验证码图片。
然后我们得到了验证码图片的地址,复制下来
。
import requests as rq
def code_get(pic_num,scr,path):
i = 0
while i < pic_num:
picture = rq.get(scr, headers= {
'user-agent':'Chrome/10'} )
with open(path+'code'+str(i)+'.jpg','wb') as f:
f.write(picture.content)
print("图片"+str(i)+"爬取完成")
i+=1
url = input("输入网址:")
n = eval(input("请输入要爬取的图片数量:"))
path = 'D://'
code_get(n,url,path)
然后我们就得到了很多张验证码图片!