【Python学习】有趣的爬虫

今天来学习爬图片

import requests

url = 'http://ww2.sinaimg.cn/large/9150e4e5gy1fqlsbgiohjj208c069dfz.jpg'
fanhui = requests.get(url)
print(fanhui.text)

会显示出来图片的Unicode
如果在fanhui后面不加text会显示

import requests

url = 'http://ww2.sinaimg.cn/large/9150e4e5gy1fqlsbgiohjj208c069dfz.jpg'
fanhui = requests.get(url)
img = fanhui.content
with open('test.jpg','wb')as f:  #将conten数据 输出文件jpg
    f.write(img)                 #保存下来

然后就会显示出来jpg的文件了
.text返回的是Unicode型的数据。
.content返回的是bytes型也就是二进制的数据。

import requests
import re

haha = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.26 Safari/537.36 Core/1.63.5221.400 QQBrowser/10.0.1125.400"}
html = requests.get('http://www.17k.com/',headers = haha )
html.encoding = 'UTF-8'

# print (html.text)
huifu = re.findall('target="_blank">(.*?)',html.text,re.S)
for each in huifu:
    print (each)

跑出来了小说的名字23333
(:з」∠)好难啊爬虫但是又觉得好玩今天先到这里了明天还是继续书上的内容一步一步来吧~

你可能感兴趣的:(萌新编程)