Python3爬虫教程-1.使用爬虫抓取网页上的一张图片

Python3爬虫教程-1.使用爬虫抓取网页上的一张图片

  • 操作环境
  • 用到的库
  • 操作
    • 安装库:request
    • 定位图片
    • 写代码

操作环境

  1. win10 专业版(1803)
  2. Python 3.7.2
  3. Chrome版本 73.0.3683.103(正式版本)(64 位)

用到的库

  1. requests 2.21.0

操作

安装库:request

pip3 install requests

定位图片

在百度百科搜索github希望下载logo
Python3爬虫教程-1.使用爬虫抓取网页上的一张图片_第1张图片
在开发者工具(F12)内找到Network,刷新浏览器,在图片上右击检查发现是一个jpg类型图片
Python3爬虫教程-1.使用爬虫抓取网页上的一张图片_第2张图片
在Network中按类型排序可以快速定位到图片文件,选中后查看headers
Python3爬虫教程-1.使用爬虫抓取网页上的一张图片_第3张图片
可以看到请求方式(Request Method)是GET,那么在代码中我们可以使用requests.get这个方法来获取这张图片,requests.get(‘Request URL’),Request URL即为你在headers中的链接

写代码

>>> re = requests.get('https://gss0.bdstatic.com/94o3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D220/sign=d034324c01f79052eb1f403c3cf2d738/0dd7912397dda1445da42dedbab7d0a20df486c4.jpg')
>>> print(re)	

# 返回的状态码为200说明请求正常
>>> print(re.content)
b'\xff\xd8\xff\xe0\x00\x10JFIF\x00\x01\x01\x01\x00\x01\x00\x01\x00\x00\xff\xdb\x00C\x00\x06\x04\x05\x06\x05\x04\x06\x06\x05\x06\x07\x07\x06\x08\n\x10\n\n\t\t\n\x14\x0e\x0f\x0c\x10\x17\x14\x18\x18\x17\x14\x16\x16\x1a\x1d%\x1f\x1a\x1b#\x1c\x16\x16 , #&\')*)\x19\x1f-0-(0%()(\xff\xdb\x00C\x01\x07\x07\x07\n\x08\n\x13\n\n\x13(\x1a\x16\x1a((((((((((((((((((((((((((((((((((((((((((((((((((\xff\xc0\x00\x11\x08\x00\x96\x00\xdc\x03\x01"\x00\x02\x11\x01\x03\x11\x01\xff\xc4\x00\x1f\x00\x00\x01\x05\x01\x01\x01\x01\x01\x01\x00\x00\x00\x00\x00\x00\x00\x00\x01\x02\x03\x04\x05\x06\x07\x08\t\n\x0b\xff\xc4\x00\xb5\x10\x00\x02\x01\x03\x03\x02\x04\x03\x05\x05\x04\x04\x00\x00\x01}\x01\x02\x03\x00\x04\x11\x05\x12!1A\x06\x13Qa\x07"q\x142\x81\x91\xa1\x08#B\xb1\xc1\x15R\xd1\xf0$3br\x82\t\n\x16\x17\x18\x19\x1a%&\'()*456789:CDEFGHIJSTUVWXYZcdefghijstuvwxyz\x83\x84\x85\x86\x87\x88\x89\x8a\x92\x93\x94\x95\x96\x97\x98\x99\x9a\xa2\xa3\xa4\xa5\xa6\xa7\xa8\xa9\xaa\xb2\xb3\xb4\xb5\xb6\xb7\xb8\xb9\xba\xc2\xc3\xc4\xc5\xc6\xc7\xc8\xc9\xca\xd2\xd3\xd4\xd5\xd6\xd7\xd8\xd9\xda\xe1\xe2\xe3\xe4\xe5\xe6\xe7\xe8\xe9\xea\xf1\xf2\xf3\xf4\xf5\xf6\xf7\xf8\xf9\xfa\xff\xc4\x00\x1f\x01\x00\x03\x01\x01\x01\x01\x01\x01\x01\x01\x01\x00\x00\x00\x00\x00\x00\x01\x02\x03\x04\x05\x06\x07\x08\t\n\x0b\xff\xc4\x00\xb5\x11\x00\x02\x01\x02\x04\x04\x03\x04\x07\x05\x04\x04\x00\x01\x02w\x00\x01\x02\x03\x11\x04\x05!1\x06\x12AQ\x07aq\x13"2\x81\x08\x14B\x91\xa1\xb1\xc1\t#3R\xf0\x15br\xd1\n\x16$4\xe1%\xf1\x17\x18\x19\x1a&\'()*56789:CDEFGHIJSTUVWXYZcdefghijstuvwxyz\x82\x83\x84\x85\x86\x87\x88\x89\x8a\x92\x93\x94\x95\x96\x97\x98\x99\x9a\xa2\xa3\xa4\xa5\xa6\xa7\xa8\xa9\xaa\xb2\xb3\xb4\xb5\xb6\xb7\xb8\xb9\xba\xc2\xc3\xc4\xc5\xc6\xc7\xc8\xc9\xca\xd2\xd3\xd4\xd5\xd6\xd7\xd8\xd9\xda\xe2\xe3\xe4\xe5\xe6\xe7\xe8\xe9\xea\xf2\xf3\xf4\xf5\xf6\xf7\xf8\xf9\xfa\xff\xda\x00\x0c\x03\x01\x00\x02\x11\x03\x11\x00?\x00\xfa\xa6\x8a(\xa0\x02\x8a(\xa0\x02\x8a(\xa0\x02\x8a(\xa0\x02\x8a+\x8a\xf1\xff\x00\xc4\xdf\x0cx\x1a,kW\xe0\xde\x95\xdc\x96V\xe3\xcc\x9d\xbf\xe0?\xc2=\xdb\x02\x80;Zl\x92$h\xcf#\x05E\x19,\xc7\x00~5\xf2\x1f\x8c\xbfi/\x11\xean\xf1xf\xd2\xdfG\xb6<\td\x02y\xc8\xfc~E\xfc\x8f\xd6\xbc{^\xf1.\xb9\xe2\tL\x9a\xe6\xaf\x7f~\xc7\xb5\xc4\xec\xca>\x8b\x9c\x0f\xc0P\x07\xdf\x1a\xa7\xc4\x0f\x08iD\x8b\xff\x00\x12\xe8\xf0\xb0\xea\xa6\xed\x0b\x0f\xc0\x12k\x11\xfe3\xfc=V\xc1\xf1M\x81>\xdb\xcf\xf2Z\xf8-@_\xba\x00\xfa\x0cS\xb2}h\x19\xf7\xdd\x9f\xc5\xbf\x01]\xb8X|W\xa5\x02\x7f\xe7\xa4\xde_\xfe\x85\x8a\xea\xb4\xcdgL\xd5S~\x99\xa8Y\xde/\xad\xbc\xeb \xff\x00\xc7I\xaf\xcd\x9c\x9at\x12=\xbc\xa2[whe\x07!\xe3%X~#\x9a\x00\xfd3\xa2\xbe\x0e\xf0\xa7\xc6_\x1cxq\x91`\xd6\xa5\xbe\xb6_\xf9w\xd4\x07\x9e\xa4zn?0\xfc\x1a\xbd\xe3\xc0\x7f\xb4~\x85\xab4v\xbe)\xb6m\x16\xe8\xe0}\xa0\x13-\xb3\x1fs\x8d\xc9\xf8\x82=\xe8\x11\xef4T6wP^\xdbGqi4S\xdb\xc8\xbb\x92X\x982\xb8\xf5\x04pEM@\x05\x14Q@\x05\x14Q@\x05\x14Q@\x05\x14Q@\x05\x14Q@\x05\x14Q@\x05\x14Q@\x05Gsq\x15\xad\xbc\x93\xdcJ\x91C\x1a\x97wv\n\xaa\xa3\x92I=\x00\xf5\xa2\xe6x\xadm\xe5\x9e\xe2D\x8a\x18\x94\xbb\xbb\xb6\x15T\x0c\x92O`\x05|a\xf1\xdf\xe2\xfd\xcf\x8d\xefe\xd24I^\x1f\x0c\xc4\xd8\xe3*\xd7\xa4\x1f\xbe\xdf\xecz/\xe2{\x00\x01\xd7|^\xfd\xa1&\xb8y\xb4\x9f\x00\xc8a\x80e$\xd5H\xf9\x9f\xfe\xb8\x83\xd0\x7f\xb6y\xf4\x03\xad|\xe7q4\xb73\xc9=\xc4\xb2K4\x8cY\xe4\x91\x8b3\x93\xdc\x93\xc95\x1d\x14\x0c(\xa2\x8a\x00(\xa2\x8a\x00(\xa2\x8a\x00(\xa2\x8a\x00\xed>\x1c\xfcI\xf1\x0f\x80o\x03\xe8\xf7>e\x836f\xb0\x9c\x93\x0c\x9e\xa4\x0f\xe0o\xf6\x97\xf1\xcd}\x97\xf0\xc3\xe2N\x89\xf1\x07L3ir\x18/\xa1Pnle#\xcd\x84\xfa\xff\x00\xb4\xbe\x8c8\xfa\x1e+\xe0\n\xd1\xf0\xfe\xb5\xa8\xf8{X\xb6\xd54k\xa9-/\xad\xdbtr\xa7\xea\x08\xee\xa7\xa1\x07\x83@\x1f\xa4\x94W\x9d\xfc\x19\xf8\x9bc\xf1\x13B,B[kV\xa0\x0b\xcb@z\x13\xd2D\xcfT?\xa1\xe0\xfa\x9fD\xa0AE\x14P\x01E\x14P\x01E\x14P\x01E\x14P\x01E\x14P\x01E\x15\xc4\xfcb\xf1\x92x\x1b\xc0\x97\xfa\xaa\x957\xad\x88,\xd1\xbf\x8af\xce\xdf\xc0r\xc7\xd9h\x03\xc3\xff\x00j_\x89msw\'\x834Y\x88\xb7\x8b\x07S\x95\x0f\xdf~\xa2\x1f\xa0\xe0\xb7\xbe\x07c_8S\xe7\x9a[\x89\xe4\x9a\xe2F\x96i\x18\xbb\xc8\xe7,\xecNI\'\xd4\x92M2\x81\x964\xfbI\xb5\x0b\xfb[+U\xdfqs*C\x1a\xfa\xb30Q\xfa\x9a\xfa^\xff\x00\xf6[\x80\xdagO\xf1D\xebr\x17\xa5\xc5\xaa\xb2\x13\xff\x00\x01 \x81\xf9\xd7\x8c\xfc\r\xb6K\xaf\x8b\xbe\x15\x8eL\x15\x17\x82N}Q\x19\x87\xea\x05}\xf8:\n\x04|\x13\xe3\xcf\x84\x9e-\xf0ZI>\xa1a\xf6\xbd9:\xde\xd9\x13,`z\xb0\xc6\xe4\xfcF=\xeb\x80\xeb\xd3\xa5~\x9a2\x86\x040\xc8<\x11^e\xad|\x0c\xf0&\xaf\xae\xb6\xa9q\xa5\xd1 \xf6\'!G\xe1\x9a\xfa_\xc1\xfe\x12\xd1\x85\x01\xad:\x04\x14QE\x00\x14QE\x00\x14QE\x00\x14QE\x00\x15\xf1\xb7\xedm\xa6%\x97\xc4\xeb{\xc8\xc6>\xdfa\x1c\x8f\xee\xc8\xcc\x99\xfc\x82\xd7\xd95\xf2?\xed\x8d >8\xd0\xa3\x1dWNf?\x8c\xad\xfe\x14\x01\xe0TQE\x03=\xff\x00\xf69\xbd1\xf8\xd7]\xb2\xdd\x84\x9fOYq\xeaR@?\x93\x9a\xfa\xda\xbe3\xfd\x92I\x1f\x15&\x1e\xbad\xdf\xfa\x1cu\xf6e\x02\n(\xa2\x80\n(\xa2\x80\n(\xa2\x80\n(\xa2\x809/\x8bvf\xff\x00\xe1\x8f\x8am\x90e\x9fM\x9c\x81\xee\x10\x9f\xe9_\x9e\xf9\xc8\xcf\xaf5\xfa_{m\x1d\xe5\x9c\xf6\xd3\x0c\xc524l=C\x0c\x1f\xe7_\x9bZ\xb5\x84\xbaV\xa9y\xa7N\n\xcdi;\xdb\xb8>\xa8\xc5\x7f\xa5\x03EZ1\x9e\x0fCE\x14\x01\xf7\xd7\xc0\xcd`k\x7f\n<7s\xb84\x91\xda-\xb4\x9e\xcf\x17\xee\xce\x7f\xef\x90\x7f\x1a\xee\xeb\xe5_\xd9#\xc6\xf1\xd9_\xdexF\xfeP\x89x\xe6\xea\xc8\xb1\xe3\xcd\x03\x0f\x1f\xd4\x80\x18\x7f\xba\xd5\xf5U\x02\n(\xa2\x80\n(\xa2\x80\n(\xa2\x80\n(\xa2\x80\n\xf8\x83\xf6\x9c\xd5\xd7U\xf8\xbb\xa8\xc7\x1b\xef\x8e\xc2\x18\xac\xc1\x1f\xde\x03{~\xaeG\xe1__x\xfb\xc56^\r\xf0\xa5\xfe\xb5\xa80\xd9n\x9f\xbb\x8f82\xc8xD\x1e\xe4\xe3\xf0\xc9\xed_\x9e\x9a\x9d\xf5\xc6\xa7\xa9]\xdf\xde\xbf\x99uu+\xcf+\xff\x00y\xd8\x92O\xe6h\x02\xb5\x14Q@\xcfw\xfd\x8f\xad|\xdf\x88z\xad\xc9\x1f,\x1ak\x0c\xfb\xbc\x89\x8f\xfd\x04\xd7\xd7\xd5\xf3\x97\xecm\xa4\x18\xb4_\x11k\x0e\x9c\\\\Gk\x1b{F\xa5\x9b\xf5\x90~U\xf4m\x02\n(\xa2\x80\n(\xa2\x80\n(\xa2\x80\n(\xa2\x80\n\xf8\x9b\xf6\x9e\xf0\xd3h_\x13\xeeo#M\xb6\xba\xbcb\xf1\x08\xe9\xe6}\xd9\x07\xd7 7\xfc\n\xbe\xd9\xaf(\xfd\xa4|\x14\xde-\xf0\x04\xb3\xd9\xc4d\xd4\xf4\xa2n\xe0\n>g\\~\xf1\x07\xd5y\x1e\xea(\x03\xe2\x1aB\xca\x0e\x0b.}3\xcd(=\x08\xe4u\xaf\xa1\xfe\x05\xfc@\xf0\x9c\xda-\xaf\x83\xfcU\xa3iv\xd7\r\x98m\xef\xe5\xb5\x8d\xe2\x9c\xb7\xdd\x12\xe4p\xf98\xc9\xe0\xf1\xd2\x81\x9f>\xdbO5\xa5\xccW\x16\xd2\xc9\r\xc4.$\x8eH\xdbk#\x03\x90A\xecA\xaf\xae\xbe\x0e\xfcy\xd3\xb5\xfbk}+\xc5\xf3\xc3\xa7\xebJ\x02-\xcb\xfc\x90]\x1f\\\xf4G=\xc1\xe0\xf6=\xab\xcf>,\xfc\x1a\x161]\\xn\xce\xec\xdei\xf6\x89u|\xb1\xda\x18\xed.T\x92\x19\xad\xfef\xd8\xeb\x8c\xb4Y\xe8r\xbe\x95\xe0|\x11\xd8\x83\xfa\xd0\x07\xe9\xa2\xb2\xb0\x05H \x8c\x82;\xd2\xd7\xe7\xd7\x84~%x\xbb\xc2J\xb1h\x9a\xdd\xccv\xab\xd2\xdalM\x08\xfa+g\x1f\x86+\xd7\xfc\x13\xfbC\xf8\xb3W\xd6,4\x86\xf0\xe6\x9d\xa9^\xddH!\x8cA+\xdb\x96\'\xb9\xce\xe0\x00\x19$\xf6\x00\xd0#\xeaj)\x90\x971!\x94*\xc9\x81\xb8)\xc8\x07\xbe\x0f\xa5>\x80\n(\xaf1\xf8\xdd\xf1\x07Z\xf8{\xa6\xda\xdf\xe9\xfa\x1d\xbe\xa1a3yOq%\xc3\'\x93!\xfb\xa1\x94/ \xf69\xea1\xe9@\x1e\x9d\\\xe7\x8d|k\xa0\xf83M7\x9e \xd4#\xb6\x04\x1f.\x1f\xbd,\xa7\xd1\x13\xab\x7f/R+\xe4\x8f\x11\xfe\xd0>:\xd6\x11\xe3\xb6\xbb\xb4\xd2bn1e\x07\xcf\x8f\xf7\xdc\xb1\xfc\xb1^Y\xa8_]\xeaW\x92]\xea7S\xdd\xddI\xcb\xcd<\x86Go\xa9<\xd0\x07s\xf1\x7f\xe2n\xa3\xf1\x17XG\x91Z\xd3H\xb6\'\xec\xb6{\xb3\x8c\xf5w=\xdc\x8f\xc0\x0e\x07r|\xfa\x8a(\x18Q\xd3\x9c\x13\xec(\xafL\xfd\x9f<\x16\xde1\xf8\x85jn"/\xa5\xe9\x85o.\x89\x1c6\x0f\xee\xe3\xff\x00\x810\xfc\x94\xd0\x07\xd6\x7f\x06<4|\'\xf0\xdbD\xd3%@\xb7B\x1f>\xe4c\x9f6C\xbd\x81\xfag\x1f\x85v\xd4\x0e(\xa0AE\x14P\x01E\x14P\x01E\x14P\x01E\x14P\x01A\x19\xebE\x14\x01\xf1?\xed\x15\xf0\xe5\xbc\x19\xe2\x86\xd4\xb4\xe8J\xe8:\x9c\x8c\xf1m\x1f,\x12\x9eZ/`ye\xf6\xc8\xed^Dy\x18<\x83_\xa3\xde,\xf0\xee\x9d\xe2\xad\x02\xefG\xd6 \x13Y\xdc\xa6\xd6\x19\xc1S\xd42\x9e\xcc\x0f \xfa\xd7\xc2_\x14<\x03\xaa|?\xf1\x0b\xe9\xfa\x882\xdaHKZ^\x05\xc2\\\'\xf4a\xdd{}\x08\xa0g\xd1_\x02\xf5\xe3\xf1+\xe1\xf2h\xda\xbe\xa3}\x06\xab\xa1\\\xc2\xdfh\xb6\x9bd\xb2F\xa713\x1f\xe2\x04\x06F\x04\x1c\xe3=Myw\xc4O\x84z\x95\xee\xa1\xac\xeb\x1e\x11\xd1/ml\xe1\xbd\x92\x19t\xdb\xa5X\x9dNr\x1e\xdc\x93\xb6H\x9b \x80\x0eGL\x1a\xf3\xdf\x87\x1e4\xd4|\x07\xe2x5\x8d3\x12\x00<\xbb\x8bv8Y\xe2\'%I\xecx\x04\x1e\xc4}E}y\xa5x\xd3\xe1\xf7\xc5\x9f\x0f\xff\x00f\xea\x13Z\xca%*\xd2\xe9\xb7\xcf\xe5J\xac\x0eF9\x19\xc1\xee\xa4\xd0\x07\xc6\xcd\xe1?\x11\xad\xc1\x81\xbc?\xac\x89\x81\xc1O\xb0\xcb\x9c\xff\x00\xdf5\xef\xff\x00\xb3\x0f\xc3moF\xf1=\xd6\xbf\xe2M&k\x14\x8e\xd4\xc3h.\x08Y7\xb9\x1b\x8e\xcc\xe5~Q\x8eq\xf7\xab\xdf.|3iq\xafiz\xba\xddj\x11>\x9f\x11\x8a\x18!\xbbu\xb7e#\x1f<`\xe1\x8f=O\xa0\xf4\x14\xdf\x0b\xe8:\x06\x85y\xaa\xff\x00aE\x0cWW\xb3\xfd\xaa\xf7l\xc6Fi\x1b?1\x04\x92;\xf1\xc0\xa0GCE\x14P\x01\\\xb7\xc5\x1d\x1a-\x7f\xe1\xef\x884\xd9\x97p\x96\xceB\x9e\xce\xaaY\x0f\xe0\xca+\xa9\xaa\x1a\xf7\xfc\x815\x0f\xfa\xf7\x93\xff\x00@4\x01\xf9\xb0\xa7r\xabz\x80ii\xb1\xff\x00\xabO\xf7G\xf2\xa7P0\xa2\x8aUR\xcc\x15A,H\x00\x01\x92O`(\x02k\x1bK\x8b\xfb\xd8-,\xa1y\xee\xa7\x91b\x8a(\xc6Y\xdc\x9c\x00=\xc9\xaf\xbc\xbe\x0c\xf8\x0e\x1f\x00x6\x0b\x06\xd8\xfa\x94\xe7\xcf\xbe\x99\x7f\x8eR>\xe8?\xddQ\xf2\x8f\xa1=\xeb\x82\xfd\x9d\xbe\x10\xb7\x86bO\x12x\x96\x005\xc9\x93\xfd\x1a\xd9\xc6~\xc6\x84rO\xfd4#\xaf\xf7G\x1dI\xafy\xa0AE\x14P\x01E\x14P\x01E\x14P\x01E\x14P\x01E\x14P\x01E\x14P\x01X\x9e1\xf0\xbe\x95\xe2\xfd\x0e}\']\xb5[\x8bYy\x1d\x9a6\xec\xe8\xddU\x87\xaf\xf4\xad\xba(\x03\xe1_\x8b?\x08\xb5\xaf\x00\\Ir\x15\xf5\r\x04\xb7\xee\xef\xa3_\xf5c\xb2\xca\xa3\xee\x9f\x7f\xba}\xbaW\x9a\x10\x0fP\x0f\xd6\xbfL\xa6\x89&\x89\xe2\x99\x15\xe3pU\x95\x86C\x03\xd4\x10z\x8a\xf0\x9f\x88\xdf\xb3\xa6\x8d\xad<\xb7\xbe\x13\x99t[\xe6\xcb\x1br\xa5\xad\\\xfd\x071\xff\x00\xc0r=\xa8\x03\xe4\x91up\xa9\xb1ng\t\xfd\xd1+c\xf2\xcd}\x1b\xfb\x18\x7f\xc7\xff\x00\x8b}Lv\xc4\x9e\xe7\x99k\xc7>> with open(r'c:\temp\logo.jpg', 'wb') as logo:
... 	logo.write(re.content)
... 	logo.close()
...
4427
# 返回数字及说明图片保存成功
>>>

现在查看我们保存图片的路径下就有logo.jpg的图片了
Python3爬虫教程-1.使用爬虫抓取网页上的一张图片_第4张图片

你可能感兴趣的:(Python3爬虫教程,Python3,爬虫,入门)