4行爬虫我就把搜狗爬了!!!!

最近有人私信说,上一篇爬虫太难了,我看不懂,然后我今天就发布一篇超级无敌简单的爬虫。

上代码:

import requests
if __name__ == '__main__':
    #指定url
    url = "https://www.baidu.com/"
    #发送请求
    response = requests.get(url=url)
    #获取响应的数据 response.text是响应的字符串形式的数据
    page_text = response.text
    print(page_text)
    #持久化存储
    with open('./baidu.html', 'w', encoding='utf-8') as  fp:
        fp.write(page_text)
    print('爬取成功')

说明一下哈:这里需要安装requests库,
可以直接pip install requests 也可以根据第一篇的爬虫进行安装自行选择。
爬取成功后就会显示一个小的网页的全部信息,可以试一下,适合新手。

你可能感兴趣的:(python,爬虫)