Python爬虫学习(3):案例练习--软科中国大学排名

一、分析

1、爬取网站地址:https://www.shanghairanking.cn/rankings/bcur/2020.
2、爬取内容:网站第1页左侧30个大学的排名
3、爬取网页源码部分的html:
Python爬虫学习(3):案例练习--软科中国大学排名_第1张图片
Python爬虫学习(3):案例练习--软科中国大学排名_第2张图片

二、代码优化前

Python爬虫学习(3):案例练习--软科中国大学排名_第3张图片
运行结果:
Python爬虫学习(3):案例练习--软科中国大学排名_第4张图片

三、代码优化后

Python爬虫学习(3):案例练习--软科中国大学排名_第5张图片
Python爬虫学习(3):案例练习--软科中国大学排名_第6张图片
运行结果:
Python爬虫学习(3):案例练习--软科中国大学排名_第7张图片

四、增加将结果写入本地txt文件的功能

Python爬虫学习(3):案例练习--软科中国大学排名_第8张图片
运行结果:
Python爬虫学习(3):案例练习--软科中国大学排名_第9张图片
如果希望输出到本地文件中去掉中括号[],则可以将print(info, file=data)代码修改为print(info[0], info[1], info[2], file=data):
Python爬虫学习(3):案例练习--软科中国大学排名_第10张图片
运行结果:
Python爬虫学习(3):案例练习--软科中国大学排名_第11张图片
-----end-----

你可能感兴趣的:(Python学习,python)