Python爬虫与数据可视化案例(共享源码)

       计算机技术日新月异,编程语言众多,每种编程语言又有自己的特点和适用场景,究竟应该如何选择呢?众说纷纭。我们可以参考编程语言的热度排名,了解世界范围内,各种编程语言的热度及发展趋势

       TIOBE编程语言排行榜根据互联网上有经验的程序员、课程和第三方厂商的数量,并使用搜索引擎以及Wikipedia、Amazon、YouTube统计出排名数据,能够较好反映某个编程语言的热门程度,TIOBE排行榜每个月更新一次,网址为:https://www.tiobe.com/tiobe-index/。下面我们就 通过Python抓取2001年5月至今,TIOBE编程语言排行榜上编程语言的热度数据,并绘制成动态的效果图,最终效果如下。

Python爬虫与数据可视化案例(共享源码)_第1张图片

1、数据抓取和保存

       首先打开TIOBE排行榜首页:https://www.tiobe.com/tiobe-index/,查看源代码,可发现源代码中就直接包含了排名前十的编程语言在各个时期的热度值,源代码部分截图如下:

Python爬虫与数据可视化案例(共享源码)_第2张图片

       接下来可直接获取网页内容,然后通过正则表达式进行解析获取每一部分信息。首先,获取每一种编程语言的信息;然后循环解析这些信息,获取每一个月份的热度值;最后,将解析的结果保存到文件中去。关键代码参考如下:

Python爬虫与数据可视化案例(共享源码)_第3张图片

2、绘制动态变化图

        首先,使用Pandas库中相关方法,直接读取csv文件,得到DataFrame类型对象,获取所有的不重复的时间信息;然后,循环遍历每一个时间信息,获取该时间下所有编程语言的热度,并根据热度值对数据以及编程语言进行排序,使得热度最高放在最上面;接着,根据排好序的热度值以及编程语言名称,绘制水平的条形图;最后,每个图停留0.05秒,清空图上的内容,继续绘制下一个时间对应的图。参考到代码如下:

Python爬虫与数据可视化案例(共享源码)_第4张图片

 注意:代码中使用到了一些第三方库,要保证相关库已安装并且已导入,否则无法执行。相关导入内容如下:   

Python爬虫与数据可视化案例(共享源码)_第5张图片

 
     

Python爬虫与数据可视化案例(共享源码)_第6张图片

源代码及相关资源,可关注 Python资源分享 微信公众号,回复rank 即可获取。

 

你可能感兴趣的:(Python学习,python,数据可视化)