python 图表_Python入门学习系列——使用Python调用Web API实现图表统计

使用Python调用Web API实现图表统计

Web API:Web应用编程接口,用于URL请求特定信息的程序交互,请求的数据大多以非常易于处理的格式返回,比如JSON或CSV等。

本文将使用Python中的requests包实现Web API的调用,API接口来自于GitHub提供的公用API,最后使用图表对API调用的结果进行图表统计显示。

API地址为:https://api.github.com/search/repositories?q=language:python&sort=stars,该调用返回GitHub当前托管了多少个Python项目,包括最受欢迎的Python仓库的信息,结果如下:

{

"total_count": 3114636,

"incomplete_results": false,

"items": [

{

"id": 21289110,

"node_id": "MDEwOlJlcG9zaXRvcnkyMTI4OTExMA==",

"name": "awesome-python",

"full_name": "vinta/awesome-python",

"private": false,

"owner": {

"login": "vinta",

"id": 652070,

"node_id": "MDQ6VXNlcjY1MjA3MA==",

"avatar_url": "https://avatars2.githubusercontent.com/u/652070?v=4",

...

使用Web API

如果想要Python调用Web API,需要使用requests包,该包用于处理网络请求和返回响应信息。可以使用pip工具输入以下命令进行安装:

$ pip install --user requests

使用requests处理API响应

import requests

#执行API调用并存储响应

url='https://api.github.com/search/repositories?q=language:python&sort=stars'

# 调用url,将响应对象存储在变量r中

r=requests.get(url)

# 查看请求返回的http 状态码,200表示请求成功

print("Stauts Code",r.status_code)

# 使用json()将API的响应信息(json格式)转换为一个Python字典或JSON对象

response_dict=r.json()

#处理结果

print(response_dict.keys())

执行后,输出结果如下:

Stauts Code 200

dict_keys(['total_count', 'incomplete_results', 'items'])

对返回的结果进行深度处理

针对上述API返回的结果,进一步的进行解析,返回每一个仓库的详细信息。具体见代码注释说明:

import requests

#执行API调用并存储响应

url='https://api.github.com/search/repositories?q=language:python&sort=stars'

# 调用url,将响应对象存储在变量r中

r=requests.get(url)

# 查看请求返回的http 状态码,200表示请求成功

print("Stauts Code",r.status_code)

# 使用json()将API的响应信息(json格式)转换为一个Python字典或JSON对象

response_dict=r.json()

# 获取GitHub包含的Python库数量

print("Total repositories:",response_dict["total_count"])

#探索有关仓库的信息,items是由多个字典组成的列表,每一个字典包含一个仓库信息

repo_dicts=response_dict['items']

print("Repositories returned:",len(repo_dicts))

##研究第一个仓库

#repo_dict=repo_dicts[0]

#print("\nKeys:",len(repo_dict))

#for key in sorted(repo_dict.keys()):

# print(key)

print("\nSelected information about each repository:")

# 循环遍历获取每一个仓库的详细信息

for repo_dict in repo_dicts:

# 项目名称

print('\nName:', repo_dict['name'])

# 键owner来访问表示所有者的字典,再使用键key来获取所有者的登录名。

print('Owner:', repo_dict['owner']['login'])

print('Stars:', repo_dict['stargazers_count'])

print('Repository:', repo_dict['html_url'])

print('Created:', repo_dict['created_at'])

print('Updated:', repo_dict['updated_at'])

print('Description:', repo_dict['description'])

上述代码返回的结果如下:

Stauts Code 200

Total repositories: 3114623

Repositories returned: 30

Selected information about each repository:

Name: awesome-python

Owner: vinta

Stars: 56507

Repository: https://github.com/vinta/awesome-python

Created: 2014-06-27T21:00:06Z

Updated: 2018-10-21T22:26:31Z

Description: A curated list of awesome Python frameworks, libraries, software an

d resources

Name: system-design-primer

Owner: donnemartin

Stars: 50650

Repository: https://github.com/donnemartin/system-design-primer

Created: 2017-02-26T16:15:28Z

Updated: 2018-10-21T22:02:07Z

Description: Learn how to design large-scale systems. Prep for the system design

interview. Includes Anki flashcards.

Name: models

....

注意:大多数API都存在速率限制,即你在特定时间内可执行的请求数存在限制。要获悉你是否接近了GitHub的限制,请在浏览器中输入https://api.github.com/rate_limit,你将看到类似于下面的响应:

AAffA0nNPuCLAAAAAElFTkSuQmCC

通过结果可以指定,极限为每分钟10个请求。

使用Pygal对分析的结果进行可视化

完整代码如下所示,具体说明见代码中的详细注释:

import requests

import pygal

from pygal.style import LightColorizedStyle as LCS, LightenStyle as LS

#执行API调用并存储响应

url='https://api.github.com/search/repositories?q=language:python&sort=stars'

# 调用url,将响应对象存储在变量r中

r=requests.get(url)

# 查看请求返回的http 状态码,200表示请求成功

print("Stauts Code",r.status_code)

# 使用json()将API的响应信息(json格式)转换为一个Python字典或JSON对象

response_dict=r.json()

# 获取GitHub包含的Python库数量

print("Total repositories:",response_dict["total_count"])

#探索有关仓库的信息,items是由多个字典组成的列表,每一个字典包含一个仓库信息

repo_dicts=response_dict['items']

#print("Repositories returned:",len(repo_dicts))

## 创建两个空列表存储包含在图表中的信息,名称用于条形图表的标签,星的数量用于确定条形图表的高度

#names,stars=[],[]

# plot_dicts用于添加自定义工具提示

names,plot_dicts=[],[]

for repo_dict in repo_dicts:

names.append(repo_dict["name"])

# 并不是每个节点一定有description,所以加if判断

if repo_dict["description"]:

plot_dict={

# Pygal根据与键'value'相关联的数字来确定条形的高度

'value':int(repo_dict["stargazers_count"]),

# 使用与'label'相关联的字符串给条形创建工具提示

'label':repo_dict["description"],

# 为条形图表添加可点击的链接

'xlink': repo_dict['html_url'],

}

plot_dicts.append(plot_dict)

#可视化,定义样式,将其基色设置为深蓝色,并传入LightColorizedStyle

my_style=LS('#333366',base_style=LCS)

my_config = pygal.Config()

# 表示让标签绕x轴旋转45度

my_config.x_label_rotation = 45

# 表示隐藏了图例

my_config.show_legend = False

# 图表标题字体大小

my_config.title_font_size = 24

# 副标签字体大小,包括x轴上的项目名以及y轴上的大部分数字

my_config.label_font_size = 14

# 主标签字体大小,y轴上为5000整数倍的刻度

my_config.major_label_font_size = 18

# 将较长的项目名缩短为15个字符

my_config.truncate_label = 15

# 隐藏图表中的水平线

my_config.show_y_guides = False

# 设置了自定义宽度

my_config.width = 1000

# 使用Bar()创建一个简单的条形图

# x_label_rotation=45:表示让标签绕x轴旋转45度

# show_legend=False:表示隐藏了图例

# chart=pygal.Bar(style=my_style,x_label_rotation=45,show_legend=False)

# 将上述的配置进行改进,分装为一个my_config对象

# 传递配置设置

chart=pygal.Bar(my_config,style=my_style)

chart.title="Most-Starred Python Projects on GitHub"

chart.x_labels=names

# 暂不需要添加标签

#chart.add('',stars)

# 添加工具提示需要的字典列表

chart.add('',plot_dicts)

chart.render_to_file("python_repos.svg")

#print("\nSelected information about each repository:")

## 循环遍历获取每一个仓库的详细信息

#for repo_dict in repo_dicts:

# # 项目名称

# print('\nName:', repo_dict['name'])

# # 键owner来访问表示所有者的字典,再使用键key来获取所有者的登录名。

# print('Owner:', repo_dict['owner']['login'])

# print('Stars:', repo_dict['stargazers_count'])

# print('Repository:', repo_dict['html_url'])

# print('Created:', repo_dict['created_at'])

# print('Updated:', repo_dict['updated_at'])

# print('Description:', repo_dict['description'])

上述代码中,使用了pygal.Bar()方法创建一个简单的条形图,并向它传递了my_style。同时还传递了另外两个样式实参:让标签绕x轴旋转45度(x_label_rotation=45),并隐藏了图例(show_legend=False),因为只在图表中绘制一个数据系列。

执行代码显示结果如下图所示:

AAffA0nNPuCLAAAAAElFTkSuQmCC

参考资源

《Python编程:从入门到实践》

本文后续会随着知识的积累不断补充和更新,内容如有错误,欢迎指正。

最后一次更新时间:2018-10-23

你可能感兴趣的:(python,图表)