weixin_39519619

python做数据可视化的代码_利用Python实现数据可视化（入门）

什么是 matplotlib ？

matplotlib 是一个数学绘图库，我们可以用它来制作一些简单的图表，例如折线图，或散点图。

绘制简单的折线图

import matplotlib.pyplot as plt

squares = [1, 4, 9, 16, 25]

plt.plot(squares)

plt.show()

模块 pyplot 包含很多用于生成图表的函数，类似于 matlab

把列表作为参数传入函数 pyplot.plot(),

这个函数会尝试根据这些数字绘制出有意义的图形。

函数 pyplot.show() 会打开图像查看器，并显示绘制的图形。查看器可以实现放大缩小或者保存功能。

在画出了一个简单的图标之后，我们可以对图表进行简单的改动，来增加图形的可读行，如修改标签文字和线条粗细。

import matplotlib.pyplot as plt

squares = [1, 4, 9, 16, 25]

plt.plot(squares, linewidth=5)

# 设置图标标题，并给坐标轴加上标签

plt.title("Square Numbers", fontsize=24)

plt.xlabel("Value", fontsize=14)

plt.ylabel("Square of Value", fontsize=14)

# 设置刻度标记大小

plt.tick_params(axis='both', labelsize=14)

plt.show()

在代码中, linewidth 决定了 plot() 绘制的线条的粗细。函数 title() 给图标指定标题。

参数 fontsize 代表图表中文字的大小。

函数 xlabel() 和函数 ylabel() 可以设定每条轴线的标题，而函数 tick_params() 设置刻度的样式，

其中指定的实参可以设置x轴和y轴上的刻度。

再完成了这些设置之后，就会发现图形的可读性有了一点提高。

但是，如果我们自习观察图表，我们会发现，图中的数据并不是完全正确的，例如图中4的平放式25.

这事由于绘图工具plot的一些默认设置导致的问题。如，plot的默认原点x=0，但是我们这个例子中要求的原点x=1

为了改变这种默认的设置，我们可以添加输入值和输出值

input_values = [1, 2, 3, 4, 5]

squares = [1, 4, 9, 16, 25]

plt.plot(input_values, squares, linewidth=5)

这样一来我们就可以实现正确的绘制一个简单的折线图

绘制简单的散点图

有时我们需要绘制散点图来处理离散的数据，所以我们就可以利用函数 scatter() 来绘制简单的散点图.

import matplotlib.pyplot as plt

plt.scatter(2, 4)

plt.show()

利用简单的两行语句就可实现一个散点的绘制，同时我们也可以对代码进行修改来设置输出的样式，使得散点图更具有可读性。

import matplotlib.pyplot as plt

plt.scatter(2, 4, s=200)

# 设置图表标题并给坐标轴加上标签

plt.title("Square Number", fontsize=24)

plt.xlabel("Value", fontsize=14)

plt.ylabel("Square of Value", fontsize=14)

# 设置刻度标记的大小

plt.tick_params(axis='both', which='major', labelsize=14)

plt.show()

在设置了各项参数之后，我们就可以得到一个较为完整的散点图了。

不过，我们在数据处理时，大多数情况下都是要处理的是大量的数据，而不是只有一个离散的点，所以我们需要使用函数绘制一些列的点。

通过列表来给函数传输一系列的点

import matplotlib.pyplot as plt

x_values = [1, 2, 3, 4, 5]

y_values = [1, 4, 9, 16, 25]

plt.scatter(x_values, y_values, s=200)

--snip--

函数 scatter() 分别从 x_value 和 y_value 读取一个值来绘制一个点 (x,y)。

手工输入或手工计算列表中所有的值，在数据量很大的时候效率会非常的低。我们可以使用循环来代替我们完成计算。

import matplotlib.pyplot as plt

x_values = list(range(1, 1001))

y_values = [x ** 2 for x in x_values]

plt.scatter(x_values, y_values, s=1)

--snip--

# 设置每个坐标轴的取值范围

plt.axis([0, 1100, 0, 1100000])

plt.show()

利用函数 range() 创建数字1~1000的列表，遍历x的值并计算 x**2 ,并将其结果存储到列表 y_values 中。

函数 axis() 指定每个坐标轴的取值范围。向函数中传入四个参数，x、y的最大值最小值。

这样我们就可以让循环来帮助我们计算大量的数据并绘图了。

matplotlib 默认散点图中的点为蓝色点和黑色轮廓，但是在数据过多时我们会发现。黑色轮廓会粘连在一起。

不过我们可以通过改变一些参数来修改一些外观。

plt.scatter(x_values, y_values, edgecolors='none', s=40)

这样一来就会发现图中将时蓝色的实心点。

当然我们也可以修改数据点的颜色。

plt.scatter(x_values, y_values, c='red', edgecolors='none', s=40)

# 也可以使用RGB来设置自定义颜色

plt.scatter(x_values, y_values, c=(0, 0, 0.8), edgecolors='none', s=40)

为了使图表的可读性更强，也更漂亮，我们可以使用颜色映射(colormap)是一些列颜色，从其实颜色渐变到结束颜色。

在可视化中颜色映射可以突出数据的规律，较浅的颜色来显示较小的值，并使用较深的颜色显示较大的值。

我们只需在 scatter() 函数中的一个参数，就可将图形改变为颜色映射。

plt.scatter(x_values, y_values, c=y_values, cmap=plt.cm.Blues,

edgecolor='none', s=1)

为了避免我们在作图之后忘记保存，我们可以在程序中直接添加自动保存功能。将 show() 函数替换为 savefig()

plt.savefig('squares_plot.png', bbox_inches='tight')

绘制随机漫步图

什么是随机漫步图？

随机漫步是一种路径，这种路径每次行走都是完全随机的，没有明确的方向，结果是有一些列随机决策决定的。

我们可以把它当作蚂蚁在晕头转向的情况下，每次都沿着随机的方向行进所经过的路径。

在生活中的很多领域我们都可以用到随机漫步。

例如，漂浮在水滴上的划分因不断受到水分子的挤压而在水面上移动。

水滴中的分子运动是随机的，因此划分在水面上的运动路径犹如随机漫步。

接下来我们将一步一步的实现随机漫步。首先我们要先创建 RandomWalk 类。

from random import choice

class RandomWalk():

"""一个随机生成漫步数据的类"""

def __init__(self, num_points=5000):

"""初始化随机漫步数据的属性"""

self.num_points = num_points

# 所有随机漫步都始于(0,0)

self.x_values = [0]

self.y_values = [0]

在该类中包含三个属性，其中一个存储随机漫步的次数，在上面代码中次数为5000个。

另外两个是列表，分别存放随机漫步经过的每个点的x和y坐标，

在上述代码中规定所有的随机漫步都始于(0,0)。

接下来使用函数 fill_walk() 来生成漫步包含的点，并决定每次漫步的方向以及漫步的距离。

from random import choice

def fill_walk(self):

"""计算随机漫步包含的所有点"""

# 不断漫步，直到列表到达指定的长度

while len(self.x_values) < self.num_points:

# 决定前进方向以及沿这个方向前进的距离

x_direction = choice([1, -1])

x_distance = choice([0, 1, 2, 3, 4])

x_step = x_direction * x_distance

y_direction = choice([1, -1])

y_distance = choice([0, 1, 2, 3, 4])

y_step = y_direction * y_distance

# 拒绝原地踏步

if x_step == 0 and y_step == 0:

continue

# 计算下一个点的x和y值

next_x = self.x_values[-1] + x_step

next_y = self.y_values[-1] + y_step

self.x_values.append(next_x)

self.y_values.append(next_y)

在函数中设置一个循环，让“蚂蚁”不断漫步，直到步数到达最大的设定。

使用 choice() 函数给 x_direction 选择一个值，结果是向右走（1）或是向左走（-1）,

同时用该函数为 y_direction 设置1~4中的一个值，来提供向方向的移动距离。

但如何确定“蚂蚁”移动的方向是上下还是左右呢?

我们建立在x,y二维坐标轴上。

x_step为正，则向右。而为负，则向左。

y_step为正，则向上。而为负，则向下。

为了获取漫步中下一个点的x值和y值，我们可以将 x/y_step + x/y_values 得到新的位置。

不过，这个 fill_walk() 函数过于冗长，我们可以对他进行重构。

def get_step(self):

"""计算下一个随机漫步落点"""

direction = choice([1, -1])

distance = choice([0, 1, 2, 3, 4])

return direction * distance

def fill_walk(self):

"""计算随机漫步包含的所有点"""

# 不断漫步，直到列表到达指定的长度

while len(self.x_values) < self.num_points:

# 决定前进方向以及沿这个方向前进的距离

x_step = self.get_step()

y_step = self.get_step()

# 拒绝原地踏步

if x_step == 0 and y_step == 0:

continue

# 计算下一个点的x和y值

next_x = self.x_values[-1] + x_step

next_y = self.y_values[-1] + y_step

self.x_values.append(next_x)

self.y_values.append(next_y)

为了绘制出随机漫步的图像，我们可以使用函数 scatter()

import matplotlib.pyplot as plt

from randomwalk import RandomWalk

# 创建一个RandomWalk实例，并将其包含的点都绘制出来

rw = RandomWalk()

rw.fill_walk()

plt.scatter(rw.x_values, rw.y_values, s=2)

plt.show()

同时我们也可以对随机漫步的图表的特性进行修改，我们的目的是突出每次漫步的重要特征，并让分散注意力的元素不显得那么显眼。

对于颜色：

我们可以使用颜色映射来指出漫步中各点的先后顺序，让漫步的顺序更加清晰。

point_numbers = list(range(rw.num_points))

plt.scatter(rw.x_values, rw.y_values, c=point_numbers, cmap=plt.cm.Blues,

edgecolors='none', s=10)

point_numbers 是一个0~5000的列表，用来记忆各个点出现的顺序，当作参数传入函数scatter()。

对于坐标轴：

我们要隐藏坐标轴，因为坐标轴在有些随机漫步的图表中并不重要。

只需要两条语句，设置 set_visible() 为 False

plt.axes().get_xaxis().set_visible(False)

plt.axes().get_yaxis().set_visible(False)

使用 Pygal 来模拟抛骰子

什么是 Pygal ？

Pygal 是 Python 的可视化包，用来生成可缩放的矢量图形文件。对于需要在尺寸不同的屏幕上显示的图表，使用 Pygal 绘制将很有用，

因为他们可以进行自动的缩放。

模拟骰子

对于骰子来说，我们可以创建一个Die类，来表示一个骰子。

from random import randint

class Die():

"""表示一个骰子的类"""

def __init__(self,num_sides=6):

"""骰子默认为6面"""

self.num_sides = num_sides

def roll(self):

"""返回一个位于1和骰子面数之间的随机值"""

return randint(1, self.num_sides)

方法 roll() 使用函数 randint 随机生成一个 1~面数之间的随机数，模拟动作抛骰子。

使用 Pygal 创建图表之前，我们先抛几次骰子来获得一些基础数据。

from die import Die

# 创建一个D6（六面骰子）

die = Die()

# 抛几次骰子，并将结果存储在一个列表中

results = []

for roll_num in range(1000):

result = die.roll()

results.append(result)

print(results)

在上面的代码中，我们抛了1000次骰子，作为接下来处理的基础数据。

[4, 3, 6, 6, 5, 4, 4, 6, 2, 3, 3, 5, 6, 6, 3, 6, 3, 1, 1, 2,...]

接下来，对我们自己设计的数据来进行分析。为了分析我们设置的 Die 是否正确，我们对每一面出现的次数进行统计，

如果每一个面出现的次数相近，则表示我们创建的骰子类 Die 与我们生活中的骰子较为相似。

frequencies = []

for value in range(1, die.num_sides):

frequency = results.count(value)

frequencies.append(frequency)

print(frequencies)

列表 frequencies 用于存储每种点数出现的次数，我们遍历可能的点数，用函数 count() 计算每种点数在结果中出现的次数。

列表 freqencies : [163, 162, 177, 177, 140, 181]

目测结果每个面出现的次数偏差不大，为了更直观的比较，我们将使用 Pygal 把数据做成可视化的形式。

import pygal

--snip--

hist = pygal.Bar()

hist.title = 'Results of rolling one D6 1009 times.'

hist.x_labels = ['1', '2', '3', '4', '5', '6']

hist.x_title = 'Result'

hist.y_title = 'Frequency of Result'

hist.add('D6', frequencies)

hist.render_to_file('die_visual.svg')

hist 存储 pygal.Bar() 实例，之后设置图像的各种其他信息。

之后我们使用 add() 将一系列值添加到图表中（向他传递要给添加的值指定的标签，还有一个列表，其中包含将出现在图表中的值）。

同时抛两个骰子

同时抛两个骰子，求两个骰子的点数和。这样的到的点数更多，结果分布情况也不同。

我们也通过简单修改上面的代码，实现同时抛两个骰子，并对两个骰子的数据结果可视化显示，来研究分布结果。

from die import Die

import pygal

# 创建两个D6（六面骰子）

die_1 = Die()

die_2 = Die()

# 抛几次骰子，并将结果存储在一个列表中

results = []

for roll_num in range(1000):

result = die_1.roll() + die_2.roll()

results.append(result)

# 分析结果

frequencies = []

max_reslut = die_1.num_sides + die_2.num_sides

for value in range(2, max_reslut + 1):

frequency = results.count(value)

frequencies.append(frequency)

hist = pygal.Bar()

hist.title = 'Results of rolling two D6 dice 1000 times.'

hist.x_labels = ['2', '3', '4', '5', '6', '7', '8', '9', '10', '11', '12']

hist.x_title = 'Result'

hist.y_title = 'Frequency of Result'

hist.add('D6 + D6', frequencies)

hist.render_to_file('die_visual.svg')

同时抛两个面数不同的骰子

接下来我们创建一个6面骰子和10面骰子，看看同时抛这两个骰子500000次的数据结果

from die import Die

import pygal

# 创建两个D6（六面骰子）

die_1 = Die()

die_2 = Die(10)

# 抛几次骰子，并将结果存储在一个列表中

results = []

for roll_num in range(50000):

result = die_1.roll() + die_2.roll()

results.append(result)

# 分析结果

frequencies = []

max_reslut = die_1.num_sides + die_2.num_sides

for value in range(2, max_reslut + 1):

frequency = results.count(value)

frequencies.append(frequency)

hist = pygal.Bar()

hist.title = 'Results of rolling a D6 and a D10 dice 50,000 times.'

hist.x_labels = ['2', '3', '4', '5', '6', '7', '8', '9', '10', '11', '12', '13', '14', '15', '16']

hist.x_title = 'Result'

hist.y_title = 'Frequency of Result'

hist.add('D6 + D10', frequencies)

hist.render_to_file('die_visual.svg')

接下来，我们可以对代码进行重构，让他更具有可用性。

我们可以先更改 x_label 的设置，让设置更加自动化。

for num in range(2, max_result + 1):

x_labels.append(str(num))

hist.x_labels = x_labels.copy()

然后把 die_visual.py 文件重构为函数。

def throw_two_dice(die_1_sides=6, die_2_sides=6):

die_1 = Die(die_1_sides)

die_2 = Die(die_2_sides)

# 抛几次骰子，并将结果存储在一个列表中

results = []

for roll_num in range(50000):

result = die_1.roll() + die_2.roll()

results.append(result)

# 分析结果

frequencies = []

max_result = die_1.num_sides + die_2.num_sides

for value in range(2, max_result + 1):

frequency = results.count(value)

frequencies.append(frequency)

hist = pygal.Bar()

hist.title = 'Results of rolling a D' + str(die_1.num_sides) + ' and a D' + str(die_2.num_sides) + ' dice 50,000 times.'

x_labels = []

for num in range(2, max_result + 1):

x_labels.append(str(num))

hist.x_labels = x_labels.copy()

hist.x_title = 'Result'

hist.y_title = 'Frequency of Result'

hist.add('D' + str(die_1.num_sides) + '+ D' + str(die_2.num_sides), frequencies)

hist.render_to_file('die_visual.svg')

使用 Python 处理以 CSV 个数存储的数据

什么是 CSV ？

CSV, Comma-Separated Values 是逗号分隔值，其文件以纯文本存储表格数据（数字和文本）。

CSV文件由任意数目的记录组成，记录间以某种换行符分隔；

每条记录由字段组成，字段间的分隔符是其它字符或字符串，最常见的是逗号或制表符。

CSV是一种通用的广泛应用。最广泛的应用是在程序之间转移表格数据、相对简单的文件格式，被用户、商业和科学。

CSV 文件格式

import csv

filename = 'sitka_weather_07-2014.csv'

with open(filename) as f:

reader = csv.reader(f)

header_row = next(reader)

print(header_row)

在模块 csv 中存在一个阅读器类 reader ，我们创建一个读取 filename 的对象存储在 reader 中。

reader 类中的方法 next() 可以返回文件的下一行，而第一次调用就代表返回文件的第一行。我们将返回的数据存储在 header_row 中，

包含与天气相关的文件头，指出每行都包含哪些数据。

运行代码可得到

['AKDT', 'Max TemperatureF', 'Mean TemperatureF', 'Min TemperatureF', ...]

reader 处理文件以逗号分割第一行数据，并将每项数据都作为一个元素存储在列表中。

也可以更换另一种输出方式

for index, column_header in enumerate(header_row):

print(index, column_header)

对列表调用 enumerate() 来获取每个元素的索引及其值。

0 AKDT

1 Max TemperatureF

2 Mean TemperatureF

3 Min TemperatureF

...

接下来可以分别处理第0行的日期和第1行最高气温

首先读取每天的最高气温：

highs = []

for row in reader:

high = int(row[1])

highs.append(high)

阅读器对象从其停留的地方继续向下读取 CSV 文件，每次都是自动返回当前所处位置的下一行。

即从第二行开始读。

得到数据：

['64', '71', '64', '59', '69', '62', '61', ...]

之后对这些最高温度值绘制气温图表

# 根据数据绘制图形

fig = plt.figure(dpi=128, figsize=(10,6))

plt.plot(highs, c='red')

# 设置图形的格式

plt.title("Daily high temperatures, July 2014", fontsize=24)

plt.xlabel('',fontsize=16)

plt.ylabel("Temperature (F)", fontsize=16)

plt.tick_params(axis='both', which='major', labelsize=16)

plt.show()

使用 plot() 函数绘画一个简单的折线图，

但是对 xlabel() 函数，由于还没有添加日期所以没有给x轴添加坐标。

接下来我们从文件中读取日期。从CSV文件中读取数据时获得的是一个字符串，

所以我们需要把字符串转化为一个表示相应日期的对象。

dates = []

for row in reader:

current_date = datetime.strptime(row[0], "%Y-%m-%d")

dates.append(current_date)

plt.plot(dates, highs, c='red')

我们利用模块 datetime 中的函数 strptime() 来将日期数据转换为 datetime 类。

再调用 autofmt_xdate() 函数来绘制斜着的日期标签，以免他们彼此重叠。

fig.autofmt_xdate()

绘制出图形：

修改读取文件，实现读取更大范围的数据。

再在图表中添加最低气温数据，使图表完整

lows = []

for row in reader:

low = int(row[3])

lows.append(low)

plt.plot(dates, lows, c='blue')

可以使用函数 fill_between() 来将最高气温和最低气温之间的区域涂色，使得气温范围变得更加明显。

plt.fill_between(dates, highs, lows, facecolor='blue', alpha=0.1)

# alpha 代表透明度，从0~1逐渐透明

有时候我们获取的数据并不是完全正确的，可能原始数据中就会有一些错误。

如果按照上述程序来运行，若遇到存在错误的原始程序，则会导致程序崩溃，所以我们需要修改代码，使代码能够应对这个问题。

dates, highs, lows = [], [], []

for row in reader:

try:

current_date = datetime.strptime(row[0], "%Y-%m-%d")

high = int(row[1])

low = int(row[3])

except ValueError:

print(current_date, 'missing data')

else:

dates.append(current_date)

highs.append(high)

lows.append(low)

每次我们从文件中提取信息，只要中间有一项确实，Python都会引发 ValueError 的异常

如果出现数据缺失，则会打印：

日期 + missing data

处理 JSON 文件存储的数据

什么是 JSON 文件？

JSON (javascript Object Notation) 格式最初是为了 JavaScript 开发的，

但随后成了一种常见格式，被包含 Python 在内的众多语言中。

模块 json 让你能够将简单的Python数据结构转储到文件中，

并在程序再次运行时加载该文件中的数据，你还可以使用 json 在 Python 程序之间分享数据。更重要的是，

JSON 数据格式并非 Python 专用的，这让你能够以 JSON 格式存储的数据与使用其他编程语言的人分享。

下载收盘价数据

我们可以先从网上下载文件，在程序中对下载后的本地文件进行处理。

也可以从在程序运行的过程中直接通过程序读取网上的文档并处理。

方法一：先从网上下载文件，再在程序中读取本地文件

import json

filename = 'btc_close_2017.json'

with open(filename) as f:

file = json.load(f)

print(file)

方法二：直接在程序中从网上下载文件

1.使用模块 urllib 模块中的函数 urlopen() 将 url 传入到函数中，

Python 就会向网站发送请求，服务器响应后就把文件发送给 Python

from urllib.request import urlopen

import json

json_url = 'http://raw.githubusercontent.com/muxuezi/btc/master/btc_close_2017.json'

response = urlopen(json_url)

# 读取数据

req = response.read()

# 将数据写入文件

with open('btc_close_2017_urllib.json','wb') as f:

f.write(req)

# 加载 json 格式

# 此时 req 和 f 可以互换

file_urllib = json.loads(req)

print(file_urllib)

2.使用模块 requests 中的方法，可以让上述过程变得简单

函数 requests.get() 可以从网络上下载文件到 Python 中的 req ，

req.text 为文件中的内容，而 req.json() 函数把内容转化为 Python 能够处理的格式。

import requests

json_url = 'http://raw.githubsercontent.com/muxuezi/btc/master/btc_close_2017.json'

req = requests.get(json_url)

# 将数据写入文件

with open('btc_close_2017_request.json','w') as f:

f.write(req.text)

file_requests = req.json()

提取相关数据

为了方便使用 Pygal 作图，我们需要把文件中的数据提取到 Python 中，

并把数字字符串转化为 int 的格式方便处理。

# 打印每一天的信息

for btc_dict in btc_data:

date = btc_dict['date']

month = int(btc_dict['month'])

week = int(btc_dict['week'])

weekday = btc_dict['weekday']

close = int(float(btc_dict['close']))

print("{} is month {} week {}, {}, the close prise is {} RMB".format(date, month, week, weekday, close))

这里需要注意的是，btc_dict['close'] 中的字符串为 '3928.6492' 形式的，

若直接转化为 int 格式，则会出现 ValueError 异常。

所以我们需要先 float() 转化为 float 类型，再 int()

得到的数据：

2017-01-01 is month 1 week 52, Sunday, the close prise is 6928 RMB

2017-01-02 is month 1 week 1, Monday, the close prise is 7070 RMB

......

绘制收盘价折线图

在绘制折线图之前，我们需要首先获取 x 轴和 y 轴的信息，所以创建几个列表来存储数据。

# 创建5个列表，分别存储日期和收盘价

dates, moenths, weeks, weekdays, close = [], [], [], [], []

# 每一天的信息

for btc_dict in btc_data:

dates.append(btc_dict['date'])

moenths.append(int(btc_dict['month']))

weeks.append(int(btc_dict['week']))

weekdays.append(btc_dict['weekday'])

close.append(int(float(btc_dict['close'])))

我们使用 pygal 模块中的 Line() 函数，之后传入 x 轴和 y 轴参数，对图像的其他设置进行调整。

import pygal

line_chart = pygal.Line(x_label_rotation=20, show_minor_x_labels=False)

line_chart.title = '收盘价 (￥)'

line_chart.x_labels = dates

# x轴坐标每间隔20天显示一次

N = 20

line_chart.x_labels_major= dates[::N]

line_chart.add('收盘价', close)

line_chart.render_to_file('收盘价折线图(￥).svg')

显示的结果如下图：

探索时间序列特征

进行时间序列分析，总是期望发现趋势，周期性，和噪声，从而能够根据事实，预测未来，做出决策。为了寻找周期性，需要首先将非线性的趋势消除。

对数变换，是常用的处理方法之一。

从收盘价的折线图可以看出，2017年的总体趋势是非线性的，而且增长幅度不断增大，

似乎呈指数分布，但是我们还可以发现在每个嫉妒末似乎有一些相似的波动。尽管这些波动被增长的趋势掩盖了，

不过其中也许存在周期性。

使用 Python 标准库中的 math 模块，来对数据进行对数变换。

只对收盘价进行对数变换，而不改变日期叫做半对数变换。

close_log = [math.log10(num) for num in close]

line_chart.add('收盘价', close_log)

line_chart.render_to_file('收盘价对数折线图(￥).svg')

用对数变换剔除非线性趋势之后，整体上涨的趋势更接近线性增长。并可以大致从图中看出周期性。三月，六月，九月，都出现了明显的波动。

使用 WebAPI

什么是 API ?

Web API 是网站的一部分，用于与使用非常具体的 URL 请求特定信息的程序交互。

这种请求称为 API 调用。

请求的数据将以易于处理的格式（如JSON或CSV）返回。依赖于外部数据源的大多数应用程序都依赖于 API 调用，如

继承社交媒体网站的应用程序。

我们将以 Github 网站为例，了解 API 的使用。

Github 的API可以让我们能够通过API调用来请求各种信息。在浏览器输入：

https://api.github.com/search/repositories?q=language:python&sort=stars

api.github.com/ 将请求发送到 Github 网站中响应 API 调用的部分;

search/repositories 让 API 搜索 Github 上的所有代码库

? 代表我们要传入一个实参

q 代表查询，= 代表开始查询

language:python 代表我们只想获取语言为 python 的代码库

&sort=stars 代表排序的顺序是按照星数排序

得到的结果如下：

{

"total_count": 4812373,

"incomplete_results": false,

"items": [

{

"id": 83222441,

"node_id": "MDEwOlJlcG9zaXRvcnk4MzIyMjQ0MQ==",

"name": "system-design-primer",

-snip--

可以看出，响应的结果是一个字典，包含了三个 key ，分别是 total_count 库总数,incomplete_results 未完成结果,items 成员

处理 API 响应

接下来我们编写程序，处理 API 响应。

import requests

# 执行API调用并存储相应

url = 'http://api.github.com/search/repositories?q=language:python&sort=stars'

r = requests.get(url)

print("Status code:", r.status_code)

# 将API响应存储在一个变量中

response_dict = r.json()

# 处理结果

print(response_dict.keys())

使用模块 requests 来执行调用，调用函数 get() 将响应对象存储在变量 r，对象中存在一个属性 status_code，他是一种状态码，

让我们判断请求是否成功。状态码200表示请求成功。

再调用 json() 函数将 API 返回的信息转化为 Python 能够处理的字典格式。

将字典存储在 response_dict 中。输出字典中的键得到：

Status code: 200

dict_keys(['total_count', 'incomplete_results', 'items'])

处理响应字典

得到 API 字典之后，就可以处理这个字典中的数据

# 探索有关仓库的信息

repo_dicts = response_dict['items']

print("Repositories returned: ", len(repo_dicts))

# 研究第一个仓库

repo_dict = repo_dicts[0]

print("\nKeys: ", len(repo_dict))

for key in sorted(repo_dict.keys()):

print(key)

与 items 相关联的值是一个列表，其中包含很多字典，每个字典都包含有关一个 Python 仓库的信息。

而对于每一个仓库字典，包含了这个库的许多信息。我们可以通过打印一个仓库字典中的键得到仓库的一些信息。

运行结果：

Keys: 74

archive_url

archived

assignees_url

--snip--

url

watchers

watchers_count

Github 的 API 返回有关仓库的大量信息，从返回结果看有 74 个键，

我们通过查看这些键就可以了解仓库的大致信息。

输出最受欢迎的仓库

接下来借助代码来查看这些信息。在循环中我们打印每个项目的名称，所有者，星级，在 Github 上的 URL 及其描述。

for repo_dict in repo_dicts:

print("\nSelected information about first repository:")

print("Name: ", repo_dict['name'])

print("Owner: ", repo_dict['owner']['login'])

print("Star: ", repo_dict['stargazers_count'])

print("Repository: ", repo_dict['html_url'])

print("Created: ", repo_dict['created_at'])

print("Updated: ", repo_dict['updated_at'])

print("Description: ", repo_dict['description'])

得到的结果

Selected information about first repository:

Name: awesome-python

Owner: vinta

Star: 79188

Repository: https://github.com/vinta/awesome-python

Created: 2014-06-27T21:00:06Z

Updated: 2020-02-13T06:49:04Z

Description: A curated list of awesome Python frameworks, libraries, software and resources

Selected information about first repository:

Name: public-apis

Owner: public-apis

Star: 70563

Repository: https://github.com/public-apis/public-apis

Created: 2016-03-20T23:49:42Z

Updated: 2020-02-13T07:01:48Z

Description: A collective list of free APIs for use in software and web development.

--snip--

Selected information about first repository:

Name: localstack

Owner: localstack

Star: 23017

Repository: https://github.com/localstack/localstack

Created: 2016-10-25T23:48:03Z

Updated: 2020-02-13T06:51:02Z

Description: A fully functional local AWS cloud stack. Develop and test your cloud & Serverless apps offline!

使用 Pygal 可视化仓库

使用 Pygal 模块中的函数 Bar() 构建柱状图

from pygal.style import LightColorizedStyle as LCS, LightenStyle as LS

# 探索有关仓库的信息

repo_dicts = response_dict['items']

names, stars = [], []

for repo_dict in repo_dicts:

names.append(repo_dict['name'])

stars.append(repo_dict['stargazers_count'])

# 可视化

my_style = LS('#333366', base_style=LCS)

chart = pygal.Bar(style=my_style, x_label_rotation=45, show_legend=False)

chart.title = 'Most-Starred Python Project on Github'

chart.x_labels = names

chart.add('', stars)

chart.render_to_file('python_repos.svg')

显示的柱状图：

接下来来改进这个图表，进行多方面的定制。

# 可视化

my_style = LS('#333366', base_style=LCS)

# 创建 Config 对象

my_config = pygal.Config()

my_config.x_label_rotation = 45

my_config.show_legend = False

# 设置标题标签的字体大小

my_config.title_font_size = 24

my_config.label_font_size = 14

my_config.major_label_font_size = 18

# 缩短较长的字符为15个

my_config.truncate_label = 15

# 隐藏水平线

my_config.show_y_guides = False

# 自定义宽度

my_config.width = 1000

chart = pygal.Bar(config=my_config, style=my_style)

得到的图像：

为了让图表中显示更多的信息，而不仅仅是代码库的名字和star数。我们可以创建一个列表存放我们想要添加的信息。

plot_dicts = []

plot_dict = {

'value': repo_dict['stargazers_count'],

'label': str(repo_dict['description']),

'xlink': repo_dict['html_url']

}

plot_dicts.append(plot_dict)

--snip--

chart.add('', plot_dicts)

这样我们就可以得到既包含星数还包含代码库的描述以及网址，并实现点击表格就可以跳转到该网址。

你可能感兴趣的:(python做数据可视化的代码)

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
爬山后遗症璃绛
爬山，攀登，一步一步走向制高点，是一种挑战。成功抵达是一种无法言语的快乐，在山顶吹吹风，看看风景，这是从未有过的体验。然而，爬山一时爽，下山腿打颤，颠簸的路，一路向下走，腿部力量不够，走起来抖到不行，停不下来了！第二天必定腿疼，浑身酸痛，坐立难安！
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st

python做数据可视化的代码_利用Python实现数据可视化 （入门）

你可能感兴趣的:(python做数据可视化的代码)

python做数据可视化的代码_利用Python实现数据可视化（入门）