散点图
散点图可以用于看数据之间有无关联性。重要的几个参数:颜色,大小,透明度。透明度可以看数据之间叠加的程度大小。
scatter的意思是散射的意思。
简单的一块代码入门:
import matplotlib.pyplot as plt #将pyplot 改名为 plt
x = [1,2,3,4,5,6,7,8,9,10,11,12,13]
y = [2,3,3,4,5,6,7,8,9,10,11,12,13]
plt.scatter(x,y)
plt.show()
运行结果如下图:
看大量的数据(随机生成的,期望应该是无任何关联性)
import random
import matplotlib.pyplot as plt #将pyplot 改名为 plt
x = []
y = []
for _ in range(100):
x.append(random.randint(1,100))
y.append(random.randint(1,100))
plt.scatter(x,y)
plt.show()
结果下图,很明显没有相关性。
这里可以改变颜色,大小,透明度等等。
python的功能很强大,它会把scatter的参数都显现出来,可以了解别的参数,我这里修改了几个参数。s为面积的大小默认20,c为颜色默认‘b’蓝色,alpha为透明度。
import random
import matplotlib.pyplot as plt #将pyplot 改名为 plt
x = []
y = []
for _ in range(1000):
x.append(random.randint(1,100))
y.append(random.randint(1,100))
plt.scatter(x,y,s=12,c='r',alpha=0.5)
plt.show()
运行结果如下,可以看出透明度的作用,有的地方颜色深,有的地方颜色浅。看出数据重叠的程度。
import matplotlib.pyplot as plt #将pyplot 改名为 plt
x = [1,4,6,7,9]
y = [2,3,9,7,4]
plt.plot(x,y)
plt.show()
实际应用中,x轴一般为时间。而且有很多不同的折线。这时候就需要改变折线样式,颜色,大小等等了,当然也可以为折线图命名,为x,y轴命名。
import matplotlib.pyplot as plt #将pyplot 改名为 plt
#设置标题,以及x轴,y轴
plt.title("beijing && tulufan", fontsize=24)
plt.xlabel("Data", fontsize=14)
plt.ylabel("Tempreture", fontsize=14)
#北京
data = [i for i in range(1,32)]
temp_beijing = [34,34,28,22,27,26,
20,18,23,25,28,28,
30,29,25,25,29,28,
26,30,25,29,25,28,
31,32,34,29,29,30,31]
#吐鲁番
temp_tulufan = [37,37,30,30,31,30,
26,23,26,30,30,32,
35,34,31,30,29,30,
28,33,34,30,36,30,
35,36,37,30,30,35,32]
plt.plot(data,temp_beijing,c='r',linewidth='1',linestyle='--')
plt.plot(data,temp_tulufan,c='g',linewidth='1',linestyle='-.')
plt.show()
linestyle有很多形式:
‘-’ 实线
‘–’ 虚线
‘-.’ 线点
‘:’ 点
plot里面参数也有很多。不一 一介绍了。
当然可以和爬虫结合在一起,爬取数据然后绘制图,进行分析。
我也刚学,如有不对,请指出。感谢观看。