09_散点图显示字段相关性

在这里插入图片描述

文章目录

  • 加载远程的数据集
  • 散点图与乱码问题


博文配套视频课程:24小时实现从零到AI人工智能


加载远程的数据集

Matplotlib 是 Python 的绘图库。 它可与 NumPy 一起使用,提供了一种有效的 MatLab 开源替代方案。 默认情况下Aancanda已经集成了MatplotLib可视化绘图库,它也可以和图形工具包一起使用,如 PyQt 和 wxPython。

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# 通过查看源码发现,默认加载的是github远程的数据文件
tips = sns.load_dataset("tips")
print(tips.type(tips))
tips.info()
print(tips.head(n=3))
# DataFrame保存csv格式
tips.to_csv("../data/tips.csv",index_label='row_id')

散点图与乱码问题

散点图是指在回归分析中,数据点在直角坐标系平面上的分布图,散点图表示因变量随自变量而变化的大致趋势,据此可以选择合适的函数对数据点进行拟合

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

plt.rcParams['font.sans-serif'] = ['SimHei']
tips = pd.read_csv('../data/tips.csv')
tips.info()
# 如果是相关性,则建议采用散点图
plt.scatter(tips['total_bill'],tips['tip'])
# 对x,y输入标题
plt.xlabel('消费金额')
plt.ylabel('小费金额')
# 所有可视化都需要调用show函数
plt.show()

在这里插入图片描述

你可能感兴趣的:(Python,数据分析与可视化)