机器学习之使用pandas进行数据探索---通过分析电信运营商的客户离网率数据集

pandas可以使用类似SQL的方式对.csv,;tsv,.xlsx等格式的数据进行处理分析
pandas主要使用的数据结构是series和dataFrame类。
series是一种类似于一维数组的对象,它是一组数据(各种numpy数据类型)及一组与之相关的数据标签(即索引)组成
dataFrame是一个二维数据结构,即一张表格,其中每列数据的类型相同。你可以把它看成由series实例构成的字典‘
首先载入必要的库:
即Numpy和Pandas
import numpy as np
import numpy as pd
read_csv()读取数据
head()查看前5行数据
shape()维度
columns()列名
describe()可以显示数值特征

你可能感兴趣的:(机器学习)