使用Python进行数据分析时——numpy、pandas的常用函数

科学计算库Numpy

创建数组:

  • numpy.array()
  • numpy.arange()

查看数组:

  • dtype
  • ndim 维度
  • shape 形状
  • size 元素个数

数组操作:

  • tolist 转换列表
  • reshape 修改形状
  • array[start:stop:step] 切片(含左不含右)
  • numpy.append 添加元素
  • numpy.insert 插入元素
  • numpy.delete 删除元素
  • numpy.unique 数组去重
  • numpy.concatenate() 数组连接
  • numpy.stack() 数组堆叠
  • numpy.split() 数组分割
  • numpy.transpose() 数组转置

相关函数:

  • 字符串函数
  • 数学函数
  • 统计函数

科学计算库Pandas

读取数据:

  • pandas.read_csv()
  • pandas.read_excel()
  • df = pandas.DataFrame()

查看数据:

  • dtypes 通过列的类型选取列
  • shape 形状
  • df.info() 信息
  • df.describe() 描述
  • df.count() 非nan数量
  • df.isnull() 是否为空
  • df.unique() 唯一值
  • head() 头部数据
  • tail() 尾部数据

数据提取:

  • loc() 按字段提取
  • iloc() 按位置提取
  • usecols 读取数据时,使用此函数选择列

数据预处理:

  • merge() 多表合并
  • append() 表追加
  • join() 表连接
  • set_index() 设置索引
  • index_col 行索引
  • sort_index() 按照索引排序
  • sort_values() 按值排序
  • value_counts() 计算某一列或行中有哪些不同值,并排序

数据清洗:

  • drop_duplicates() 删除重复行
  • fillna() 填充
  • map() 映射
  • df[‘字段’].str.replace() 字符串替换

数据分析:

  • groupby() 分组聚合
  • pivot_table() 透视

你可能感兴趣的:(Python,数据分析)