pytorch常用的库函数

pytorch常用的库函数

sklearn

(安装顺序:Numpy --> Scipy --> matplotlib --> sklearn)

Numpy

引用

常用方法/函数的名字

.ndim :维度 
.shape :各维度的尺度 (2,5) 
.size :元素的个数 10 
.dtype :元素的类型 dtype(‘int32’) 
.itemsize :每个元素的大小,以字节为单位 ,每个元素占4个字节 

  • ndarray数组的创建 
  • 数组的维度变换
  • 数组的类型变换
  • 数组切片
  • 数组的运算 
  • 数据的CSV文件存取
  • numpy随机数函数
  • numpy的统计函数
  • numpy的梯度函数
  • 图像的表示和变换

Pandas

pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。

Series DateFrame
类似一维数组的对象, 类似多维数组/表格数组;每列数据可以是不同的类型;索引包括列索引和行索引。

Series类型

引用

Series 类型创建

Series类型是一组数据及与之相关的数据索引组成

index 获得索引 .values 获得数据

in : 判断“键”是否在字段中 返回 True / False
b.get(‘f’, 100) 获取b的索引为‘f’的数据,若不存在,返回100

DataFrame类型创建

 DataFrame是表格型类,可理解为二维数据类型, 其由共用相同索引的一组列组成: index(axis=0),colum(axis=1)

从ndarray创建DataFrame类型
d= pd.DataFrame(np.arange(10).reshape(2,5))

 注意:必须先[‘one’]后[‘b’],先列后行

Pandas数据类型操作

重新索引
reindex(index=None, columns=None,…)方法 可改变或重排Series和DataFrame索引

fill_value 在重新索引,用于填充缺失位置的值
method 填充方法,ffill当前值向前填充, bfill向后填充
limit 最大填充量
copy 默认为True,生成新的对象,False时,新旧相等,但不复制

索引类型常用方法

.append(idx) 连接另外一个Index对象,产生新的Index对象
.diff(idx) 计算差集,产生新的Index对象
.intersection(idx) 计算交集,产生新对象
.union(idx) 计算并集
.delete(loc) 删除loc位置处的元素
.insert(loc, e) 在loc位置增加一各元素e

数据排序

.sort_index()方法在指定轴上根据索引进行排序,默认升序。
.sort_index(axis=0,ascending = True) ascending是指递增排序
.sort_values()方法在指定轴上根据数值进行排序,默认升序。
Serier.sort_values(axis= 0, ascending=True)
DataFrame.sort_values(by, axis = 0, ascending = True)
by: 只对axis轴上的某个 索引 或 索引列表 进行排序

Pandas统计分析函数

.sum() 计算数据总和,按0轴计算
.count() 非NaN值的数量
.mean() .median() 计算算术平均值、算术中位数
.var() .var() 计算方差、标准差
.min() .max 计算最小、大值

.argmin() .argmax() 计算最大、小值所在位置的索引(针对自动索引的)(适用于Series类型:)
.idxmin() .idxmax() 计算最大、小值所在位置的索引(针对自定义索引的)(适用于Series类型:)

.describe() 针对0轴(各列)的统计汇总

数据的相关性

.cov() 计算协方差矩阵
.corr() 计算相关系数矩阵

你可能感兴趣的:(pytorch,python,numpy)