2020-01-08培训

numpy and pandas分别用来传数据和分析数据

线性代数:特征值和特征向量
特征值,即
一个常数*某特征向量的基础解系为特征向量
数组的零表是广播操作
不相关数组的copy使用copy()函数
改变维度,将每一维行列信息传给reshape(hang,lie,...)

矩阵维度一般提列
列不变
行一直会变
python numpy数组的选择使用在数组的中括号里面
mumpy数组里参数为负数,代表倒数第几行


切片

切片按“:”切分,“,”是选择点
列合并,行合并


数组合并

np.vstack:垂直连接
np.hstack:水平连接
转置.T
矩阵乘法

axis=1为水平变化,axis=0为垂直变化

1表示横轴,方向从左到右;0表示纵轴,方向从上到下。当axis=1时,数组的变化是横向的,体现出列的增加或者减少。反之,当axis=0时,数组的变化是纵向的,体现出行的增加或减少。
sort(1)按行排序
sort(0)按列排序

 numpy里1为行,0为列
集合运算

numpy用的都是数字,先把数据中某一列数字提取出来,再返回给pandas数据处理
series类似于一维数组


pandas基础语法
max()和min()都是numpy的函数
pandas应该使用.value()或者.index()
花式索引不要忘记内部的中括号
numpy赋值not a number,赋值的时候要用
series[index]=np.NaN
pandas中NaN与None等价
dataframe就像是一个二维表
行号(索引)自动生成,列名为字典里提供的index(不提供默认索引为数字)

保持镇定,什么时候该思考什么,就不要去想,沉浸在现在的思考中

如何在series中获得某行(不适用切片) 列只能靠列属性值取,不能根据标号取,如何解决?

doc()行优先
loc()行标签
iloc()行号
pop()方法可以将所选列从原数据块中弹出,原数据块不再保留该列。
删行·列用drop(),根据axis不同选择闪出某一行或者列
求两个表的交集

np.array()强制转换为数组模式


提取某行可以直接使用推导式

pandas单纯加会产生NaN,如果使用add函数就可以定义参数

数据筛选(重要)

series列小写,str必加

contains()是否包含


count的几个用法

agmin()返回最小值的索引位置
彭德怀是指挥百团大战的人


由值找含义

map跟着字典,字典的key最好使用字符串
你可得智障了
apply可以根据参数里的行数加一行
根据某行信息增加一行
lambda一句话搞定

你可能感兴趣的:(2020-01-08培训)