python pandas学习笔记

  1. df假设是我们要进行计算的data frame。
  2. 有些是函数,比如说pd.isnull(),而有些是methods,比如说df.drop()。
  3. df.drop():删除行或者列。这样生成一个新的data frame,但可以设置参数,选择是否在原df也删除行或者列。axis=1表示,删除的是列;默认不改变原来的df,但是加上inplace = True会删除在原df中的行或者列。
  4. df.shift(i):表示df数据都往下移i个位置。
  5. pd.isnull(df):判断是否为0.
  6. df.sum():计算和,如果是空白或者0,列上面和,如果是1,计算每个行的和。
  7. len(df):返回行的数量。
  8. df.index 返回行名或者index。
  9. df.columns返回列名。
  10. 生成空的df,同时确定行和列名(行列数也确定):df = pd.DataFrame(index = ["a","b,"c"], columns = ["1","2","3","4"])。
  11. 在已生成的df中加入行或者列:df.loc["newRow",:] = []。可以直接使用list,也可以是pd.Series。
  12. df.std()返回的是无偏差的unbiased标准差。
  13. 建立空的df:通过np包建立,df = pd.DataFrame(np.zeros([nRows, nColumns]))
  14. 索引:
  • 行名索引行:df.loc["rowName"]或df.loc["rowName",:]
  • 列名索引列:df["columnName"]或df.loc[:,"columnName"]
  • 行号索引行:df.iloc[rowNum,:]
  • 列号索引列:df.iloc[:,columnNum]
  • 可以使用range或者行名和列名的list索引多个行和多个列
  • 不能用名字和号码同时索引行或列,去索引某个准确位置的element

你可能感兴趣的:(python学习,python,pandas,DataFrame)