Pandas 04. 查询数据的几种方法,重点df.loc[]

Pandas查询数据的几种方法

  1. df.loc方法,根据行、列的标签值查询

  2. df.iloc方法,根据行、列的数字位置查询

  3. df.where方法

  4. df.quey方法

使用df.loc既能查询,又能装盖写入,强烈推荐!

#Pandas使用df.loc查询数据的方法

  1. 使用单个label值查询数据

    import pandas as pd
    
    df = pd.read_csv("./ml-latest-small/ratings.csv")
    print(df["userId"])
    print(df.loc[:, "userId"])
    print(df.loc[10, "userId"])
    print(df.loc[10, :])
    
  2. 使用值列表批量查询

    print(df.loc[:, ["userId", "movieId"]])
    
  3. 使用数值区间进行范围查询

    print(df.loc[:, "movieId":"timestamp"])
    print(df.loc[50:100:2, "movieId":"timestamp"])
    
  4. 使用条件表达式查询

    print(df.loc[df["rating"] > 3.0, :])
    print(df.loc[(df["rating"] > 3.0) & (df["rating"] < 4.0), :])  # &或者|逻辑符连接多个条件
    
  5. 调用函数查询

    def fun(d: df, f: float, s: str):
        d1 = d[s] > f
        return d1
    
    
    var = df.loc[fun(df, 3.5, "rating"), :]
    print(var)
    

#注意

  1. 以上查询方法,既适用于行,也适用于列

  2. 注意观察降维dataFrame>Series>值

你可能感兴趣的:(pandas,python,数据分析,机器学习)