题目来自牛客网,本文仅是个人学习笔记
现有一个Nowcoder.csv文件,它记录了部分用户数据,包含如下字段(字段与字段之间以逗号间隔)
import pandas as pd
Nowcoder = pd.read_csv('Nowcoder.csv',sep=',',dtype=object)
print(Nowcoder.head(6))
pandas是python的一个数据库,在使用数据库的时候需要输入 import pandas as pd 引入,
df = pd.read.csv(''文件路径“):这是利用pandas数据库读取CSV文件的方法,如果读取EXCEL文件或者其他文件,csv文件换成其他文件的格式。
df.dtypes:如果在文件中有字符型数据返回object
df.head(n):表示将前n行数据显示出来,默认是显示前五行
df.tail(n):表示将后n行数据显示出来,默认后五行
最后打印即可
打开文件时需要添加dtype=object,防止年份信息读取为小数。
现有一个Nowcoder.csv文件,它记录了部分用户数据,包含如下字段(字段与字段之间以逗号间隔)
你不需要输出全部数据,请直接告诉我们这个数据集的大小,即行数与列数。
import pandas as pd
df = pd.read_csv('Nowcoder.csv',sep=',',dtype=object)
print(df.shape)
现有一个Nowcoder.csv文件,它记录了部分用户数据,包含如下字段(字段与字段之间以逗号间隔)
查看这个数据集中第10行的用户的全部信息
import pandas as pd
Nowcoder = pd.read_csv('Nowcoder.csv',sep=',',dtype=object)
print(Nowcoder.loc[10,:])
分清楚iloc和loc的区别,前者通过行号定位,后者通过索引定位
iloc[行索引,列索引] (不接受列字段名称作为参数,只支持列字段的位置索引作为参数)
loc[行索引,列名/column] (接受具体名称)
现有一个Nowcoder.csv文件,它记录了部分用户数据,包含如下字段(字段与字段之间以逗号间隔):
Nowcoder_ID:用户ID
Level:等级
Achievement_value:成就值
Num_of_exercise:刷题量
Graduate_year:毕业年份
Language:常用语言
查看这个数据集中第10行到第20行的用户的常用语言分别是什么,请你帮他输出一下。
import pandas as pd
Nowcoder = pd.read_csv("Nowcoder.csv", sep=",", dtype=object)
print(Nowcoder.loc[10:20, "Language"])
# print(Nowcoder.iloc[10:20,5])
loc : Selection by Label ,按标签取数据,
loc[行索引,列名/column]
(如果第二个参数的个数是全部即 : ,可以省略不写)。
例:
print(df.loc[1,‘name’]) # 索引1(行),名为‘name’的列
iloc : Selection by Position,即按位置选择. 只接受整型参数。
不接受列字段名称作为参数,只支持列字段的位置索引作为参数。
iloc[行索引,列索引] (没有逗号及以后就是默认列为所有列)
例:
print(df.iloc[1,0]) # 第2行第1列的值
现有一个Nowcoder.csv文件,它记录了牛客网的部分用户数据,包含如下字段(字段与字段之间以逗号间隔
想知道这份数据是不是所有列的信息都是有数据的,有没有哪些列的数据没有补全,请输出每列信息是否有为空值。
import pandas as pd
Nowcoder = pd.read_csv("Nowcoder.csv", sep=",", dtype=object)
print(Nowcoder.isnull().any(axis=0))
- isnull: 判断是否为空。
返回bool类型的值:True or False- any:返回是否至少一个元素为真
all:返回是否所有元素为真
axis=1或0: 1表示横轴,方向从左到右;0表示纵轴,方向从上到下
现有一个Nowcoder.csv文件,它记录了牛客网的部分用户数据,包含如下字段(字段与字段之间以逗号间隔):
Nowcoder_ID:用户ID
Level:等级
Achievement_value:成就值
Num_of_exercise:刷题量
Graduate_year:毕业年份
Language:常用语言
想知道哪些人经常使用Python这门语言,并且他们的其他信息是怎么样的
输出该数据集中语言为Python对应的所有列的信息,包括列号。
import pandas as pd
Nowcoder = pd.read_csv("Nowcoder.csv", sep=",", dtype=object)
print(Nowcoder[Nowcoder["Language"] == "Python"])