【Python数据分析】pandas(持续更新)

题目来自牛客网,本文仅是个人学习笔记

文章目录

      • 1、用pandas查看用户数据
      • 2、查看数据集的大小
      • 3、查看第10位用户信息
      • 4、查看第10行到第20行特定列数据
      • 5、判断文件列数据是否完整
      • 6、查看特定数据的信息
      • 7、

1、用pandas查看用户数据

现有一个Nowcoder.csv文件,它记录了部分用户数据,包含如下字段(字段与字段之间以逗号间隔)

import pandas as pd
Nowcoder = pd.read_csv('Nowcoder.csv',sep=',',dtype=object)
print(Nowcoder.head(6))

pandas是python的一个数据库,在使用数据库的时候需要输入 import pandas as pd 引入,
df = pd.read.csv(''文件路径“):这是利用pandas数据库读取CSV文件的方法,如果读取EXCEL文件或者其他文件,csv文件换成其他文件的格式。
df.dtypes:如果在文件中有字符型数据返回object
df.head(n):表示将前n行数据显示出来,默认是显示前五行
df.tail(n):表示将后n行数据显示出来,默认后五行
最后打印即可

打开文件时需要添加dtype=object,防止年份信息读取为小数。

2、查看数据集的大小

现有一个Nowcoder.csv文件,它记录了部分用户数据,包含如下字段(字段与字段之间以逗号间隔)
你不需要输出全部数据,请直接告诉我们这个数据集的大小,即行数与列数

import pandas as pd
df = pd.read_csv('Nowcoder.csv',sep=',',dtype=object)
print(df.shape)

3、查看第10位用户信息

现有一个Nowcoder.csv文件,它记录了部分用户数据,包含如下字段(字段与字段之间以逗号间隔)
查看这个数据集中第10行的用户的全部信息

import pandas as pd 
Nowcoder = pd.read_csv('Nowcoder.csv',sep=',',dtype=object)
print(Nowcoder.loc[10,:])

分清楚iloc和loc的区别,前者通过行号定位,后者通过索引定位
iloc[行索引,列索引] (不接受列字段名称作为参数,只支持列字段的位置索引作为参数)
loc[行索引,列名/column] (接受具体名称)

4、查看第10行到第20行特定列数据

现有一个Nowcoder.csv文件,它记录了部分用户数据,包含如下字段(字段与字段之间以逗号间隔):

Nowcoder_ID:用户ID
Level:等级
Achievement_value:成就值
Num_of_exercise:刷题量
Graduate_year:毕业年份
Language:常用语言

查看这个数据集中第10行到第20行的用户的常用语言分别是什么,请你帮他输出一下。

import pandas as pd

Nowcoder = pd.read_csv("Nowcoder.csv", sep=",", dtype=object)
print(Nowcoder.loc[10:20, "Language"])
# print(Nowcoder.iloc[10:20,5])

loc : Selection by Label ,按标签取数据,
loc[行索引,列名/column]
(如果第二个参数的个数是全部即 : ,可以省略不写)。
例:
print(df.loc[1,‘name’]) # 索引1(行),名为‘name’的列

iloc : Selection by Position,即按位置选择. 只接受整型参数。
不接受列字段名称作为参数,只支持列字段的位置索引作为参数。
iloc[行索引,列索引] (没有逗号及以后就是默认列为所有列)
例:
print(df.iloc[1,0]) # 第2行第1列的值

5、判断文件列数据是否完整

现有一个Nowcoder.csv文件,它记录了牛客网的部分用户数据,包含如下字段(字段与字段之间以逗号间隔

想知道这份数据是不是所有列的信息都是有数据的,有没有哪些列的数据没有补全,请输出每列信息是否有为空值

import pandas as pd

Nowcoder = pd.read_csv("Nowcoder.csv", sep=",", dtype=object)
print(Nowcoder.isnull().any(axis=0))
  • isnull: 判断是否为空。
    返回bool类型的值:True or False
  • any:返回是否至少一个元素为真
    all:返回是否所有元素为真
    axis=1或0: 1表示横轴,方向从左到右;0表示纵轴,方向从上到下

6、查看特定数据的信息

现有一个Nowcoder.csv文件,它记录了牛客网的部分用户数据,包含如下字段(字段与字段之间以逗号间隔):
Nowcoder_ID:用户ID
Level:等级
Achievement_value:成就值
Num_of_exercise:刷题量
Graduate_year:毕业年份
Language:常用语言

想知道哪些人经常使用Python这门语言,并且他们的其他信息是怎么样的

输出该数据集中语言为Python对应的所有列的信息,包括列号

import pandas as pd

Nowcoder = pd.read_csv("Nowcoder.csv", sep=",", dtype=object)
print(Nowcoder[Nowcoder["Language"] == "Python"])

【Python数据分析】pandas(持续更新)_第1张图片

7、

你可能感兴趣的:(#,python,数据分析,pandas,python,数据分析)