基于Python的大数据分析实战篇(一)

☀前言:

        Hello,大家好!我又回来了,下面我将给大家讲解一下,关于我们Python大数据分析的实战测试,希望大家可以在发现错误后,提出意见,我将立刻做出修改。‍

首先,1、Python数据分析流程及学习路径

Python数据分析的流程概括起来主要是:读写、处理计算、分析建模和可视化四个部分。在不同的步骤中会用到不同的Python工具。每一步的主题也包含众多内容。

2、利用Python读写数据

        基于Python的大数据分析实战篇(一)_第1张图片

3、利用Python处理和计算数据

基于Python的大数据分析实战篇(一)_第2张图片

在第一步和第二步,我们主要使用的是Python的工具库NumPy和pandas。其中,NumPy主要用于矢量化的科学计算,pandas主要用于表型数据处理。

4、利用Python分析建模

基于Python的大数据分析实战篇(一)_第3张图片 

 5、利用Python数据可视化

基于Python的大数据分析实战篇(一)_第4张图片

 以上就是关于Python数据分析的简单介绍,下面步入正题!

#1、利用所学知识将文件中的学生成绩信息导入到二维结构中。

import numpy as np
import pandas as pd
df = pd.read_excel('E:/18级信息管理第一学期智育成绩.xlsx','Sheet1')
df

基于Python的大数据分析实战篇(一)_第5张图片

关于路径问题,推荐选择绝对路径,并且注意  /  的使用即可 

 

#2、使用numpy求数学的平均分。

import numpy as np
import pandas as pd
df = pd.read_excel('E:/18级信息管理第一学期智育成绩.xlsx','Sheet1')
df
df.iloc[:,7:8]
math=df.iloc[0:99,7:8]
print(math)
print("数学的平均分: ")
math.mean()

基于Python的大数据分析实战篇(一)_第6张图片

 

 #3、使用numpy求大学英语的中位数成绩。

import numpy as np
import pandas as pd
df = pd.read_excel('E:/18级信息管理第一学期智育成绩.xlsx','Sheet1')
df
df.iloc[:,5:6]
english=df.iloc[:,5:6]
print(english)
print("英语的中位数: ")
print(np.median(english))

 基于Python的大数据分析实战篇(一)_第7张图片

 

  #4、使用numpy找出所有有不及格科目的学生。

import numpy as np
import pandas as pd
df = pd.read_excel('E:/18级信息管理第一学期智育成绩.xlsx','Sheet1')
df.loc[(df['C语言程序设计A']<60)|(df['计算机应用技术基础A']<60)|(df['大学英语A1']<60)|(df['Python程序设计C']<60)|(df['数学A1']<60),
       ['学号','姓名']]

基于Python的大数据分析实战篇(一)_第8张图片 

 结语:
写到此处,我们的Python数据分析实战第一篇就暂时结束了!对于后面不足的内容,在接下来的一段时间内将进行补充,请大家多多支持!‍
如果发现内容问题,希望可以评论留言(ง •_•)ง

你可能感兴趣的:(python,jupyter,大数据)