Pandas数据分析深入浅出

1.Pandas做数据读取

文章目录

  • 1.Pandas做数据读取
  • 前言
  • 一、pandas是什么?
  • 二、pandas读取数据
    • 1.读取csv数据
    • 2.读取excel表格数据
    • 3.读取sql数据库数据
    • 4.pandas读取文件做日期解析parse_dates
  • 总结


前言

笔者最近正在学习Pandas数据分析,将自己的学习笔记做成一套系列文章。


一、pandas是什么?

Pandas,python+data+analysis的组合缩写,是python中基于numpy和matplotlib的第三方数据分析库,与后两者共同构成了python数据分析的基础工具包,享有数分三剑客之名。Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具,其长远目标是成为最强大、最灵活、可以支持任何语言的开源数据分析工具。

二、pandas读取数据

Pandas数据分析深入浅出_第1张图片

1.读取csv数据

官方文档
但是官方文档的一个缺点就是太复杂了,我在此据几个例子来便于读者的理解。
600033.csv文件数据:
Pandas数据分析深入浅出_第2张图片

代码如下:

import pandas as pd
fpath="./600033.csv"
#1. 使用pd.read_csv读取数据
ratings=pd.read_csv(fpath)

#2.查看前几行数据
ratings.head()

结果:
Pandas数据分析深入浅出_第3张图片

#3.查看数据的形状,返回行数和列数
ratings.shape

在这里插入图片描述

#4.查看列名列表
ratings.columns

在这里插入图片描述

#5. 查看索引列
ratings.index

在这里插入图片描述

#6. 查看每一个列的数据类型
ratings.dtypes

Pandas数据分析深入浅出_第4张图片

读取txt文件表格内容:
date.txt文件内容:
Pandas数据分析深入浅出_第5张图片

path="./date.txt"
pvuv=pd.read_csv(
    fpath,
    sep="\t",   #表示我们使用原文档中tab作为分隔符
    header=None,  #表示这个读取的内容中没有头部
    names=["属性1","属性2","属性3"])

pvuv

结果:

Pandas数据分析深入浅出_第6张图片

采用如下方法设置表格头部:
即通过header=[0]设置第0行数据就是dataFrame的头部。
Pandas数据分析深入浅出_第7张图片

2.读取excel表格数据

自选股数据记录.xlsx"文件内容:

Pandas数据分析深入浅出_第8张图片

代码如下:

fpath="./自选股数据记录.xlsx"
pvuv=pd.read_excel(fpath)
pvuv

Pandas数据分析深入浅出_第9张图片

3.读取sql数据库数据

数据库数据内容:
Pandas数据分析深入浅出_第10张图片

代码如下:

import pymysql
conn=pymysql.connect(
        host='127.0.0.1',
        user='root',
        password='root',
        database='pandas',
        charset='utf8'
)
mysql_page=pd.read_sql("select * from data1",con=conn)
mysql_page

结果:
Pandas数据分析深入浅出_第11张图片

4.pandas读取文件做日期解析parse_dates

read_csv()方法中有一个参数是parse_dates,这个param表示的是我们要指定日期解析的列,我在进行股票量化的时候就需要去解析时间列。
Pandas数据分析深入浅出_第12张图片

总结

这就是pandas大概读取数据的基本用法了,希望可以帮助到你。

你可能感兴趣的:(pandas,pandas,python,数据分析)