import pandas as pd
table1 = './data/table1.csv'
file = pd.read_csv(filepath_or_buffer, sep="", names="", index_col="", parse_dates="")
数据输入的路径:可以是文件路径、可以是URL,也可以是实现read方法的任意对象。
#for example
#读取csv文件,最常见的情形
pd.read_csv("table.csv")
#通过URL访问文件
pd.read_csv("http://168.137.2:8080/table.csv")
读取csv文件时指定的分隔符,默认为逗号。有特殊要求则需要设置分隔符,注意:"csv文件的分隔符" 和 "我们读取csv文件时指定的分隔符" 一定要一致。
比如:分隔符从逗号改成"\t"
pd.read_csv('table.csv', sep='\t')
当names没被赋值时,即选取数据文件的第一行作为列名。
当names被赋值时,为文件制定列名。
注意:names与另外一个参数header同时出现时,另当别论。
#为学生表赋列值 pd.read_csv('student.csv',names=["Name","Stu_id","Sex","Age"])
读取文件之后,生成的 DataFrame 的索引默认是0 1 2 3...,我们当然可以 set_index,但是也可以在读取的时候就指定某个列为索引。
进行时序预测分析时,需要对数据进行可视化分析,观察不同时间的数据走向,可以使得时间为索引,然后进行画图分析。