import pandas as pd
import xlrd
#加载对应的文件路径,如XLSX格式
file_path = r'data_file_path'
#将数据读入dataframe
df = pd.Dataframe(pd.read_excel(file_path))
#删除不完整的数据
df = df.dropna(axis-0,how='any')
#遍历隔行各列
for index,row in df.iterrows():
#各种操作
#具体处理数据
from datetime import datetime
date_get = datetime.strptime(date_time,'%Y-%m-%d %H:%M:%S')#date_time转换为字符串格式
#转变为字符串的提取
int_day=date_get.day
int_month=date_get.month
str_year=str(date_get.year)
str_month=str(date_get.month)
str_day=str(date_get.day)
str_hour=str(date_get.hour)
#时间数据切分整合
test_str_time_1 = 'YY-MM-DD HH:MM:SS'
test_str_time_2 = 'YY-MM-DD HH:MM:SS'
df_txt_1 = df[(df.release_date<=test_str_time_1)]
df_txt_2 = df[(df.release_date>test_str_time_1)&(df.release_date<=test_str_time_2)]
df_txt_3 = df[(df.release_date>test_str_time_2)]
#导出文件
df_txt_1.to_csv(file_path,index=False,header=True)
%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
plt.plot(dataframe.A,dataframe.B,"b--",linewidth=1)#设置线的颜色与粗细
plt.figure(figsize=(16,8))
plt.show()
#其他的一些学术上用的东西再做另外的归纳。