人生第一篇pandas处理excel---处理数据块

接触代码四年有余,但代码能力一直都是菜的不行(vegetable~)但最近手里有个活儿干,是关于数据分析的,之前也没有弄过数据分析,想着网上说是Python做数据分析,所以也就自己开始接触python干活。我遇到不会的也是经常百度,查CSDN以寻求解决的办法。尽管有一些困难,通过自己和资料查询也得以解决。写文章希望把自己解决的问题记录下来,一是记录自己的成长,二是可以帮助需要帮助的人吧!!!------------------------------------------------------第一次没啥经验,多多指教

问题1:希望从表格中查询有一定数据帧格式的数据,并将其凑到一起

有两种:一种是整个数据块只有一个帧头,如F1;另一种是整个数据块有两个帧头,帧头1,是BB,帧头2也是BB

#导入第三方库
import openpyxl
import pandas as pd
#读取excel表格
df=pd.read_excel("表格.xlsx")
​​​​​​​#拿到数据这一列的数据并且转为str字符串类型
data=df["数 据"].map(str)

#数据块只有一个帧头

#获取数据这一列含有F1的整行数据
data_F1=df[data.isin(['F1'])]
#定义一个DataFrame对象
result_F1=pd.DataFrame()
#把F1的数据进行分文件存储
for i in data_F1.index:
  #使得后面的循环不覆盖前面的DataFrame
  #df.iloc[i:i+13]获得i索引所在行以及后面13行(后续13行是整个数据块分散的其他数据)    
  #的整行数据存入result_F1
  result_F1=result_F1.append(pd.DataFrame(df.iloc[i:i+13]),ignore_index=True)
#将数据存入excel文件
result_F1.to_excel("df_F1.xlsx")

#数据块有两个帧头
#i为0到data长度遍历
for i in range(0,len(data)-1):
    #如果数据列表中某一个为帧头,且后一数据也为帧头则留下该数据及后面5行(5个数据组成一个数据块)
    if data[i]=='BB' and data[i+1]=='BB':
        result_BB = result_BB.append(pd.DataFrame(df.iloc[i:i + 5]), ignore_index=True)
result_BB.to_excel("df_BB.xlsx")

你可能感兴趣的:(python,big,data,机器学习)