python读入excel,进行excel处理的基础操作

1.合并多个Excel文件的sheet

可以使用Python中的pandas库来读取和合并多个Excel文件的sheet。 首先需要安装pandas库,可以使用以下命令进行安装: ``` pip install pandas ``` 接下来,可以使用以下代码来读取和合并多个Excel文件的sheet:

```python
import pandas as pd

# 定义要读取的Excel文件列表
excel_files = ['file1.xlsx', 'file2.xlsx', 'file3.xlsx']

# 定义要读取的sheet名称
sheet_names = ['Sheet1', 'Sheet2', 'Sheet3']

# 定义一个空的DataFrame
df = pd.DataFrame()

# 循环读取每个Excel文件的每个sheet,并将其合并到df中
for file, sheet in zip(excel_files, sheet_names):
    data = pd.read_excel(file, sheet_name=sheet)
    df = pd.concat([df, data])

# 将合并后的数据保存到一个新的Excel文件中
df.to_excel('merged.xlsx', index=False)
```

在上面的代码中,首先定义了要读取的Excel文件列表和sheet名称列表。然后使用一个空的DataFrame来存储合并后的数据。接着使用循环来读取每个Excel文件的每个sheet,并将其合并到df中。最后将合并后的数据保存到一个新的Excel文件中。 需要注意的是,如果要合并的Excel文件中的sheet结构不同,可能需要进行一些数据清洗和处理,以确保合并后的数据结构一致。

2.pandas库来读取多个Excel文件,并按列显示数据。 

可以使用pandas库来读取多个Excel文件,并按列显示数据。

首先,需要安装pandas库。可以使用以下命令进行安装:

```
pip install pandas
```

然后,可以使用pandas的read_excel函数来读取Excel文件。可以使用glob库来获取所有需要读取的Excel文件的文件名,然后使用循环来读取每个文件并将它们合并到一个DataFrame中。最后,可以使用pandas的iloc函数来按列显示数据。

以下是一个示例代码:

```python
import pandas as pd
import glob

# 获取所有需要读取的Excel文件的文件名
excel_files = glob.glob('*.xlsx')

# 循环读取每个Excel文件并将它们合并到一个DataFrame中
df = pd.DataFrame()
for file in excel_files:
    data = pd.read_excel(file)
    df = pd.concat([df, data], axis=0)

# 按列显示数据
print(df.iloc[:, 0:3])
```

在上面的代码中,`glob.glob('*.xlsx')`会获取当前目录下所有扩展名为xlsx的文件名。`pd.read_excel(file)`会读取每个Excel文件并将其存储在一个DataFrame中。`pd.concat([df, data], axis=0)`会将每个DataFrame合并到一个大的DataFrame中。`df.iloc[:, 0:3]`会按列显示前三列数据。

 3.使用Python中的pandas库来读取和修改Excel文件

 

可以使用Python中的pandas库来读取和修改Excel文件。以下是一个示例代码,可以读取多个Excel文件并更改列名:

```python
import pandas as pd
import glob

# 获取所有Excel文件的文件名
excel_files = glob.glob('*.xlsx')

# 循环读取每个Excel文件并更改列名
for file in excel_files:
    df = pd.read_excel(file)
    df = df.rename(columns={'old_column_name': 'new_column_name'})
    df.to_excel(file, index=False)
```

在上面的代码中,`glob.glob('*.xlsx')`会获取当前目录下所有扩展名为xlsx的文件名。然后,使用一个循环来读取每个Excel文件,使用`pd.read_excel()`函数读取Excel文件,使用`df.rename()`函数更改列名,最后使用`df.to_excel()`函数将修改后的数据写回到原始Excel文件中。

你可能感兴趣的:(excel,pandas,数据分析)