读取不同格式文件中的内容(xlsx,csv,txt,npz,yaml)

1.读取.xlsx中的内容

import pandas as pd

# 读取Excel文件
data = pd.read_excel('your_file.xlsx')  # 替换 'your_file.xlsx' 为你的文件路径

# 现在,'data' 包含了Excel文件中的数据,可以像访问数据框一样访问和操作它
# 例如,你可以使用 data.head() 查看前几行数据

# 也可以将特定列的数据提取出来,例如:
id_column = data['id']
sentence1_column = data['sentence1']
sentence2_column = data['sentence2']

# 然后你可以使用这些列的数据进行进一步的操作

2.读取csv中的内容

import csv

# 打开CSV文件进行读取
with open('your_file.csv', mode='r', encoding='utf-8') as csv_file:
    csv_reader = csv.reader(csv_file)

    # 跳过第一行(列名行)
    next(csv_reader)

    # 遍历CSV文件的每一行
    for row in csv_reader:
        # 在每行中访问不同列的数据
        id = row[0]  # 第一列的数据
        sentence1 = row[1]  # 第二列的数据
        sentence2 = row[2]  # 第三列的数据

        # 在这里,你可以处理或输出提取的数据
        print(f"ID: {id}, Sentence1: {sentence1}, Sentence2: {sentence2}")
import pandas as pd
# 打开CSV文件进行读取
file = 'E:/SRS/project/plot_code/violin_plot/violin_and_box/df.csv'
# 读取CSV文件
df = pd.read_csv(file)
# 假设您要提取的列名为'column_name'
same_reaction = df['same_reaction'].values.tolist() # type->numpy->list

3.读取.txt中的内容

# 打开文本文件进行读取
with open('your_file.txt', mode='r', encoding='utf-8') as file:
    content = file.read()
    print(content)

4.读取.npz中的内容

import numpy as np

# 从 .npz 文件中加载数据
data = np.load('your_file.npz')  # 用你的文件名替换 'your_file.npz'

# 获取存储在 .npz 文件中的对象名称列表
object_names = data.files

# 遍历对象名称并访问每个对象
for object_name in object_names:
    object_data = data[object_name]
    print(f"Object Name: {object_name}")
    print("Object Data:")
    print(object_data)

读取不同格式文件中的内容(xlsx,csv,txt,npz,yaml)_第1张图片

5.读取.yaml中的内容

import yaml

# 打开 YAML 文件进行读取
with open('your_file.yaml', 'r', encoding='utf-8') as yaml_file:
    yaml_data = yaml.load(yaml_file, Loader=yaml.FullLoader)

# 现在,yaml_data 包含了 YAML 文件的内容,它通常会转换为字典或其他合适的数据结构
# 你可以访问和操作 yaml_data 中的数据

你可能感兴趣的:(Python,python)