使用 Pandas 读取多个分隔方式的文件

        如果您的文本文件的第一行数据是使用逗号分隔的,而其余行是使用 tab 分隔的,您需要在 Pandas 中使用 read_csv 函数,并使用正则表达式指定多个分隔符。

1,2,3,4,5,6
a	b	c	d	e	f
z	x	c	v	b	n

        以下是如何使用 Pandas 读取该文件的代码:

import pandas as pd

# 读取文本文件,使用正则表达式指定多个分隔符,并将第一行作为列名
df = pd.read_csv('data.txt', sep=r'[,\t]', engine='python', header=0)

# 打印数据框
print(df)

        输出结果应为:

   1  2  3  4  5  6
0  a  b  c  d  e  f
1  z  x  c  v  b  n

        这里的 sep 参数使用了正则表达式 [,\t],表示分隔符可以是逗号或者 tab。engine 参数指定了解析器的引擎,这里我们选择了 Python 自带的解析器。最后,header=0 参数告诉 Pandas 使用第一行作为列名。

你可能感兴趣的:(python,技术总结,个人通过各种教程的总结,pandas)