常用Pandas读取excel(或txt)部分行列并输出

读取

data = pd.read_excel(excel_path)  # excel文件路径
print(data.shape)  # (69, 6)

按行列输出

用.loc()和.iloc方法,前者是用行列名称(新版python中.loc()方法也可以用索引),后者是索引。

# 按行输出
for i in range(len(data)):
    print(data.iloc[i, :])
# 按列输出
for i in range(len(data.columns)):
    print(data.iloc[:, i])

取整个表的部分行列,需要用到.reindex(index=,columns=,)

# 随机创建个表
data = pd.DataFrame(np.random.randn(5, 4), index=np.arange(5), columns=list("abcd"))
print(data)

# 输出
          a         b         c         d
0 -0.733757 -0.411153  0.580073 -1.024741
1  1.070656 -0.731510 -1.205196 -0.523969
2 -0.225261  0.758134 -0.270350  1.040465
3  0.386032  1.394033  1.997889 -0.307555
4  0.991085 -0.226683  0.847998  0.970155
# 取前2行前2列
data_ = data.reindex(index=range(5), columns=list("ab"))
print(data_)
          a         b
0 -0.733757 -0.411153
1  1.070656 -0.731510

 .reindex()其他参数的用法详见

pandas中的reindex用法_我是小蚂蚁的博客-CSDN博客_pandas reindexpandas中的reindex方法可以为series和dataframe添加或者删除索引。如果新添加的索引没有对应的值,则默认为nan。如果减少索引,就相当于一个切片操作。import numpy as npimport pandas as pdfrom pandas import Series, DataFramenp.random.seed(666)# series reind...https://blog.csdn.net/missyougoon/article/details/83409717

你可能感兴趣的:(学习经验记录,pandas,python,数据分析)