【Python】提取文本文件中某个位置的数据

目录

问题背景:

问题分析:

问题解决:


问题背景:

1.提取文本文件中,某一行某一列的一个数据;

2.一个文件夹下有n个这样的文件,都需要提取同样位置的数据;

3.只从这n个文件中筛选出想要的文件进行数据提取;

4.每个文本文件中提取出来的m个不同位置的数,然后算出这些书中最大值或者最小值和该值对应的索引值。

问题分析:

这本身是我工作中一个做的一个小工具脚本,可以拆分成一些小问题来分别处理,这里为了便于理解,会将解决这些问题对应的每个小知识点都做一个概要解释,具体分析如下:

1.Python提取文本文件中某个位置的数据

先找到文本文件具体某一行的数据,然后再把该行数据存到列表中,通过索引的方式取该行具体对应某一列的数据。

Python取文件中某一行数据方法:

import linecache

str=linecache.getline(filename,linenumber)

该方法返回一个类型数据

2.Python获取某个路径文件夹下的所有文件

import os

files=os.listdir(dirpath)

dirpath是需要处理的文件夹路径,files是一个存着所有该路径下的文件名列表,之后通过循环处理每一个文件。

3.筛选问题其实相对好处理,在循环读取文件时加一个判断条件即可

4.Python取列表最大最小值与其对应的索引值

这里使用heapq来取最大值,使用map方法去匹配对应的索引值。

import heapq

max_value=heapq.nlargest(1,value_lists)

问题解决:

具体代码如下:

1.Python获取指定路径文件夹下的所有文件

如果需要筛选的话也在这里加判断条件

def getFiles(dirpath):

    files=os.listdir(dirpath)

    for file in files:

        print(file)

    return files

调用:

filelist=getFiles("C:/Desktop/test.txt")

2.Python提取文本文件中某个位置的数据

def handleText(filelist):

    value_list=[]

    flie_index=[]

    for file in filelist:

        value=linecache.getline(file,20)

        value=value.strip().split("  ")[10]

        value_list.append(value)

    max_value=heapq.nlargest(1,value_list)

    max_value_index=list(map(value_list.index,max_value))

    max_value_index=int(max_value[0])

    filename=file_index[max_value_index]

你可能感兴趣的:(Python,python,开发语言)