目录
问题背景:
问题分析:
问题解决:
1.提取文本文件中,某一行某一列的一个数据;
2.一个文件夹下有n个这样的文件,都需要提取同样位置的数据;
3.只从这n个文件中筛选出想要的文件进行数据提取;
4.每个文本文件中提取出来的m个不同位置的数,然后算出这些书中最大值或者最小值和该值对应的索引值。
这本身是我工作中一个做的一个小工具脚本,可以拆分成一些小问题来分别处理,这里为了便于理解,会将解决这些问题对应的每个小知识点都做一个概要解释,具体分析如下:
1.Python提取文本文件中某个位置的数据
先找到文本文件具体某一行的数据,然后再把该行数据存到列表中,通过索引的方式取该行具体对应某一列的数据。
Python取文件中某一行数据方法:
import linecache
str=linecache.getline(filename,linenumber)
该方法返回一个
2.Python获取某个路径文件夹下的所有文件
import os
files=os.listdir(dirpath)
dirpath是需要处理的文件夹路径,files是一个存着所有该路径下的文件名列表,之后通过循环处理每一个文件。
3.筛选问题其实相对好处理,在循环读取文件时加一个判断条件即可
4.Python取列表最大最小值与其对应的索引值
这里使用heapq来取最大值,使用map方法去匹配对应的索引值。
import heapq
max_value=heapq.nlargest(1,value_lists)
具体代码如下:
1.Python获取指定路径文件夹下的所有文件
如果需要筛选的话也在这里加判断条件
def getFiles(dirpath):
files=os.listdir(dirpath)
for file in files:
print(file)
return files
调用:
filelist=getFiles("C:/Desktop/test.txt")
2.Python提取文本文件中某个位置的数据
def handleText(filelist):
value_list=[]
flie_index=[]
for file in filelist:
value=linecache.getline(file,20)
value=value.strip().split(" ")[10]
value_list.append(value)
max_value=heapq.nlargest(1,value_list)
max_value_index=list(map(value_list.index,max_value))
max_value_index=int(max_value[0])
filename=file_index[max_value_index]