实际中,很多数据都是存为txt文件、csv文件等,但是在程序中处理的时候numpy数组或列表是最方便的。本文简单介绍读入txt文件以及将之转化为numpy数组或列表的方法。
1 将txt文件读为list并转化为numpy数组
import numpy as np
file = open('filename.txt')
val_list = file.readlines()
lists =[]
for string in val_list:
string = string.split('\t',3)
lists.append(string[0:2]) #只取每个string的前两项,得到的lists即为所要的列表
a = numpy.loadtxt('filename.txt')
这样直接得到一个全为数字的numpy数组。
2 split等方法的简介split函数通过指定分隔符对字符串进行分隔,如果参数num有值,则表示将字符串分隔为num个字符串。语法格式:string.split(str = " " , num = x ),str为分隔符,默认是所有的空字符,如空格、换行、制表符等。num为子字符串个数。返回值为分隔后的字符串列表。实列如上文中:
string = string.split('\t',3)
表示以\t为分隔符,分成3个字符串。除了常用的split,还有一个常用的功能相关的函数strip(),它用于移除字符串头尾指定的字符。它的语法格式:string.strip([char]),char为
要移除的指定的字符,默认为空格。返回值为移除后的新字符串。实列如下:
str = "000111aaabbb111000"
print str.strip('0')
输出为:
111aaabbb111