机器读取的数据

CSV文件

csv文件是指将数据列用逗号分隔的文件,文件的扩展名是.csv。
另一种数据类型,叫做制表符分隔值(TSV),TSV 和CSV唯一的不同之处在于,数据列直接的分隔符是制表符(tab),而不是逗号。

导入CSV数据

基于python 2.7 版本下的数据读取

import csv

file = open('wenjian.csv' , 'r')
reader = file.reader(file)

for x in reader:
   print row

JSON文件

网站在像页面的JavaScript传输数据时,JSON也是最常用的数据,易于阅读且方便解析

导入JSON数据

imort json
 
json_data = open(wenjian.json ).read()

data = json.loads(json_data)

for item in data
  print item

XML 数据

xml是一种标记语言,它具有保函格式化数据的文档结构,本质上只是个是特殊的数据文件。

导入xml 数据

from xml.tree import ELementTree as ET
tree = ET.parse('wenjian.xml')
root = tree.getroot()
#这里可以打印一下标签,找到你需要的标签
#print list(root)
data = root.find('Data')
all_data = []
for observation in data: 
     record = {}
     for item in observation:
     lookup_key = item.attrib.keys()[0]
      if lookup_key == 'Numeric':
             rec_key = 'NUMERIC'
             rec_value = item.attrib['Numeric']
      else:
             rec_key = item.attrib[lookup_key]                 
             rec_value = item.attrib['Code']
      record[rec_key] = rec_value
  all_data.append(record)
print all_data

你可能感兴趣的:(机器读取的数据)