python之利用pandas进行数据加载/存储

一、读写文本格式的数据

1.1 从文件、URL等对象中读写数据

pandas提供了一些用于将表格型数据读取为DataFrame对象的函数:

python之利用pandas进行数据加载/存储_第1张图片

最常用的两个函数:read_csv和read_table,这两个函数参数及其说明如下:

python之利用pandas进行数据加载/存储_第2张图片

python之利用pandas进行数据加载/存储_第3张图片

#从文本文件中读取数据
df=pd.read_csv('data.csv')    #数据自带列名
#等效于
#sep指分隔符,对于不是固定的分隔符时,可以编写正则表达式作为分隔符
df=pd.read_table('data.csv',sep=',')
#若数据未带列名,可默认:
df1=pd.read_csv('data1.csv',header=None)
#自定义列名:
df2=pd.read_csv('data1.csv',names=['a','b','c','d','messgae'])
#指定message列(第4列)为列索引,index_col为整数或序列
df3=pd.read_csv('data.csv',index_col=4)
"""
df、df2:                            df1:                      df3:
   a   b   c   d messgae       0   1   2   3      4               a   b   c   d
0  1   2   3   4   hello    0  1   2   3   4  hello      messgae               
1  5   6   7   8   world    1  5   6   7   8  world      hello    1   2   3   4
2  9  10  11  12      ha    2  9  10  11  12     ha      world    5   6   7   8
                                                         ha       9  10  11  12
"""    
#将数据保存到文本文件中
df3.to_csv('data2.csv')

1.2 从json中读写数据

JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式。它基于ECMAScript的一个子集。

Python3 中可以使用 json 模块来对 JSON 数据进行编解码,它包含了两个函数:

  • json.dumps(): 对数据进行编码。
  • json.loads(): 对数据进行解码。
import json

# Python字典类型转换为 JSON 对象
data = {
    'no' : 1,
    'name' : 'LZH12345',
    'url' : 'https://blog.csdn.net/lzh_12345/article/details/79499203'
}

json_str = json.dumps(data)
#json_str:'{"no": 1, "name": "LZH12345", "url": "https://blog.csdn.net/lzh_12345/article/details/79499203"}'
str1=json.loads(json_str)
#str1:{'name': 'LZH12345','no': 1,'url': 'https://blog.csdn.net/lzh_12345/article/details/79499203'}

你可能感兴趣的:(数据分析工具)