Pandas使用一(DataFrame创建,csv、exl、sql读取写入)

Pandas操作的数据类型为DataFrame,可以看作多个元祖组合而成, shape函数得到大小

.创建,读取,保存数据

1. 创建DataFrame

  • 元祖创建,只能创建一列,不能指定列名,name为整个表的名字,index参数为行名,作为索引
pd.Series([30, 35, 40], index=['2015 Sales', '2016 Sales', '2017 Sales'],name='Product A')
2015 Sales 30
2016 Sales 35
2017 Sales 40
  • 字典创建,按列赋值
pd.DataFrame({'Yes': [50, 21] , 'No': [131, 2]}, index = ['A','B'])
Yes No
A 50 131
B 21 2
  • columns为列名,按行赋值
fruit_sales = pd.DataFrame([[35, 21], [41, 34]],
                         columns=['Apples', 'Bananas'],
                              index=['2017 Sales', '2018 Sales'])
Apples Bananas
2017 Sales 35 21
2018 Sales 41 34

2.读取数据

  • 从csv中读取
    index_col设置作为索引的列
    head()显示数据,默认为前5行
wine_reviews = pd.read_csv("../input/wine-reviews/winemag-data-130k-v2.csv", index_col=0)
wine_reviews.head()
  • 从exl中读取
    一个xls可能有很多表,需要指定表名,往往含有很多附加信息,要先进行数据清洗
wic = pd.read_excel("../input/publicassistance/xls_files_all/WICAgencies2013ytd.xls", 
                    sheet_name='Total Women')
  • 从sql数据库中读取
import sqlite3
conn = sqlite3.connect("../input/188-million-us-wildfires/FPA_FOD_20170508.sqlite")
fires = pd.read_sql_query("SELECT * FROM fires", conn)

3.写入数据

  • csv
wine_reviews.head().to_csv("wine_reviews.csv")
  • exl
wic.to_excel('wic.xlsx', sheet_name='Total Women')
  • sql数据库
 conn = sqlite3.connect("fires.sqlite")
fires.head(10).to_sql("fires", conn)`

原文

你可能感兴趣的:(Pandas使用一(DataFrame创建,csv、exl、sql读取写入))