Pandas 是 Python 的一个功能强大且灵活的三方包,可处理标记和时间序列数据。还提供统计方法、启用绘图等功能。Pandas 的一项重要功能是能够编写和读取 Excel、CSV 和许多其他类型的文件并且能有效地进行处理文件。
在你所在的开发环境命令行输入。如果默认用的Anaconda安装的话可以略过此过程。
pip install pandas
使用 20 个国家/地区相关的数据。数据的列的说明如下:
SHORT_NAME | COUNTRY | POP | AREA | GDP | CONT | IND_DAY |
---|---|---|---|---|---|---|
CHN | China | 1398.72 | 9596.96 | 12234.78 | Asia | 1949-10-01 |
IND | India | 1351.16 | 3287.26 | 2575.67 | Asia | 1947-08-15 |
USA | US | 329.74 | 9833.52 | 19485.39 | N.America | 1776-07-04 |
IDN | Indonesia | 268.07 | 1910.93 | 1015.54 | Asia | 1945-08-17 |
BRA | Brazil | 210.32 | 8515.77 | 2055.51 | S.America | 1822-09-07 |
PAK | Pakistan | 205.71 | 881.91 | 302.14 | Asia | 1947-08-14 |
NGA | Nigeria | 200.96 | 923.77 | 375.77 | Africa | 1960-10-01 |
BGD | Bangladesh | 167.09 | 147.57 | 245.63 | Asia | 1971-03-26 |
RUS | Russia | 146.79 | 17098.25 | 1530.75 | 1992-06-12 | |
MEX | Mexico | 126.58 | 1964.38 | 1158.23 | N.America | 1810-09-16 |
JPN | Japan | 126.22 | 377.97 | 4872.42 | Asia | |
DEU | Germany | 83.02 | 357.11 | 3693.2 | Europe | |
FRA | France | 67.02 | 640.68 | 2582.49 | Europe | 1789-07-14 |
GBR | UK | 66.44 | 242.5 | 2631.23 | Europe | |
ITA | Italy | 60.36 | 301.34 | 1943.84 | Europe | |
ARG | Argentina | 44.94 | 2780.4 | 637.49 | S.America | 1816-07-09 |
DZA | Algeria | 43.38 | 2381.74 | 167.56 | Africa | 1962-07-05 |
CAN | Canada | 37.59 | 9984.67 | 1647.12 | N.America | 1867-07-01 |
AUS | Australia | 25.47 | 7692.02 | 1408.68 | Oceania | |
KAZ | Kazakhstan | 18.53 | 2724.9 | 159.41 | Asia | 1991-12-16 |
看到上面的数据有部分是丢失的。使用嵌套字典的方式记录这些数据。
data = { 'CHN': { 'COUNTRY': 'China', 'POP': 1_398.72, 'AREA': 9_596.96, 'GDP': 12_234.78, 'CONT': 'Asia', 'IND_DAY': '1949-10-01'}, 'IND': { 'COUNTRY': 'India', 'POP': 1_351.16, 'AREA': 3_287.26, 'GDP': 2_575.67, 'CONT': 'Asia', 'IND_DAY': '1947-08-15'}, 'USA': { 'COUNTRY': 'US', 'POP': 329.74, 'AREA': 9_833.52, 'GDP': 19_485.39, 'CONT': 'N.America', 'IND_DAY': '1776-07-04'}, 'IDN': { 'COUNTRY': 'Indonesia', 'POP': 268.07, 'AREA': 1_910.93, 'GDP': 1_015.54, 'CONT': 'Asia', 'IND_DAY': '1945-08-17'}, 'BRA': { 'COUNTRY': 'Brazil', 'POP': 210.32, 'AREA': 8_515.77, 'GDP': 2_055.51, 'CONT': 'S.America', 'IND_DAY': '1822-09-07'}, 'PAK': { 'COUNTRY': 'Pakistan', 'POP': 205.71, 'AREA': 881.91, 'GDP': 302.14, 'CONT': 'Asia', 'IND_DAY': '1947-08-14'}, 'NGA': { 'COUNTRY': 'Nigeria', 'POP': 200.96, 'AREA': 923.77, 'GDP': 375.77, 'CONT': 'Africa', 'IND_DAY': '1960-10-01'}, 'BGD': { 'COUNTRY': 'Bangladesh', 'POP': 167.09, 'AREA': 147.57, 'GDP': 245.63, 'CONT': 'Asia', 'IND_DAY': '1971-03-26'}, 'RUS': { 'COUNTRY': 'Russia', 'POP': 146.79, 'AREA': 17_098.25, 'GDP': 1_530.75, 'IND_DAY': '1992-06-12'}, 'MEX': { 'COUNTRY': 'Mexico', 'POP': 126.58, 'AREA': 1_964.38, 'GDP': 1_158.23, 'CONT': 'N.America', 'IND_DAY': '1810-09-16'}, 'JPN': { 'COUNTRY': 'Japan', 'POP': 126.22, 'AREA': 377.97, 'GDP': 4_872.42, 'CONT': 'Asia'}, 'DEU': { 'COUNTRY': 'Germany', 'POP': 83.02, 'AREA': 357.11, 'GDP': 3_693.20, 'CONT': 'Europe'}, 'FRA': { 'COUNTRY': 'France', 'POP': 67.02, 'AREA': 640.68, 'GDP': 2_582.49, 'CONT': 'Europe', 'IND_DAY': '1789-07-14'}, 'GBR': { 'COUNTRY': 'UK', 'POP': 66.44, 'AREA': 242.50, 'GDP': 2_631.23, 'CONT': 'Europe'}, 'ITA': { 'COUNTRY': 'Italy', 'POP': 60.36, 'AREA': 301.34, 'GDP': 1_943.84, 'CONT': 'Europe'}, 'ARG': { 'COUNTRY': 'Argentina', 'POP': 44.94, 'AREA': 2_780.40, 'GDP': 637.49, 'CONT': 'S.America', 'IND_DAY': '1816-07-09'}, 'DZA'