2401_86391915

Python基础（十一）超详细的Pandas库三万字总结_gdp_data

| 2019-01-01 | -0.935378 | -0.190742 | 0.925984 | -0.818969 |
| 2019-01-02 | -0.234414 | -1.194674 | 1.080779 | -2.294395 |
| 2019-01-03 | -0.141572 | 0.058118 | 1.102248 | 1.207726 |

注意：这里的3是取不到的。

（2）列切片

df

	A	B	C	D
2019-01-01	-0.935378	-0.190742	0.925984	-0.818969
2019-01-02	-0.234414	-1.194674	1.080779	-2.294395
2019-01-03	-0.141572	0.058118	1.102248	1.207726
2019-01-04	0.305088	0.535920	-0.978434	0.177251
2019-01-05	0.313383	0.234041	0.163155	-0.296649
2019-01-06	0.250613	-0.904400	-0.858240	-1.573342

df.loc[:, "A": "C"]

	A	B	C
2019-01-01	-0.935378	-0.190742	0.925984
2019-01-02	-0.234414	-1.194674	1.080779
2019-01-03	-0.141572	0.058118	1.102248
2019-01-04	0.305088	0.535920	-0.978434
2019-01-05	0.313383	0.234041	0.163155
2019-01-06	0.250613	-0.904400	-0.858240

df.iloc[:, 0: 3]

	A	B	C
2019-01-01	-0.935378	-0.190742	0.925984
2019-01-02	-0.234414	-1.194674	1.080779
2019-01-03	-0.141572	0.058118	1.102248
2019-01-04	0.305088	0.535920	-0.978434
2019-01-05	0.313383	0.234041	0.163155
2019-01-06	0.250613	-0.904400	-0.858240

（3）多种多样的取值

df

	A	B	C	D
2019-01-01	-0.935378	-0.190742	0.925984	-0.818969
2019-01-02	-0.234414	-1.194674	1.080779	-2.294395
2019-01-03	-0.141572	0.058118	1.102248	1.207726
2019-01-04	0.305088	0.535920	-0.978434	0.177251
2019-01-05	0.313383	0.234041	0.163155	-0.296649
2019-01-06	0.250613	-0.904400	-0.858240	-1.573342

行、列同时切片

df.loc["2019-01-02": "2019-01-03", "C":"D"]

	C	D
2019-01-02	1.080779	-2.294395
2019-01-03	1.102248	1.207726

df.iloc[1: 3, 2:]

	C	D
2019-01-02	1.080779	-2.294395
2019-01-03	1.102248	1.207726

行切片，列分散取值

df.loc["2019-01-04": "2019-01-06", ["A", "C"]]

	A	C
2019-01-04	0.305088	-0.978434
2019-01-05	0.313383	0.163155
2019-01-06	0.250613	-0.858240

df.iloc[3:, [0, 2]]

	A	C
2019-01-04	0.305088	-0.978434
2019-01-05	0.313383	0.163155
2019-01-06	0.250613	-0.858240

行分散取值，列切片

df.loc[["2019-01-02", "2019-01-06"], "C": "D"]

上面这种方式是行不通的。

df.iloc[[1, 5], 0: 3]

	A	B	C
2019-01-02	-0.234414	-1.194674	1.080779
2019-01-06	0.250613	-0.904400	-0.858240

行、列均分散取值

df.loc[["2019-01-04", "2019-01-06"], ["A", "D"]]

同样，上面这种方式是行不通的。

df.iloc[[1, 5], [0, 3]]

	A	D
2019-01-02	-0.234414	-2.294395
2019-01-06	0.250613	-1.573342

4、布尔索引

相当于numpy当中的掩码操作。

df

	A	B	C	D
2019-01-01	-0.935378	-0.190742	0.925984	-0.818969
2019-01-02	-0.234414	-1.194674	1.080779	-2.294395
2019-01-03	-0.141572	0.058118	1.102248	1.207726
2019-01-04	0.305088	0.535920	-0.978434	0.177251
2019-01-05	0.313383	0.234041	0.163155	-0.296649
2019-01-06	0.250613	-0.904400	-0.858240	-1.573342

df > 0

	A	B	C	D
2019-01-01	False	False	True	False
2019-01-02	False	False	True	False
2019-01-03	False	True	True	True
2019-01-04	True	True	False	True
2019-01-05	True	True	True	False
2019-01-06	True	False	False	False

df[df > 0]

	A	B	C	D
2019-01-01	NaN	NaN	0.925984	NaN
2019-01-02	NaN	NaN	1.080779	NaN
2019-01-03	NaN	0.058118	1.102248	1.207726
2019-01-04	0.305088	0.535920	NaN	0.177251
2019-01-05	0.313383	0.234041	0.163155	NaN
2019-01-06	0.250613	NaN	NaN	NaN

可以观察到，为true的部分都被取到了，而false没有。

df.A > 0

2019-01-01    False
2019-01-02    False
2019-01-03    False
2019-01-04     True
2019-01-05     True
2019-01-06     True
Freq: D, Name: A, dtype: bool

df[df.A > 0]

	A	B	C	D
2019-01-04	0.305088	0.535920	-0.978434	0.177251
2019-01-05	0.313383	0.234041	0.163155	-0.296649
2019-01-06	0.250613	-0.904400	-0.858240	-1.573342

isin（）方法

df2 = df.copy()
df2['E'] = ['one', 'one', 'two', 'three', 'four', 'three']
df2

	A	B	C	D	E
2019-01-01	-0.935378	-0.190742	0.925984	-0.818969	one
2019-01-02	-0.234414	-1.194674	1.080779	-2.294395	one
2019-01-03	-0.141572	0.058118	1.102248	1.207726	two
2019-01-04	0.305088	0.535920	-0.978434	0.177251	three
2019-01-05	0.313383	0.234041	0.163155	-0.296649	four
2019-01-06	0.250613	-0.904400	-0.858240	-1.573342	three

ind = df2["E"].isin(["two", "four"])
ind

2019-01-01    False
2019-01-02    False
2019-01-03     True
2019-01-04    False
2019-01-05     True
2019-01-06    False
Freq: D, Name: E, dtype: bool

df2[ind]

	A	B	C	D	E
2019-01-03	-0.141572	0.058118	1.102248	1.207726	two
2019-01-05	0.313383	0.234041	0.163155	-0.296649	four

（5）赋值

df

DataFrame 增加新列

s1 = pd.Series([1, 2, 3, 4, 5, 6], index=pd.date_range('20190101', periods=6))
s1

2019-01-01    1
2019-01-02    2
2019-01-03    3
2019-01-04    4
2019-01-05    5
2019-01-06    6
Freq: D, dtype: int64

df["E"] = s1
df

	A	B	C	D	E
2019-01-01	-0.935378	-0.190742	0.925984	-0.818969	1
2019-01-02	-0.234414	-1.194674	1.080779	-2.294395	2
2019-01-03	-0.141572	0.058118	1.102248	1.207726	3
2019-01-04	0.305088	0.535920	-0.978434	0.177251	4
2019-01-05	0.313383	0.234041	0.163155	-0.296649	5
2019-01-06	0.250613	-0.904400	-0.858240	-1.573342	6

修改赋值

df.loc["2019-01-01", "A"] = 0
df

	A	B	C	D	E
2019-01-01	0.000000	-0.190742	0.925984	-0.818969	1
2019-01-02	-0.234414	-1.194674	1.080779	-2.294395	2
2019-01-03	-0.141572	0.058118	1.102248	1.207726	3
2019-01-04	0.305088	0.535920	-0.978434	0.177251	4
2019-01-05	0.313383	0.234041	0.163155	-0.296649	5
2019-01-06	0.250613	-0.904400	-0.858240	-1.573342	6

df.iloc[0, 1] = 0
df

	A	B	C	D	E
2019-01-01	0.000000	0.000000	0.925984	-0.818969	1
2019-01-02	-0.234414	-1.194674	1.080779	-2.294395	2
2019-01-03	-0.141572	0.058118	1.102248	1.207726	3
2019-01-04	0.305088	0.535920	-0.978434	0.177251	4
2019-01-05	0.313383	0.234041	0.163155	-0.296649	5
2019-01-06	0.250613	-0.904400	-0.858240	-1.573342	6

df["D"] = np.array([5]\*len(df))   # 可简化成df["D"] = 5
df

	A	B	C	D	E
2019-01-01	0.000000	0.000000	0.925984	5	1
2019-01-02	-0.234414	-1.194674	1.080779	5	2
2019-01-03	-0.141572	0.058118	1.102248	5	3
2019-01-04	0.305088	0.535920	-0.978434	5	4
2019-01-05	0.313383	0.234041	0.163155	5	5
2019-01-06	0.250613	-0.904400	-0.858240	5	6

修改index和columns

df.index = [i for i in range(len(df))]
df

	A	B	C	D	E
0	0.000000	0.000000	0.925984	5	1
1	-0.234414	-1.194674	1.080779	5	2
2	-0.141572	0.058118	1.102248	5	3
3	0.305088	0.535920	-0.978434	5	4
4	0.313383	0.234041	0.163155	5	5
5	0.250613	-0.904400	-0.858240	5	6

df.columns = [i for i in range(df.shape[1])]
df

	0	1	2	3	4
0	0.000000	0.000000	0.925984	5	1
1	-0.234414	-1.194674	1.080779	5	2
2	-0.141572	0.058118	1.102248	5	3
3	0.305088	0.535920	-0.978434	5	4
4	0.313383	0.234041	0.163155	5	5
5	0.250613	-0.904400	-0.858240	5	6

11.3 数值运算及统计分析

1、数据的查看

import pandas as pd
import numpy as np

dates = pd.date_range(start='2019-01-01', periods=6)
df = pd.DataFrame(np.random.randn(6,4), index=dates, columns=["A", "B", "C", "D"])
df

	A	B	C	D
2019-01-01	-0.854043	0.412345	-2.296051	-0.048964
2019-01-02	1.371364	-0.121454	-0.299653	1.095375
2019-01-03	-0.714591	-1.103224	0.979250	0.319455
2019-01-04	-1.397557	0.426008	0.233861	-1.651887
2019-01-05	0.434026	0.459830	-0.095444	1.220302
2019-01-06	-0.133876	0.074500	-1.028147	0.605402

（1）查看前面的行

df.head()    # 默认5行，也可以进行设置

	A	B	C	D
2019-01-01	-0.854043	0.412345	-2.296051	-0.048964
2019-01-02	1.371364	-0.121454	-0.299653	1.095375
2019-01-03	-0.714591	-1.103224	0.979250	0.319455
2019-01-04	-1.397557	0.426008	0.233861	-1.651887
2019-01-05	0.434026	0.459830	-0.095444	1.220302

df.head(2)

	A	B	C	D
2019-01-01	-0.854043	0.412345	-2.296051	-0.048964
2019-01-02	1.371364	-0.121454	-0.299653	1.095375

（2）查看后面的行

df.tail()    # 默认5行

	A	B	C	D
2019-01-02	1.371364	-0.121454	-0.299653	1.095375
2019-01-03	-0.714591	-1.103224	0.979250	0.319455
2019-01-04	-1.397557	0.426008	0.233861	-1.651887
2019-01-05	0.434026	0.459830	-0.095444	1.220302
2019-01-06	-0.133876	0.074500	-1.028147	0.605402

df.tail(3)

	A	B	C	D
2019-01-04	-1.397557	0.426008	0.233861	-1.651887
2019-01-05	0.434026	0.459830	-0.095444	1.220302
2019-01-06	-0.133876	0.074500	-1.028147	0.605402

（3）查看总体信息

df.iloc[0, 3] = np.nan
df

	A	B	C	D
2019-01-01	-0.854043	0.412345	-2.296051	NaN
2019-01-02	1.371364	-0.121454	-0.299653	1.095375
2019-01-03	-0.714591	-1.103224	0.979250	0.319455
2019-01-04	-1.397557	0.426008	0.233861	-1.651887
2019-01-05	0.434026	0.459830	-0.095444	1.220302
2019-01-06	-0.133876	0.074500	-1.028147	0.605402

df.info()


DatetimeIndex: 6 entries, 2019-01-01 to 2019-01-06
Freq: D
Data columns (total 4 columns):
A    6 non-null float64
B    6 non-null float64
C    6 non-null float64
D    5 non-null float64
dtypes: float64(4)
memory usage: 240.0 bytes

2、Numpy通用函数同样适用于Pandas

（1）向量化运算

x = pd.DataFrame(np.arange(4).reshape(1, 4))
x

	0	1	2	3
0	0	1	2	3

x+5

	0	1	2	3
0	5	6	7	8

np.exp(x)

	0	1	2	3
0	1.0	2.718282	7.389056	20.085537

y = pd.DataFrame(np.arange(4,8).reshape(1, 4))
y

	0	1	2	3
0	4	5	6	7

x\*y

	0	1	2	3
0	0	5	12	21

（2）矩阵化运算

np.random.seed(42)
x = pd.DataFrame(np.random.randint(10, size=(30, 30)))
x

	0	1	2	3	4	5	6	7	8	9	…	20	21	22	23	24	25	26	27	28	29
0	6	3	7	4	6	9	2	6	7	4	…	4	0	9	5	8	0	9	2	6	3
1	8	2	4	2	6	4	8	6	1	3	…	2	0	3	1	7	3	1	5	5	9
2	3	5	1	9	1	9	3	7	6	8	…	6	8	7	0	7	7	2	0	7	2
3	2	0	4	9	6	9	8	6	8	7	…	0	2	4	2	0	4	9	6	6	8
4	9	9	2	6	0	3	3	4	6	6	…	9	6	8	6	0	0	8	8	3	8
5	2	6	5	7	8	4	0	2	9	7	…	2	0	4	0	7	0	0	1	1	5
6	6	4	0	0	2	1	4	9	5	6	…	5	0	8	5	2	3	3	2	9	2
7	2	3	6	3	8	0	7	6	1	7	…	3	0	1	0	4	4	6	8	8	2
8	2	2	3	7	5	7	0	7	3	0	…	1	1	5	2	8	3	0	3	0	4
9	3	7	7	6	2	0	0	2	5	6	…	4	2	3	2	0	0	4	5	2	8
10	4	7	0	4	2	0	3	4	6	0	…	5	6	1	9	1	9	0	7	0	8
11	5	6	9	6	9	2	1	8	7	9	…	6	5	2	8	9	5	9	9	5	0
12	3	9	5	5	4	0	7	4	4	6	…	0	7	2	9	6	9	4	9	4	6
13	8	4	0	9	9	0	1	5	8	7	…	5	8	4	0	3	4	9	9	4	6
14	3	0	4	6	9	9	5	4	3	1	…	6	1	0	3	7	1	2	0	0	2
15	4	2	0	0	7	9	1	2	1	2	…	6	3	9	4	1	7	3	8	4	8
16	3	9	4	8	7	2	0	2	3	1	…	8	0	0	3	8	5	2	0	3	8
17	2	8	6	3	2	9	4	4	2	8	…	6	9	4	2	6	1	8	9	9	0
18	5	6	7	9	8	1	9	1	4	4	…	3	5	2	5	6	9	9	2	6	2
19	1	9	3	7	8	6	0	2	8	0	…	4	3	2	2	3	8	1	8	0	0
20	4	5	5	2	6	8	9	7	5	7	…	3	5	0	8	0	4	3	2	5	1
21	2	4	8	1	9	7	1	4	6	7	…	0	1	8	2	0	4	6	5	0	4
22	4	5	2	4	6	4	4	4	9	9	…	1	7	6	9	9	1	5	5	2	1
23	0	5	4	8	0	6	4	4	1	2	…	8	5	0	7	6	9	2	0	4	3
24	9	7	0	9	0	3	7	4	1	5	…	3	7	8	2	2	1	9	2	2	4
25	4	1	9	5	4	5	0	4	8	9	…	9	3	0	7	0	2	3	7	5	9
26	6	7	1	9	7	2	6	2	6	1	…	0	6	5	9	8	0	3	8	3	9
27	2	8	1	3	5	1	7	7	0	2	…	8	0	4	5	4	5	5	6	3	7
28	6	8	6	2	2	7	4	3	7	5	…	1	7	9	2	4	5	9	5	3	2
29	3	0	3	0	0	9	5	4	3	2	…	1	3	0	4	8	0	8	7	5	6

30 rows × 30 columns

转置

z = x.T
z

	0	1	2	3	4	5	6	7	8	9	…	20	21	22	23	24	25	26	27	28	29
0	6	8	3	2	9	2	6	2	2	3	…	4	2	4	0	9	4	6	2	6	3
1	3	2	5	0	9	6	4	3	2	7	…	5	4	5	5	7	1	7	8	8	0
2	7	4	1	4	2	5	0	6	3	7	…	5	8	2	4	0	9	1	1	6	3
3	4	2	9	9	6	7	0	3	7	6	…	2	1	4	8	9	5	9	3	2	0
4	6	6	1	6	0	8	2	8	5	2	…	6	9	6	0	0	4	7	5	2	0
5	9	4	9	9	3	4	1	0	7	0	…	8	7	4	6	3	5	2	1	7	9
6	2	8	3	8	3	0	4	7	0	0	…	9	1	4	4	7	0	6	7	4	5
7	6	6	7	6	4	2	9	6	7	2	…	7	4	4	4	4	4	2	7	3	4
8	7	1	6	8	6	9	5	1	3	5	…	5	6	9	1	1	8	6	0	7	3
9	4	3	8	7	6	7	6	7	0	6	…	7	7	9	2	5	9	1	2	5	2
10	3	8	7	1	3	5	3	0	7	5	…	4	0	2	6	4	1	9	9	1	0
11	7	1	4	0	6	7	6	8	3	5	…	7	5	0	5	1	0	5	8	3	5
12	7	9	1	6	2	8	7	8	5	5	…	9	0	4	1	2	9	2	4	3	1
13	2	8	4	6	5	3	0	1	7	2	…	3	1	8	5	8	8	2	5	5	7
14	5	9	7	7	1	0	5	6	3	5	…	9	0	0	1	6	9	8	3	5	9
15	4	4	9	4	9	0	7	9	2	7	…	7	4	2	1	6	8	6	9	0	4
16	1	1	8	2	8	9	4	2	8	1	…	9	9	3	1	5	8	4	1	7	6
17	7	3	8	7	4	3	3	6	2	4	…	1	8	0	2	7	5	9	7	5	9
18	5	6	0	5	5	6	1	9	8	0	…	4	5	0	1	3	7	6	5	2	1
19	1	7	8	2	3	1	5	8	1	0	…	8	0	7	3	7	0	8	4	8	7
20	4	2	6	0	9	2	5	3	1	4	…	3	0	1	8	3	9	0	8	1	1
21	0	0	8	2	6	0	0	0	1	2	…	5	1	7	5	7	3	6	0	7	3
22	9	3	7	4	8	4	8	1	5	3	…	0	8	6	0	8	0	5	4	9	0
23	5	1	0	2	6	0	5	0	2	2	…	8	2	9	7	2	7	9	5	2	4
24	8	7	7	0	0	7	2	4	8	0	…	0	0	9	6	2	0	8	4	4	8
25	0	3	7	4	0	0	3	4	3	0	…	4	4	1	9	1	2	0	5	5	0
26	9	1	2	9	8	0	3	6	0	4	…	3	6	5	2	9	3	3	5	9	8
27	2	5	0	6	8	1	2	8	3	5	…	2	5	5	0	2	7	8	6	5	7
28	6	5	7	6	3	1	9	8	0	2	…	5	0	2	4	2	5	3	3	3	5
29	3	9	2	8	8	5	2	2	4	8	…	1	4	1	3	4	9	9	7	2	6

30 rows × 30 columns

np.random.seed(1)
y = pd.DataFrame(np.random.randint(10, size=(30, 30)))
y

	0	1	2	3	4	5	6	7	8	9	…	20	21	22	23	24	25	26	27	28	29
0	5	8	9	5	0	0	1	7	6	9	…	1	7	0	6	9	9	7	6	9	1
1	0	1	8	8	3	9	8	7	3	6	…	9	2	0	4	9	2	7	7	9	8
2	6	9	3	7	7	4	5	9	3	6	…	7	7	1	1	3	0	8	6	4	5
3	6	2	5	7	8	4	4	7	7	4	…	0	1	9	8	2	3	1	2	7	2
4	6	0	9	2	6	6	2	7	7	0	…	1	5	4	0	7	8	9	5	7	0
5	9	3	9	1	4	4	6	8	8	9	…	1	8	7	0	3	4	2	0	3	5
6	1	2	4	3	0	6	0	7	2	8	…	4	3	3	6	7	3	5	3	2	4
7	4	0	3	3	8	3	5	6	7	5	…	1	7	3	1	6	6	9	6	9	6
8	0	0	2	9	6	0	6	7	0	3	…	6	7	9	5	4	9	5	2	5	6
9	6	8	7	7	7	2	6	0	5	2	…	7	0	6	2	4	3	6	7	6	3
10	0	6	4	7	6	2	9	5	9	9	…	4	9	3	9	1	2	5	4	0	8
11	2	3	9	9	4	4	8	2	1	6	…	0	5	9	8	6	6	0	4	7	3
12	0	1	6	0	6	1	6	4	2	5	…	8	8	0	7	2	0	7	1	1	9
13	5	1	5	9	6	4	9	8	7	5	…	2	4	3	2	0	0	4	2	5	0
14	0	3	8	5	3	1	4	7	3	2	…	8	5	5	7	5	9	1	3	9	3
15	3	3	6	1	3	0	5	0	5	2	…	7	1	7	7	3	8	3	0	6	3
16	0	6	5	9	6	4	6	6	2	2	…	3	6	8	6	5	1	3	2	6	3
17	6	7	2	8	0	1	8	6	0	0	…	5	6	2	5	4	3	0	6	2	1
18	9	4	4	0	9	8	7	7	6	1	…	7	9	9	7	1	1	4	6	5	6
19	4	1	1	5	1	2	6	2	3	3	…	0	0	0	9	8	5	9	3	4	0
20	9	8	6	3	9	9	0	8	1	6	…	2	9	0	1	3	9	4	8	8	8
21	2	8	6	4	9	0	5	5	6	1	…	6	7	5	6	8	7	4	2	4	0
22	0	3	5	9	0	3	6	5	1	1	…	6	2	5	3	9	3	9	5	1	9
23	7	7	0	8	6	1	2	0	4	4	…	1	9	6	0	2	8	3	7	2	5
24	6	0	4	2	3	1	0	5	7	0	…	1	1	2	7	5	2	9	4	7	3
25	5	0	2	1	4	9	4	6	9	3	…	5	5	3	5	9	2	7	4	1	6
26	9	8	1	8	1	6	2	6	1	8	…	2	5	1	2	5	3	3	6	1	8
27	1	8	6	4	6	9	5	4	7	2	…	9	3	1	5	1	1	7	1	2	6
28	0	7	7	4	3	2	7	8	5	2	…	0	2	8	3	7	3	9	2	3	8
29	8	0	2	6	8	3	6	4	9	7	…	6	7	8	5	7	2	5	3	4	5

30 rows × 30 columns

x.dot(y)

	0	1	2	3	4	5	6	7	8	9	…	20	21	22	23	24	25	26	27	28	29
0	616	560	723	739	612	457	681	799	575	590	…	523	739	613	580	668	602	733	585	657	700
1	520	438	691	600	612	455	666	764	707	592	…	555	681	503	679	641	506	779	494	633	590
2	557	570	786	807	690	469	804	828	704	573	…	563	675	712	758	793	672	754	550	756	638
3	605	507	664	701	660	496	698	806	651	575	…	582	685	668	586	629	534	678	484	591	626
4	599	681	753	873	721	563	754	770	620	654	…	633	747	661	677	726	649	716	610	735	706
5	422	354	602	627	613	396	617	627	489	423	…	456	572	559	537	499	384	589	436	574	507
6	359	446	599	599	481	357	577	572	451	464	…	449	550	495	532	633	554	663	476	565	602
7	531	520	698	590	607	537	665	696	571	472	…	576	588	551	665	652	527	742	528	650	599
8	449	322	547	533	593	399	584	638	587	424	…	402	596	523	523	447	362	561	386	529	484
9	373	433	525	601	522	345	551	521	434	447	…	508	498	438	478	459	418	488	407	503	496
10	500	427	574	607	667	477	652	656	615	477	…	622	702	531	610	558	532	598	471	582	561
11	664	694	772	841	779	574	730	810	711	608	…	591	760	616	638	721	676	846	678	754	708
12	545	547	687	701	721	576	689	724	710	532	…	674	684	648	694	710	564	757	571	671	656
13	574	586	723	750	691	494	696	787	667	523	…	618	681	568	682	715	644	756	557	690	604
14	502	382	645	557	570	403	538	677	500	501	…	369	650	507	576	546	531	554	437	616	463
15	510	505	736	651	649	510	719	733	694	557	…	605	717	574	642	678	576	755	455	598	654
16	567	376	614	612	643	514	598	724	547	464	…	456	639	520	560	569	442	596	517	659	532
17	626	716	828	765	740	603	809	852	692	591	…	664	716	655	721	742	612	819	593	744	712
18	600	559	667	664	641	556	624	815	638	564	…	581	701	559	677	710	554	748	597	614	657
19	445	431	661	681	641	552	690	719	602	474	…	515	637	576	620	572	512	599	455	622	538
20	523	569	784	725	713	501	740	772	638	640	…	589	775	664	686	726	672	747	548	723	645
21	487	465	553	639	517	449	592	609	454	398	…	492	567	534	404	554	417	561	466	498	492
22	479	449	574	686	583	377	566	614	563	455	…	453	539	491	501	596	520	722	478	565	501
23	483	386	476	526	550	426	492	585	536	482	…	322	541	438	456	487	408	502	426	474	481
24	523	551	658	767	537	444	663	731	576	577	…	522	590	525	664	691	548	635	526	641	538
25	652	656	738	753	853	508	752	815	669	576	…	694	833	693	606	575	616	704	559	728	672
26	578	577	744	856	699	497	779	800	733	587	…	630	754	704	834	760	680	765	592	731	629
27	554	494	665	689	630	574	695	703	636	599	…	554	685	532	658	649	554	693	577	634	668
28	498	552	659	784	552	492	690	775	544	551	…	567	636	518	599	742	521	733	533	605	604
29	513	491	563	642	477	367	589	647	516	484	…	428	574	504	548	553	483	540	407	547	455

30 rows × 30 columns

%timeit x.dot(y)

218 µs ± 18.7 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

%timeit np.dot(x, y)

81.1 µs ± 2.85 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

执行相同运算，Numpy与Pandas的对比

x1 = np.array(x)
x1

y1 = np.array(y)
y1

%timeit x1.dot(y1)

22.1 µs ± 992 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

%timeit np.dot(x1, y1)

22.6 µs ± 766 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

%timeit np.dot(x.values, y.values)

42.9 µs ± 1.24 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

x2 = list(x1)
y2 = list(y1)
x3 = []
y3 = []
for i in x2:
    res = []
    for j in i:
        res.append(int(j))
    x3.append(res)
for i in y2:
    res = []
    for j in i:
        res.append(int(j))
    y3.append(res)

def f(x, y):
    res = []
    for i in range(len(x)):
        row = []
        for j in range(len(y[0])):
            sum_row = 0
            for k in range(len(x[0])):
                sum_row += x[i][k]\*y[k][j]
            row.append(sum_row)
        res.append(row)
    return res

%timeit f(x3, y3)

4.29 ms ± 207 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

一般来说，纯粹的计算在Numpy里执行的更快

Numpy更侧重于计算，Pandas更侧重于数据处理

（3）广播运算

np.random.seed(42)
x = pd.DataFrame(np.random.randint(10, size=(3, 3)), columns=list("ABC"))
x

	A	B	C
0	6	3	7
1	4	6	9
2	2	6	7

按行广播

x.iloc[0]

A    6
B    3
C    7
Name: 0, dtype: int32

x/x.iloc[0]

	A	B	C
0	1.000000	1.0	1.000000
1	0.666667	2.0	1.285714
2	0.333333	2.0	1.000000

按列广播

x.A

0    6
1    4
2    2
Name: A, dtype: int32

x.div(x.A, axis=0)             # add sub div mul

	A	B	C
0	1.0	0.5	1.166667
1	1.0	1.5	2.250000
2	1.0	3.0	3.500000

x.div(x.iloc[0], axis=1)

	A	B	C
0	1.000000	1.0	1.000000
1	0.666667	2.0	1.285714
2	0.333333	2.0	1.000000

3、新的用法

（1）索引对齐

A = pd.DataFrame(np.random.randint(0, 20, size=(2, 2)), columns=list("AB"))
A

	A	B
0	3	7
1	2	1

B = pd.DataFrame(np.random.randint(0, 10, size=(3, 3)), columns=list("ABC"))
B

	A	B	C
0	7	5	1
1	4	0	9
2	5	8	0

pandas会自动对齐两个对象的索引，没有的值用np.nan表示

A+B

	A	B	C
0	10.0	12.0	NaN
1	6.0	1.0	NaN
2	NaN	NaN	NaN

缺省值也可用fill_value来填充

A.add(B, fill_value=0)

	A	B	C
0	10.0	12.0	1.0
1	6.0	1.0	9.0
2	5.0	8.0	0.0

A\*B

	A	B	C
0	21.0	35.0	NaN
1	8.0	0.0	NaN
2	NaN	NaN	NaN

（2）统计相关

数据种类统计

y = np.random.randint(3, size=20)
y

array([2, 2, 2, 1, 2, 1, 1, 2, 1, 2, 2, 0, 2, 0, 2, 2, 0, 0, 2, 1])

np.unique(y)

array([0, 1, 2])

用Counter方法统计数据

from collections import Counter
Counter(y)

Counter({2: 11, 1: 5, 0: 4})

y1 = pd.DataFrame(y, columns=["A"])
y1

	A
0	2
1	2
2	2
3	1
4	2
5	1
6	1
7	2
8	1
9	2
10	2
11	0
12	2
13	0
14	2
15	2
16	0
17	0
18	2
19	1

np.unique(y1)

有value counter的方法

y1["A"].value_counts()

2    11
1     5
0     4
Name: A, dtype: int64

产生新的结果，并进行排序

population_dict = {"BeiJing": 2154,
                   "ShangHai": 2424,
                   "ShenZhen": 1303,
                   "HangZhou": 981 }
population = pd.Series(population_dict) 

GDP_dict = {"BeiJing": 30320,
            "ShangHai": 32680,
            "ShenZhen": 24222,
            "HangZhou": 13468 }
GDP = pd.Series(GDP_dict)

city_info = pd.DataFrame({"population": population,"GDP": GDP})
city_info

	population	GDP
BeiJing	2154	30320
ShangHai	2424	32680
ShenZhen	1303	24222
HangZhou	981	13468

city_info["per\_GDP"] = city_info["GDP"]/city_info["population"]
city_info

	population	GDP	per_GDP
BeiJing	2154	30320	14.076137
ShangHai	2424	32680	13.481848
ShenZhen	1303	24222	18.589409
HangZhou	981	13468	13.728848

递增排序

city_info.sort_values(by="per\_GDP")

	population	GDP	per_GDP
ShangHai	2424	32680	13.481848
HangZhou	981	13468	13.728848
BeiJing	2154	30320	14.076137
ShenZhen	1303	24222	18.589409

递减排序

city_info.sort_values(by="per\_GDP", ascending=False)

	population	GDP	per_GDP
ShenZhen	1303	24222	18.589409
BeiJing	2154	30320	14.076137
HangZhou	981	13468	13.728848
ShangHai	2424	32680	13.481848

按轴进行排序

data = pd.DataFrame(np.random.randint(20, size=(3, 4)), index=[2, 1, 0], columns=list("CBAD"))
data

	C	B	A	D
2	3	13	17	8
1	1	19	14	6
0	11	7	14	2

行排序

data.sort_index()

	C	B	A	D
0	11	7	14	2
1	1	19	14	6
2	3	13	17	8

列排序

data.sort_index(axis=1)

	A	B	C	D
2	17	13	3	8
1	14	19	1	6
0	14	7	11	2

data.sort_index(axis=1, ascending=False)

	D	C	B	A
2	8	3	13	17
1	6	1	19	14
0	2	11	7	14

统计方法

df = pd.DataFrame(np.random.normal(2, 4, size=(6, 4)),columns=list("ABCD"))
df

	A	B	C	D
0	1.082198	3.557396	-3.060476	6.367969
1	13.113252	6.774559	2.874553	5.527044
2	-2.036341	-4.333177	5.094802	-0.152567
3	-3.386712	-1.522365	-2.522209	2.537716
4	4.328491	5.550994	5.577329	5.019991
5	1.171336	-0.493910	-4.032613	6.398588

非空个数

df.count()

A    6
B    6
C    6
D    6
dtype: int64

求和

df.sum()

A    14.272224
B     9.533497
C     3.931385
D    25.698741
dtype: float64

df.sum(axis=1)

0     7.947086
1    28.289408
2    -1.427283
3    -4.893571
4    20.476806
5     3.043402
dtype: float64

最大值最小值

df.min()

A   -3.386712
B   -4.333177
C   -4.032613
D   -0.152567
dtype: float64

df.max(axis=1)

0     6.367969
1    13.113252
2     5.094802
3     2.537716
4     5.577329
5     6.398588
dtype: float64

df

	A	B	C	D
0	1.082198	3.557396	-3.060476	6.367969
1	13.113252	6.774559	2.874553	5.527044
2	-2.036341	-4.333177	5.094802	-0.152567
3	-3.386712	-1.522365	-2.522209	2.537716
4	4.328491	5.550994	5.577329	5.019991
5	1.171336	-0.493910	-4.032613	6.398588

df.idxmax()

A    1
B    1
C    4
D    5
dtype: int64

均值

df.mean()

A    2.378704
B    1.588916
C    0.655231
D    4.283124
dtype: float64

方差

df.var()

A    34.980702
B    19.110656
C    18.948144
D     6.726776
dtype: float64

标准差

df.std()

A    5.914449
B    4.371574
C    4.352947
D    2.593603
dtype: float64

中位数

df.median()

A    1.126767
B    1.531743
C    0.176172
D    5.273518
dtype: float64

众数

data = pd.DataFrame(np.random.randint(5, size=(10, 2)), columns=list("AB"))
data

	A	B
0	4	2
1	3	2
2	2	0
3	2	4
4	2	0
5	4	1
6	2	0
7	1	1
8	3	4
9	2	0

data.mode()

	A	B
0	2	0

75%分位数

df.quantile(0.75)

A    3.539202
B    5.052594
C    4.539740
D    6.157738
Name: 0.75, dtype: float64

用describe()可以获取所有属性

df.describe()

	A	B	C	D
count	6.000000	6.000000	6.000000	6.000000
mean	2.378704	1.588916	0.655231	4.283124
std	5.914449	4.371574	4.352947	2.593603
min	-3.386712	-4.333177	-4.032613	-0.152567
25%	-1.256706	-1.265251	-2.925910	3.158284
50%	1.126767	1.531743	0.176172	5.273518
75%	3.539202	5.052594	4.539740	6.157738
max	13.113252	6.774559	5.577329	6.398588

data_2 = pd.DataFrame([["a", "a", "c", "d"],
                       ["c", "a", "c", "b"],
                       ["a", "a", "d", "c"]], columns=list("ABCD"))
data_2

	A	B	C	D
0	a	a	c	d
1	c	a	c	b
2	a	a	d	c

字符串类型的describe

data_2.describe()

	A	B	C	D
count	3	3	3	3
unique	2	1	2	3
top	a	a	c	d
freq	2	3	2	1

11.4 缺失值处理

1、发现缺失值

import pandas as pd
import numpy as np

data = pd.DataFrame(np.array([[1, np.nan, 2],
                              [np.nan, 3, 4],
                              [5, 6, None]]), columns=["A", "B", "C"])
data

	A	B	C
0	1	NaN	2
1	NaN	3	4
2	5	6	None

注意：有None、字符串等，数据类型全部变为object，它比int和float更消耗资源

np.nan是一个特殊的浮点数，类型是浮点类型，所以表示缺失值时最好使用NaN。

data.dtypes

A    object
B    object
C    object
dtype: object

data.isnull()

	A	B	C
0	False	True	False
1	True	False	False
2	False	False	True

data.notnull()

	A	B	C
0	True	False	True
1	False	True	True
2	True	True	False

2、删除缺失值

data = pd.DataFrame(np.array([[1, np.nan, 2, 3],
                              [np.nan, 4, 5, 6],
                              [7, 8, np.nan, 9],
                              [10, 11 , 12, 13]]), columns=["A", "B", "C", "D"])
data

	A	B	C	D
0	1.0	NaN	2.0	3.0
1	NaN	4.0	5.0	6.0
2	7.0	8.0	NaN	9.0
3	10.0	11.0	12.0	13.0

注意：np.nan是一种特殊的浮点数

data.dtypes

A    float64
B    float64
C    float64
D    float64
dtype: object

（1）删除整行

data.dropna()

	A	B	C	D
3	10.0	11.0	12.0	13.0

（2）删除整列

data.dropna(axis="columns")

	D
0	3.0
1	6.0
2	9.0
3	13.0

data["D"] = np.nan
data

	A	B	C	D
0	1.0	NaN	2.0	NaN
1	NaN	4.0	5.0	NaN
2	7.0	8.0	NaN	NaN
3	10.0	11.0	12.0	NaN

data.dropna(axis="columns", how="all")

	A	B	C
0	1.0	NaN	2.0
1	NaN	4.0	5.0
2	7.0	8.0	NaN
3	10.0	11.0	12.0

all表示都是缺失值时才删除。

data.dropna(axis="columns", how="any")


0
—
1
2
3

data.loc[3] = np.nan
data

	A	B	C	D
0	1.0	NaN	2.0	NaN
1	NaN	4.0	5.0	NaN
2	7.0	8.0	NaN	NaN
3	NaN	NaN	NaN	NaN

data.dropna(how="all")

	A	B	C	D
0	1.0	NaN	2.0	NaN
1	NaN	4.0	5.0	NaN
2	7.0	8.0	NaN	NaN

3、填充缺失值

data = pd.DataFrame(np.array([[1, np.nan, 2, 3],
                              [np.nan, 4, 5, 6],
                              [7, 8, np.nan, 9],
                              [10, 11 , 12, 13]]), columns=["A", "B", "C", "D"])
data

	A	B	C	D
0	1.0	NaN	2.0	3.0
1	NaN	4.0	5.0	6.0
2	7.0	8.0	NaN	9.0
3	10.0	11.0	12.0	13.0

data.fillna(value=5)

	A	B	C	D
0	1.0	5.0	2.0	3.0
1	5.0	4.0	5.0	6.0
2	7.0	8.0	5.0	9.0
3	10.0	11.0	12.0	13.0

用均值进行替换

fill = data.mean()
fill

A    6.000000
B    7.666667
C    6.333333
D    7.750000
dtype: float64

data.fillna(value=fill)

	A	B	C	D
0	1.0	7.666667	2.000000	3.0
1	6.0	4.000000	5.000000	6.0
2	7.0	8.000000	6.333333	9.0
3	10.0	11.000000	12.000000	13.0

全部数据的平均值，先进行摊平，再进行填充即可。

fill = data.stack().mean()
fill

7.0

data.fillna(value=fill)

	A	B	C	D
0	1.0	7.0	2.0	3.0
1	7.0	4.0	5.0	6.0
2	7.0	8.0	7.0	9.0
3	10.0	11.0	12.0	13.0

11.5 合并数据

构造一个生产DataFrame的函数

import pandas as pd
import numpy as np

def make\_df(cols, ind):
    "一个简单的DataFrame"
    data = {c: [str(c)+str(i) for i in ind]  for c in cols}
    return pd.DataFrame(data, ind)

make_df("ABC", range(3))

	A	B	C
0	A0	B0	C0
1	A1	B1	C1
2	A2	B2	C2

垂直合并

df_1 = make_df("AB", [1, 2])
df_2 = make_df("AB", [3, 4])
print(df_1)
print(df_2)

    A   B
1  A1  B1
2  A2  B2
    A   B
3  A3  B3
4  A4  B4

pd.concat([df_1, df_2])

	A	B
1	A1	B1
2	A2	B2
3	A3	B3
4	A4	B4

水平合并

df_3 = make_df("AB", [0, 1])
df_4 = make_df("CD", [0, 1])
print(df_3)
print(df_4)

    A   B
0  A0  B0
1  A1  B1
    C   D
0  C0  D0
1  C1  D1

pd.concat([df_3, df_4], axis=1)

	A	B	C	D
0	A0	B0	C0	D0
1	A1	B1	C1	D1

索引重叠

行重叠

df_5 = make_df("AB", [1, 2])
df_6 = make_df("AB", [1, 2])
print(df_5)
print(df_6)

    A   B
1  A1  B1
2  A2  B2
    A   B
1  A1  B1
2  A2  B2

pd.concat([df_5, df_6])

	A	B
1	A1	B1
2	A2	B2
1	A1	B1
2	A2	B2

pd.concat([df_5, df_6],ignore_index=True)

	A	B
0	A1	B1
1	A2	B2
2	A1	B1
3	A2	B2

列重叠

df_7 = make_df("ABC", [1, 2])
df_8 = make_df("BCD", [1, 2])
print(df_7)
print(df_8)

    A   B   C
1  A1  B1  C1
2  A2  B2  C2
    B   C   D
1  B1  C1  D1
2  B2  C2  D2

pd.concat([df_7, df_8], axis=1)

	A	B	C	B	C	D
1	A1	B1	C1	B1	C1	D1
2	A2	B2	C2	B2	C2	D2

pd.concat([df_7, df_8],axis=1, ignore_index=True)

	0	1	2	3	4	5
1	A1	B1	C1	B1	C1	D1
2	A2	B2	C2	B2	C2	D2

对齐合并merge()

df_9 = make_df("AB", [1, 2])
df_10 = make_df("BC", [1, 2])
print(df_9)
print(df_10)

    A   B
1  A1  B1
2  A2  B2
    B   C
1  B1  C1
2  B2  C2

pd.merge(df_9, df_10)

	A	B	C
0	A1	B1	C1
1	A2	B2	C2

df_9 = make_df("AB", [1, 2])
df_10 = make_df("CB", [2, 1])
print(df_9)
print(df_10)

    A   B
1  A1  B1
2  A2  B2
    C   B
2  C2  B2
1  C1  B1

pd.merge(df_9, df_10)

	A	B	C
0	A1	B1	C1
1	A2	B2	C2

【例】合并城市信息

population_dict = {"city": ("BeiJing", "HangZhou", "ShenZhen"),
                   "pop": (2154, 981, 1303)}
population = pd.DataFrame(population_dict)
population

	city	pop
0	BeiJing	2154
1	HangZhou	981
2	ShenZhen	1303

GDP_dict = {"city": ("BeiJing", "ShangHai", "HangZhou"),
            "GDP": (30320, 32680, 13468)}
GDP = pd.DataFrame(GDP_dict)
GDP

	city	GDP
0	BeiJing	30320
1	ShangHai	32680
2	HangZhou	13468

city_info = pd.merge(population, GDP)
city_info

	city	pop	GDP
0	BeiJing	2154	30320
1	HangZhou	981	13468

这里outer是求并集

city_info = pd.merge(population, GDP, how="outer")
city_info

	city	pop	GDP
0	BeiJing	2154.0	30320.0
1	HangZhou	981.0	13468.0
2	ShenZhen	1303.0	NaN
3	ShangHai	NaN	32680.0

11.6 分组和数据透视表

df = pd.DataFrame({"key":["A", "B", "C", "C", "B", "A"],
                  "data1": range(6),
                  "data2": np.random.randint(0, 10, size=6)})
df

	key	data1	data2
0	A	0	1
1	B	1	4
2	C	2	9
3	C	3	9
4	B	4	1
5	A	5	9

（1）分组

延迟计算

df.groupby("key")

这说明已经分好了，等待我们用什么样的方法进行处理后，再显示。

df.groupby("key").sum()

	data1	data2
key
A	5	10
B	5	6
C	5	11

df.groupby("key").mean()

	data1	data2
key
A	2.5	5.0
B	2.5	3.0
C	2.5	5.5

可以打印看看这是什么东西：

for i in df.groupby("key"):
    print(str(i))

('A',   key  data1  data2
0   A      0      2
5   A      5      8)
('B',   key  data1  data2
1   B      1      2
4   B      4      4)
('C',   key  data1  data2
2   C      2      8
3   C      3      3)

按列取值

df.groupby("key")["data2"].sum()

key
A    10
B     6
C    11
Name: data2, dtype: int32

按组迭代

for data, group in df.groupby("key"):
    print("{0:5} shape={1}".format(data, group.shape))

A     shape=(2, 3)
B     shape=(2, 3)
C     shape=(2, 3)

调用方法

df.groupby("key")["data1"].describe()

	count	mean	std	min	25%	50%	75%	max
key
A	2.0	2.5	3.535534	0.0	1.25	2.5	3.75	5.0
B	2.0	2.5	2.121320	1.0	1.75	2.5	3.25	4.0
C	2.0	2.5	0.707107	2.0	2.25	2.5	2.75	3.0

支持更复杂的操作

df.groupby("key").aggregate(["min", "median", "max"])

	data1	data2
	min	median
key
A	0	2.5
B	1	2.5
C	2	2.5

过滤

def filter\_func(x):
    return x["data2"].std() > 3
df.groupby("key")["data2"].std()

key
A    4.242641
B    1.414214
C    3.535534
Name: data2, dtype: float64

df.groupby("key").filter(filter_func)

	key	data1	data2
0	A	0	2
2	C	2	8
3	C	3	3
5	A	5	8

转换

df

	key	data1	data2
0	A	0	2
1	B	1	2
2	C	2	8
3	C	3	3
4	B	4	4
5	A	5	8

df.groupby("key").transform(lambda x: x-x.mean())

	data1	data2
0	-2.5	-3.0
1	-1.5	-1.0
2	-0.5	2.5
3	0.5	-2.5
4	1.5	1.0
5	2.5	3.0

df

	key	data1	data2
0	A	0	1
1	B	1	4
2	C	2	9
3	C	3	9
4	B	4	1
5	A	5	9

df.groupby("key").apply(lambda x: x-x.mean())

	data1	data2
0	-2.5	-4.0
1	-1.5	1.5
2	-0.5	0.0
3	0.5	0.0
4	1.5	-1.5
5	2.5	4.0

apply（）方法

df

	key	data1	data2
0	A	0	2
1	B	1	2
2	C	2	8
3	C	3	3
4	B	4	4
5	A	5	8

def norm\_by\_data2(x):
    x["data1"] /= x["data2"].sum()
    return x

df.groupby("key").apply(norm_by_data2)

	key	data1	data2
0	A	0.000000	2
1	B	0.166667	2
2	C	0.181818	8
3	C	0.272727	3
4	B	0.666667	4
5	A	0.500000	8

将列表、数组设为分组键

这里的L相当于一个新的标签替代原来的行标签。

L = [0, 1, 0, 1, 2, 0]
df

	key	data1	data2
0	A	0	2
1	B	1	2
2	C	2	8
3	C	3	3
4	B	4	4
5	A	5	8

df.groupby(L).sum()

	data1	data2
0	7	18
1	4	5
2	4	4

用字典将索引映射到分组

df2 = df.set_index("key")
df2

	data1	data2
key
A	0	2
B	1	2
C	2	8
C	3	3
B	4	4
A	5	8

mapping = {"A": "first", "B": "constant", "C": "constant"}
df2.groupby(mapping).sum()

	data1	data2
constant	10	17
first	5	10

任意Python函数

df2.groupby(str.lower).mean()

	data1	data2
a	2.5	5.0
b	2.5	3.0
c	2.5	5.5

多个有效值组成的列表

只有这两个数都相等，才会分到同一个组。

df2.groupby([str.lower, mapping]).mean()

		data1	data2
a	first	2.5	5.0
b	constant	2.5	3.0
c	constant	2.5	5.5

【例1】行星观测数据处理

import seaborn as sns

planets = sns.load_dataset("planets")

planets.shape

(1035, 6)

planets.head()

	method	number	orbital_period	mass	distance	year
0	Radial Velocity	1	269.300	7.10	77.40	2006
1	Radial Velocity	1	874.774	2.21	56.95	2008
2	Radial Velocity	1	763.000	2.60	19.84	2011
3	Radial Velocity	1	326.030	19.40	110.62	2007
4	Radial Velocity	1	516.220	10.50	119.47	2009

planets.describe()

	number	orbital_period	mass	distance	year
count	1035.000000	992.000000	513.000000	808.000000	1035.000000
mean	1.785507	2002.917596	2.638161	264.069282	2009.070531
std	1.240976	26014.728304	3.818617	733.116493	3.972567
min	1.000000	0.090706	0.003600	1.350000	1989.000000
25%	1.000000	5.442540	0.229000	32.560000	2007.000000
50%	1.000000	39.979500	1.260000	55.250000	2010.000000
75%	2.000000	526.005000	3.040000	178.500000	2012.000000
max	7.000000	730000.000000	25.000000	8500.000000	2014.000000

planets.head()

	method	number	orbital_period	mass	distance	year
0	Radial Velocity	1	269.300	7.10	77.40	2006
1	Radial Velocity	1	874.774	2.21	56.95	2008
2	Radial Velocity	1	763.000	2.60	19.84	2011
3	Radial Velocity	1	326.030	19.40	110.62	2007
4	Radial Velocity	1	516.220	10.50	119.47	2009

decade = 10 \* (planets["year"] // 10)
decade.head()

0    2000
1    2000
2    2010
3    2000
4    2000
Name: year, dtype: int64

decade = decade.astype(str) + "s"
decade.name = "decade"
decade.head()

0    2000s
1    2000s
2    2010s
3    2000s
4    2000s
Name: decade, dtype: object

planets.head()

	method	number	orbital_period	mass	distance	year
0	Radial Velocity	1	269.300	7.10	77.40	2006
1	Radial Velocity	1	874.774	2.21	56.95	2008
2	Radial Velocity	1	763.000	2.60	19.84	2011
3	Radial Velocity	1	326.030	19.40	110.62	2007
4	Radial Velocity	1	516.220	10.50	119.47	2009

planets.groupby(["method", decade]).sum()

		number	orbital_period	mass	distance	year
method	decade
Astrometry	2010s	2	1.262360e+03	0.00000	35.75	4023
Eclipse Timing Variations	2000s	5	1.930800e+04	6.05000	261.44	6025
2010s	10	2.345680e+04	4.20000	1000.00	12065
Imaging	2000s	29	1.350935e+06	0.00000	956.83	40139
2010s	21	6.803750e+04	0.00000	1210.08	36208
Microlensing	2000s	12	1.732500e+04	0.00000	0.00	20070
2010s	15	4.750000e+03	0.00000	41440.00	26155
Orbital Brightness Modulation	2010s	5	2.127920e+00	0.00000	2360.00	6035
Pulsar Timing	1990s	9	1.900153e+02	0.00000	0.00	5978
2000s	1	3.652500e+04	0.00000	0.00	2003
2010s	1	9.070629e-02	0.00000	1200.00	2011
Pulsation Timing Variations	2000s	1	1.170000e+03	0.00000	0.00	2007
Radial Velocity	1980s	1	8.388800e+01	11.68000	40.57	1989
1990s	52	1.091561e+04	68.17820	723.71	55943
2000s	475	2.633526e+05	945.31928	15201.16	619775
2010s	424	1.809630e+05	316.47890	11382.67	432451
Transit	2000s	64	2.897102e+02	0.00000	31823.31	124462
2010s	712	8.087813e+03	1.47000	102419.46	673999
Transit Timing Variations	2010s	9	2.393505e+02	0.00000	3313.00	8050

这里使用两个中括号[[]]，取出来是DF类型的数据，而一个中括号[]取出来是Serios的数据，前者更美观一点。

planets.groupby(["method", decade])[["number"]].sum().unstack().fillna(0)

	number
decade	1980s
method
Astrometry	0.0
Eclipse Timing Variations	0.0
Imaging	0.0
Microlensing	0.0
Orbital Brightness Modulation	0.0
Pulsar Timing	0.0
Pulsation Timing Variations	0.0
Radial Velocity	1.0
Transit	0.0
Transit Timing Variations	0.0

（2）数据透视表

【例2】泰坦尼克号乘客数据分析

import seaborn as sns

titanic = sns.load_dataset("titanic")

titanic.head()

	survived	pclass	sex	age	sibsp	fare	embarked	class	who	adult_male	deck	embark_town	alive	alone
0	0	3	male	22.0	1	7.2500	S	Third	man	True	NaN	Southampton	no	False
1	1	1	female	38.0	1	71.2833	C	First	woman	False	C	Cherbourg	yes	False
2	1	3	female	26.0	0	7.9250	S	Third	woman	False	NaN	Southampton	yes	True
3	1	1	female	35.0	1	53.1000	S	First	woman	False	C	Southampton	yes	False
4	0	3	male	35.0	0	8.0500	S	Third	man	True	NaN	Southampton	no	True

T = titanic[titanic.age.notnull()].copy()

T.age.apply(lambda x: 60 if x>=60 else x)
T.age.value_counts()

24.00    30
22.00    27
60.00    26
18.00    26
28.00    25
30.00    25
19.00    25
21.00    24
25.00    23
36.00    22
29.00    20
35.00    18
32.00    18
27.00    18
26.00    18
31.00    17
16.00    17
34.00    15
20.00    15
33.00    15
23.00    15
39.00    14
40.00    13
17.00    13
42.00    13
45.00    12
38.00    11
4.00     10
50.00    10
2.00     10
         ..
8.00      4
5.00      4
11.00     4
6.00      3
7.00      3
46.00     3
30.50     2
57.00     2
0.83      2
55.00     2
10.00     2
59.00     2
13.00     2
28.50     2
40.50     2
45.50     2
0.75      2
32.50     2
34.50     1
55.50     1
0.92      1
36.50     1
12.00     1
53.00     1
14.50     1
0.67      1
20.50     1
23.50     1
24.50     1
0.42      1
Name: age, Length: 77, dtype: int64

Age = 10\*(T["age"]//10)
Age = Age.astype(int)
Age.head()
Age.value_counts()

20    220
30    167
10    102
40     89
0      62
50     48
60     26
Name: age, dtype: int64

Age.astype(str)+"s"

0      20s
1      30s
2      20s
3      30s
4      30s
6      50s
7       0s
8      20s
9      10s
10      0s
11     50s
12     20s
13     30s
14     10s
15     50s
16      0s
18     30s
20     30s
21     30s
22     10s
23     20s
24      0s
25     30s
27     10s
30     40s
33     60s
34     20s
35     40s
37     20s
38     10s
      ... 
856    40s
857    50s
858    20s
860    40s
861    20s
862    40s
864    20s
865    40s
866    20s
867    30s
869     0s
870    20s
871    40s
872    30s
873    40s
874    20s
875    10s
876    20s
877    10s
879    50s
880    20s
881    30s
882    20s
883    20s
884    20s
885    30s
886    20s
887    10s
889    20s
890    30s
Name: age, Length: 714, dtype: object

T.groupby(["sex", Age])["survived"].mean().unstack()

age	0	10	20	30	40	50	60
sex
female	0.633333	0.755556	0.722222	0.833333	0.687500	0.888889	1.000000
male	0.593750	0.122807	0.168919	0.214953	0.210526	0.133333	0.136364

T.age = Age
T.pivot_table("survived", index="sex", columns="age")

age	0	10	20	30	40	50	60
sex
female	0.633333	0.755556	0.722222	0.833333	0.687500	0.888889	1.000000
male	0.593750	0.122807	0.168919	0.214953	0.210526	0.133333	0.136364

titanic.describe()

你可能感兴趣的:(python,pandas,开发语言)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
seaborn又一个扩展heatmapz qq_21478261 #Python可视化 matplotlib
推荐阅读：Pythonmatplotlib保姆级教程嫌Matplotlib繁琐？试试Seaborn！
NGS测序基础梳理01-文库构建（Library Preparation） qq_21478261 #生物信息生物学
本文介绍Illumina测序平台文库构建（LibraryPreparation）步骤，文库结构。写作时间：2020.05。推荐阅读：10W字《Python可视化教程1.0》来了！一份由公众号「pythonic生物人」精心制作的PythonMatplotlib可视化系统教程，105页PDFhttps://mp.weixin.qq.com/s/QaSmucuVsS_DR-klfpE3-Q10W字《Rg
Python 常用内置函数详解（七）：dir()函数——获取当前本地作用域中的名称列表或对象的有效属性列表
目录一、功能二、语法和示例一、功能dir()函数获取当前本地作用域中的名称列表或对象的有效属性列表。二、语法和示例dir()函数有两种形式，如果没有实参，则返回当前本地作用域中的名称列表。如果有实参，它会尝试返回该对象的有效属性列表。如果对象有一个名为__dir__()的方法，那么该方法将被调用，并且必须返回一个属性列表。dir()函数的语法格式如下：C:\Users\amoxiang>ipyth
pythonjson中list操作_Python json.dumps 特殊数据类型的自定义序列化操作
场景描述：Python标准库中的json模块，集成了将数据序列化处理的功能；在使用json.dumps()方法序列化数据时候，如果目标数据中存在datetime数据类型，执行操作时，会抛出异常：TypeError:datetime.datetime(2016,12,10,11,04,21)isnotJSONserializable那么遇到json.dumps序列化不支持的数据类型，该怎么办！首先，
Python 日期格式转json.dumps的解决方法 douyaoxin python json 开发语言
classDateEncoder(json.JSONEncoder):defdefault(self,obj):ifisinstance(obj,datetime.datetime):returnobj.strftime('%Y-%m-%d%H:%M:%S')elifisinstance(obj,datetime.date):returnobj.strftime("%Y-%m-%d")json.d
Python 爬虫实战：视频平台播放量实时监控（含反爬对抗与数据趋势预测）西攻城狮北 python 爬虫音视频
一、引言在数字内容蓬勃发展的当下，视频平台的播放量数据已成为内容创作者、营销人员以及行业分析师手中极为关键的情报资源。它不仅能够实时反映内容的受欢迎程度，更能在竞争分析、营销策略制定以及内容优化等方面发挥不可估量的作用。然而，视频平台为了保护自身数据和用户隐私，往往会设置一系列反爬虫机制，对数据爬取行为进行限制。这就向我们发起了挑战：如何巧妙地突破这些限制，同时精准地捕捉并预测播放量的动态变化趋势
Python技能手册 - 模块module 金色牛神 Python python windows 开发语言
系列Python常用技能手册-基础语法Python常用技能手册-模块modulePython常用技能手册-包package目录module模块指什么typing数据类型int整数float浮点数str字符串bool布尔值TypeVar类型变量functools高阶函数工具functools.partial()函数偏置functools.lru_cache()函数缓存sorted排序列表排序元组排序
Ubuntu基础（Python虚拟环境和Vue） aaiier ubuntu python linux
Python虚拟环境sudoaptinstallpython3python3-venv进入项目目录cdXXX创建虚拟环境python3-mvenvvenv激活虚拟环境sourcevenv/bin/activate退出虚拟环境deactivateVue安装Node.js和npm#安装Node.js和npm（Ubuntu默认仓库可能版本较旧，适合入门）sudoaptinstallnodejsnpm#验
苦练Python第9天：if-else分支九剑 python后端前端人工智能
苦练Python第9天：if-else分支九剑前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。欢迎点赞、收藏、关注，一键三连！！！欢迎来到100天Python挑战第9天！今天我们不练循环，改磨“分支剑法”——ifelse三式：单分支、双分支、多分支，以及嵌套和三元运算符，全部实战演练，让
苦练Python第8天：while 循环之妙用 python后端前端人工智能
苦练Python第8天：while循环之妙用原文链接：https://dev.to/therahul_gupta/day-9100-while-loops-with-real-world-examples-528f作者：RahulGupta译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众
苦练Python第5天：字符串从入门到格式化 python后端人工智能前端
苦练Python第5天：字符串从入门到格式化原文链接：https://dev.to/therahul_gupta/day-5100-working-with-strings-basics-to-formatting-2kkn作者：RahulGupta译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。

	0	1	2	3	4	5	6	7	8	9	…	20	21	22	23	24	25	26	27	28	29
0	6	3	7	4	6	9	2	6	7	4	…	4	0	9	5	8	0	9	2	6	3
1	8	2	4	2	6	4	8	6	1	3	…	2	0	3	1	7	3	1	5	5	9
2	3	5	1	9	1	9	3	7	6	8	…	6	8	7	0	7	7	2	0	7	2
3	2	0	4	9	6	9	8	6	8	7	…	0	2	4	2	0	4	9	6	6	8
4	9	9	2	6	0	3	3	4	6	6	…	9	6	8	6	0	0	8	8	3	8
5	2	6	5	7	8	4	0	2	9	7	…	2	0	4	0	7	0	0	1	1	5
6	6	4	0	0	2	1	4	9	5	6	…	5	0	8	5	2	3	3	2	9	2
7	2	3	6	3	8	0	7	6	1	7	…	3	0	1	0	4	4	6	8	8	2
8	2	2	3	7	5	7	0	7	3	0	…	1	1	5	2	8	3	0	3	0	4
9	3	7	7	6	2	0	0	2	5	6	…	4	2	3	2	0	0	4	5	2	8
10	4	7	0	4	2	0	3	4	6	0	…	5	6	1	9	1	9	0	7	0	8
11	5	6	9	6	9	2	1	8	7	9	…	6	5	2	8	9	5	9	9	5	0
12	3	9	5	5	4	0	7	4	4	6	…	0	7	2	9	6	9	4	9	4	6
13	8	4	0	9	9	0	1	5	8	7	…	5	8	4	0	3	4	9	9	4	6
14	3	0	4	6	9	9	5	4	3	1	…	6	1	0	3	7	1	2	0	0	2
15	4	2	0	0	7	9	1	2	1	2	…	6	3	9	4	1	7	3	8	4	8
16	3	9	4	8	7	2	0	2	3	1	…	8	0	0	3	8	5	2	0	3	8
17	2	8	6	3	2	9	4	4	2	8	…	6	9	4	2	6	1	8	9	9	0
18	5	6	7	9	8	1	9	1	4	4	…	3	5	2	5	6	9	9	2	6	2
19	1	9	3	7	8	6	0	2	8	0	…	4	3	2	2	3	8	1	8	0	0
20	4	5	5	2	6	8	9	7	5	7	…	3	5	0	8	0	4	3	2	5	1
21	2	4	8	1	9	7	1	4	6	7	…	0	1	8	2	0	4	6	5	0	4
22	4	5	2	4	6	4	4	4	9	9	…	1	7	6	9	9	1	5	5	2	1
23	0	5	4	8	0	6	4	4	1	2	…	8	5	0	7	6	9	2	0	4	3
24	9	7	0	9	0	3	7	4	1	5	…	3	7	8	2	2	1	9	2	2	4
25	4	1	9	5	4	5	0	4	8	9	…	9	3	0	7	0	2	3	7	5	9
26	6	7	1	9	7	2	6	2	6	1	…	0	6	5	9	8	0	3	8	3	9
27	2	8	1	3	5	1	7	7	0	2	…	8	0	4	5	4	5	5	6	3	7
28	6	8	6	2	2	7	4	3	7	5	…	1	7	9	2	4	5	9	5	3	2
29	3	0	3	0	0	9	5	4	3	2	…	1	3	0	4	8	0	8	7	5	6

	0	1	2	3	4	5	6	7	8	9	…	20	21	22	23	24	25	26	27	28	29
0	6	8	3	2	9	2	6	2	2	3	…	4	2	4	0	9	4	6	2	6	3
1	3	2	5	0	9	6	4	3	2	7	…	5	4	5	5	7	1	7	8	8	0
2	7	4	1	4	2	5	0	6	3	7	…	5	8	2	4	0	9	1	1	6	3
3	4	2	9	9	6	7	0	3	7	6	…	2	1	4	8	9	5	9	3	2	0
4	6	6	1	6	0	8	2	8	5	2	…	6	9	6	0	0	4	7	5	2	0
5	9	4	9	9	3	4	1	0	7	0	…	8	7	4	6	3	5	2	1	7	9
6	2	8	3	8	3	0	4	7	0	0	…	9	1	4	4	7	0	6	7	4	5
7	6	6	7	6	4	2	9	6	7	2	…	7	4	4	4	4	4	2	7	3	4
8	7	1	6	8	6	9	5	1	3	5	…	5	6	9	1	1	8	6	0	7	3
9	4	3	8	7	6	7	6	7	0	6	…	7	7	9	2	5	9	1	2	5	2
10	3	8	7	1	3	5	3	0	7	5	…	4	0	2	6	4	1	9	9	1	0
11	7	1	4	0	6	7	6	8	3	5	…	7	5	0	5	1	0	5	8	3	5
12	7	9	1	6	2	8	7	8	5	5	…	9	0	4	1	2	9	2	4	3	1
13	2	8	4	6	5	3	0	1	7	2	…	3	1	8	5	8	8	2	5	5	7
14	5	9	7	7	1	0	5	6	3	5	…	9	0	0	1	6	9	8	3	5	9
15	4	4	9	4	9	0	7	9	2	7	…	7	4	2	1	6	8	6	9	0	4
16	1	1	8	2	8	9	4	2	8	1	…	9	9	3	1	5	8	4	1	7	6
17	7	3	8	7	4	3	3	6	2	4	…	1	8	0	2	7	5	9	7	5	9
18	5	6	0	5	5	6	1	9	8	0	…	4	5	0	1	3	7	6	5	2	1
19	1	7	8	2	3	1	5	8	1	0	…	8	0	7	3	7	0	8	4	8	7
20	4	2	6	0	9	2	5	3	1	4	…	3	0	1	8	3	9	0	8	1	1
21	0	0	8	2	6	0	0	0	1	2	…	5	1	7	5	7	3	6	0	7	3
22	9	3	7	4	8	4	8	1	5	3	…	0	8	6	0	8	0	5	4	9	0
23	5	1	0	2	6	0	5	0	2	2	…	8	2	9	7	2	7	9	5	2	4
24	8	7	7	0	0	7	2	4	8	0	…	0	0	9	6	2	0	8	4	4	8
25	0	3	7	4	0	0	3	4	3	0	…	4	4	1	9	1	2	0	5	5	0
26	9	1	2	9	8	0	3	6	0	4	…	3	6	5	2	9	3	3	5	9	8
27	2	5	0	6	8	1	2	8	3	5	…	2	5	5	0	2	7	8	6	5	7
28	6	5	7	6	3	1	9	8	0	2	…	5	0	2	4	2	5	3	3	3	5
29	3	9	2	8	8	5	2	2	4	8	…	1	4	1	3	4	9	9	7	2	6

	0	1	2	3	4	5	6	7	8	9	…	20	21	22	23	24	25	26	27	28	29
0	5	8	9	5	0	0	1	7	6	9	…	1	7	0	6	9	9	7	6	9	1
1	0	1	8	8	3	9	8	7	3	6	…	9	2	0	4	9	2	7	7	9	8
2	6	9	3	7	7	4	5	9	3	6	…	7	7	1	1	3	0	8	6	4	5
3	6	2	5	7	8	4	4	7	7	4	…	0	1	9	8	2	3	1	2	7	2
4	6	0	9	2	6	6	2	7	7	0	…	1	5	4	0	7	8	9	5	7	0
5	9	3	9	1	4	4	6	8	8	9	…	1	8	7	0	3	4	2	0	3	5
6	1	2	4	3	0	6	0	7	2	8	…	4	3	3	6	7	3	5	3	2	4
7	4	0	3	3	8	3	5	6	7	5	…	1	7	3	1	6	6	9	6	9	6
8	0	0	2	9	6	0	6	7	0	3	…	6	7	9	5	4	9	5	2	5	6
9	6	8	7	7	7	2	6	0	5	2	…	7	0	6	2	4	3	6	7	6	3
10	0	6	4	7	6	2	9	5	9	9	…	4	9	3	9	1	2	5	4	0	8
11	2	3	9	9	4	4	8	2	1	6	…	0	5	9	8	6	6	0	4	7	3
12	0	1	6	0	6	1	6	4	2	5	…	8	8	0	7	2	0	7	1	1	9
13	5	1	5	9	6	4	9	8	7	5	…	2	4	3	2	0	0	4	2	5	0
14	0	3	8	5	3	1	4	7	3	2	…	8	5	5	7	5	9	1	3	9	3
15	3	3	6	1	3	0	5	0	5	2	…	7	1	7	7	3	8	3	0	6	3
16	0	6	5	9	6	4	6	6	2	2	…	3	6	8	6	5	1	3	2	6	3
17	6	7	2	8	0	1	8	6	0	0	…	5	6	2	5	4	3	0	6	2	1
18	9	4	4	0	9	8	7	7	6	1	…	7	9	9	7	1	1	4	6	5	6
19	4	1	1	5	1	2	6	2	3	3	…	0	0	0	9	8	5	9	3	4	0
20	9	8	6	3	9	9	0	8	1	6	…	2	9	0	1	3	9	4	8	8	8
21	2	8	6	4	9	0	5	5	6	1	…	6	7	5	6	8	7	4	2	4	0
22	0	3	5	9	0	3	6	5	1	1	…	6	2	5	3	9	3	9	5	1	9
23	7	7	0	8	6	1	2	0	4	4	…	1	9	6	0	2	8	3	7	2	5
24	6	0	4	2	3	1	0	5	7	0	…	1	1	2	7	5	2	9	4	7	3
25	5	0	2	1	4	9	4	6	9	3	…	5	5	3	5	9	2	7	4	1	6
26	9	8	1	8	1	6	2	6	1	8	…	2	5	1	2	5	3	3	6	1	8
27	1	8	6	4	6	9	5	4	7	2	…	9	3	1	5	1	1	7	1	2	6
28	0	7	7	4	3	2	7	8	5	2	…	0	2	8	3	7	3	9	2	3	8
29	8	0	2	6	8	3	6	4	9	7	…	6	7	8	5	7	2	5	3	4	5

	0	1	2	3	4	5	6	7	8	9	…	20	21	22	23	24	25	26	27	28	29
0	616	560	723	739	612	457	681	799	575	590	…	523	739	613	580	668	602	733	585	657	700
1	520	438	691	600	612	455	666	764	707	592	…	555	681	503	679	641	506	779	494	633	590
2	557	570	786	807	690	469	804	828	704	573	…	563	675	712	758	793	672	754	550	756	638
3	605	507	664	701	660	496	698	806	651	575	…	582	685	668	586	629	534	678	484	591	626
4	599	681	753	873	721	563	754	770	620	654	…	633	747	661	677	726	649	716	610	735	706
5	422	354	602	627	613	396	617	627	489	423	…	456	572	559	537	499	384	589	436	574	507
6	359	446	599	599	481	357	577	572	451	464	…	449	550	495	532	633	554	663	476	565	602
7	531	520	698	590	607	537	665	696	571	472	…	576	588	551	665	652	527	742	528	650	599
8	449	322	547	533	593	399	584	638	587	424	…	402	596	523	523	447	362	561	386	529	484
9	373	433	525	601	522	345	551	521	434	447	…	508	498	438	478	459	418	488	407	503	496
10	500	427	574	607	667	477	652	656	615	477	…	622	702	531	610	558	532	598	471	582	561
11	664	694	772	841	779	574	730	810	711	608	…	591	760	616	638	721	676	846	678	754	708
12	545	547	687	701	721	576	689	724	710	532	…	674	684	648	694	710	564	757	571	671	656
13	574	586	723	750	691	494	696	787	667	523	…	618	681	568	682	715	644	756	557	690	604
14	502	382	645	557	570	403	538	677	500	501	…	369	650	507	576	546	531	554	437	616	463
15	510	505	736	651	649	510	719	733	694	557	…	605	717	574	642	678	576	755	455	598	654
16	567	376	614	612	643	514	598	724	547	464	…	456	639	520	560	569	442	596	517	659	532
17	626	716	828	765	740	603	809	852	692	591	…	664	716	655	721	742	612	819	593	744	712
18	600	559	667	664	641	556	624	815	638	564	…	581	701	559	677	710	554	748	597	614	657
19	445	431	661	681	641	552	690	719	602	474	…	515	637	576	620	572	512	599	455	622	538
20	523	569	784	725	713	501	740	772	638	640	…	589	775	664	686	726	672	747	548	723	645
21	487	465	553	639	517	449	592	609	454	398	…	492	567	534	404	554	417	561	466	498	492
22	479	449	574	686	583	377	566	614	563	455	…	453	539	491	501	596	520	722	478	565	501
23	483	386	476	526	550	426	492	585	536	482	…	322	541	438	456	487	408	502	426	474	481
24	523	551	658	767	537	444	663	731	576	577	…	522	590	525	664	691	548	635	526	641	538
25	652	656	738	753	853	508	752	815	669	576	…	694	833	693	606	575	616	704	559	728	672
26	578	577	744	856	699	497	779	800	733	587	…	630	754	704	834	760	680	765	592	731	629
27	554	494	665	689	630	574	695	703	636	599	…	554	685	532	658	649	554	693	577	634	668
28	498	552	659	784	552	492	690	775	544	551	…	567	636	518	599	742	521	733	533	605	604
29	513	491	563	642	477	367	589	647	516	484	…	428	574	504	548	553	483	540	407	547	455

	A	B	C	D
A	1.000000	0.831063	0.331060	0.510821
B	0.831063	1.000000	0.179244	0.719112
C	0.331060	0.179244	1.000000	-0.450365
D	0.510821	0.719112	-0.450365	1.000000

	A	B	C	D
0	1.082198	4.639594	1.579117	7.947086
1	13.113252	19.887811	22.762364	28.289408
2	-2.036341	-6.369518	-1.274717	-1.427283
3	-3.386712	-4.909077	-7.431287	-4.893571
4	4.328491	9.879485	15.456814	20.476806
5	1.171336	0.677427	-3.355186	3.043402

	0	1	2	3	4	5	6	7	8	9	…	20	21	22	23	24	25	26	27	28	29
0	6	3	7	4	6	9	2	6	7	4	…	4	0	9	5	8	0	9	2	6	3
1	8	2	4	2	6	4	8	6	1	3	…	2	0	3	1	7	3	1	5	5	9
2	3	5	1	9	1	9	3	7	6	8	…	6	8	7	0	7	7	2	0	7	2
3	2	0	4	9	6	9	8	6	8	7	…	0	2	4	2	0	4	9	6	6	8
4	9	9	2	6	0	3	3	4	6	6	…	9	6	8	6	0	0	8	8	3	8
5	2	6	5	7	8	4	0	2	9	7	…	2	0	4	0	7	0	0	1	1	5
6	6	4	0	0	2	1	4	9	5	6	…	5	0	8	5	2	3	3	2	9	2
7	2	3	6	3	8	0	7	6	1	7	…	3	0	1	0	4	4	6	8	8	2
8	2	2	3	7	5	7	0	7	3	0	…	1	1	5	2	8	3	0	3	0	4
9	3	7	7	6	2	0	0	2	5	6	…	4	2	3	2	0	0	4	5	2	8
10	4	7	0	4	2	0	3	4	6	0	…	5	6	1	9	1	9	0	7	0	8
11	5	6	9	6	9	2	1	8	7	9	…	6	5	2	8	9	5	9	9	5	0
12	3	9	5	5	4	0	7	4	4	6	…	0	7	2	9	6	9	4	9	4	6
13	8	4	0	9	9	0	1	5	8	7	…	5	8	4	0	3	4	9	9	4	6
14	3	0	4	6	9	9	5	4	3	1	…	6	1	0	3	7	1	2	0	0	2
15	4	2	0	0	7	9	1	2	1	2	…	6	3	9	4	1	7	3	8	4	8
16	3	9	4	8	7	2	0	2	3	1	…	8	0	0	3	8	5	2	0	3	8
17	2	8	6	3	2	9	4	4	2	8	…	6	9	4	2	6	1	8	9	9	0
18	5	6	7	9	8	1	9	1	4	4	…	3	5	2	5	6	9	9	2	6	2
19	1	9	3	7	8	6	0	2	8	0	…	4	3	2	2	3	8	1	8	0	0
20	4	5	5	2	6	8	9	7	5	7	…	3	5	0	8	0	4	3	2	5	1
21	2	4	8	1	9	7	1	4	6	7	…	0	1	8	2	0	4	6	5	0	4
22	4	5	2	4	6	4	4	4	9	9	…	1	7	6	9	9	1	5	5	2	1
23	0	5	4	8	0	6	4	4	1	2	…	8	5	0	7	6	9	2	0	4	3
24	9	7	0	9	0	3	7	4	1	5	…	3	7	8	2	2	1	9	2	2	4
25	4	1	9	5	4	5	0	4	8	9	…	9	3	0	7	0	2	3	7	5	9
26	6	7	1	9	7	2	6	2	6	1	…	0	6	5	9	8	0	3	8	3	9
27	2	8	1	3	5	1	7	7	0	2	…	8	0	4	5	4	5	5	6	3	7
28	6	8	6	2	2	7	4	3	7	5	…	1	7	9	2	4	5	9	5	3	2
29	3	0	3	0	0	9	5	4	3	2	…	1	3	0	4	8	0	8	7	5	6

	0	1	2	3	4	5	6	7	8	9	…	20	21	22	23	24	25	26	27	28	29
0	6	8	3	2	9	2	6	2	2	3	…	4	2	4	0	9	4	6	2	6	3
1	3	2	5	0	9	6	4	3	2	7	…	5	4	5	5	7	1	7	8	8	0
2	7	4	1	4	2	5	0	6	3	7	…	5	8	2	4	0	9	1	1	6	3
3	4	2	9	9	6	7	0	3	7	6	…	2	1	4	8	9	5	9	3	2	0
4	6	6	1	6	0	8	2	8	5	2	…	6	9	6	0	0	4	7	5	2	0
5	9	4	9	9	3	4	1	0	7	0	…	8	7	4	6	3	5	2	1	7	9
6	2	8	3	8	3	0	4	7	0	0	…	9	1	4	4	7	0	6	7	4	5
7	6	6	7	6	4	2	9	6	7	2	…	7	4	4	4	4	4	2	7	3	4
8	7	1	6	8	6	9	5	1	3	5	…	5	6	9	1	1	8	6	0	7	3
9	4	3	8	7	6	7	6	7	0	6	…	7	7	9	2	5	9	1	2	5	2
10	3	8	7	1	3	5	3	0	7	5	…	4	0	2	6	4	1	9	9	1	0
11	7	1	4	0	6	7	6	8	3	5	…	7	5	0	5	1	0	5	8	3	5
12	7	9	1	6	2	8	7	8	5	5	…	9	0	4	1	2	9	2	4	3	1
13	2	8	4	6	5	3	0	1	7	2	…	3	1	8	5	8	8	2	5	5	7
14	5	9	7	7	1	0	5	6	3	5	…	9	0	0	1	6	9	8	3	5	9
15	4	4	9	4	9	0	7	9	2	7	…	7	4	2	1	6	8	6	9	0	4
16	1	1	8	2	8	9	4	2	8	1	…	9	9	3	1	5	8	4	1	7	6
17	7	3	8	7	4	3	3	6	2	4	…	1	8	0	2	7	5	9	7	5	9
18	5	6	0	5	5	6	1	9	8	0	…	4	5	0	1	3	7	6	5	2	1
19	1	7	8	2	3	1	5	8	1	0	…	8	0	7	3	7	0	8	4	8	7
20	4	2	6	0	9	2	5	3	1	4	…	3	0	1	8	3	9	0	8	1	1
21	0	0	8	2	6	0	0	0	1	2	…	5	1	7	5	7	3	6	0	7	3
22	9	3	7	4	8	4	8	1	5	3	…	0	8	6	0	8	0	5	4	9	0
23	5	1	0	2	6	0	5	0	2	2	…	8	2	9	7	2	7	9	5	2	4
24	8	7	7	0	0	7	2	4	8	0	…	0	0	9	6	2	0	8	4	4	8
25	0	3	7	4	0	0	3	4	3	0	…	4	4	1	9	1	2	0	5	5	0
26	9	1	2	9	8	0	3	6	0	4	…	3	6	5	2	9	3	3	5	9	8
27	2	5	0	6	8	1	2	8	3	5	…	2	5	5	0	2	7	8	6	5	7
28	6	5	7	6	3	1	9	8	0	2	…	5	0	2	4	2	5	3	3	3	5
29	3	9	2	8	8	5	2	2	4	8	…	1	4	1	3	4	9	9	7	2	6

	0	1	2	3	4	5	6	7	8	9	…	20	21	22	23	24	25	26	27	28	29
0	5	8	9	5	0	0	1	7	6	9	…	1	7	0	6	9	9	7	6	9	1
1	0	1	8	8	3	9	8	7	3	6	…	9	2	0	4	9	2	7	7	9	8
2	6	9	3	7	7	4	5	9	3	6	…	7	7	1	1	3	0	8	6	4	5
3	6	2	5	7	8	4	4	7	7	4	…	0	1	9	8	2	3	1	2	7	2
4	6	0	9	2	6	6	2	7	7	0	…	1	5	4	0	7	8	9	5	7	0
5	9	3	9	1	4	4	6	8	8	9	…	1	8	7	0	3	4	2	0	3	5
6	1	2	4	3	0	6	0	7	2	8	…	4	3	3	6	7	3	5	3	2	4
7	4	0	3	3	8	3	5	6	7	5	…	1	7	3	1	6	6	9	6	9	6
8	0	0	2	9	6	0	6	7	0	3	…	6	7	9	5	4	9	5	2	5	6
9	6	8	7	7	7	2	6	0	5	2	…	7	0	6	2	4	3	6	7	6	3
10	0	6	4	7	6	2	9	5	9	9	…	4	9	3	9	1	2	5	4	0	8
11	2	3	9	9	4	4	8	2	1	6	…	0	5	9	8	6	6	0	4	7	3
12	0	1	6	0	6	1	6	4	2	5	…	8	8	0	7	2	0	7	1	1	9
13	5	1	5	9	6	4	9	8	7	5	…	2	4	3	2	0	0	4	2	5	0
14	0	3	8	5	3	1	4	7	3	2	…	8	5	5	7	5	9	1	3	9	3
15	3	3	6	1	3	0	5	0	5	2	…	7	1	7	7	3	8	3	0	6	3
16	0	6	5	9	6	4	6	6	2	2	…	3	6	8	6	5	1	3	2	6	3
17	6	7	2	8	0	1	8	6	0	0	…	5	6	2	5	4	3	0	6	2	1
18	9	4	4	0	9	8	7	7	6	1	…	7	9	9	7	1	1	4	6	5	6
19	4	1	1	5	1	2	6	2	3	3	…	0	0	0	9	8	5	9	3	4	0
20	9	8	6	3	9	9	0	8	1	6	…	2	9	0	1	3	9	4	8	8	8
21	2	8	6	4	9	0	5	5	6	1	…	6	7	5	6	8	7	4	2	4	0
22	0	3	5	9	0	3	6	5	1	1	…	6	2	5	3	9	3	9	5	1	9
23	7	7	0	8	6	1	2	0	4	4	…	1	9	6	0	2	8	3	7	2	5
24	6	0	4	2	3	1	0	5	7	0	…	1	1	2	7	5	2	9	4	7	3
25	5	0	2	1	4	9	4	6	9	3	…	5	5	3	5	9	2	7	4	1	6
26	9	8	1	8	1	6	2	6	1	8	…	2	5	1	2	5	3	3	6	1	8
27	1	8	6	4	6	9	5	4	7	2	…	9	3	1	5	1	1	7	1	2	6
28	0	7	7	4	3	2	7	8	5	2	…	0	2	8	3	7	3	9	2	3	8
29	8	0	2	6	8	3	6	4	9	7	…	6	7	8	5	7	2	5	3	4	5

	0	1	2	3	4	5	6	7	8	9	…	20	21	22	23	24	25	26	27	28	29
0	616	560	723	739	612	457	681	799	575	590	…	523	739	613	580	668	602	733	585	657	700
1	520	438	691	600	612	455	666	764	707	592	…	555	681	503	679	641	506	779	494	633	590
2	557	570	786	807	690	469	804	828	704	573	…	563	675	712	758	793	672	754	550	756	638
3	605	507	664	701	660	496	698	806	651	575	…	582	685	668	586	629	534	678	484	591	626
4	599	681	753	873	721	563	754	770	620	654	…	633	747	661	677	726	649	716	610	735	706
5	422	354	602	627	613	396	617	627	489	423	…	456	572	559	537	499	384	589	436	574	507
6	359	446	599	599	481	357	577	572	451	464	…	449	550	495	532	633	554	663	476	565	602
7	531	520	698	590	607	537	665	696	571	472	…	576	588	551	665	652	527	742	528	650	599
8	449	322	547	533	593	399	584	638	587	424	…	402	596	523	523	447	362	561	386	529	484
9	373	433	525	601	522	345	551	521	434	447	…	508	498	438	478	459	418	488	407	503	496
10	500	427	574	607	667	477	652	656	615	477	…	622	702	531	610	558	532	598	471	582	561
11	664	694	772	841	779	574	730	810	711	608	…	591	760	616	638	721	676	846	678	754	708
12	545	547	687	701	721	576	689	724	710	532	…	674	684	648	694	710	564	757	571	671	656
13	574	586	723	750	691	494	696	787	667	523	…	618	681	568	682	715	644	756	557	690	604
14	502	382	645	557	570	403	538	677	500	501	…	369	650	507	576	546	531	554	437	616	463
15	510	505	736	651	649	510	719	733	694	557	…	605	717	574	642	678	576	755	455	598	654
16	567	376	614	612	643	514	598	724	547	464	…	456	639	520	560	569	442	596	517	659	532
17	626	716	828	765	740	603	809	852	692	591	…	664	716	655	721	742	612	819	593	744	712
18	600	559	667	664	641	556	624	815	638	564	…	581	701	559	677	710	554	748	597	614	657
19	445	431	661	681	641	552	690	719	602	474	…	515	637	576	620	572	512	599	455	622	538
20	523	569	784	725	713	501	740	772	638	640	…	589	775	664	686	726	672	747	548	723	645
21	487	465	553	639	517	449	592	609	454	398	…	492	567	534	404	554	417	561	466	498	492
22	479	449	574	686	583	377	566	614	563	455	…	453	539	491	501	596	520	722	478	565	501
23	483	386	476	526	550	426	492	585	536	482	…	322	541	438	456	487	408	502	426	474	481
24	523	551	658	767	537	444	663	731	576	577	…	522	590	525	664	691	548	635	526	641	538
25	652	656	738	753	853	508	752	815	669	576	…	694	833	693	606	575	616	704	559	728	672
26	578	577	744	856	699	497	779	800	733	587	…	630	754	704	834	760	680	765	592	731	629
27	554	494	665	689	630	574	695	703	636	599	…	554	685	532	658	649	554	693	577	634	668
28	498	552	659	784	552	492	690	775	544	551	…	567	636	518	599	742	521	733	533	605	604
29	513	491	563	642	477	367	589	647	516	484	…	428	574	504	548	553	483	540	407	547	455

Python基础（十一） 超详细的Pandas库三万字总结_gdp_data

11.3 数值运算及统计分析

11.4 缺失值处理

11.5 合并数据

11.6 分组和数据透视表

你可能感兴趣的:(python,pandas,开发语言)

Python基础（十一）超详细的Pandas库三万字总结_gdp_data

	0	1	2	3	4	5	6	7	8	9	…	20	21	22	23	24	25	26	27	28	29
0	6	3	7	4	6	9	2	6	7	4	…	4	0	9	5	8	0	9	2	6	3
1	8	2	4	2	6	4	8	6	1	3	…	2	0	3	1	7	3	1	5	5	9
2	3	5	1	9	1	9	3	7	6	8	…	6	8	7	0	7	7	2	0	7	2
3	2	0	4	9	6	9	8	6	8	7	…	0	2	4	2	0	4	9	6	6	8
4	9	9	2	6	0	3	3	4	6	6	…	9	6	8	6	0	0	8	8	3	8
5	2	6	5	7	8	4	0	2	9	7	…	2	0	4	0	7	0	0	1	1	5
6	6	4	0	0	2	1	4	9	5	6	…	5	0	8	5	2	3	3	2	9	2
7	2	3	6	3	8	0	7	6	1	7	…	3	0	1	0	4	4	6	8	8	2
8	2	2	3	7	5	7	0	7	3	0	…	1	1	5	2	8	3	0	3	0	4
9	3	7	7	6	2	0	0	2	5	6	…	4	2	3	2	0	0	4	5	2	8
10	4	7	0	4	2	0	3	4	6	0	…	5	6	1	9	1	9	0	7	0	8
11	5	6	9	6	9	2	1	8	7	9	…	6	5	2	8	9	5	9	9	5	0
12	3	9	5	5	4	0	7	4	4	6	…	0	7	2	9	6	9	4	9	4	6
13	8	4	0	9	9	0	1	5	8	7	…	5	8	4	0	3	4	9	9	4	6
14	3	0	4	6	9	9	5	4	3	1	…	6	1	0	3	7	1	2	0	0	2
15	4	2	0	0	7	9	1	2	1	2	…	6	3	9	4	1	7	3	8	4	8
16	3	9	4	8	7	2	0	2	3	1	…	8	0	0	3	8	5	2	0	3	8
17	2	8	6	3	2	9	4	4	2	8	…	6	9	4	2	6	1	8	9	9	0
18	5	6	7	9	8	1	9	1	4	4	…	3	5	2	5	6	9	9	2	6	2
19	1	9	3	7	8	6	0	2	8	0	…	4	3	2	2	3	8	1	8	0	0
20	4	5	5	2	6	8	9	7	5	7	…	3	5	0	8	0	4	3	2	5	1
21	2	4	8	1	9	7	1	4	6	7	…	0	1	8	2	0	4	6	5	0	4
22	4	5	2	4	6	4	4	4	9	9	…	1	7	6	9	9	1	5	5	2	1
23	0	5	4	8	0	6	4	4	1	2	…	8	5	0	7	6	9	2	0	4	3
24	9	7	0	9	0	3	7	4	1	5	…	3	7	8	2	2	1	9	2	2	4
25	4	1	9	5	4	5	0	4	8	9	…	9	3	0	7	0	2	3	7	5	9
26	6	7	1	9	7	2	6	2	6	1	…	0	6	5	9	8	0	3	8	3	9
27	2	8	1	3	5	1	7	7	0	2	…	8	0	4	5	4	5	5	6	3	7
28	6	8	6	2	2	7	4	3	7	5	…	1	7	9	2	4	5	9	5	3	2
29	3	0	3	0	0	9	5	4	3	2	…	1	3	0	4	8	0	8	7	5	6

	0	1	2	3	4	5	6	7	8	9	…	20	21	22	23	24	25	26	27	28	29
0	6	8	3	2	9	2	6	2	2	3	…	4	2	4	0	9	4	6	2	6	3
1	3	2	5	0	9	6	4	3	2	7	…	5	4	5	5	7	1	7	8	8	0
2	7	4	1	4	2	5	0	6	3	7	…	5	8	2	4	0	9	1	1	6	3
3	4	2	9	9	6	7	0	3	7	6	…	2	1	4	8	9	5	9	3	2	0
4	6	6	1	6	0	8	2	8	5	2	…	6	9	6	0	0	4	7	5	2	0
5	9	4	9	9	3	4	1	0	7	0	…	8	7	4	6	3	5	2	1	7	9
6	2	8	3	8	3	0	4	7	0	0	…	9	1	4	4	7	0	6	7	4	5
7	6	6	7	6	4	2	9	6	7	2	…	7	4	4	4	4	4	2	7	3	4
8	7	1	6	8	6	9	5	1	3	5	…	5	6	9	1	1	8	6	0	7	3
9	4	3	8	7	6	7	6	7	0	6	…	7	7	9	2	5	9	1	2	5	2
10	3	8	7	1	3	5	3	0	7	5	…	4	0	2	6	4	1	9	9	1	0
11	7	1	4	0	6	7	6	8	3	5	…	7	5	0	5	1	0	5	8	3	5
12	7	9	1	6	2	8	7	8	5	5	…	9	0	4	1	2	9	2	4	3	1
13	2	8	4	6	5	3	0	1	7	2	…	3	1	8	5	8	8	2	5	5	7
14	5	9	7	7	1	0	5	6	3	5	…	9	0	0	1	6	9	8	3	5	9
15	4	4	9	4	9	0	7	9	2	7	…	7	4	2	1	6	8	6	9	0	4
16	1	1	8	2	8	9	4	2	8	1	…	9	9	3	1	5	8	4	1	7	6
17	7	3	8	7	4	3	3	6	2	4	…	1	8	0	2	7	5	9	7	5	9
18	5	6	0	5	5	6	1	9	8	0	…	4	5	0	1	3	7	6	5	2	1
19	1	7	8	2	3	1	5	8	1	0	…	8	0	7	3	7	0	8	4	8	7
20	4	2	6	0	9	2	5	3	1	4	…	3	0	1	8	3	9	0	8	1	1
21	0	0	8	2	6	0	0	0	1	2	…	5	1	7	5	7	3	6	0	7	3
22	9	3	7	4	8	4	8	1	5	3	…	0	8	6	0	8	0	5	4	9	0
23	5	1	0	2	6	0	5	0	2	2	…	8	2	9	7	2	7	9	5	2	4
24	8	7	7	0	0	7	2	4	8	0	…	0	0	9	6	2	0	8	4	4	8
25	0	3	7	4	0	0	3	4	3	0	…	4	4	1	9	1	2	0	5	5	0
26	9	1	2	9	8	0	3	6	0	4	…	3	6	5	2	9	3	3	5	9	8
27	2	5	0	6	8	1	2	8	3	5	…	2	5	5	0	2	7	8	6	5	7
28	6	5	7	6	3	1	9	8	0	2	…	5	0	2	4	2	5	3	3	3	5
29	3	9	2	8	8	5	2	2	4	8	…	1	4	1	3	4	9	9	7	2	6

	0	1	2	3	4	5	6	7	8	9	…	20	21	22	23	24	25	26	27	28	29
0	5	8	9	5	0	0	1	7	6	9	…	1	7	0	6	9	9	7	6	9	1
1	0	1	8	8	3	9	8	7	3	6	…	9	2	0	4	9	2	7	7	9	8
2	6	9	3	7	7	4	5	9	3	6	…	7	7	1	1	3	0	8	6	4	5
3	6	2	5	7	8	4	4	7	7	4	…	0	1	9	8	2	3	1	2	7	2
4	6	0	9	2	6	6	2	7	7	0	…	1	5	4	0	7	8	9	5	7	0
5	9	3	9	1	4	4	6	8	8	9	…	1	8	7	0	3	4	2	0	3	5
6	1	2	4	3	0	6	0	7	2	8	…	4	3	3	6	7	3	5	3	2	4
7	4	0	3	3	8	3	5	6	7	5	…	1	7	3	1	6	6	9	6	9	6
8	0	0	2	9	6	0	6	7	0	3	…	6	7	9	5	4	9	5	2	5	6
9	6	8	7	7	7	2	6	0	5	2	…	7	0	6	2	4	3	6	7	6	3
10	0	6	4	7	6	2	9	5	9	9	…	4	9	3	9	1	2	5	4	0	8
11	2	3	9	9	4	4	8	2	1	6	…	0	5	9	8	6	6	0	4	7	3
12	0	1	6	0	6	1	6	4	2	5	…	8	8	0	7	2	0	7	1	1	9
13	5	1	5	9	6	4	9	8	7	5	…	2	4	3	2	0	0	4	2	5	0
14	0	3	8	5	3	1	4	7	3	2	…	8	5	5	7	5	9	1	3	9	3
15	3	3	6	1	3	0	5	0	5	2	…	7	1	7	7	3	8	3	0	6	3
16	0	6	5	9	6	4	6	6	2	2	…	3	6	8	6	5	1	3	2	6	3
17	6	7	2	8	0	1	8	6	0	0	…	5	6	2	5	4	3	0	6	2	1
18	9	4	4	0	9	8	7	7	6	1	…	7	9	9	7	1	1	4	6	5	6
19	4	1	1	5	1	2	6	2	3	3	…	0	0	0	9	8	5	9	3	4	0
20	9	8	6	3	9	9	0	8	1	6	…	2	9	0	1	3	9	4	8	8	8
21	2	8	6	4	9	0	5	5	6	1	…	6	7	5	6	8	7	4	2	4	0
22	0	3	5	9	0	3	6	5	1	1	…	6	2	5	3	9	3	9	5	1	9
23	7	7	0	8	6	1	2	0	4	4	…	1	9	6	0	2	8	3	7	2	5
24	6	0	4	2	3	1	0	5	7	0	…	1	1	2	7	5	2	9	4	7	3
25	5	0	2	1	4	9	4	6	9	3	…	5	5	3	5	9	2	7	4	1	6
26	9	8	1	8	1	6	2	6	1	8	…	2	5	1	2	5	3	3	6	1	8
27	1	8	6	4	6	9	5	4	7	2	…	9	3	1	5	1	1	7	1	2	6
28	0	7	7	4	3	2	7	8	5	2	…	0	2	8	3	7	3	9	2	3	8
29	8	0	2	6	8	3	6	4	9	7	…	6	7	8	5	7	2	5	3	4	5

	0	1	2	3	4	5	6	7	8	9	…	20	21	22	23	24	25	26	27	28	29
0	616	560	723	739	612	457	681	799	575	590	…	523	739	613	580	668	602	733	585	657	700
1	520	438	691	600	612	455	666	764	707	592	…	555	681	503	679	641	506	779	494	633	590
2	557	570	786	807	690	469	804	828	704	573	…	563	675	712	758	793	672	754	550	756	638
3	605	507	664	701	660	496	698	806	651	575	…	582	685	668	586	629	534	678	484	591	626
4	599	681	753	873	721	563	754	770	620	654	…	633	747	661	677	726	649	716	610	735	706
5	422	354	602	627	613	396	617	627	489	423	…	456	572	559	537	499	384	589	436	574	507
6	359	446	599	599	481	357	577	572	451	464	…	449	550	495	532	633	554	663	476	565	602
7	531	520	698	590	607	537	665	696	571	472	…	576	588	551	665	652	527	742	528	650	599
8	449	322	547	533	593	399	584	638	587	424	…	402	596	523	523	447	362	561	386	529	484
9	373	433	525	601	522	345	551	521	434	447	…	508	498	438	478	459	418	488	407	503	496
10	500	427	574	607	667	477	652	656	615	477	…	622	702	531	610	558	532	598	471	582	561
11	664	694	772	841	779	574	730	810	711	608	…	591	760	616	638	721	676	846	678	754	708
12	545	547	687	701	721	576	689	724	710	532	…	674	684	648	694	710	564	757	571	671	656
13	574	586	723	750	691	494	696	787	667	523	…	618	681	568	682	715	644	756	557	690	604
14	502	382	645	557	570	403	538	677	500	501	…	369	650	507	576	546	531	554	437	616	463
15	510	505	736	651	649	510	719	733	694	557	…	605	717	574	642	678	576	755	455	598	654
16	567	376	614	612	643	514	598	724	547	464	…	456	639	520	560	569	442	596	517	659	532
17	626	716	828	765	740	603	809	852	692	591	…	664	716	655	721	742	612	819	593	744	712
18	600	559	667	664	641	556	624	815	638	564	…	581	701	559	677	710	554	748	597	614	657
19	445	431	661	681	641	552	690	719	602	474	…	515	637	576	620	572	512	599	455	622	538
20	523	569	784	725	713	501	740	772	638	640	…	589	775	664	686	726	672	747	548	723	645
21	487	465	553	639	517	449	592	609	454	398	…	492	567	534	404	554	417	561	466	498	492
22	479	449	574	686	583	377	566	614	563	455	…	453	539	491	501	596	520	722	478	565	501
23	483	386	476	526	550	426	492	585	536	482	…	322	541	438	456	487	408	502	426	474	481
24	523	551	658	767	537	444	663	731	576	577	…	522	590	525	664	691	548	635	526	641	538
25	652	656	738	753	853	508	752	815	669	576	…	694	833	693	606	575	616	704	559	728	672
26	578	577	744	856	699	497	779	800	733	587	…	630	754	704	834	760	680	765	592	731	629
27	554	494	665	689	630	574	695	703	636	599	…	554	685	532	658	649	554	693	577	634	668
28	498	552	659	784	552	492	690	775	544	551	…	567	636	518	599	742	521	733	533	605	604
29	513	491	563	642	477	367	589	647	516	484	…	428	574	504	548	553	483	540	407	547	455