Wen Yu

Project

import pandas as pd
c1=pd.read_excel('C:/Users/50502/Desktop/Python项目/02-百货商场data/data/cumcm2018c1.xlsx')
c2=pd.read_csv('C:/Users/50502/Desktop/Python项目/02-百货商场data/data/cumcm2018c2.csv')

D:\Anaconda3\lib\site-packages\IPython\core\interactiveshell.py:3057: DtypeWarning: Columns (0,11) have mixed types. Specify dtype option on import or set low_memory=False.
  interactivity=interactivity, compiler=compiler, result=result)

c1.head()

	kh	csrq	djsj
0	c68b20b4	2002-11-02 00:00:00	2013-05-11 00:00:00.000
1	1ca15332	NaN	2004-11-04 16:31:52.436
2	a37cc182	1967-02-17 00:00:00	2004-12-31 21:24:34.216
3	2ab88539	1982-06-01 00:00:00	2010-11-19 00:00:00.000
4	b4c77269	1964-02-05 00:00:00	2007-12-14 00:00:00.000

c2.head()

	kh	dtime	spbm	sl	sj	je	spmc	jf	syjh	djh	gzbm	gzmc
0	1be1e3fe	2015-01-01 00:05:41.593	f09c9303	1	290.0	270.20	兰芝化妆品正价瓶	270.20	6	25bb	8077.0	兰芝柜
1	1be1e3fe	2015-01-01 00:05:41.593	f09c9303	1	325.0	302.80	兰芝化妆品正价瓶	302.80	6	25bb	8077.0	兰芝柜
2	1be1e3fe	2015-01-01 00:05:41.593	f09c9303	1	195.0	181.80	兰芝化妆品正价瓶	181.80	6	25bb	8077.0	兰芝柜
3	1be1e3fe	2015-01-01 00:05:41.593	f09c9303	1	270.0	251.55	兰芝化妆品正价瓶	251.55	6	25bb	8077.0	兰芝柜
4	1be1e3fe	2015-01-01 00:05:41.593	f09c9303	2	245.0	456.55	兰芝化妆品正价瓶	456.55	6	25bb	8077.0	兰芝柜

#去重
c1=c1.drop_duplicates()
c2=c2.drop_duplicates()
#合并数据集
c = pd.merge(c1,c2)
c.head()

	kh	csrq	djsj	dtime	spbm	sl	sj	je	spmc	jf	syjh	djh	gzbm	gzmc
0	a37cc182	1967-02-17 00:00:00	2004-12-31 21:24:34.216	2016-09-25 10:49:14.016	d62a69e3	1	499.0	297.07	WMF D无	297.08	101	7cd8	7296.0	WMF 柜
1	a37cc182	1967-02-17 00:00:00	2004-12-31 21:24:34.216	2016-09-25 10:49:14.016	d62a69e3	1	12288.0	11089.93	WMF D无	11089.92	101	7cd8	7296.0	WMF 柜
2	a37cc182	1967-02-17 00:00:00	2004-12-31 21:24:34.216	2017-02-28 17:17:35.533	252403ef	1	598.0	598.00	双立人商品 F无	598.00	102	ed0a	7242.0	双立人柜
3	34c2dc93	1986-07-18 00:00:00	2007-04-19 00:00:00.000	2017-11-13 13:36:45.656	4708e0bb	1	260.0	260.00	植村秀三色眼影/眼线液/眉笔.	260.00	97	c3f4	8156.0	Shu Uemura
4	828aa9b4	1951-12-29 00:00:00	2004-09-24 16:39:08.716	2017-05-17 11:30:39.080	a4809307	1	1288.0	1288.00	酷彩F件	1288.00	102	95b0	7300.0	Le Creuset(酷彩)

# 查看数据的形状
print("数据的形状：", c.shape)
# 查看每列数据的非空值的个数和数据类型
print("每列数据的非空值的个数和数据类型：\n", c.info())
# 查看每列数据的描述统计信息
print("数据的描述统计信息：\n", c.describe())
# 查看每列数据的空值个数
print("每列数据的空值个数:\n", c.isnull().sum())

数据的形状： (506006, 15)

Int64Index: 506006 entries, 0 to 506005
Data columns (total 15 columns):
kh       506006 non-null object
csrq     482173 non-null object
xb       495568 non-null float64
djsj     474547 non-null datetime64[ns]
dtime    506006 non-null object
spbm     506006 non-null object
sl       506006 non-null int64
sj       506006 non-null float64
je       506006 non-null float64
spmc     506006 non-null object
jf       506006 non-null float64
syjh     506006 non-null int64
djh      506006 non-null object
gzbm     506006 non-null float64
gzmc     492463 non-null object
dtypes: datetime64[ns](1), float64(5), int64(2), object(7)
memory usage: 61.8+ MB
每列数据的非空值的个数和数据类型：
 None
数据的描述统计信息：
                   xb             sl            sj            je  \
count  495568.000000  506006.000000  5.060060e+05  5.060060e+05   
mean        0.098372       1.054300  1.430813e+03  1.356862e+03   
std         0.297817       2.366001  3.695847e+03  3.706632e+03   
min         0.000000     -30.000000  1.000000e-01 -6.712575e+05   
25%         0.000000       1.000000  3.400000e+02  3.200000e+02   
50%         0.000000       1.000000  7.200000e+02  6.960000e+02   
75%         0.000000       1.000000  1.622000e+03  1.577430e+03   
max         1.000000    1492.000000  1.342515e+06  1.342515e+06   

                  jf           syjh           gzbm  
count  506006.000000  506006.000000  506006.000000  
mean     1030.375453     111.340160    6296.818781  
std      2125.932871      82.427647    2363.259002  
min   -201616.000000       1.000000       0.000000  
25%       145.000000      43.000000    4334.000000  
50%       500.000000      97.000000    8064.000000  
75%      1270.000000     170.000000    8121.000000  
max    268503.000000     320.000000    9005.000000  
每列数据的空值个数:
 kh           0
csrq     23833
xb       10438
djsj     31459
dtime        0
spbm         0
sl           0
sj           0
je           0
spmc         0
jf           0
syjh         0
djh          0
gzbm         0
gzmc     13543
dtype: int64

c.describe()

	xb	sl	sj	je	jf	syjh	gzbm
count	495568.000000	506006.000000	5.060060e+05	5.060060e+05	506006.000000	506006.000000	506006.000000
mean	0.098372	1.054300	1.430813e+03	1.356862e+03	1030.375453	111.340160	6296.818781
std	0.297817	2.366001	3.695847e+03	3.706632e+03	2125.932871	82.427647	2363.259002
min	0.000000	-30.000000	1.000000e-01	-6.712575e+05	-201616.000000	1.000000	0.000000
25%	0.000000	1.000000	3.400000e+02	3.200000e+02	145.000000	43.000000	4334.000000
50%	0.000000	1.000000	7.200000e+02	6.960000e+02	500.000000	97.000000	8064.000000
75%	0.000000	1.000000	1.622000e+03	1.577430e+03	1270.000000	170.000000	8121.000000
max	1.000000	1492.000000	1.342515e+06	1.342515e+06	268503.000000	320.000000	9005.000000

c.info()


Int64Index: 506006 entries, 0 to 506005
Data columns (total 15 columns):
kh       506006 non-null object
csrq     482173 non-null object
xb       495568 non-null float64
djsj     474547 non-null datetime64[ns]
dtime    506006 non-null object
spbm     506006 non-null object
sl       506006 non-null int64
sj       506006 non-null float64
je       506006 non-null float64
spmc     506006 non-null object
jf       506006 non-null float64
syjh     506006 non-null int64
djh      506006 non-null object
gzbm     506006 non-null float64
gzmc     492463 non-null object
dtypes: datetime64[ns](1), float64(5), int64(2), object(7)
memory usage: 61.8+ MB

# 查看销售日期列数据中每个值的个数
c.dtime.value_counts()

2017-11-25 15:36:23.626    54
2015-04-25 11:16:56.140    45
2015-03-02 12:12:11.923    38
2015-04-26 13:19:38.080    37
2016-06-24 14:27:57.830    37
2016-09-23 14:50:44.063    36
2015-04-24 18:47:34.390    35
2015-06-03 16:07:30.813    34
2016-12-31 16:45:42.343    33
2015-04-26 17:40:18.063    33
2015-04-24 17:03:14.423    32
2017-11-26 16:02:26.936    32
2017-08-27 17:29:24.376    31
2016-11-25 12:19:11.720    31
2016-08-27 12:13:19.203    31
2015-04-26 11:20:21.813    30
2015-01-10 17:13:34.343    30
2015-04-24 15:17:28.390    30
2016-09-23 18:09:19.796    30
2015-08-17 13:44:25.686    30
2017-05-12 16:14:14.360    29
2015-01-01 11:52:18.890    29
2017-09-23 15:48:34.186    29
2017-10-08 16:41:18.283    28
2015-04-24 17:17:20.110    27
2017-08-26 15:06:12.046    27
2015-04-25 15:24:03.436    27
2017-11-26 15:05:00.516    27
2015-02-16 17:28:15.906    26
2017-05-12 18:59:47.906    26
                           ..
2016-11-04 14:03:26.453     1
2016-03-30 16:48:55.110     1
2017-10-19 17:27:16.126     1
2016-05-24 15:16:28.936     1
2017-05-23 14:34:51.546     1
2015-04-24 16:33:23.423     1
2017-01-19 17:12:30.610     1
2015-06-24 12:10:02.813     1
2016-07-26 19:34:21.330     1
2015-04-02 20:47:07.453     1
2016-01-09 16:42:14.156     1
2017-05-08 13:52:32.266     1
2017-06-18 16:39:42.436     1
2015-01-16 16:54:14.063     1
2017-05-05 13:18:11.686     1
2017-02-03 18:28:31.203     1
2017-05-19 12:08:02.500     1
2017-09-17 15:24:35.500     1
2017-08-17 12:41:08.626     1
2015-07-13 11:04:57.796     1
2015-04-30 17:17:53.110     1
2017-07-05 18:30:27.813     1
2016-06-28 12:15:22.093     1
2015-07-27 12:07:34.093     1
2015-05-02 19:00:01.626     1
2017-10-13 13:44:54.173     1
2017-09-22 17:02:49.360     1
2015-02-01 17:17:37.580     1
2017-04-08 12:51:00.110     1
2016-06-28 11:58:35.296     1
Name: dtime, Length: 264022, dtype: int64

## 查看销售日期列数据中每年的个数
import datetime as dt
c['dtime']=pd.to_datetime(c['dtime'],errors='coerce')
c.dtime.dt.year.value_counts()

2017    231373
2016    146958
2015    123852
2018      3823
Name: dtime, dtype: int64

# 数据去重
new_c = c.drop_duplicates()
print(new_c.shape)

(506006, 15)

# 去除数据中的空值
c = new_c.dropna()
c.shape

(445894, 15)

c.info()


Int64Index: 445894 entries, 0 to 506005
Data columns (total 15 columns):
kh       445894 non-null object
csrq     445894 non-null object
xb       445894 non-null float64
djsj     445894 non-null datetime64[ns]
dtime    445894 non-null datetime64[ns]
spbm     445894 non-null object
sl       445894 non-null int64
sj       445894 non-null float64
je       445894 non-null float64
spmc     445894 non-null object
jf       445894 non-null float64
syjh     445894 non-null int64
djh      445894 non-null object
gzbm     445894 non-null float64
gzmc     445894 non-null object
dtypes: datetime64[ns](2), float64(5), int64(2), object(6)
memory usage: 54.4+ MB

#定义年龄0-44为青年，45-59为中年人，60以上为老年人
#在c表中csrq
import datetime as dt
#提取年数
c['csrq']=pd.to_datetime(c['csrq'],errors='coerce')
c['year'] = c['csrq'].dt.year
#年龄计算
now_year = dt.datetime.now().year
c['age'] = now_year - c['year']
#年龄阶层
bins = [0,44,59,120] 
labels = ['青年 ','中年人', '老年人'] 
c['年龄阶层'] = pd.cut(c['age'], bins, labels=labels)
#季节
c['month']=c['dtime'].dt.month
bins = [0,2.9,5,8,11,12.1] 
labels = ['冬季 ','春季', '夏季', '秋季','冬季']
#labels = ['Winter ','Spring', 'Summer', 'Autumn','Winter'] 
c['季节'] = pd.cut(c['month'], bins, labels=labels)
#入会时长数据定义、处理与描述
c['djsj']=pd.to_datetime(c['djsj'],errors='coerce')
c['入会时长']=dt.datetime.now().year-c['djsj'].dt.year

D:\Anaconda3\lib\site-packages\ipykernel_launcher.py:5: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  """
D:\Anaconda3\lib\site-packages\ipykernel_launcher.py:6: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  
D:\Anaconda3\lib\site-packages\ipykernel_launcher.py:9: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  if __name__ == '__main__':
D:\Anaconda3\lib\site-packages\ipykernel_launcher.py:13: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  del sys.path[0]
D:\Anaconda3\lib\site-packages\ipykernel_launcher.py:15: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  from ipykernel import kernelapp as app
D:\Anaconda3\lib\site-packages\ipykernel_launcher.py:19: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
D:\Anaconda3\lib\site-packages\ipykernel_launcher.py:21: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
D:\Anaconda3\lib\site-packages\ipykernel_launcher.py:22: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy

c.head()

	kh	csrq	djsj	dtime	spbm	sl	sj	je	spmc	...	syjh	djh	gzbm	gzmc	year	age	年龄阶层	month	季节	入会时长
0	a37cc182	1967-02-17	2004-12-31 21:24:34.216	2016-09-25 10:49:14.016	d62a69e3	1	499.0	297.07	WMF D无	...	101	7cd8	7296.0	WMF 柜	1967	53	中年人	9	秋季	16
1	a37cc182	1967-02-17	2004-12-31 21:24:34.216	2016-09-25 10:49:14.016	d62a69e3	1	12288.0	11089.93	WMF D无	...	101	7cd8	7296.0	WMF 柜	1967	53	中年人	9	秋季	16
2	a37cc182	1967-02-17	2004-12-31 21:24:34.216	2017-02-28 17:17:35.533	252403ef	1	598.0	598.00	双立人商品 F无	...	102	ed0a	7242.0	双立人柜	1967	53	中年人	2	冬季	16
3	34c2dc93	1986-07-18	2007-04-19 00:00:00.000	2017-11-13 13:36:45.656	4708e0bb	1	260.0	260.00	植村秀三色眼影/眼线液/眉笔.	...	97	c3f4	8156.0	Shu Uemura	1986	34	青年	11	秋季	13
4	828aa9b4	1951-12-29	2004-09-24 16:39:08.716	2017-05-17 11:30:39.080	a4809307	1	1288.0	1288.00	酷彩F件	...	102	95b0	7300.0	Le Creuset(酷彩)	1951	69	老年人	5	春季	16

5 rows × 21 columns

c.age.describe()

count    445894.000000
mean         63.031622
std          62.198657
min           3.000000
25%          38.000000
50%          46.000000
75%          53.000000
max         267.000000
Name: age, dtype: float64

#去除不符合逻辑的值：删除年龄大于>120的行（认为会员最高年龄不超过120随）
c['age'] = c['age'].drop(c['age'][c['age'] > 120].index)
#去除不符合逻辑的值：删除消费金额小于0的行
c['je']=c['je'].drop(c['je'][c['je'] < 0].index)

D:\Anaconda3\lib\site-packages\ipykernel_launcher.py:2: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  
D:\Anaconda3\lib\site-packages\ipykernel_launcher.py:4: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  after removing the cwd from sys.path.

# c.rename(
#     columns={'kh':'卡号', 'dtime':'消费时间', 'spbm':'商品编码', 'sl':'数量',
#              'sj':'售价', 'je':'实际消费金额', 'spmc':'商品名称', 'jf':'积分',
#              'syjh':'收银机号', 'djh':'单据号', 'gzbm':'柜组编码',
#              'gzmc':'柜组名称'}, inplace = True)

import numpy as np
c.groupby(by=["spmc"])["je"].agg({"各类商品销售金额":np.sum})

D:\Anaconda3\lib\site-packages\ipykernel_launcher.py:2: FutureWarning: using a dict on a Series for aggregation
is deprecated and will be removed in a future version

	各类商品销售金额
spmc
.雷达钟表无	1370300.52
23区女装系列A件	1655993.77
23区女装系列B.5件	253656.22
23区女装系列B件	280106.95
23区女装系列C件	258243.90
23区女装系列D件	63571.14
23区女装系列E件	105316.01
23区女装系列F件	1426.00
23区女装系列正价件	14810.40
3S 系列B无	1599.00
3S 系列C无	1399.00
5+E	285.00
5+E.	335.00
5+服饰A件	1521.00
5+服饰C件	978.00
5+服饰E件	445.00
6F-NIKEKIDS正价件	199.00
6F欣欣玩具正价个	713.00
8848 正价个	270080.00
A.O.史密斯正价件	146028.04
ABLE JEANS正价件	1399.00
AD 正价无	799.00
ADSE 正价无	699.00
ADSE 系列A无	508.00
AD集合店正价	1996.00
AO2F件	5615.00
AO2正价件	1434.00
AOJO 正价副	549.00
APM D无	48688.00
APM 正价无	2364639.24
...	...
香奈儿限量35ml邂逅35ml	6077.00
香奈儿青春光彩保湿粉凝霜.	16182.50
香奈儿青春光彩柔润粉芯.	22616.94
香奈儿青春光彩柔润粉饼13g	281251.06
香奈儿青春光彩水润粉底液30ml	2899.16
香奈儿魅力润体乳200ml	1010.00
香水正价无	95674.49
马天奴 A件	2788.00
骆驼新B*	670.00
高美高手袋系列A个	14881.11
高美高手袋系列B个	51714.90
高美高手袋系列F个	3397.00
高美高手袋系列正价个	2088.00
高美高正价*	1888.00
高美高特卖个	5568.00
高美高系列正价个	479329.78
魅可唇膏支	510.00
魅可持久防水眼线笔支	200.00
魅可新式卷笔刀支	40.00
魅可时尚焦点小眼影(片)支	115.00
魅可焦点小眼影支	155.00
黄金金条件	37978.20
黄金饰品克	105375.00
黛安芬内衣系列3件	36.00
黛安芬内衣系列B件	47239.81
黛安芬内衣系列C件	24655.99
黛安芬内衣系列E件	2124.00
黛安芬内衣系列F件	2647.92
黛安芬内衣系列件	475907.51
黛安芬内衣系列员购件	8669.00

5936 rows × 1 columns

je = c.groupby(by=["spmc"])["je"].agg({"sum":np.sum})[0:5]
#index = range(len(je))
index = range(5)
plt.bar(index, je["sum"], color="dodgerblue")
plt.xticks(index, je.index)
plt.show()

D:\Anaconda3\lib\site-packages\ipykernel_launcher.py:1: FutureWarning: using a dict on a Series for aggregation
is deprecated and will be removed in a future version
  """Entry point for launching an IPython kernel.

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-59b1cBLf-1584007168716)(output_18_1.png)]

import matplotlib.pyplot as plt
qn=c.age[(c.age < 45)].shape[0]
zn=c.age[(c.age < 60)&(c.age >= 45)].shape[0]
ln=c.age[(c.age >= 60)].shape[0]
import matplotlib.pyplot as plt
labels=('Young','Middle-aged','Elderly')
sizes=(qn,zn,ln)
colors=['lightgreen','gold','lightskyblue']
explode=0,0,0.1
plt.pie(sizes,explode=explode,labels=labels,
        colors=colors,autopct='%1.1f%%',shadow=True,startangle=50)
plt.axis('equal')
plt.title('Distribution of member age')
plt.show()

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XOo9KI81-1584007168721)(output_19_0.png)]

#性别人数比例和不同性别消费金额比例
#性别，0女，1男
#性别比例图
#年龄占比图
import matplotlib.pyplot as plt
Female=c['xb'][(c['xb'] == 0)].shape[0]
Male=c['xb'][(c['xb'] == 1)].shape[0]
labels=('Female','Male')
sizes=(Female,Male)
colors=['lightgreen','gold']
explode=0,0.1
plt.pie(sizes,explode=explode,labels=labels,
        colors=colors,autopct='%1.1f%%',shadow=True,startangle=50)
plt.axis('equal')
plt.title('Distribution of member sex')
plt.show()

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XPB7UnkN-1584007168723)(output_20_0.png)]

#不同年龄阶层消费总额占比
qne = c[(c.age < 45)]['je'].sum()
zne = c[(c.age < 60)&(c.age >= 45)]['je'].sum()
lne = c[(c.age >= 60)]['je'].sum()
labels=('Young','Middle-aged','Elderly')
sizes=(qn,zn,ln)
colors=['lightgreen','gold','lightskyblue']
explode=0,0,0.1
plt.pie(sizes,explode=explode,labels=labels,
        colors=colors,autopct='%1.1f%%',shadow=True,startangle=50)
plt.axis('equal')
plt.title('Distribution of different age member''s payment')
plt.show()

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-muUEQQEd-1584007168727)(output_21_0.png)]

#不同性别消费金额占比
import matplotlib.pyplot as plt
Female=c[(c['xb'] == 0)]['je'].sum()
Male=c[(c['xb'] == 1)]['je'].sum()
labels=('Female','Male')
sizes=(Female,Male)
colors=['lightskyblue','gold']
explode=0,0.1
plt.pie(sizes,explode=explode,labels=labels,
        colors=colors,autopct='%1.1f%%',shadow=True,startangle=50)
plt.axis('equal')
plt.title('Distribution of different members sex payment')
plt.show()

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AyHHa9WB-1584007168729)(output_22_0.png)]

#会员订单数=会员字段非空且单据号字段非空的行数；(剔除不符合逻辑的消费金额小于零值)
hy=c2[(c2['kh'].isnull()==False)&(c2['djh'].isnull()==False)&(c2['je']>=0)]
#非会员订单数=会员字段为空但单据号字段非空的行数；(剔除不符合逻辑的消费金额小于零值)
fhy=c2[(c2['kh'].isnull()==True)&(c2['djh'].isnull()==False)&(c2['je']>=0)]
# #提取年数
# hy['csrq']=pd.to_datetime(hy['csrq'],errors='coerce')
# hy['year'] = hy['csrq'].dt.year
# fhy['csrq']=pd.to_datetime(fhy['csrq'],errors='coerce')
# fhy['year'] = fhy['csrq'].dt.year
# #年龄计算
# now_year = dt.datetime.now().year
# hy['age'] = now_year - hy['year']
# fhy['age'] = now_year - fhy['year']
# #去除不符合逻辑的值：删除年龄大于>120的行（认为会员最高年龄不超过120随）
# hy['age'] = hy['age'].drop(hy['age'][hy['age'] > 120].index)
# fhy['age'] = fhy['age'].drop(fhy['age'][fhy['age'] > 120].index)
#c2['kh'](c2['kh'].isnull()==True)
num_hy=hy.iloc[:,0].size
num_fhy=fhy.iloc[:,0].size
print (num_hy,num_fhy)

869072 997811

#会员与非会员的订单数饼图
import matplotlib.pyplot as plt
labels=('Member orders','Non-member orders')
sizes=(num_hy,num_fhy)
colors=['lightgreen','gold']
explode=0,0
plt.pie(sizes,explode=explode,labels=labels,
        colors=colors,autopct='%1.1f%%',shadow=True,startangle=50)
plt.axis('equal')
plt.title('Distribution of member orders')
plt.show()

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Srh33bjN-1584007168731)(output_24_0.png)]

#会员与非会员的消费金额总数饼图
import matplotlib.pyplot as plt
labels=('Member orders','Non-member orders')
sizes=(hy['je'].sum(),fhy['je'].sum())
colors=['lightblue','gold']
explode=0,0
plt.pie(sizes,explode=explode,labels=labels,
        colors=colors,autopct='%1.1f%%',shadow=True,startangle=50)
plt.axis('equal')
plt.title('Distribution of member orders')
plt.show()

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jERIprf7-1584007168740)(output_25_0.png)]

#2015-2018各年会员消费总额
#对hy表格增加年、月两列，删除除je、year、month的列
hy['dtime']=pd.to_datetime(hy['dtime'],errors='coerce')
hyy=hy
hyy['year']=hyy['dtime'].dt.year
hyy['month']=hyy['dtime'].dt.month
hyy=hyy.drop(['kh', 'dtime','spbm','sl','sj','spmc','jf','syjh','djh','gzbm','gzmc'], axis=1)
#会员2015-2018各年会员消费总额
import numpy as np
je_counts=hyy.groupby(by=["year"])["je"].agg({"各年销售金额":np.sum})
#饼图
plt.pie(je_counts, labels=je_counts.index,explode=[0.1,0,0.1,0.1],
        colors=['lightblue','gold','lightgreen','lightcoral'], 
        autopct='%.2f%%',shadow=True,startangle=50)
plt.axis('equal')
plt.title('Distribution of yearly payment')
plt.show()

D:\Anaconda3\lib\site-packages\ipykernel_launcher.py:3: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  This is separate from the ipykernel package so we can avoid doing imports until
D:\Anaconda3\lib\site-packages\ipykernel_launcher.py:5: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  """
D:\Anaconda3\lib\site-packages\ipykernel_launcher.py:6: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  
D:\Anaconda3\lib\site-packages\ipykernel_launcher.py:10: FutureWarning: using a dict on a Series for aggregation
is deprecated and will be removed in a future version
  # Remove the CWD from sys.path while we load stuff.
D:\Anaconda3\lib\site-packages\ipykernel_launcher.py:14: MatplotlibDeprecationWarning: Non-1D inputs to pie() are currently squeeze()d, but this behavior is deprecated since 3.1 and will be removed in 3.3; pass a 1D array instead.

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tUu3vx9P-1584007168751)(output_26_1.png)]

#2015-2018年每个月的消费金额
c['dtime']=pd.to_datetime(c['dtime'],errors='coerce')
for i in range(2015, 2019):
    monthly = []
    for j in range(0,13):
        monthly.append(c[(c['dtime'].dt.year == i) & (c['dtime'].dt.month == j)]['je'].sum())
    plt.plot(range(0,len(monthly)), monthly,color=(0.4, 0.8, 0.6))
    plt.xlabel("Month")
    plt.ylabel("Amount")
    plt.grid(True)
    plt.title('The consumption in '+str(i))
    plt.show()    
# plt.plot(sl_counts.index, sl_counts, "-", color=(0.4, 0.8, 0.6))
# plt.xlabel("日期")
# plt.xticks(rotation=15)
# plt.ylabel("销量")
# plt.grid(True)
# plt.title("折线图")
# plt.show()

D:\Anaconda3\lib\site-packages\ipykernel_launcher.py:2: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-IGATV2CI-1584007168765)(output_27_1.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yrT9weJs-1584007168776)(output_27_2.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8O0NO7gq-1584007168780)(output_27_3.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-uJ5IRmQ4-1584007168786)(output_27_4.png)]

#各时段消费人数
zs=c['dtime'][(c['dtime'].dt.hour >= 5)&(c['dtime'].dt.hour < 11)].shape[0]
zw=c['dtime'][(c['dtime'].dt.hour >= 11)&(c['dtime'].dt.hour < 14)].shape[0]
xw=c['dtime'][(c['dtime'].dt.hour >= 14)&(c['dtime'].dt.hour < 19)].shape[0]
ws=c['dtime'][(c['dtime'].dt.hour >= 19)&(c['dtime'].dt.hour < 24)].shape[0]
lc=c['dtime'][(c['dtime'].dt.hour >= 0)&(c['dtime'].dt.hour < 5)].shape[0]
print ('早上：05:00:00～10:59:59订单数量：%d'%zs)
print ('中午：11:00:00～13:59:59订单数量：%d'%zw)
print ('下午：14:00:00～18:59:59订单数量：%d'%xw)
print ('晚上：19:00:00～23:59:59订单数量：%d'%ws)
print ('凌晨：00:00:00～04:59:59订单数量：%d'%lc)

早上：05:00:00～10:59:59订单数量：17833
中午：11:00:00～13:59:59订单数量：104883
下午：14:00:00～18:59:59订单数量：223950
晚上：19:00:00～23:59:59订单数量：99136
凌晨：00:00:00～04:59:59订单数量：92

#各时段人数可视化图
import matplotlib.pyplot as plt
labels=('Morning','Noon','Early morning','Afternoon','Evening')
sizes=(zs,zw,lc,xw,ws)
explode=[0,0.1,0,0.1,0.1]
plt.pie(sizes,explode=explode,labels=labels,colors=['lightblue','gold','lightgreen','lightcoral','lightgreen'],
        autopct='%1.1f%%',shadow=True,startangle=50)
plt.axis('equal')
plt.title('Distribution of member time')
plt.show()

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-N8C60Yuv-1584007168789)(output_29_0.png)]

#春季3、4、5月；夏季6、7、8月；秋季9、10、11月；冬季12、1、2月
Spring=c['dtime'][(c['dtime'].dt.month >= 3)&(c['dtime'].dt.month <= 5)].shape[0]
Summer=c['dtime'][(c['dtime'].dt.month >= 6)&(c['dtime'].dt.month <= 8)].shape[0]
Autumn=c['dtime'][(c['dtime'].dt.month >= 9)&(c['dtime'].dt.month <= 11)].shape[0]
Winter=c['dtime'][(c['dtime'].dt.month >= 12)&(c['dtime'].dt.month <= 2)].shape[0]
print ('春季3、4、5月订单数量：%d'%Spring)
print ('夏季6、7、8月订单数量：%d'%Summer)
print ('秋季9、10、11月订单数量：%d'%Autumn)
print ('冬季12、1、2月订单数量：%d'%Winter)

春季3、4、5月订单数量：132681
夏季6、7、8月订单数量：118389
秋季9、10、11月订单数量：100197
冬季12、1、2月订单数量：0

#各季节会员消费人数
import matplotlib.pyplot as plt
labels=('Spring','Summer','Autumn','Winter')
sizes=(Spring,Summer,Autumn,Winter)
explode=[0.1,0,0.1,0]
colors=['lightgreen','gold','lightskyblue','lightcoral']
plt.pie(sizes,explode=explode,labels=labels,colors=colors
        ,autopct='%.2f%%',shadow=True,startangle=50)
plt.axis('equal')
plt.title('Distribution of season')
plt.show()

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EwYd2g5S-1584007168790)(output_31_0.png)]

c.head()

	kh	csrq	djsj	dtime	spbm	sl	sj	je	spmc	...	syjh	djh	gzbm	gzmc	year	age	年龄阶层	month	季节	入会时长
0	a37cc182	1967-02-17	2004-12-31 21:24:34.216	2016-09-25 10:49:14.016	d62a69e3	1	499.0	297.07	WMF D无	...	101	7cd8	7296.0	WMF 柜	1967	53.0	中年人	9	秋季	16
1	a37cc182	1967-02-17	2004-12-31 21:24:34.216	2016-09-25 10:49:14.016	d62a69e3	1	12288.0	11089.93	WMF D无	...	101	7cd8	7296.0	WMF 柜	1967	53.0	中年人	9	秋季	16
2	a37cc182	1967-02-17	2004-12-31 21:24:34.216	2017-02-28 17:17:35.533	252403ef	1	598.0	598.00	双立人商品 F无	...	102	ed0a	7242.0	双立人柜	1967	53.0	中年人	2	冬季	16
3	34c2dc93	1986-07-18	2007-04-19 00:00:00.000	2017-11-13 13:36:45.656	4708e0bb	1	260.0	260.00	植村秀三色眼影/眼线液/眉笔.	...	97	c3f4	8156.0	Shu Uemura	1986	34.0	青年	11	秋季	13
4	828aa9b4	1951-12-29	2004-09-24 16:39:08.716	2017-05-17 11:30:39.080	a4809307	1	1288.0	1288.00	酷彩F件	...	102	95b0	7300.0	Le Creuset(酷彩)	1951	69.0	老年人	5	春季	16

5 rows × 21 columns

##任务3.1：构建会员用户“基本”特征标签
#固有基础属性标签：性别、年龄阶层、入会时长
c['性别']=c['xb'].map({1.0:'男',0.0:'女'})
# c['年龄']=aaa.replace("黑色","黄色")
im=c.drop(['csrq','xb','djsj','dtime','spbm','sl','sj',
              'syjh','djh','gzbm','gzmc','year','age','month'], axis=1)
im.head()

	kh	je	spmc	jf	年龄阶层	季节	入会时长	性别	消费水平	新老会员
0	a37cc182	297.07	WMF D无	297.08	中年人	秋季	16	女	低消费	老会员
1	a37cc182	11089.93	WMF D无	11089.92	中年人	秋季	16	女	高消费	老会员
2	a37cc182	598.00	双立人商品 F无	598.00	中年人	冬季	16	女	中等消费	老会员
3	34c2dc93	260.00	植村秀三色眼影/眼线液/眉笔.	260.00	青年	秋季	13	女	低消费	老会员
4	828aa9b4	1288.00	酷彩F件	1288.00	老年人	春季	16	女	中等消费	老会员

#任务3.2：构建会员用户“业务”特征标签
#基础性息处理后得到标签：消费水平（300以下低消费；300-1500中等消费；1500以上高消费）
#入会时长：新老会员；消费水平：低中高;有价值的用户信息
#消费金额数据描述
im['je'].describe()
im['入会时长'].describe()

count    445894.000000
mean          6.322101
std           2.989830
min           2.000000
25%           4.000000
50%           5.000000
75%           8.000000
max          18.000000
Name: 入会时长, dtype: float64

im['消费水平'] = pd.cut(im['je'], bins=[0,300,1500,9999999], labels=['低消费','中等消费', '高消费'] )
im['新老会员'] = pd.cut(im['入会时长'], bins=[0,5,999], labels=['新会员','老会员'] )
im.head()

	kh	je	jf	年龄阶层	季节	入会时长	性别	消费水平	新老会员
0	a37cc182	297.07	297.08	中年人	秋季	16	女	低消费	老会员
1	a37cc182	11089.93	11089.92	中年人	秋季	16	女	高消费	老会员
2	a37cc182	598.00	598.00	中年人	冬季	16	女	中等消费	老会员
3	34c2dc93	260.00	260.00	青年	秋季	13	女	低消费	老会员
4	828aa9b4	1288.00	1288.00	老年人	春季	16	女	中等消费	老会员

#任务3.3：构建会员用户“偏好”特征标签
#用户行为推测标签：经常购买运动T、裤、鞋为体育标签；购物行为——怀孕标签
#购物时间段、季节、商品类型偏好
im['购物时间段'] = pd.cut(c['dtime'].dt.hour, bins=[0,5,11,14,19,24], labels=['凌晨','早上', '中午','下午','晚上'] )
im.head()

	kh	je	spmc	jf	年龄阶层	季节	入会时长	性别	消费水平	新老会员	购物时间段
0	a37cc182	297.07	WMF D无	297.08	中年人	秋季	16	女	低消费	老会员	早上
1	a37cc182	11089.93	WMF D无	11089.92	中年人	秋季	16	女	高消费	老会员	早上
2	a37cc182	598.00	双立人商品 F无	598.00	中年人	冬季	16	女	中等消费	老会员	下午
3	34c2dc93	260.00	植村秀三色眼影/眼线液/眉笔.	260.00	青年	秋季	13	女	低消费	老会员	中午
4	828aa9b4	1288.00	酷彩F件	1288.00	老年人	春季	16	女	中等消费	老会员	早上

#删去无关列
im=im.drop(['je','jf','入会时长'], axis=1)
im.head()

	kh	spmc	年龄阶层	季节	性别	消费水平	新老会员	购物时间段
0	a37cc182	WMF D无	中年人	秋季	女	低消费	老会员	早上
1	a37cc182	WMF D无	中年人	秋季	女	高消费	老会员	早上
2	a37cc182	双立人商品 F无	中年人	冬季	女	中等消费	老会员	下午
3	34c2dc93	植村秀三色眼影/眼线液/眉笔.	青年	秋季	女	低消费	老会员	中午
4	828aa9b4	酷彩F件	老年人	春季	女	中等消费	老会员	早上

#任务3.4：建立用户画像
#整合所有标签信息
#1.文字呈现每个用户的画像结果（#会员卡号、性别、偏好品类、近期消费次数）
#2.可视化方式呈现
#对2bde7c95
bd=im[(im['kh']=='2bde7c95')]
bd=bd.drop(['kh'], axis=1)
bd.head()
bd.to_csv('D:/test.csv') 


# import matplotlib.pyplot as plt
# mid_je = im
# mid_je = mid_je.reset_index()
# dic = {x[0]:x[1] for x in mid_je.loc[:,:].values}
# wc= wordcloud.WordCloud(scale=16, font_path='simhei.ttf',
#                         background_color='white', max_words=100,colormap="coolwarm")
# X = wc.generate_from_frequencies(dic)
# plt.axis('off')
# plt.imshow(X)
# wordcloud = WordCloud(background_color='white',scale=1.5).generate(bd)
# #显示词云图片
# plt.imshow(wordcloud)
# plt.axis('off')
# plt.show()

#导入wordcloud模块和matplotlib模块
from wordcloud import WordCloud
import matplotlib.pyplot as plt
from scipy.misc import imread
#读取一个txt文件
with open("D:/test.csv" ,encoding="utf-8")as file:
    #读取文本内容
    text=file.read()
#读入背景图片
# bg_pic = imread('D:/3.png')
#生成词云
wordcloud = WordCloud(background_color='white',font_path='simhei.ttf',scale=1.5,
                       max_words=100,colormap="coolwarm").generate(text)
# image_colors = ImageColorGenerator(bg_pic)
#显示词云图片
plt.imshow(wordcloud)
plt.axis('off')
plt.show()
#保存图片
# wordcloud.to_file('test.jpg')

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-P9HCikf3-1584007168794)(output_39_0.png)]

c.head()

	kh	csrq	djsj	dtime	spbm	sl	sj	je	spmc	...	gzmc	year	age	年龄阶层	month	季节	入会时长	性别	消费水平	新老会员
0	a37cc182	1967-02-17	2004-12-31 21:24:34.216	2016-09-25 10:49:14.016	d62a69e3	1	499.0	297.07	WMF D无	...	WMF 柜	1967	53.0	中年人	9	秋季	16	女	低消费	老会员
1	a37cc182	1967-02-17	2004-12-31 21:24:34.216	2016-09-25 10:49:14.016	d62a69e3	1	12288.0	11089.93	WMF D无	...	WMF 柜	1967	53.0	中年人	9	秋季	16	女	高消费	老会员
2	a37cc182	1967-02-17	2004-12-31 21:24:34.216	2017-02-28 17:17:35.533	252403ef	1	598.0	598.00	双立人商品 F无	...	双立人柜	1967	53.0	中年人	2	冬季	16	女	中等消费	老会员
3	34c2dc93	1986-07-18	2007-04-19 00:00:00.000	2017-11-13 13:36:45.656	4708e0bb	1	260.0	260.00	植村秀三色眼影/眼线液/眉笔.	...	Shu Uemura	1986	34.0	青年	11	秋季	13	女	低消费	老会员
4	828aa9b4	1951-12-29	2004-09-24 16:39:08.716	2017-05-17 11:30:39.080	a4809307	1	1288.0	1288.00	酷彩F件	...	Le Creuset(酷彩)	1951	69.0	老年人	5	春季	16	女	中等消费	老会员

5 rows × 24 columns

from sklearn.preprocessing import StandardScaler
from sklearn.cluster import KMeans
km=c.drop(['csrq','xb','djsj','dtime','spbm','sl','sj','spmc',
              'syjh','gzbm','gzmc','year','age','month','jf',
           '年龄阶层','季节','性别','消费水平','新老会员'], axis=1)
km_cp=km.copy()
km.head()

	kh	je	djh	入会时长
0	a37cc182	297.07	7cd8	16
1	a37cc182	11089.93	7cd8	16
2	a37cc182	598.00	ed0a	16
3	34c2dc93	260.00	c3f4	13
4	828aa9b4	1288.00	95b0	16

#入会时长 (Duration)
#消费频率 (Frequency)
#消费金额 (Monetary)
#计算最近一次消费
D=km_cp[['kh','入会时长']]
#计算消费次数
Fre=km_cp[['kh','djh']].groupby('kh').count().reset_index()
#用户个人总消费金额
Mone=km_cp[['kh','je']].groupby('kh').sum().reset_index()
#合并数据集
km_1=pd.merge(D,Fre,on='kh',how='inner')
km_2=pd.merge(km_1,Mone,on='kh',how='inner')
km_2=km_2.rename(columns={'kh':'卡号','djh':'消费频率','je':'消费金额'})
km_2.describe()

	入会时长	消费频率	消费金额
count	445894.000000	445894.000000	4.458940e+05
mean	6.322101	85.904888	1.172853e+05
std	2.989830	262.171340	3.098385e+05
min	2.000000	1.000000	0.000000e+00
25%	4.000000	11.000000	1.071100e+04
50%	5.000000	32.000000	3.541280e+04
75%	8.000000	81.000000	1.081595e+05
max	18.000000	3039.000000	3.257258e+06

#K-means模型训练
km_future=km_2[['入会时长','消费频率','消费金额']]
km_2_SC=StandardScaler().fit_transform(data_future)
KMeans_model=KMeans(n_clusters=3)
fit_model=KMeans_model.fit(data_b_SC) 
print(KMeans_model.cluster_centers_)

[[ 1.30518985 -0.10829497 -0.13086107]
 [-1.11113518 11.26400174 10.13423447]
 [-0.54919514 -0.06399474 -0.04323129]]

#K-means聚类雷达图绘制
angles=np.linspace(0,2*np.pi,3,endpoint=False) 
angles=np.concatenate((angles,[angles[0]]))
centers=KMeans_model.cluster_centers_ 
plt_data=np.concatenate((centers,centers[:,[0]]),axis=1)
label=['Duration','Frequency','Monetary']
fig=plt.figure(figsize=(6,6))
ax=fig.add_subplot(111,polar=True)
for i in range(len(plt_data)):
    ax.plot(angles,plt_data[i],'o-',label=label[i])
ax.set_thetagrids(angles*180/np.pi,label)
plt.legend(bbox_to_anchor=(0.8,1.15),ncol=3)
plt.show()

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-IFPDvVQF-1584007168796)(output_44_0.png)]

# from sklearn.preprocessing import StandardScaler # 导入数据标准化模块
# from sklearn.cluster import KMeans # 导入K-Means聚类模块
# from sklearn.datasets import load_iris # 导入鸢尾花数据
# iris = load_iris()
# iris_data = iris['data']
# iris_target = iris['target']
# iris_names = iris['feature_names']
# sc = StandardScaler()
# iris_data = sc.fit_transform(iris_data) # 数据标准化
# model = KMeans(n_clusters=3,random_state=0,max_iter=500) # 构建聚类模块
# fit_model = model.fit(iris_data) # 训练聚类模块
# #输出聚类中心
# print('聚类中心\n',model.cluster_centers_)
# print('类别\n',pd.Series(model.labels_).value_counts())
# angles = np.linspace(0,2*np.pi,4,endpoint=False) # 将圆根据标签的个数等比分
# angles = np.concatenate((angles,[angles[0]])) # 闭合
# centers = model.cluster_centers_  # 获取聚类中心数据
# plot_data = np.concatenate((centers,centers[:,[0]]),axis=1)
# label = iris_names # 设置标签
# fig = plt.figure(figsize=(6,6))
# ax = fig.add_subplot(111,polar = True)
# for i in range(len(plot_data)):
#     ax.plot(angles, plot_data[i], 'o-', label='聚类群体'+str(i+1))
# ax.set_thetagrids(angles*180/np.pi, label)
# plt.legend(bbox_to_anchor=(0.8, 1.15),ncol=3) # 设置图例的位置
# plt.show()

你可能感兴趣的:(Python)

python中!ls -r_光学现象的Python实现 weixin_39838798 python中!ls -r
“Youwillseelightinthedarkness。Youwillmakesomesenseofthis.”“你终将于黑暗中触摸白昼，它将如影般随行。”如果说20世纪是电子的世界，那么21世纪就是光学的舞台。光学和光子学无处不在：智能手机和计算设备上的显示方式，互联网中承载信息的光纤，先进的精密制造，大量的生物医学应用终端，全光衍射神经网络等。对光学的深入理解为每一个学习物理和工程的同学带
xgboost在spark集群使用指南一颗小草333 算法 mapreduce spark 数据挖掘
简介XGBoost是一个优化的分布式梯度增强库，具有高效、灵活和可移植性。在梯度增强框架下实现了机器学习算法。XGBoost提供了一种并行树增强(也称为GBDT、GBM)，可以快速、准确地解决许多数据科学问题。相同的代码在主要的分布式环境(Hadoop、SGE、MPI)上运行，可以解决数十亿个示例的训练问题。xgb相对于gbt所做的改进：1.2.3.XGBoost可以使用R、python、java
python实战项目27：boss直聘招聘数据可视化分析 wp_tao Python副业接单实战项目信息可视化 python 数据分析
boss直聘招聘数据可视化分析一、数据预处理二、数据可视化三、完整代码一、数据预处理在上一篇博客中，笔者已经详细介绍了使用selenium爬取南昌市web前端工程师的招聘岗位数据，数据格式如下：这里主要对薪水列进行处理，为方便处理，将日薪和周薪的数据删除，将带有13薪和14薪的数据也删除，计算出最低薪资、最高薪资和平均薪资三列。数据预处理代码如下：importpandasaspddf=pd.rea
Python 3 中使用 SMTP 发送邮件：高级技巧与应用三带俩王 python 网络服务器
在现代的软件开发和自动化流程中，发送电子邮件是一项常见的任务。Python3提供了强大的工具来实现这一功能，特别是通过使用SMTP（SimpleMailTransferProtocol）协议。本文将深入探讨Python3中使用SMTP发送邮件的高级用法，展示其在不同场景下的灵活性和强大功能。一、SMTP简介SMTP是一种用于发送电子邮件的协议。它允许客户端（如Python程序）与邮件服务器进行通信
Python 在股票分析中的高级应用：挖掘金融数据的深度洞察三带俩王 python 金融开发语言
在当今的金融世界中，股票分析是投资者和金融从业者必备的技能。Python作为一种强大且灵活的编程语言，为股票分析提供了丰富的工具和技术。本文将深入探讨使用Python进行股票分析的高级用法，涵盖从数据获取与清洗、高级分析指标计算到机器学习和深度学习在股票分析中的应用等多个方面。一、数据获取与预处理：构建坚实的分析基础1.数据来源与获取直接从证券交易所获取数据：许多证券交易所提供了数据接口，例如，上
Python 中的complex(real[, imag])函数：高级用法与强大功能三带俩王 python 开发语言算法
在Python中，complex(real[,imag])函数是一个用于创建复数的强大工具。复数在数学、物理学、工程学等领域中有着广泛的应用，而Python的complex类型为我们提供了便捷的方式来处理复数。本文将深入探讨complex(real[,imag])函数的高级用法，展示其在不同场景下的强大功能。一、复数的基本概念复数是由实数和虚数组成的数，通常表示为a+bj的形式，其中a和b是实数，
python 利用 ddddocr包 ocr识别图片码风_流沙 python工具备忘录 python ocr 开发语言
ddddocr是一个轻量级的OCR（光学字符识别）库，适用于识别图片中的文字，包括验证码等图像文本。要使用ddddocr进行图片验证码的识别，可以按照以下步骤进行：1.安装ddddocr包首先，你需要安装ddddocr包。你可以使用pip安装：pipinstallddddocr2.使用ddddocr进行OCR识别importddddocr#创建OCR对象ocr=ddddocr.DdddOcr()#
计算机毕业设计之基于PythonBOSS直聘招聘数据可视化系统的设计与实现 wx—bishe58 信息可视化数据分析数据挖掘 rnn 人工智能课程设计 python
本文主要介绍了基于PythonBOSS直聘招聘数据可视化系统的设计与实现。随着互联网的普及，BOSS直聘招聘网站成为了企业和求职者的重要交流平台。然而，大量的招聘信息给用户带来了信息过载的问题。为了解决这一问题，本文提出了一种基于PythonBOSS直聘招聘数据可视化系统的设计与实现方法。首先，本文采用爬虫技术收集了拉勾BOSS直聘招聘网站上的大量招聘信息。然后，利用爬虫优化算法对爬取到的数据进行
Python 中的异常处理：try except Exception as e 三带俩王 python
在Python编程中，异常处理是一项至关重要的技能，它可以帮助我们提高程序的稳定性和可靠性。其中，tryexceptExceptionase语句是一种常见的异常处理方式。在这篇博客中，我们将深入探讨这个语句的要点和高级用法。一、异常处理的重要性在编程过程中，错误是不可避免的。这些错误可能是由于用户输入错误、文件不存在、网络连接问题等原因引起的。如果我们不处理这些错误，程序可能会崩溃，导致数据丢失或
python中的CSV模块一粒微尘_1 Python基础 python 开发语言后端
1、查询CSV模块中都有哪些函数和功能？①通过dir()函数查询CSV模块都有哪些函数importcsvforiindir(csv):print(i)②搜索CSV模块的官方教程’https://docs.python.org/3.6/library/csv.html‘③搜索中文教材’https://yiyibooks.cn/xx/python_352/library/csv.html#module
python爱心代码高级 youyouxiong python 开发语言
在Python中，绘制爱心图案可以通过多种方式实现，包括使用turtle模块、matplotlib库或者PIL库。以下是一些使用这些库绘制爱心的高级方法：使用turtle模块绘制动画爱心importturtleimportmathdefdraw_heart(t,size):""“绘制爱心的函数”""t.begin_fill()a=2*math.pit.circle(size,a/2)t.circl
Python李峋同款跳动的爱心代码（可写字版）雪碧没气阿 python 数据库开发语言 ide webstorm 爬虫
一年前小编曾用python编写过跳动的爱心代码，不知道有多少小伙伴们已经学会了呢，最近小编在用c语言和java编写跳动的爱心的时候，发现之前用python编写跳动的爱心时没有添加文字，这不，小编立马翻出之前的代码一顿操作，给大家带来了更新后的爱心，快来看看趴~（附详细分析哦）环境PythonPyCharm跳动的爱心运行结果完整程序importtkinterastkimporttkinter.mes
Apache Airflow 2.1.2：开源工作流管理系统的全面指南銀河鐵道的企鵝
本文还有配套的精品资源，点击获取简介：ApacheAirflow2.1.2是一个开源的工作流管理系统，用于编排、调度和监控复杂的业务逻辑。它基于DAG（有向无环图）概念，通过Python代码定义任务的Operator，定义任务的执行顺序和条件。该版本提供了任务调度、监控、错误处理、插件扩展和多环境管理等核心功能。解压后包含许可证文件、文档和源代码目录等，且介绍了安装和运行步骤。Airflow适用于
python无法启动此程序因为_(python shell怎么用)为啥我按照python安装教程，总说无法启动此程序，因为计算机中丢失？... weixin_39540023 python无法启动此程序因为
python3.8遍历整个列表？你打印的是colorprint(color)不对应该是magician为啥我按照python安装教程，总说无法启动此程序，因为计算机中丢失？这是你windows操作文件丢失的，和python无关。首先去网上搜索下载api-ms-win-crt-process-l1-1-0.dll文件载完毕后，把dll文件放到C:\Windows\System32下即可。如果下载的d
举例说明Python的CSV模块 weixin_30556161 python
举例说明Python的CSV模块byGaryJia—上次修改时间:2007-11-3017:28文章标签pythonzope举几个例子来介绍一下，Python的CSV模块的使用方法，包括，reader,writer,DictReader,DictWriter.register_dialect一直非常喜欢python的csv模块，简单易用，经常在项目中使用，现在举几个例子说明一下。reader(cs
Python爬虫实战：解析京东商品信息（附部分源码）是有头发的程序猿 API API接口 python 爬虫开发语言
在信息爆炸的今天，网络爬虫（WebScraping）作为一种自动获取网页内容的技术，已经成为数据采集的重要手段。Python，因其简洁的语法和强大的库支持，成为编写爬虫的首选语言之一。本文将通过一个实战案例，展示如何使用Python编写爬虫，以京东商品页面为例，解析商品信息。环境准备在开始编写爬虫之前，需要准备以下环境和工具：Python3.x网络请求库：requestsHTML解析库：Beaut
90、Python Web抓取与数据爬虫：技巧、实践与道德规范多多的编程笔记 python 前端爬虫
Python开发：学习Web抓取和数据爬虫大家好，今天我将向大家介绍Python的Web抓取和数据爬虫技术，主要包括BeautifulSoup和Scrapy两个库。在此之前，请大家先思考一个问题：为什么我们需要Web抓取和数据爬虫？为什么需要Web抓取和数据爬虫？在互联网时代，数据量呈爆炸式增长，但并不是所有数据都易于获取。很多时候，我们需要从网站上获取数据，这就需要用到Web抓取和数据爬虫技术。
《CPython Internals》阅读笔记：p360-p377 python
《CPythonInternals》学习第20天，p360-p377总结，总计18页。一、技术总结1.seaborn可视化工具。2.dtrace(1)安装sudoapt-getinstallsystemtap-sdt-dev(2)编译./configure--with-dtracemakecleanmake3.snakeviz适用于cProfile的可视化工具。二、英语总结(生词：0)无。关于英语
【python】csv模块 m 宽 python python 开发语言
importcsv#用列表方式写入withopen("test.csv","w",newline="")asf:#注意，执行newline=""那么数据会自动换行,如果不指定，那么会多换一行writer=csv.writer(f)writer.writerow(["symbol","date","close"])writer.writerow(["rb2101","20200907","3736"
解决Python中libhdfs.so的共享库找不到的问题 code_welike python 开发语言 Python
解决Python中libhdfs.so的共享库找不到的问题在Python开发过程中，有时会遇到导入共享库时出现"ImportError:Cannotfindthesharedlibrary:libhdfs.so"的错误。这个错误通常发生在使用Python访问Hadoop分布式文件系统（HadoopDistributedFileSystem，简称HDFS）时，由于缺少libhdfs.so共享库文件而
The application can not locate Python39.dll (126) chengyunkuan python python 运维 windows
TheapplicationcannotlocatePython39.dll(126)描述：利用pyinstaller打包带pywinauto项目报如下错误：TheapplicationcannotlocatePython39.dll(126)（我这是利用pyinstaller打包带pywinauto项目出现的。）解决办法：将pywinauto库，换成0.6.5版本。pipinstallpywin
【2024最新】python第三方库的概述——功能、特点西西很呆 python 开发语言源代码管理编辑器计算机网络 scrapy pandas
文章目录一、网络请求与爬虫Requests：Scrapy：BeautifulSoup：二、数据处理与分析NumPy：Pandas：SQLAlchemy：SciPy：matplotlib：Seaborn：三、Web开发Flask：Django：四、图像处理Pillow（PILFork）：OpenCV-Python：五、游戏开发Pygame：Pyglet：六、自然语言处理NLTK（NaturalLan
使用python调用JIRA6 进行OAuth1认证获取AccessToken yaoshengting python #jira python
Jira配置应用程序链接1)创建应用程序链接登录JIRA管理后台。转到Administration>Applications>ApplicationLinks。在输入框中输入外部应用程序的URL（例如GitLab或自定义应用），然后点击Createnewlink。2)配置ConsumerKey和PublicKey在创建应用链接的过程中：ConsumerKey：自定义一个唯一的字符串标识应用程序（例
【python】2024年最新——爱心代码高级西西很呆 python 开发语言编辑器计算机网络源代码管理 matplotlib numpy
文章目录一、字符爱心（简单）思路代码示例二、图案爱心（普通）思路代码示例三、炫酷的爱心（高级）思路代码示例总结一、字符爱心（简单）思路这个代码定义了一个名为print_heart的函数，该函数包含了一个字符串列表，每个字符串代表爱心形状的一部分。然后，通过遍历这个列表并打印每一行，我们在控制台上得到了一个简单的爱心形状。代码示例#定义爱心形状的字符打印函数defprint_heart():hear
python name is not defined_Python: name is not defined weixin_39654322 Python 汉诺塔游戏代码实现文本界面
D'aprèscequejevois,auniveauindentation,jeu=clHanoiTxt(h)estaumêmeniveauquedef__init__DoncpourPython,les3dernièrelignesdetonprogrammefontpartiedetaclasse.Ilfautqu'ilssoientendébutdeligne.Penseàbieninde
预测未来，Python中的时间序列分析模型ARIMA Python学研大本营 python 开发语言
时间序列分析：Python中的ARIMA模型，ARIMA模型是一种常用的时间序列预测工具，可以使用statsmodels库在Python中实现。微信搜索关注《Python学研大本营》，加入读者群，分享更多精彩时间序列分析广泛用于预测和预报时间序列中的未来数据点。ARIMA模型被广泛用于时间序列预测，并被认为是最流行的方法之一。在本教程中，我们将学习如何在Python中搭建和评估用于时间序列预测的A
正确解决NameError: name ‘python‘ is not defined异常的有效解决方法飞码创造者解决bug python 前端开发语言 bug
正确解决NameError:name‘python‘isnotdefined异常的有效解决方法文章目录报错问题报错原因解决方法报错问题NameError:name‘python‘isnotdefined异常报错原因在Python中，如果你遇到了NameError:nam
蓝桥刷题记——python实现第二篇一台电脑走天下 python 蓝桥杯平面
1.卡片#统计1累计出现的次数val=0num=0whileTrue:num+=str(val).count('1')ifnum>=2021:print(val)breakval+=12.直线#解析参考这位博主#直线x=[iforiinrange(20)]y=[iforiinrange(21)]zuobiao=set()foriinx:forjiny:zuobiao.add((i,j))zuobi
蓝桥刷题基础训练python 小馨不滑水笔记 python 蓝桥杯算法
""""数列排序问题描述给定一个长度为n的数列，将这个数列按从小到大的顺序排列。1<=n<=200输入格式第一行为一个整数n。第二行包含n个整数，为待排序的数，每个整数的绝对值小于10000。输出格式输出一行，按从小到大的顺序输出排序后的数列。"""#ls=[]#a=int(input())#b=input().split()#foriinb:#ls.append(int(i))#ls.sort(
NameError: name ‘python‘ is not defined的正确解决方法，亲测有效，嘿嘿嘿代码无疆 Python python 开发语言
文章目录问题分析：报错原因：解决思路：解决方法：问题分析：NameError是Python中的一个异常类型，它表明你尝试访问一个当前作用域中未定义的变量名。在给出的错误信息NameError:name‘python‘isnotdefined中，它表明你尝试使用一个名为python的变量或对象，但是在当前的代码上下文中并没有定义这个名称。报错原因：报错原因通常是因为以下几个情况之一：拼写错误：可能你
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS