stenphen82

中国保险业过去五年基础数据分析

分析报告目录

中国保险业过去五年基础数据分析

一.分析报告介绍
二.用到的主要工具
三.保险数据采集
四.数据清洗和预处理
五.数据分析阶段

5.1 当前保险业状态分析
5.2 过去统计数据分析
5.3 未来状态预测

六.数据分析总结

一.分析报告介绍

“保险”是近两年来人们茶余饭后的热门话题，我本次的报告是网上学习了数据分析相关课程以后的项目结业作业。本作业将从公开途径抓取中国保险业过去5年的基础数据，管中窥豹看一看这个行业及保险产品当前的状况，过去的发展及未来的驱势。

本次作业选取了这两年我个人比较感兴趣，自己平时比较关注的保险业进行了简单的分析，从选题，数据抓取，建模分析独立完成，历时一周，花了大量的时间。虽然这份报告对于真正业内人士来说只能算是皮毛，但是也给了我一个很好了解，体验数据挖掘/数据分析的整个过程。最大的感受是最重要的是好的，足够完备的数据，有了好的数据，后面的分析建模很多时候就是水到渠成的事情了。

此外，对保险行业内部的相关资料和知识点查询，也感谢我个人的保险经纪人陆颖一直一来有问必答的无私帮助。

二.用到的主要工具

Python版本： Python3.6
jupter notebook: Anaconda3-5.2.0-Windows-x86_64
pandas：数据分析读取数据
matplotlib：绘图
rcParams：用来正常显示中文,并设置中文字体

三.保险数据采集

本次报告的数据是通过和讯保险页面采集自2013年1月至2018年9月的保险行业基础数据，主要是保险总保费，各险种保费，和总赔付支出，各险种赔付支出的数据。
具体数据爬取代码这里就省略了。

四.数据清洗和预处理

经过数据爬取阶段，我们获得了所有的数据组成一个以月份为辨识标签的二维数组(total_data),接下来我们需要对数据进行基本的预处理，其中包括了生成Dataframe，查看数据缺失及错误状况，添加缺失并修改错误数据。

import pandas as pd
import numpy as np
a = np.vstack(total_data)                     #将初始数组生成DataFrame
columns_name = ['date','原保险保费总收入','财产险收入','人身险总收入','寿险收入','健康险收入','人身意外保险收入','原保险赔付总支出','财产险支出','人身险总支出','寿险支出','健康险支出','人身意外保险支出']
df = pd.DataFrame(data = a,columns = columns_name)

df.date = pd.to_datetime(df.date)             #将传入的日期数据转变成datatime
df.set_index('date',inplace = True)           #将日期数据转成DatatimeIndex

df1 = df.loc[:,:].astype(float)               #确保每个表项都是float型

由于数据都是线性的，所以我们可以通过画个图来看数据采集是否完整，有无错误。
###############################################
####本段内容是为了解决画图无法显示中文字体的问题，如果可以显示中文则无需执行本段内容
####指定默认字体需要先将网上下载的的SimHei.ttf 文件放入 ~\Anaconda3\Lib\site-packages\matplotlib\mpl-data\fonts\ttf 中,然后敲入以下命令即可：

import matplotlib
matplotlib.rcParams['font.sans-serif'] = ['SimHei'] 
matplotlib.rcParams['font.family']='sans-serif'
#解决负号'-'显示为方块的问题
matplotlib.rcParams['axes.unicode_minus'] = False

###############################################

from matplotlib import pyplot as plt
%matplotlib inline
df1.plot(figsize=(16,9))                            #对初始的DataFrame进行画图

根据图示，我们可以看到2016年后段，17年1月份，12月份数据缺失，此外，16年7月， 18年2月和8月线条都有突变，预示数据大概率有误。这里数据的矫正只能手动输入，矫正数据源自保险监督管理委员会官网。

官网数据网页没有规律，且网页内表格不同年份的格式不一致，所以并未直接作为数据源进行采样。

df2 = df1.replace(0,np.nan)                #先将0值全部替换成NAN值，以便后期检索是否还有未补缺数据

#获取缺失的基本月份数据
data1608 = [22958.9373,5635.0848,17323.8524,13721.4564,3098.2305,504.1655,6901.1431,2937.1279,3964.0152,3242.7249,605.3101,115.9803]
data1609 = [25168.2615,6370.5827,18797.6788,14783.8733,3430.4069,583.3985,7750.6999,3321.5870,4429.1129,3610.5333,687.1908,131.3888]
data1610 = [27010.3752,7018.3821,19991.9932,15703.9707,3647.7410,640.2814,8526.1670,3670.1245,4856.0425,3946.5561,763.4167,146.0697]
data1611 = [28864.8711,7773.0544,21091.8167,16556.6817,3841.7960,693.3390,9450.0194,4131.1226,5318.8968,4287.5209,870.7195,160.6564]
data1701 = [8553.4033,973.8127,7579.5907,6861.5894,641.1138,76.8875,1277.2914,419.6850,857.6063,729.5261,109.4866,18.5937]
data1712 = [36581.0074,9834.6579,26746.3495,21455.5650,4389.4604,901.3241,11180.7933,5087.4496,6093.3437,4574.8907,1294.7670,223.6859]
data1612 = [30959.1009,8724.4981,22234.6028,17442.2167,4042.4968,749.8893,10512.8900,4726.1839,5786.7061,4602.9462,1000.7522,183.0077]

#将缺失月份输入dataframe中
df2.loc['2016-08-01'] = pd.Series(data1608,index = df2.columns)
df2.loc['2016-09-01'] = pd.Series(data1609,index = df2.columns)
df2.loc['2016-10-01'] = pd.Series(data1610,index = df2.columns)
df2.loc['2016-11-01'] = pd.Series(data1611,index = df2.columns)
df2.loc['2017-01-01'] = pd.Series(data1701,index = df2.columns)
df2.loc['2017-12-01'] = pd.Series(data1712,index = df2.columns)
df2.loc['2016-12-01'] = pd.Series(data1612,index = df2.columns)

#对数据错误表项，根据官网校验后修正
df2.loc['2016-07-01']['原保险赔付总支出'], df2.loc['2016-07-01']['寿险收入'] = df2.loc['2016-07-01']['寿险收入'], df2.loc['2016-07-01']['原保险赔付总支出']
df2.loc['2018-02-01'][-1],df2.loc['2018-02-01'][-3] = df2.loc['2018-02-01'][-3], df2.loc['2018-02-01'][-1]
df2.loc['2018-08-01'][-1] = df2.loc['2018-08-01'][-4]-df2.loc['2018-08-01'][-3] - df2.loc['2018-08-01'][-2]

#再次画图查看数据是否连续线性
df2.plot(figsize=(16,9))

查看过官网以后，我们还发现，每个月的数据其实都是当年自一月份以来数据之和，而不是单个月数据，这意味着我们对除一月份以外的数据，都需要减去该月之前一个月的数据，以算出真正该月产生的保险数据。

df_month = df2.copy()

i = len(df_month)
while i > 0:
    i -= 1                                             #从表最后行往前修正数据
    if (df_month.index[i]).to_pydatetime().month == 1: #如果当月月份是一月份，则数据不需要修改
        continue
    else:                                              #非一月份的当月数据需要减去前面一个月的数据以获取当月值
        df_month.loc[df_month.index[i]] -= df_month.loc[df_month.index[i] - pd.DateOffset(months=1)]

#获取最终的月数据，画图检验
df_month.plot(figsize=(16,9))

#接下来根据月数据生成季度数据和年度数据

df_year = df_month.resample('Y').sum()
df_quarter = df_month.resample('Q').sum()

五.数据分析阶段

数据分析阶段，我们将分成当前数据状态分析，过去统计数据分析和未来状态预测三个方面来进行。

5.1 当前保险业状态分析

我们将通过对2018年保险业收入和支出的饼图来进行当前保险业的状态分析。
#2018年保费收入和赔付的饼图
#先定义一个简单函数，使得饼图中不但可以显示百分比，还能显示具体数字显示

def pct_number(pct, data):
    number = float(pct/100.*np.sum(data))
    return "{:.2f}%\n({:.2f} 亿元)".format(pct, number)

fig, axes = plt.subplots(nrows = 1, ncols = 2,figsize = (14, 6))               #画两个饼图，一个收入，一个赔付
axes[0].axis('equal')                                                          #两个圆都是正圆
axes[1].axis('equal')

labels0 = ['财产险收入','寿险收入','健康险收入','人身意外险收入']              #定义饼图不同部分标签
labels1 = ['财产险赔付','寿险赔付','健康险赔付','人身意外险赔付']

axes[0].set_title("2018 保险收入", fontsize = 20)                           #定义饼图title
axes[1].set_title("2018 保险赔付", fontsize = 20)

#截取2018年各单项险种数据进行展示
axes[0].pie(df_year.iloc[-1,[1,3,4,5]], labels = labels0,autopct = lambda pct: pct_number(pct, df_year.iloc[-1,[1,3,4,5]]))     
axes[1].pie(df_year.iloc[-1,[7,9,10,11]], labels = labels1,autopct = lambda pct: pct_number(pct, df_year.iloc[-1,[7,9,10,11]]))

通过2018至今年第三季度饼图中各保险占比和费用的展示，我们可以清楚的看到：

1.在保险收入的部分，寿险占到了近六成份额，是保险公司绝对的营收大头。然而在支出部分，寿险却不是支出最多的，同时收入和支出的差额是各种险种中最大的。

但是为什么会造成这样的数据差距呢？其实懂点商业保险的都知道单纯的人寿保险同等保额对应的保费普遍并不会比健康险更贵，所以这里的寿险是个泛指，我个人认为里面很大比例应该是所谓的年金险。由于年金险也是在被保险人身故时结束保险责任的一种人身保险，所以在划类时也被划分到了寿险类是可以理解的。

同时年金险的缴费和赔付特点和其他所有保险都是相反的，别的保险都是短期或定期缴少量保费，出险后获取大额保额赔付，说穿了就是其他不出险人的保费都赔给出险的人了。
但是年金险的特点则是投保人需要短期或定期缴大额保费后，被保险人每年或者退休以后才能收到约定的的少量定额赔付，但是赔付次数/年限一直延续直到被保险人去世为止。这里的赔付费用用的是投保人前期交的大量保费后，保险公司用这笔钱理财盈余所得。也就是用的就是自己的本钱，和他人保费无关。
此外，年金险一般还会同时卖一个万能险，等同提供一个高额利率的银行储蓄账户，这又是一个吸钱的大杀器。

年金险的这个收入高，赔付低的特点使得寿险这块必然成为保险公司争抢市场的重中之重。

2.人身意外险和健康险收入支出占比基本相同，分别只有2%和15%左右，说明这两个险种当前并不是保险公司的营收重点。但是这两个险种收入和支出差距也很明显，显示他们也有很好的发展空间。

3.财险收入占比不到三成却要支出四成五的赔付，使得财险在赔付占比上排名第一。财险本身分类太多太杂，从车险，房屋险，到矿山，土地，甚至各种信用责任，和人身人寿无关的都算财险。对个体财险公司而言，其所承保项目每年突发事故，天灾人祸出险的多寡可能会很大的影响该财险公司的盈利，但是对整个市场来说，财险市场算是一个比较成熟稳定的市场。

5.2 过去统计数据分析

对于过去统计数据，我们会从保费的收入和赔付数额以及月同比增长率两方面来分析。

##画两个柱状图，对应收入和赔付支出的历史数据
my_colors = ['r','g','y','b']                                       #对四种险种定义4个颜色对应

fig, axes = plt.subplots(nrows = 2, ncols = 1,sharex = True,figsize = (16, 12))  

df_quarter.iloc[:,[1,3,4,5]].plot.bar(figsize = (16, 9),ax = axes[0],color = my_colors)    #四个险种的收入季度柱状图
df_quarter.iloc[:,[7,9,10,11]].plot.bar(figsize = (16, 9),ax = axes[1],color = my_colors)  #四个险种的赔付支出季度柱状图

axes[0].set_title("保险季度收入",fontsize = 15)        #定义柱状图title
axes[1].set_title("保险季度赔付",fontsize = 15)

axes[1].set_xlabel("日期")                             #定义柱状图的x，y轴label
axes[1].set_ylabel("单位: 亿元")
axes[0].set_ylabel("单位: 亿元")

patches, labels = axes[0].get_legend_handles_labels()  #这两段代码是为了调整图中示例标签的位置
axes[0].legend(patches, labels, loc = 2)

从2013年至今的保险各险种季度收入和赔付柱状图我们可以看到：

1.从保费收入来看，整体体量寿险和财险收入要明显高于健康险和人身意外险。其中寿险在每年的第一季度总能一骑绝尘，和所有其他险种拉开巨大的差距。究其原因其实还是前面提过的年金险引起的。由于年金险强大的吸金效益，每年年末新年伊始各家保险公司都会倾尽所能卖自己的“开门红”产品，这些“开门红”基本都是年金险。这就造成了第一季度巨量的保费收入。

2.从保费赔付支出来看，首先我们可以发现Y轴单位差了整整一个量级，说明保险业整体盈利能力还是非常巨大的。其次，虽然峰值依然是寿险的，但是平均来看显然财险总支出会更大些，这也符合我们前面饼图显示的各险种赔付比例。至于为什么第一季度寿险赔的也特别多呢？当然是因为年金险这个季度签得多，由于年金险赔付都是按年支出，自然同样的季节赔的也就多了。有意思的是财险总是第四季度赔付最多，应该是和大家年前清账，以便进行全年盈亏统计不无关系。

#画月同比增长率的折线图
from matplotlib.ticker import FuncFormatter

df_month_rate = df_month.pct_change(periods = 12).iloc[12:,:]  #计算月同比增长率，取值时去掉最初作为base数据的12个月
  
fig, axes = plt.subplots(nrows = 2, ncols = 1,figsize = (16, 12))

df_month_rate.iloc[:,[3,4]].plot(color=['g','y'], ax = axes[0],figsize=(16, 12),grid=True) #为避免凌乱，将4个险种两两分开显示
df_month_rate.iloc[:,[1,5]].plot(color=['r','b'], ax = axes[1],figsize=(16, 12),grid=True) #


def to_percent(temp, position):                             #定义一个可以在y轴将小数显示成百分数的函数
    return '%.f'%(100*temp) + '%'

for i in range(0,2):                                                #定义x，y轴label和格式，多画一条y=0的基准线
    axes[i].yaxis.set_major_formatter(FuncFormatter(to_percent))
    axes[i].set_ylabel("同比增长率")
    axes[i].set_xlabel("日期")
    axes[i].axhline(y=0, color='black', lw=2)
    
axes[1].set_title("财险/意外险月同比增长率",fontsize=15)   #定义图像title
axes[0].set_title("寿险/健康险月同比增长率",fontsize=15)

从分组后的月同比增长率我们可以看到：

1.根据Y轴的数值，总得来说各险种收入和赔付都处在高速的增长中，说明我国保险业近几年发展速度迅猛。

2.从各险种而言，我们可以看到健康险收入的同比增长率在2017年以前明显高于其他险种，增幅最高可以超过125%。当时超高的增长率主要是由于16年底前市场有很多带理财属性的短期/定期健康险（很多都是直接银行当有保险功能的理财产品代卖），受到当时消费者的热捧。

然而我们可以看到健康险的同比增长率自16年底开始出现急跌，17年中旬和18年开年甚至录得了负增长。其背后的原因是因为自16年中旬开始，相关监管机构和高层就开始放出“保险信保”信号，要求行业回归本源，大力发展保障型产品，而不是吸收资金只求规模，避免造成潜在金融系统风险。随之对应的是先后出台多项红头文件和措施，杜绝了健康险同年金险一样朝偏理财产品的转变。

但是就算如此，其实健康险同比增长率也并非一蹶不振，17年后期及18年中期依旧能够录得高速的增长率，说明了健康险在更注重保障以后仍然有广阔的发展空间，这是由于75,80后的人们开始保险意识的逐步觉醒，很多人开始自发的去了解保险，主动购买保险。这种主动行为目标都是以重疾险，医疗险等健康险为主体的。

相对于健康险的超高增长，寿险的增长率略低，且自16初后似乎就开始进入下降通道。主要原因还是“保险信保”的政策改变引起的。特别是17年10月份开始实行的著名的134号文件，对年金险很多快速返还，高额利率等有潜在风险的行业做法做了更严格的规定和限制，从而使年金险作为理财产品的吸引力大幅下降。

3.相对于前两个险种而言，财险和人身意外险的同比增长率虽然没有超高速的增长率，但是胜在稳定，几年来都能保持在一个区间中，其中意外险的小体量也预示着更大的发展空间。

5.3 未来状态预测

由于保险数据非常规整的季度性，很适合用prophet工具进行时间序列的分析和预测。我们会对各保险在未来三年内进行保费收入，月同比增长率以及各险种在总保险收入中的占比进行预测。

#如果没有，需要先安装fbprophet
#!conda install -c conda-forge --yes fbprophet    
from fbprophet import Prophet
import warnings
warnings.filterwarnings('ignore')

以下是各保险在未来三年内保费收入预测

#定义一个调用prophet并画出相应预测图的函数
def prophet_image(df,periods,ax):                               #传入dataframe，预测时长和子图序列信息
    df = df.reset_index()  # 重置索引
    df.columns = ['ds', 'y']
    m = Prophet()  # 创建加法模型
    m.fit(df)  # 训练
    future = m.make_future_dataframe(periods=periods, freq='M')  # 生成预测序列
    forecast = m.predict(future)  # 预测
    fig = m.plot(forecast,ax=ax)  # 绘图

#绘制4中保险月收入未来三年的预测图
fig, axes = plt.subplots(nrows=2, ncols=2,figsize=(14, 8))          #绘制一个2X2的图，分别对应四个险种

prophet_image(df_month.iloc[:,1],39,axes[0,0])                      #调用上面定义的函数进行未来3年的保费数据预测
prophet_image(df_month.iloc[:,3],39,axes[0,1])
prophet_image(df_month.iloc[:,4],39,axes[1,0])
prophet_image(df_month.iloc[:,5],39,axes[1,1])

for i in range(0,2):                                                   #定义个子图y轴label，加画一条x轴基准线已区分历史值和预测值
    for j in range(0,2):
        axes[i,j].set_ylabel("单位: 亿元")
        axes[i,j].axvline(x='2018-09-01',ls="--",color="y", lw=1)

axes[0,0].set_xlabel("财险保费未来三年预测")                          #定义各子图的x轴label
axes[0,1].set_xlabel("寿险保费未来三年预测")
axes[1,0].set_xlabel("健康险保费未来三年预测")
axes[1,1].set_xlabel("人身意外险保费未来三年预测")

从四种险种的未来三年保费收入预测图中我们可以看到:

1.各个险种的保费收入依旧能够稳步增长，说明整个行业总体增长的基石依然存在，行业还是很有发展前景的。

2.从斜率上我们也可以看出来，寿险保费预测的斜率明显低于其他三个险种，显示出寿险(年金险）由于受规模和政策的影响，发展趋缓。

3.每个图中折线周边的蓝色阴影部分标志着此点对应日期所预测数值的离散范围。财险和意外险阴影很小，说明这两个险种过往的运营数据规律性明显，所以预测值离散很小。而寿险和健康险由于受政策影响较大，过往数据规律性较差，所以预测值的离散程度也就较高。

我们最后再看下各险种在未来三年对于总保费的占比趋势预测。

fig, axes = plt.subplots(nrows=2, ncols=2,figsize=(16, 8))                          #绘制一个2X2的图，分别对应四个险种

prophet_image(df_month.iloc[:,1]/df_month.iloc[:,0],39,axes[0,0])                   #将单个险种保费除以总保费的数值带入函数中进行预测
prophet_image(df_month.iloc[:,3]/df_month.iloc[:,0],39,axes[0,1])
prophet_image(df_month.iloc[:,4]/df_month.iloc[:,0],39,axes[1,0])
prophet_image(df_month.iloc[:,5]/df_month.iloc[:,0],39,axes[1,1])

for i in range(0,2):
    for j in range(0,2):
        axes[i,j].yaxis.set_major_formatter(FuncFormatter(to_percent))              #对各子图设定y轴百分比显示
        axes[i,j].set_ylabel("占比 %")                                              #对各子图定义y轴label
        axes[i,j].axhline(y=0,ls="--",color="black", lw=1)                          #对各子图加画一条y=0基准线
        axes[i,j].axvline(x='2018-09-01',ls="--",color="y", lw=1)                   #对各子图加画一条x轴基准线已区分历史值和预测值

从各险种占总保费收入的比重预测图中我们可以看到，财险和寿险的份额会逐渐缩小，健康险和意外险的份额会逐渐扩大。这也预示着未来市场发展的重点和方向的转变。

六.数据分析总结

根据对保险业近五年基础数据的分析，我们可以知道，

首先保险业务收入支出数额巨大，巨大的保费收入最终会通过各种投资渠道流入到整个金融市场中去，在整个金融体系中占据的不可忽视的作用和地位。

对具体险种而言，财险市场总体稳定独立，发展良好。而在人寿险市场，在过去及可预见未来的时间内，寿险（年金险）市场仍将是每个保险公司的必争之地，体量巨大，利润丰厚。但是随着政策的扶持，国民保险意识的觉醒，健康险和人身意外险已经开始奋起直追，他们将是未来新兴的增长点。

2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
绘本讲师训练营【24期】8/21阅读原创《独生小孩》 1784e22615e0
24016-孟娟《独生小孩》图片发自App今天我想分享一个蛮特别的绘本，讲的是一个特殊的群体，我也是属于这个群体，80后的独生小孩。这是一本中国绘本，作者郭婧，也是一个80厚。全书一百多页，均为铅笔绘制，虽然为黑白色调，但并不显得沉闷。全书没有文字，犹如“默片”，但并不影响读者对该作品的理解，反而显得神秘，梦幻，給读者留下想象的空间。作者在前蝴蝶页这样写到：“我更希望父母和孩子一起分享这本书，使他
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
谁家酒器最绝唱，藏在酒厂人未知？景阳冈酒厂先秦藏品大揭秘李虓酒评论
文/王赛时中国的酒器酒具历史久远，举世闻名。从北京的故宫博物院、中国国家博物馆，到世界各国的大型博物馆，都以能够收藏中国古代酒具而夸耀。但很少有人知道，在山东阳谷景阳冈酒厂，默默地收藏了两千件中国酒器。这些酒器，就封藏在景阳冈的酒道馆里。其中有一些青铜酒器，一睡就是三、四千年，堪称无声国宝，堪作无字史书！今天，我将引领诸位首先窥视一下景阳冈酒道馆的9件先秦藏品，你自己来说震撼不震撼。提示：这只是景
山东大学小树林支教调研团青青仓木队——翟晓楠山东大学青青仓木队
过了半年，又一次启程，又一次回到支教的初心之地。比起上一次的试探与不安，我更多了一丝稳重与熟练。心境、处境也都随着半个学期的过去而变得不同，半个学期中，身体上的，心理上的，太多的逆境让我变得步履维艰，曲曲折折，弯弯绕绕，我仿佛打不起精神，没有胃口，没有动力。感觉走的不顺畅的时候，支教这个旅程，给了我力量。自告奋勇承担起队长这一职务的我，从组织时的复杂和困难的经历，协调各种问题，从无到有，和校长和队
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
运城寻访重逢石头纪实【严建设老照片395 集】我简直能把你想透，当我走进运城的时候。我已急得热汗直流，访问了十九个老头，把晋南的小城转了三周。虽然是悠久的思旧，我仍然是牛样的执... 严建设
运城寻访重逢石头纪实【严建设老照片395集】我简直能把你想透，当我走进运城的时候。我已急得热汗直流，访问了十九个老头，把晋南的小城转了三周。虽然是悠久的思旧，我仍然是牛样的执拗。说什么变换的世情，泛起了过去的逝流，你就是真正的故友。踏破铁鞋的淡愁，已化为不废功夫的范畴，是就像远在天涯近在咫尺，就像是梦乡的邂逅，我紧紧地攥着你的手。你已长成了高高的个头，俊逸的容颜却很清瘦，你那样顽皮的童音，已变到老
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
从0到500+，我是如何利用自媒体赚钱？一列脚印
运营公众号半个多月，从零基础的小白到现在慢慢懂了一些运营的知识。做好公众号是很不容易的，要做很多事情；排版、码字、引流…通通需要自己解决，业余时间全都花费在这上面涨这么多粉丝是真的不容易，对比知乎大佬来说，我们这种没资源，没人脉，还没钱的小透明来说，想要一个月涨粉上万，怕是今天没睡醒（不过你有的方法，算我piapia打脸）至少我是清醒的，自己慢慢努力，实现我的万粉目标！大家快来围观、支持我吧！孩子
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
大伟说成语之唉声叹气求索大伟
＊大伟说成语＊【唉声叹气】叹气：因心里不痛快或不如意而吐出长气，发出声音。因为痛苦、憋闷或感伤而发出叹息的声音。【大伟说】情绪外露，非人类所特有，动物亦有情绪，悲哀和欢乐所表示的情绪亦是不一样的，会嗷嗷大叫也会低吟痛哭。不同的是，人类的情绪更复杂，更多样，更丰富。唉声叹气，可以说是最基础的情绪，因为无奈而举足无措，不知该如何如何化解，只有独自一人慢慢承受，长吁短叹不知如何是好，其实是无能无力的表现
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
似乎，发生了很多事情阿皮Ponder
似乎，有很多事情正在发生。今天，我跟夫人陪着孩子走进来幼儿园，人生头一回以孩子家长的身份参加了小小的班级家长会。在幼儿园，遇见老同学。从2017年开始失联，因为对方遇到了一些事情，跟大家都失去了联系，今日再见面，分外激动，他拉着我一直聊，一直聊。感谢我们的孩子。孩子有点咳嗽，去医院做了检查。叔叔家的两个妹妹开始了高中生活，新的开始。过去看望，遇到一位老师，很是面熟。咨询之下，果然，曾经初中母校的老
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
高级 ECharts 技巧：自定义图表主题与样式 SnowMan1993 echarts 信息可视化数据分析
ECharts是一个强大的数据可视化库，提供了多种内置主题和样式，但你也可以根据项目的设计需求，自定义图表的主题与样式。本文将介绍如何使用ECharts自定义图表主题，以提升数据可视化的吸引力和一致性。1.什么是ECharts主题？ECharts的主题是指定义图表样式的配置项，包括颜色、字体、线条样式等。通过预设主题，你可以快速更改图表的整体风格，而自定义主题则允许你在此基础上进行个性化设置。2.
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
ARM驱动学习之基础小知识 JT灬新一 ARM 嵌入式 arm开发学习
ARM驱动学习之基础小知识•sch原理图工程师工作内容–方案–元器件选型–采购（能不能买到，价格）–原理图（涉及到稳定性）•layout画板工程师–layout（封装、布局，布线，log）（涉及到稳定性）–焊接的一部分工作（调试阶段板子的焊接）•驱动工程师–驱动，原理图，layout三部分的交集容易发生矛盾•PCB研发流程介绍–方案，原理图(网表)–layout工程师（gerber文件）–PCB板
Rust基础知识 GRKF15 rust 开发语言后端
1.Rust语言简介1.1基础语法变量声明：let关键字用于声明变量，可以指定或不指定类型，如leta=10;和letmutc=30i32;。函数定义：使用fn关键字定义函数，并指定参数类型及返回类型，如fnadd(i:i32,j:i32)->i32{i+j}。控制流：包括if、else等，控制语句后需要使用;来结束语句。1.2数据类型整数类型：i8、i16、i32、i64、i128，以及无符号的
18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构
聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

中国保险业过去五年基础数据分析

中国保险业过去五年基础数据分析

分析报告目录

一.分析报告介绍

二.用到的主要工具

三.保险数据采集

四.数据清洗和预处理

五.数据分析阶段

5.1 当前保险业状态分析

5.2 过去统计数据分析

5.3 未来状态预测

六.数据分析总结

你可能感兴趣的:(中国保险业过去五年基础数据分析)