一种基于XGBOOST的企业员工稳定性(员工离职)预测方法

简述

员工离职是每一家企业都要面对的问题,特别是优秀人才离职会对企业发展造成一定影响,员工离职风险主要包括以下几个方面,关键技术或商业秘密泄露 、客户流失 、 岗位空缺、 集体跳槽 、企业稳定性降低。如果能够在员工离职前及时预测员工离职倾向,一方面可以针对优秀人才执行挽留策略,提升业务稳定性,另一方面可以执行针对特定人群的离职审计,加强企业安全防护,因此如何降低员工离职率,在员工离职前主动检测员工离职倾向,成为了一项研究热点。当前业界针对员工离职检测的方式有两种,一种是线下问卷调查,如员工满意度调查,员工对企业文化的建议收集,此类方式主要有两方面弊端,一是员工的心理真诚度,员工往往隐瞒内心真实想法,二是此类调查方式效率低下,耗时耗力;另外一种方式是针对用户的系统行为进行实体监控规则建立,如利用企业内网登录招聘网站等,此类监控规则一方面在于监控场景受限,且即使触发监控规则后无法综合评判员工离职倾向,另一方面此类监控方式在进行规则间的关联分析时无法给出规则权重。为克服以上问题,本文提出了一种基于XGBOOST的员工离职预测方法,提前预测员工离职倾向,助力企业稳定性维护和通过离职审计降低企业风险。

方案的改进点或创新点

基于XGBOOST的员工离职预测方法通过收集员工在企业内相关系统的使用行为和已离职员工的系统使用行为,进行特征提取,相似度计算,利用优化后的AI分类模型XGBOOST进行机器学习建模,从用户系统行为的角度预测在职员工的离职倾向。结合图示,员工预离职检测工作流程如流程图1:

一种基于XGBOOST的企业员工稳定性(员工离职)预测方法_第1张图片

流程图1 

变量类型

变量名

相信说明

取值范围

备注

bool

leave_tag

是否已经离职

0,1

float

satisfaction

公司满意度问卷评分

0-100

float

work_spend_X

每天工作时长

0-100

此项生成90个维度(针对已经离职的员工取其前90天每天的工作时长;在职员工取当前时间前90天);单位为小时

bool

role

职业类别

saler、it_helper、developer、hr等13个职位类别

float

evaluation_score

绩效评分

0-100

bool

salary_level

薪资水平

1,2,3,4,5

分成五个薪资级别

bool

work_accident

是否发生过工作过错

0,1

float

hire_duration

入职时长

0-100

单位为年

bool

hire_website

是否使用内网登录过招聘网站

0,1

bool

late_X

最近8个周每周考勤迟到天数

0-31

此项会生成8个特征

float

work_overtime_x

最近8个周每周加班时长

0-100

此项会生成8个特征

float

hr_website

最近7天登录hr系统次数

0-1000

预离职员工具有关注年假余额、薪资流水的倾向

float

leave_website

最近7天每天请假时长

0-1001

此项会生成7个特征

 系统日志变量处理表格1

  1. 获取系统相关log日志,以用户为维度构建针对个体的特征,详细特征分析见系统日志变量处理表格1。
  2. 根据系统日志及预先定义的数据维度模型,提取最近离职的2000位员工和目前在值的20000名员工,进行向量化处理,得到批量数据,以支持分类建模。
  3. 将预处理后的批量数据按照8:2的比例,进行训练和测试数据的分配。
  4. 利用训练数据进行XGBOOST模型训练,并进行模型优化。XGBoost目标函数不止有损失函数,同时加入树的结构风险项(即正则项),这样在构建树的过程,会约束树的生长结构,减少过拟合问题。这样一来,目标函数就变成:

    

 

        5.利用测试数据进行模型预测,对分类结果进行分析。

XGBoost则用了损失函数的二阶近似,加快损失函数的下降速度,使迭代速度更快,能够关联特征属性,基于训练数据的分类基于不同特征以不同权值,且内部进行了联合特征的构建,对预离职员工数据的分类准确率搞到85%,

因此基于XGBOOST的员工离职预测方法具有实践指导意义,并将为企业人员稳定性和企业内部风险控制及员工离职审计做出实际贡献。

改进后的好处

基于XGBOOST的员工离职预测方法相较于常规的离职预测方法而言,具有更高效、更智能、更准确的特点。传统的离职分析方法不具有系统性,通常由hr完成,而hr无法系统感知员工行为,因此此类方法是在知识欠缺的情况下做出的,属于感性行为;常规的基于数理统计、员工属性的机器学习预测模型,受限于数据信息量过低,数据属性关联性不强的原因,在实际应用中效果较差;基于XGBOOST的员工离职预测方法相较于常规的离职预测方法关注用户属性特征的基础上,关注用历史工作行为和系统行为,并采用优化的XGBOOST进行模型建模,分类效果显著。

你可能感兴趣的:(数据安全,人工智能)