AnthonyHDM

IBM's Attribution

人员的不稳定性，一直是困扰很多企业的一个的问题，怎么才能降低员工的离职率，留住人才呢？本文选取了IBM员工的开放数据进行研究，并通过R语言进行详细分析与结果展示。首先，通过ggplot画图，探索员工离职率与其相关的各个因素之间的关系；然后，利用RandomForest画出决策树，初步判断影响离职的相关因素；最后，建立Gradient Boosting Machines模型，从而找出对离职影响最为严重的因素，为企业留住人才、保持员工的幸福感提供建议。
数据来源：https://www.kaggle.com/pavansubhasht/ibm-hr-analytics-attrition-dataset

数据探索

插入数据

setwd('E:/RCode/')
ibm<-read.csv('IBM.csv')
str(ibm)
## 'data.frame':    1470 obs. of  35 variables:
##  $ Age                     : int  41 49 37 33 27 32 59 30 38 36 ...
##  $ Attrition               : Factor w/ 2 levels "No","Yes": 2 1 2 1 1 1 1 1 1 1 ...
##  $ BusinessTravel          : Factor w/ 3 levels "Non-Travel","Travel_Frequently",..: 3 2 3 2 3 2 3 3 2 3 ...
##  $ DailyRate               : int  1102 279 1373 1392 591 1005 1324 1358 216 1299 ...
##  $ Department              : Factor w/ 3 levels "Human Resources",..: 3 2 2 2 2 2 2 2 2 2 ...
##  $ DistanceFromHome        : int  1 8 2 3 2 2 3 24 23 27 ...
##  $ Education               : int  2 1 2 4 1 2 3 1 3 3 ...
##  $ EducationField          : Factor w/ 6 levels "Human Resources",..: 2 2 5 2 4 2 4 2 2 4 ...
##  $ EmployeeCount           : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ EmployeeNumber          : int  1 2 4 5 7 8 10 11 12 13 ...
##  $ EnvironmentSatisfaction : int  2 3 4 4 1 4 3 4 4 3 ...
##  $ Gender                  : Factor w/ 2 levels "Female","Male": 1 2 2 1 2 2 1 2 2 2 ...
##  $ HourlyRate              : int  94 61 92 56 40 79 81 67 44 94 ...
##  $ JobInvolvement          : int  3 2 2 3 3 3 4 3 2 3 ...
##  $ JobLevel                : int  2 2 1 1 1 1 1 1 3 2 ...
##  $ JobRole                 : Factor w/ 9 levels "Healthcare Representative",..: 8 7 3 7 3 3 3 3 5 1 ...
##  $ JobSatisfaction         : int  4 2 3 3 2 4 1 3 3 3 ...
##  $ MaritalStatus           : Factor w/ 3 levels "Divorced","Married",..: 3 2 3 2 2 3 2 1 3 2 ...
##  $ MonthlyIncome           : int  5993 5130 2090 2909 3468 3068 2670 2693 9526 5237 ...
##  $ MonthlyRate             : int  19479 24907 2396 23159 16632 11864 9964 13335 8787 16577 ...
##  $ NumCompaniesWorked      : int  8 1 6 1 9 0 4 1 0 6 ...
##  $ Over18                  : Factor w/ 1 level "Y": 1 1 1 1 1 1 1 1 1 1 ...
##  $ OverTime                : Factor w/ 2 levels "No","Yes": 2 1 2 2 1 1 2 1 1 1 ...
##  $ PercentSalaryHike       : int  11 23 15 11 12 13 20 22 21 13 ...
##  $ PerformanceRating       : int  3 4 3 3 3 3 4 4 4 3 ...
##  $ RelationshipSatisfaction: int  1 4 2 3 4 3 1 2 2 2 ...
##  $ StandardHours           : int  80 80 80 80 80 80 80 80 80 80 ...
##  $ StockOptionLevel        : int  0 1 0 0 1 0 3 1 0 2 ...
##  $ TotalWorkingYears       : int  8 10 7 8 6 8 12 1 10 17 ...
##  $ TrainingTimesLastYear   : int  0 3 3 3 3 2 3 2 2 3 ...
##  $ WorkLifeBalance         : int  1 3 3 3 3 2 2 3 3 2 ...
##  $ YearsAtCompany          : int  6 10 0 8 2 7 1 1 9 7 ...
##  $ YearsInCurrentRole      : int  4 7 0 7 2 7 0 0 7 7 ...
##  $ YearsSinceLastPromotion : int  0 1 0 3 2 3 0 0 1 7 ...
##  $ YearsWithCurrManager    : int  5 7 0 0 2 6 0 0 8 7 ...

加载需要的包

#install.packages('grid')
#install.packages('gridExtra')
#install.packages('ggplot2')
library(grid)
library(gridExtra)
library(ggplot2)

探索Attrition和Gender、Age之间的关系

ggplot(ibm, aes(x= Gender, y=Age, group = Gender, fill = Gender)) + 
  geom_boxplot(alpha=0.7) + 
  theme(legend.position="none") + 
  facet_wrap(~ Attrition) + 
  ggtitle("Attrition") + 
  theme(plot.title = element_text(hjust = 0.5))+
  scale_fill_manual(values = c("#7EC0EE","#EEA2AD"))

从图中可以看出离职情况和年龄是有一定关系的，(1)离职的人年龄普遍较小，这很符合现实，刚开始就业的人群都会在不断更换工作中找到最适合自己的职业，直到找到了就不再更换职业；(2)少部分离职的人年龄极大，本文推测是因为推出导致的离职。
从图中也可以看出离职情况和性别关系是不大的。

探索Attrition和WorkLifeBalance、DistanceFromHome之间的关系

ggplot(ibm,aes(WorkLifeBalance,DistanceFromHome,color=Attrition))+geom_point(position = 'jitter')+scale_fill_manual(values = c("#7EC0EE","#EEA2AD"))

从公司到家里距离的以及生活幸福的平衡情况两个维度看，所有离职的数据点基本上是均匀分布的，所以距离和平衡度对离职情况并不产生重要影响
图中也反映了一个真实情况，家里距离公司近的员工人数较多

探索Attrition与Education、EducationField之间的关系

levels(ibm$EducationField) <- c("HR", "LS", "MRK", "MED", "Oth", "TD")
p5 <- ggplot(ibm, aes(x = Education, fill = Attrition)) + 
  geom_histogram(stat="count")+scale_fill_manual(values = c("#7EC0EE","#EEA2AD"))+coord_flip()
p6 <- ggplot(ibm, aes(x = EducationField, fill = Attrition)) + 
  geom_histogram(stat="count")+scale_fill_manual(values = c("#7EC0EE","#EEA2AD"))+coord_flip()
grid.arrange(p5, p6, ncol = 1, nrow = 2)

从图中可以看到，教育程度和离职情况有一定关系，离职率随着教育程度的不断增加先呈增加趋势再降低
从图中也可以看到，教育研究领域中Life Sciences的离职率较高，HR和其他领域的离职率较低

探索Attrition与JobSatisfaction、RelationshipSatisfaction、EnvironmentSatisfaction之间的关系

s1 <- ggplot(ibm, aes(x = JobSatisfaction, fill = Attrition)) + 
  geom_bar()+scale_fill_manual(values = c("#7EC0EE","#EEA2AD"))
s2 <- ggplot(ibm, aes(x = RelationshipSatisfaction, fill = Attrition)) + 
  geom_bar()+scale_fill_manual(values = c("#7EC0EE","#EEA2AD"))
levels(ibm$JobRole) <- c("HC", "HR", "LT", "Man", "MD", "RD", "RS", "SE", "SR")
s3 <- ggplot(ibm, aes(x = EnvironmentSatisfaction, fill = Attrition)) + 
  geom_bar()+scale_fill_manual(values = c("#7EC0EE","#EEA2AD"))
grid.arrange(s1, s2, s3, ncol = 3, nrow = 1)

从图中可以看出个人对公司内部各方面的满意度并不直接导致离职，离职率不随着满意度上升而降低，因此可以说明人们对IBM公司的满意度高低与是否离职无关

探索Attrition与JobInvolvement、JobLevel、JobRole的关系

w1 <- ggplot(ibm, aes(x = JobInvolvement, fill = Attrition)) + 
  geom_bar()+scale_fill_manual(values = c("#7EC0EE","#EEA2AD"))+coord_flip()
w2 <- ggplot(ibm, aes(x = JobLevel, fill = Attrition)) + 
  geom_bar()+scale_fill_manual(values = c("#7EC0EE","#EEA2AD"))+coord_flip()
levels(ibm$JobRole) <- c("HC", "HR", "LT", "Man", "MD", "RD", "RS", "SE", "SR")
w3 <- ggplot(ibm, aes(x = JobRole, fill = Attrition)) + 
  geom_bar()+scale_fill_manual(values = c("#7EC0EE","#EEA2AD"))+coord_flip()
grid.arrange(w1, w2, w3, ncol = 1, nrow = 3)

工作的参与度情况与离职率也没有相关关系
工作的层级越高离职数量越少，联系实际，导致这个的原因是（1）工作层架高的员工基数本身就小，所以离职人数相对来说也会较少（2）人们在一个公司工作很久已经升上管理层，那么换工作的想法会比较小，相反，底层员工则会不断寻找自己最适合的工作而不断的换岗位。
从图中可以看到，Sales Executive，Sales Representative，Laboratory Technician离职率较高，这些工作相对来说属于低层级的工作，而Manufacturing Director，Manager，Research Director离职率较低，这些部门主管、经理则是在公司待得比较久的，也和刚才分析的工作层级和离职率的关系相符合。

探索Attrition与BusinessTravel、Department、OverTime、TrainingTimesLastYear之间的关系

levels(ibm$BusinessTravel) <- c("R", "F", "N")
levels(ibm$Department) <- c("S", "RD", "HR")
a1 <- ggplot(ibm, aes(x = BusinessTravel, fill = Attrition)) + 
  geom_bar()+scale_fill_manual(values = c("#7EC0EE","#EEA2AD"))+coord_flip()
a2 <- ggplot(ibm, aes(x = Department, fill = Attrition)) + 
  geom_bar()+scale_fill_manual(values = c("#7EC0EE","#EEA2AD"))+coord_flip()
a3 <- ggplot(ibm, aes(x = OverTime, fill = Attrition)) + 
  geom_bar()+scale_fill_manual(values = c("#7EC0EE","#EEA2AD"))
a4 <- ggplot(ibm, aes(x = TrainingTimesLastYear, fill = Attrition)) + 
  geom_bar()+scale_fill_manual(values = c("#7EC0EE","#EEA2AD"))
grid.arrange(a1, a2, a3, a4, ncol = 2, nrow = 2)

左上图中，出差次数越少，离职率越高
右上图中，RD部门离职人数较多，但是RD部门的总人数较多，所以也不能说明情况
左下图中，是否加班与离职情况有紧密关系，明显加班的人离职率较高
右下图中，去年在公司受培训的次数与离职率也没有明显关系

探索Attrition与PerformanceRating、StockOptionLevel、PercentSalaryHike之间的关系

ggplot(ibm,aes(PerformanceRating,StockOptionLevel,color=PercentSalaryHike))+
  geom_point(position = 'jitter')+
  facet_wrap(~Attrition)+ggtitle("Attrition")

从图中可以看出，离职率随StockOptionLevel增长而降低，随PerformanceRating越好而降低

探索MonthlyIncome、HourlyRate、DailyRate、MonthlyRate之间的关系

g1<-ggplot(ibm, aes(x  = MonthlyIncome, fill = Attrition,
    alpha = .7)) +geom_density()+scale_fill_manual(values = c("#7EC0EE","#EEA2AD"))
g2<-ggplot(ibm, aes(x  = HourlyRate, fill = Attrition,
    alpha = .7)) +geom_density()+scale_fill_manual(values = c("#7EC0EE","#EEA2AD"))
g3<-ggplot(ibm, aes(x  = DailyRate, fill = Attrition,
    alpha = .7)) +geom_density()+scale_fill_manual(values = c("#7EC0EE","#EEA2AD"))
g4<-ggplot(ibm, aes(x  = MonthlyRate, fill = Attrition,
    alpha = .7)) +geom_density()+scale_fill_manual(values = c("#7EC0EE","#EEA2AD"))
grid.arrange(g1, g2, g3, g4, ncol = 2, nrow = 2)

从图中可以看出，大部分离开的人月收入和日率相对较低，小时费率和月利率则和离职率没有什么显而易见的关系。

RandomForest

加载需要的包

#install.packages('randomForest')
#install.packages('party')
#install.packages('rpart.plot')
#install.packages('rattle')
#install.packages('rpart')
library(randomForest)
library(party)
library(rpart.plot)
library(rattle)
library(rpart)

将样本分为80%训练数据，20%测试数据

set.seed(12345)
ibm<-ibm[c(-9,-10,-22,-27)]
ins<-sample(2,nrow(ibm),replace = TRUE,prob = c(0.8,0.2))
trainData<-ibm[ins==1,]
testData<-ibm[ins==2,]

建立随机森林模型

ibm.rf1<-randomForest(Attrition~.,trainData,ntree=500,nPerm=10,mtry=30,proximity=TRUE,importance=TRUE)
print(ibm.rf1)
## 
## Call:
##  randomForest(formula = Attrition ~ ., data = trainData, ntree = 500,      nPerm = 10, mtry = 30, proximity = TRUE, importance = TRUE) 
##                Type of random forest: classification
##                      Number of trees: 500
## No. of variables tried at each split: 30
## 
##         OOB estimate of  error rate: 14.03%
## Confusion matrix:
##      No Yes class.error
## No  961  16  0.01637666
## Yes 147  38  0.79459459

varImpPlot(ibm.rf1,main='Ranking variable importance that associated with nest site selection of the ibm by Random Forest1')

• 随机森林预测模型的误差率14.03%，模型需要进一步优化

画出决策树

dtree1 <- rpart(Attrition ~., data = trainData)
fancyRpartPlot(dtree1,cex=0.7)
print(dtree1)
## n= 1162 
## 
## node), split, n, loss, yval, (yprob)
##       * denotes terminal node
## 
##   1) root 1162 185 No (0.84079174 0.15920826)  
##     2) TotalWorkingYears>=1.5 1090 150 No (0.86238532 0.13761468)  
##       4) OverTime=No 798  75 No (0.90601504 0.09398496) *
##       5) OverTime=Yes 292  75 No (0.74315068 0.25684932)  
##        10) MonthlyIncome>=3924 206  33 No (0.83980583 0.16019417)  
##          20) JobRole=HC,HR,LT,Man,MD,RD,RS,SR 140  12 No (0.91428571 0.08571429) *
##          21) JobRole=SE 66  21 No (0.68181818 0.31818182)  
##            42) StockOptionLevel>=0.5 37   5 No (0.86486486 0.13513514) *
##            43) StockOptionLevel< 0.5 29  13 Yes (0.44827586 0.55172414)  
##              86) WorkLifeBalance>=2.5 21   8 No (0.61904762 0.38095238)  
##               172) YearsInCurrentRole< 6.5 13   2 No (0.84615385 0.15384615) *
##               173) YearsInCurrentRole>=6.5 8   2 Yes (0.25000000 0.75000000) *
##              87) WorkLifeBalance< 2.5 8   0 Yes (0.00000000 1.00000000) *
##        11) MonthlyIncome< 3924 86  42 No (0.51162791 0.48837209)  
##          22) Age>=33.5 43  13 No (0.69767442 0.30232558)  
##            44) BusinessTravel=N 34   7 No (0.79411765 0.20588235) *
##            45) BusinessTravel=R,F 9   3 Yes (0.33333333 0.66666667) *
##          23) Age< 33.5 43  14 Yes (0.32558140 0.67441860)  
##            46) NumCompaniesWorked< 1.5 30  14 Yes (0.46666667 0.53333333)  
##              92) JobRole=RS 19   7 No (0.63157895 0.36842105) *
##              93) JobRole=HR,LT,SR 11   2 Yes (0.18181818 0.81818182) *
##            47) NumCompaniesWorked>=1.5 13   0 Yes (0.00000000 1.00000000) *
##     3) TotalWorkingYears< 1.5 72  35 No (0.51388889 0.48611111)  
##       6) Age>=33.5 10   0 No (1.00000000 0.00000000) *
##       7) Age< 33.5 62  27 Yes (0.43548387 0.56451613)  
##        14) HourlyRate>=53 45  20 No (0.55555556 0.44444444)  
##          28) MaritalStatus=Divorced 8   0 No (1.00000000 0.00000000) *
##          29) MaritalStatus=Married,Single 37  17 Yes (0.45945946 0.54054054)  
##            58) OverTime=No 24   9 No (0.62500000 0.37500000) *
##            59) OverTime=Yes 13   2 Yes (0.15384615 0.84615385) *
##        15) HourlyRate< 53 17   2 Yes (0.11764706 0.88235294) *

在测试集上测试训练集上建立的随机森林

ibm.pre1<-predict(ibm.rf1,testDataprop.table(table(predictd=ibm.pre1,observed=ibm[ins==2,"Attrition"], dnn = c( "Predicted","Actual")),1)
##          Actual
## Predicted        No       Yes
##       No  0.8671329 0.1328671
##       Yes 0.3636364 0.6363636

• 结果中可以看到，预测的结果和实际差别有点大，需要进行模型优化

优化决策模型

ibm.rf2<-randomForest(ibm[,c('Age','BusinessTravel','EducationField','JobInvolvement','JobLevel','JobRole','JobSatisfaction','MonthlyIncome','NumCompaniesWorked','OverTime','StockOptionLevel','TotalWorkingYears','YearsAtCompany')],ibm[,'Attrition'],importance = TRUE,ntree=500)
print(ibm.rf2)
## Call:
##  randomForest(x = ibm[, c("Age", "BusinessTravel", "EducationField",      "JobInvolvement", "JobLevel", "JobRole", "JobSatisfaction",      "MonthlyIncome", "NumCompaniesWorked", "OverTime", "StockOptionLevel",      "TotalWorkingYears", "YearsAtCompany")], y = ibm[, "Attrition"],      ntree = 500, importance = TRUE) 
##                Type of random forest: classification
##                      Number of trees: 500
## No. of variables tried at each split: 3
## 
##         OOB estimate of  error rate: 13.88%
## Confusion matrix:
##       No Yes class.error
## No  1204  29  0.02351987
## Yes  175  62  0.73839662

varImpPlot(ibm.rf2,main='Ranking variable importance that associated with nest site selection of the ibm by Random Forest2')

• 随机森林预测模型优化后的的误差率13.88%，有微小降低，但是仍然很高，需要继续优化

dtree2 <- rpart(Attrition ~Age+BusinessTravel+EducationField+JobInvolvement+JobLevel+             JobRole+JobSatisfaction+MonthlyIncome+NumCompaniesWorked+OverTime+StockOptionLevel+TotalWorkingYears+YearsAtCompany, data = trainData)
fancyRpartPlot(dtree2,cex=0.7)

print(dtree2)
## n= 1162 
## 
## node), split, n, loss, yval, (yprob)
##       * denotes terminal node
## 
##   1) root 1162 185 No (0.84079174 0.15920826)  
##     2) TotalWorkingYears>=1.5 1090 150 No (0.86238532 0.13761468)  
##       4) OverTime=No 798  75 No (0.90601504 0.09398496) *
##       5) OverTime=Yes 292  75 No (0.74315068 0.25684932)  
##        10) MonthlyIncome>=3924 206  33 No (0.83980583 0.16019417)  
##          20) JobRole=HC,HR,LT,Man,MD,RD,RS,SR 140  12 No (0.91428571 0.08571429) *
##          21) JobRole=SE 66  21 No (0.68181818 0.31818182)  
##            42) StockOptionLevel>=0.5 37   5 No (0.86486486 0.13513514) *
##            43) StockOptionLevel< 0.5 29  13 Yes (0.44827586 0.55172414)  
##              86) MonthlyIncome< 7933 22   9 No (0.59090909 0.40909091)  
##               172) NumCompaniesWorked< 2 14   4 No (0.71428571 0.28571429) *
##               173) NumCompaniesWorked>=2 8   3 Yes (0.37500000 0.62500000) *
##              87) MonthlyIncome>=7933 7   0 Yes (0.00000000 1.00000000) *
##        11) MonthlyIncome< 3924 86  42 No (0.51162791 0.48837209)  
##          22) Age>=33.5 43  13 No (0.69767442 0.30232558)  
##            44) BusinessTravel=N 34   7 No (0.79411765 0.20588235) *
##            45) BusinessTravel=R,F 9   3 Yes (0.33333333 0.66666667) *
##          23) Age< 33.5 43  14 Yes (0.32558140 0.67441860)  
##            46) NumCompaniesWorked< 1.5 30  14 Yes (0.46666667 0.53333333)  
##              92) JobRole=RS 19   7 No (0.63157895 0.36842105) *
##              93) JobRole=HR,LT,SR 11   2 Yes (0.18181818 0.81818182) *
##            47) NumCompaniesWorked>=1.5 13   0 Yes (0.00000000 1.00000000) *
##     3) TotalWorkingYears< 1.5 72  35 No (0.51388889 0.48611111)  
##       6) Age>=33.5 10   0 No (1.00000000 0.00000000) *
##       7) Age< 33.5 62  27 Yes (0.43548387 0.56451613)  
##        14) OverTime=No 40  17 No (0.57500000 0.42500000)  
##          28) EducationField=LS,MED,Oth 32  10 No (0.68750000 0.31250000) *
##          29) EducationField=HR,MRK,TD 8   1 Yes (0.12500000 0.87500000) *
##        15) OverTime=Yes 22   4 Yes (0.18181818 0.81818182) *

Gradient Boosting Machines

加载需要的包

#install.packages('caret')
#install.packages('gbm')
#install.packages('ROCR')
#install.packages('pROC')
library(ROCR)
library(pROC)
library(gbm)
library(caret)

将响应变量转为0-1格式

data <- ibm[c(-9,-10,-22,-27)]
data$Attrition <- as.numeric(data$Attrition)
data <- transform(data,Attrition=Attrition-1)

建立模型并预测，求出auc值

model <- gbm(Attrition~.,data=data,shrinkage=0.01,            distribution='bernoulli',cv.folds=5,n.trees=3000,verbose=F)
gbm.predict = predict(model,data)
## Using 2188 trees...

auc(data$Attrition,gbm.predict)
## Area under the curve: 0.8848

可以看到模型预测的精确度达到88.48%

用交叉检验确定最佳迭代次数

best.iter <- gbm.perf(model,method='cv')

观察各变量的重要程度

summary(model,best.iter)


##                                               var    rel.inf
## OverTime                                 OverTime 13.4554665
## MonthlyIncome                       MonthlyIncome  9.4844019
## JobRole                                   JobRole  8.3738137
## Age                                           Age  6.8159676
## StockOptionLevel                 StockOptionLevel  6.5639248
## TotalWorkingYears               TotalWorkingYears  4.8031740
## NumCompaniesWorked             NumCompaniesWorked  4.7993857
## JobInvolvement                     JobInvolvement  4.5517174
## BusinessTravel                     BusinessTravel  4.0257955
## DailyRate                               DailyRate  3.9737030
## YearsWithCurrManager         YearsWithCurrManager  3.7192388
## DistanceFromHome                 DistanceFromHome  3.5723627
## JobSatisfaction                   JobSatisfaction  3.4075800
## EducationField                     EducationField  3.3547052
## YearsAtCompany                     YearsAtCompany  3.2044773
## RelationshipSatisfaction RelationshipSatisfaction  2.6068148
## JobLevel                                 JobLevel  2.3288474
## MonthlyRate                           MonthlyRate  2.3059917
## YearsSinceLastPromotion   YearsSinceLastPromotion  2.2537875
## TrainingTimesLastYear       TrainingTimesLastYear  2.1625711
## HourlyRate                             HourlyRate  1.2800840
## MaritalStatus                       MaritalStatus  1.1688000
## PercentSalaryHike               PercentSalaryHike  0.9610313
## Education                               Education  0.4673412
## YearsInCurrentRole             YearsInCurrentRole  0.3590171
## Department                             Department  0.0000000

综上所述，我们认为影响IBM公司员工离职最重要的5个因素是：OverTime、MonthlyIncome、JobRole、Age、StockOptionLevel.因此，我们建议IBM公司可以从以下几个方面进行优化改进从而留住员工：

（1）合理安排工作计划，减少加班频率；

（2）在公司能够财务状况允许的合理范围内尽量为员工增加工资，员工是公司最重要的财富，因此公司应该为留住员工而努力；

（3）职业的选择关乎员工的能力、兴趣等各个方面，这不是公司能够决定的，但是建议公司可以根据现有的离职率较高的职业，对其人员进行合理的关怀，以得打最好的效果；

（4）年龄也是影响人员流动率的一个主要因素，刚进公司的人员离职率较高，建议公司可以在两个方面进行提升：第一，HR方面应该重点关注，是否在招聘时没有找到最合适该岗位的人才，或者将人才用错了地方；第二，公司可以适当地为初进入公司的职员进行相应人文关怀，并配备导师为其进行指导，降低人员的流动率。

使用 @EmbeddedId 和 @ManyToOne 实现复合主键的 JPA 实践 t0_54manong 个人开发
在实际的软件开发中，我们常常需要处理复杂的实体关系，尤其是在数据库设计中，复合主键的使用场景非常常见。本文将通过一个具体的例子，展示如何在JavaPersistenceAPI(JPA)中使用@EmbeddedId和@ManyToOne注解来实现复合主键，并通过Hibernate进行数据持久化和查询。一、背景与需求假设我们有一个员工任务管理系统，其中员工（Employee）和任务（Task）是一对多
华为OD机试E卷 --最大社交距离--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript c语言 python
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述疫情期间需要大家保证一定的社交距离，公司组织开交流会议。座位一排共N个座位，编号分别为[0,N-1]。要求员工一个接着一个进入会议室，并且可以在任何时候离开会议室。满足：•每当一个员工进入时，需要坐到最大社交距离（最大化自己和其他人的距离的座位）；•如果有多个这样的座位，则坐
R 语言科研绘图第 18 期 --- 箱线图-散点 TigerZ 生信宝库 r语言贴图开发语言程序人生
在发表科研论文的过程中，科研绘图是必不可少的，一张好看的图形会是文章很大的加分项。为了便于使用，本系列文章介绍的所有绘图都已收录到了sciRplot项目中，获取方式：R语言科研绘图模板---sciRplothttps://mp.weixin.qq.com/s/QA_8LVqjkdg4A16zLonw4w?payreadticket=HLhuy98A4H7uWmJW_snkz-a2Wljhix8ma
柜员需要掌握的计算机知识,有多少计算机专业去银行后悔的，可以说说吗？酸甜草莓二侠柜员需要掌握的计算机知识
我就是计算机专业毕业后去银行工作的，也不存在后不后悔，这里从2点分析到底值不值得。第一点：去银行做综合柜员。从这方面来说绝大部分人几年后会后悔，因为现在的综合柜员说白了就是服务员、销售员，客户来办理业务你要各种服务到位，不然后期会通报批评(头上都是监控)，除了办理业务外，还要完成各种任务考核，完不成任务每天早会、夕会通报，让你颜面扫地。综合柜员在基层网点可以说是没有任何尊严的，这也是很多人离职的重
【数据挖掘实战】房价预测机器学习司猫白数据挖掘人工智能 python 机器学习
本次对kaggle中的入门级数据集，房价回归数据集进行数据挖掘，预测房屋价格。本人主页：机器学习司猫白机器学习专栏：机器学习实战PyTorch入门专栏：PyTorch入门深度学习实战：深度学习ok，话不多说，我们进入正题吧概述本次竞赛有79个解释变量（几乎）描述了爱荷华州艾姆斯住宅的各个方面，需要预测每套住宅的最终价格。数据集描述本次数据集已经上传，大家可以自行下载尝试文件说明train.csv-
华为今年的人均分红。。前端后端程序员华为
华为分红1月18日，华为发布内部文件，公布了ESOP（员工持股计划）的2024年度分红。每股价格7.85元，每股分红1.41元，分红收益率达18%（税前）。总的来说，股价没变，分红收益率下降了。虽然相比于2023年度每股分红1.5（税前收益率19.1%），同比下降了6%，但收益率18%还是相当顶尖的。要知道，2024年，保本理财已经正式进入2字头的时代了。我们可以回顾一下自2010年以来，华为「股
【R语言】debug：run all 和 knit 有什么区别？ tsumikistep BME_生物医学工程杂记 r语言开发语言
文章目录1.RunAll2.Knit具体区别示例使用`RunAll`使用`Knit`总结在R语言中，特别是在RMarkdown文档（.Rmd）中，RunAll和Knit是两个常用的执行代码的选项，但它们在功能和行为上有一些重要的区别。1.RunAll定义：RunAll是指在RMarkdown文档中运行所有代码块，但不生成最终的输出文档。用途：主要用于在开发过程中快速检查代码的执行情况，确保所有代码
CBK-D1-安全与风险管理-思维导图.md 青葱味奶糖 CISSP 安全思维导图 cissp osg 安全与风险管理
CBK-D1-安全与风险管理osg-ch2-人员安全和风险管理的概念人员安全人员经常被视为最脆弱的元素招聘新员工的步骤创建岗位描述岗位描述并非专用于招聘过程，在组织的整个生命周期中进行维护设置工作级别筛选应聘者候选人筛选背景调查#######工作和教育背景#######检查推荐信#######验证学历#######访谈同事#######个人面试#######信用核查#######性格测试和评估##
数据挖掘：定义、挑战与应用黑色叉腰丶大魔王数据挖掘人工智能
一、数据挖掘的定义（一）概念阐述数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它融合了数据库技术、统计学、机器学习、人工智能等多学科的理论和方法，旨在通过对数据的深入分析和处理，发现有价值的模式、关联、趋势等，从而为决策提供支持。（二）与相关概念的区别与联系数据库管理：数据库管理侧重于数据的存储、组织、检索和维护
FunASR语言识别的环境安装、推理山山而川_R FunASR r语言 xcode 开发语言
目录一、环境配置1、创建虚拟环境2、安装环境及pytorch官网：pytorch下载地址3、安装funasr之前，确保已经安装了下面依赖环境:python代码调用（推荐）4、模型下载5、启动funasr服务二、客户端连接2.1html连接三、推理识别模型1、实时语音识别2、非实时语音识别一、环境配置源码地址：FunASRFunASR/README_zh.mdatmain·alibaba-damo-
使用Google Vertex AI Search进行企业级高级搜索 hgSdaegva 人工智能 python
技术背景介绍GoogleVertexAISearch（前称为EnterpriseSearchonGenerativeAIAppBuilder）是GoogleCloud提供的VertexAI机器学习平台的一部分。VertexAISearch允许组织快速建立由生成式AI驱动的搜索引擎，为客户和员工提供服务。它基于各种GoogleSearch技术，包括语义搜索，通过使用自然语言处理和机器学习技术来推断内
3章mysql表连接查询_mysql学习笔记（六）--- 多表查询之外键、表连接、子查询、索引... kindle电子书单 3章mysql表连接查询
本章主要内容：一、外键二、表连接三、子查询四、索引一、外键：1、什么是外键2、外键语法3、外键的条件4、添加外键5、删除外键1、什么是外键：主键：是唯一标识一条记录，不能有重复的，不允许为空，用来保证数据完整性外键：是另一表的主键,外键可以有重复的,可以是空值，用来和其他表建立联系用的。所以说，如果谈到了外键，一定是至少涉及到两张表。例如下面这两张表：上面有两张表：部门表(dept)、员工表(em
如何设计给研发人员的激励方案研发
在现代企业中，研发人员的激励方案设计对于提升团队效率、加强创新和提升员工满意度至关重要。要设计一个有效的激励方案，企业需要综合考虑研发人员的需求、激励方式的多样性以及目标的精准匹配。与其他职能部门不同，研发人员往往更加注重工作中的自主性、技术挑战以及成长机会，而非单纯的金钱奖励。因此，一个理想的激励方案应当能够平衡物质激励与精神激励，通过给予研发人员更多的自主空间、技术上的挑战以及职业发展上的机会
JDBC基础编程练习 Ssaty. 编程 java python
第1关：JDBC更新员工密码本关任务：借助JDBC在库名tsgc中完成对数据表employee中性别为“女”的员工密码修改为“hello”；packagestep1;importjava.sql.*;publicclassUpdatePass{//修改数据publicstaticvoidupdateDB(){
AI产品经理还不会数据挖掘❓看完这篇就够了脱泥不tony 人工智能产品经理数据挖掘 python tensorflow 开发语言 llama
前言在数字化时代的浪潮中，AI产品经理正成为推动科技与商业融合的重要力量。然而，面对海量的数据，如何从中挖掘出有价值的信息，为AI产品的开发提供有力支持？这已成为AI产品经理必须面对的挑战。今天，我们就来探讨一下数据挖掘在AI产品经理工作中的重要性，以及如何通过掌握数据挖掘方法论，打造卓越的AI产品。一、数据挖掘：AI产品经理的必备技能在AI产品的世界中，大数据是构建一切的基础。无论是算法组件、知
C#单点登录（SSO）：解锁高效访问的密码步、步、为营 c#开发语言
一、单点登录（SSO）初相识在数字化办公的浪潮中，单点登录（SingleSign-On，简称SSO）技术犹如一把神奇的钥匙，为我们开启了便捷、高效的访问之门。它打破了传统登录方式的束缚，让用户在访问多个应用系统时，只需进行一次登录操作，就能畅游无阻。想象一下，你是一位忙碌的企业员工，每天需要频繁使用各种办公软件，如邮件系统、项目管理工具、财务报表平台等。在没有SSO之前，你可能需要为每个系统分别记
R语言的编程范式编程小筑包罗万象 golang 开发语言后端
R语言的编程范式探讨引言R语言作为一种专门用于统计分析和数据可视化的编程语言，近年来得到了广泛的应用。无论是在学术研究、企业分析，还是在数据科学的各个领域，R语言凭借其强大的数据处理能力和丰富的图形化工具，吸引了大批用户。在这一背景下，理解R语言的编程范式对于提升我们的编程能力、优化数据分析过程具有重要意义。本文将探讨R语言的编程范式，包括其命令式编程、函数式编程、面向对象编程等特性，并通过实例分
R语言机器学习算法实战系列（十九）特征选择之Monte Carlo算法（Monte Carlo Feature Selection）生信学习者1 R语言机器学习实战 r语言机器学习算法数据分析数据挖掘数据可视化人工智能
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍原理步骤下载数据加载R包导入数据数据预处理数据分割MCFS运行MCFS-ID过程混淆矩阵重要特征的RI最小阈值距离与共同部分收敛特征重要性排序选择重要特征构建特征依赖图提取重要特征基于重要特征构建随机森林模型混淆矩阵评估模型AUC曲线刻画模型在训练和测试数据集的表现总结系统信息介绍特征选择（FeatureSel
node.js基于的人事管理系统程序+论文可用于毕业设计亦月学姐毕设 node.js 课程设计
本系统（程序+源码+数据库+调试部署+开发环境）带文档lw万字以上，文末可获取源码系统程序文件列表开题报告内容选题背景关于人事管理系统的研究，现有研究主要以传统模式下的人事信息管理为主，多侧重于基本的员工信息存储与简单的考勤统计等功能实现。专门针对集成化、智能化且功能全面覆盖现代企业人事管理各环节的研究较少。在国外，一些先进的人事管理系统已具备高度自动化和数据分析功能，但因国情和企业管理文化差异，
告别 Excel，拥抱 R 语言：开启数据分析新时代码农老关【关东升】 excel r语言数据分析
在这个数据驱动的时代，数据分析已然成为每个行业的核心竞争力。从市场营销到金融领域，从医疗健康到教育行业，数据无处不在，深刻影响着每一个决策。然而，面对日益复杂的数据集，单纯依靠Excel进行分析，已渐渐难以满足不断增长的需求。为何弃Excel选R语言？强大的数据处理能力Excel简单易用，但其处理大数据集时，效率与能力着实有限。R语言作为专业的数据分析工具，处理成千上万的数据行不在话下，还支持丰富
华为发展历程：战略转型与分析常耀斌网络
纵观30多年的发展历程，在创始人任正非及创业团队奋力牵引下，全体员工共同奋斗，华为实现了从“一无所有”到“三分天下”、从“积极跟随者”到“行业领先者”的跨越式发展。华为在业务战略上经历了数次变革，分别是从农村到城市，从国内市场走向全球化，从B2B市场向B2b、B2C市场及云管端一体化转型变革。另外，自2019年起，华为遭受M国不断加码的政策打压。华为的发展历程可以划分为五个阶段:一是，创业初期(1
云鲸智能大裁员：AI代码生成器时代，企业如何应对寒冬？前端
近日，云鲸智能大裁员的消息引发了行业震动，涉及研发、测试等多个部门，部分团队甚至裁员比例高达65%。这一事件不仅凸显了智能家电行业面临的挑战，也引发了人们对企业发展与员工权益的深思。本文将深入分析云鲸智能裁员事件，探讨其背后的原因、行业影响以及未来展望，并思考在AI代码生成器等新技术浪潮下，企业如何更好地应对挑战。事件分析：寒冬下的无奈之举？云鲸智能此次裁员规模巨大，受影响员工涵盖老员工、应届生和
mysql窗口函数（保姆级文档）文学者 mysql mysql 数学建模数据库
mysql窗口函数第一步：创建数据库第二步：创建表格第三步：插入数据第四步:窗口函数1、序号函数2、其他函数3、头尾函数4、聚合函数5、分布函数6、前后函数第一步：创建数据库CREATEDATABASEjwdgUSE`jwdg`;第二步：创建表格DROPTABLEemployee;CREATETABLEemployee(employee_idINTPRIMARYKEY,--员工idemployee
R语言的面向对象编程 2501_90183952 包罗万象 golang 开发语言后端
R语言的面向对象编程在现代编程中，面向对象编程（Object-OrientedProgramming，OOP）是一种重要的编程范式，它通过将数据和操作数据的函数结合在一起，来提高代码的重用性和可维护性。在R语言中，面向对象编程并不是一开始就被引入的，但随着其发展，R逐渐支持了多种面向对象编程的系统，例如S3、S4以及R6等。本文将深入探讨R语言的面向对象编程，介绍其基本概念、特点以及在实际应用中的
Leetcode高频 SQL 50 题（基础版）（二） LiquoriceG leetcode sql
一、员工奖金表：Employee+-------------+---------+|ColumnName|Type|+-------------+---------+|empId|int||name|varchar||supervisor|int||salary|int|+-------------+---------+empId是该表中具有唯一值的列。该表的每一行都表示员工的姓名和id，以及他们
云鲸智能大裁员：AI代码生成器时代，企业如何应对寒冬？前端
近日，云鲸智能大裁员的消息引发了行业震动，涉及研发、测试等多个部门，部分团队甚至裁员比例高达65%。这一事件不仅凸显了智能家电行业面临的挑战，也引发了人们对企业发展与员工权益的深思。本文将深入分析云鲸智能裁员事件，探讨其背后的原因、行业影响以及未来展望，并思考在AI代码生成器等新技术浪潮下，企业如何更好地应对挑战。事件分析：寒冬下的无奈之举？云鲸智能此次裁员规模巨大，受影响员工涵盖老员工、应届生和
人工智能时代，企业如何搭建自己的AI知识库知识库知识库管理知识库软件
随着人工智能技术的迅猛发展，企业越来越意识到构建AI知识库的重要性。AI知识库不仅能够高效管理企业的海量知识资源，还能通过智能检索和推荐，提升员工的工作效率，促进企业的创新与发展。本文将详细探讨企业如何搭建自己的AI知识库，包括前期准备、技术选型、构建过程及后续维护等方面。一、前期准备在构建AI知识库之前，企业需要进行充分的前期准备，明确需求和目标。确定需求和目标企业首先需要明确知识库的服务对象、
曝华为鸿蒙PC有望今年上市；腾讯撤回“微信蓝包”商标注册；荣耀管理层大洗牌，中国区CMO将离职 | 极客头条极客日报华为 harmonyos 微信
「极客头条」——技术人员的新闻圈！CSDN的读者朋友们好，「极客头条」来啦，快来看今天都有哪些值得我们技术人关注的重要新闻吧。整理|苏宓出品|CSDN（ID：CSDNnews）一分钟速览新闻点！赵明离职之后荣耀管理层大洗牌，荣耀中国区CMO将离职曝华为鸿蒙PC正做半公开测试找新Bug，今年有望上市腾讯撤回“微信蓝包”商标注册，马化腾：希望外界不要对“送礼物”功能过度吹捧CNNIC报告称中国有2.4
在VScode设置R语言 weixin_39287540 R windows mac
在VScode设置R语言1.下载R语言和VScode2.安装所需要的插件3.下载对接RLSP的R包3.下载Radian4.设置VScode中的路径1.下载R语言和VScodeR语言官网：https://www.r-project.orgVScode官网：https://code.visualstudio.com/2.安装所需要的插件必须的插件有2个：R和RLSPClient3.下载对接RLSP的R
双非一本，非科班，外包，拿到互联网大厂 Offer！ java
大家好，我是R哥。之前分享过外包进自研、外包进国企的不可思议的案例，今天我再分享一个激动人心的面试辅导案例，外包进大厂。。。一个双非一本+非科班+外包的兄弟，离职后，通过我们的辅导，拿到两个offer:一个互联网大厂offer，涨幅40%+；一个互联网中厂offer，涨幅50%+；最终选择去了大厂，即使薪资少一丢丢，毕竟大厂的薪资要更稳，既能圆自己的大厂梦，实现了人生的逆袭，也能刷一下的履历。这兄
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><

IBM's Attribution

数据探索

插入数据

加载需要的包

探索Attrition和Gender、Age之间的关系

探索Attrition和WorkLifeBalance、DistanceFromHome之间的关系

探索Attrition与Education、EducationField之间的关系

探索Attrition与JobSatisfaction、RelationshipSatisfaction、EnvironmentSatisfaction之间的关系

探索Attrition与JobInvolvement、JobLevel、JobRole的关系

探索Attrition与BusinessTravel、Department、OverTime、TrainingTimesLastYear之间的关系

探索Attrition与PerformanceRating、StockOptionLevel、PercentSalaryHike之间的关系

探索MonthlyIncome、HourlyRate、DailyRate、MonthlyRate之间的关系

RandomForest

加载需要的包

将样本分为80%训练数据，20%测试数据

建立随机森林模型

画出决策树

在测试集上测试训练集上建立的随机森林

优化决策模型

Gradient Boosting Machines

加载需要的包

将响应变量转为0-1格式

建立模型并预测，求出auc值

用交叉检验确定最佳迭代次数

观察各变量的重要程度

你可能感兴趣的:(r语言,离职,员工,r语言数据挖掘)