Labryant

Xgboost简易入门教程

　最近准备研究一下信贷风控中机器学习模型评分卡的制作。信贷评分卡分为两种，一种是用逻辑回归，称为评分卡；一种是用集成学习算法，称为机器学习模型。逻辑回归算法相对简单，但是解释性要求高；机器学习模型理论上效果要更好一点，但是无法解释，而且模型容易不稳定。于是找了一下网上能找到的关于机器学习模型做评分卡的案例，主要有拍拍贷比赛实例、金融风控实战、kaggle上的Home Credit Default Risk比赛，附上相应的课程或比赛链接。

拍拍贷比赛案例
https://www.bilibili.com/video/BV1NE41157Ag?p=29
金融风控实战
https://www.bilibili.com/video/BV18J411R7ei?p=11
Kaggle案例
https://www.kaggle.com/fanzzz/understand-variables-in-chinese

　本篇文章是一篇简单的xgboost快速上手的教程，不涉及算法推导，帮助自己回顾一下xgboost的基本用法，后续会再复习一下算法的推导过程以及优缺点。

一、读取数据并指定参数建模

xgboost读取数据有两种方式：

使用xgboost自带的数据集格式 + xgboost自带的建模方式

把数据读取成xgb.DMatrix格式(libsvm/dataframe.values给定X和Y)

准备好一个watch_list(观测和评估的数据集)

xgb.train(dtrain)

xgb.predict(dtest)

使用pandas的DataFrame格式 + xgboost的sklearn接口

estimator = xgb.XGBClassifier()/xgb.XGBRegressor()

estimator.fit(df_train.values, df_target.values)
先看一下第一种方式读取数据和建模的方法。

import numpy as np
import pandas as pd
import pickle
import xgboost as xgb
from sklearn.model_selection import train_test_split

data = pd.read_csv('./data/Pima-Indians-Diabetes.csv')

train, test = train_test_split(data)

# 转换成Dmatrix格式
feature_columns = ['Pregnancies', 'Glucose', 'BloodPressure', 'SkinThickness', 'Insulin', 'BMI', 'DiabetesPedigreeFunction', 'Age']
target_column = 'Outcome'
# 需要将dataframe格式的数据转化为矩阵形式
xgtrain = xgb.DMatrix(train[feature_columns].values, train[target_column].values)
xgtest = xgb.DMatrix(test[feature_columns].values, test[target_column].values)

#参数设定
param = {'max_depth':5, 'eta':0.1, 'silent':1, 'subsample':0.7, 'colsample_bytree':0.7, 'objective':'binary:logistic' }

# 设定watchlist用于查看模型状态
watchlist  = [(xgtest,'eval'), (xgtrain,'train')]
num_round = 10
bst = xgb.train(param, xgtrain, num_round, watchlist)

# 使用模型预测
preds = bst.predict(xgtest)

# 判断准确率
labels = xgtest.get_label()
print ('错误类为%f' % \
       (sum(1 for i in range(len(preds)) if int(preds[i]>0.5)!=labels[i]) /float(len(preds))))

# 模型存储
bst.save_model('./model/0002.model')

　第一点就是输入数据形式要转化成矩阵的形式，第二点就是watchlist参数用于查看模型的状态，也就是为了输出eval-error和train-error。然后再解释下几个参数的含义：

‘max_depth’:设置树的最大深度。默认为6。
‘eta’：学习率。默认为0.3。
‘silent’:0表示输出信息， 1表示安静模式。默认为0。
‘subsample’:观测的子样本的比率，即对总体进行随机抽样的比例。默认为1。
'colsample_bytree ':用于构造每棵树时变量的子样本比率.即特征抽样。默认为1。
‘objective’:最小化的损失函数。

　xgboost的参数可以分为三类，通用参数/general parameters, 集成(增强)参数/booster parameters 和任务参数/task parameters。
以上silent是通用参数，objective是任务参数，其它的都是集成参数。

　再来看一下使用sklearn接口进行建模的例子。

#!/usr/bin/python
import warnings
warnings.filterwarnings("ignore")
import numpy as np
import pandas as pd
import pickle
import xgboost as xgb
from sklearn.model_selection import train_test_split
from sklearn.externals import joblib

data = pd.read_csv('./data/Pima-Indians-Diabetes.csv')

train, test = train_test_split(data)

# 取出特征X和目标y的部分
feature_columns = ['Pregnancies', 'Glucose', 'BloodPressure', 'SkinThickness', 'Insulin', 'BMI', 'DiabetesPedigreeFunction', 'Age']
target_column = 'Outcome'
train_X = train[feature_columns].values
train_y = train[target_column].values
test_X = test[feature_columns].values
test_y = test[target_column].values

# 初始化模型
xgb_classifier = xgb.XGBClassifier(n_estimators=20,max_depth=4,learning_rate=0.1, subsample=0.7, colsample_bytree=0.7)

# 拟合模型
xgb_classifier.fit(train_X, train_y)

# 使用模型预测
preds = xgb_classifier.predict(test_X)

# 判断准确率
print ('错误类为%f' %((preds!=test_y).sum()/float(test_y.shape[0])))

# 模型存储
joblib.dump(xgb_classifier, './model/0003.model')

　读取数据和建模的大致流程就这么两种，下面结合xgb建模的方式进行深入地了解。
　利用xgb进行交叉验证。

param = {'max_depth':5, 'eta':0.1, 'silent':0, 'subsample':0.7, 'colsample_bytree':0.7, 'objective':'binary:logistic' }
num_round = 10
dtrain = xgb.DMatrix(train[feature_columns].values, train[target_column].values)

xgb.cv(param, dtrain, num_round, nfold=5,metrics={'error'}, seed = 0)

xgb.cv的参数的含义如下：

‘num_round’:最大迭代次数。
‘metric’:评价指标，一般用AUC。

　除了xgb自带的验证方法以外还有GridSearchCV交叉验证方法，后面会提到。然后进行添加预处理的交叉验证，即通过计算正负样本比调整样本的权重。

# 计算正负样本比，调整样本权重
def fpreproc(dtrain, dtest, param):
    label = dtrain.get_label()
    ratio = float(np.sum(label == 0)) / np.sum(label==1)
    param['scale_pos_weight'] = ratio
    return (dtrain, dtest, param)

# 先做预处理，计算样本权重，再做交叉验证
xgb.cv(param, dtrain, num_round, nfold=5,
       metrics={'auc'}, seed = 0, fpreproc = fpreproc)

　在参数里面加了一个’scale_pos_weight’,可以在样本类别不平衡的时候加速收敛。
　下面再进行自定义损失函数与评估准则，这也是xgb的优势所在。

print ('running cross validation, with cutomsized loss function')
# 自定义损失函数，需要提供损失函数的一阶导和二阶导
def logregobj(preds, dtrain):
    labels = dtrain.get_label()
    preds = 1.0 / (1.0 + np.exp(-preds))
    grad = preds - labels
    hess = preds * (1.0-preds)
    return grad, hess

# 自定义评估准则，评估预估值和标准答案之间的差距
def evalerror(preds, dtrain):
    labels = dtrain.get_label()
    return 'error', float(sum(labels != (preds > 0.0))) / len(labels)

watchlist  = [(dtest,'eval'), (dtrain,'train')]
param = {'max_depth':3, 'eta':0.1, 'silent':1}
num_round = 5
# 自定义损失函数训练
bst = xgb.train(param, dtrain, num_round, watchlist, logregobj, evalerror)
# 交叉验证
xgb.cv(param, dtrain, num_round, nfold = 5, seed = 0,
       obj = logregobj, feval=evalerror)

　针对业务改写评价函数，这里的要求是要保证损失函数二阶可导，原因只要推导一遍xgboost公式就理解了，因为其中有一步用到泰勒展开的二阶项。
　此外，xgb还可以只用前n棵树进行预测，用到的参数是ntree_limit，不再赘述。

　了解完xgb进行建模之后，再看一下使用sklearn进行xgb建模的实例。这里使用了鸢尾花数据集合波士顿房价预测数据集分别进行分类和回归的学习。

import pickle
import xgboost as xgb

import numpy as np
from sklearn.model_selection import KFold, train_test_split, GridSearchCV
from sklearn.metrics import confusion_matrix, mean_squared_error
from sklearn.datasets import load_iris, load_digits, load_boston

rng = np.random.RandomState(31337)

分类：

#二分类：混淆矩阵
print("数字0和1的二分类问题")
digits = load_digits(2)
y = digits['target']
X = digits['data']
kf = KFold(n_splits=2, shuffle=True, random_state=rng)
print("在2折数据上的交叉验证")
for train_index, test_index in kf.split(X):
    xgb_model = xgb.XGBClassifier().fit(X[train_index],y[train_index])
    predictions = xgb_model.predict(X[test_index])
    actuals = y[test_index]
    print("混淆矩阵:")
    print(confusion_matrix(actuals, predictions))

#多分类：混淆矩阵
print("\nIris: 多分类")
iris = load_iris()
y = iris['target']
X = iris['data']
kf = KFold(n_splits=2, shuffle=True, random_state=rng)
print("在2折数据上的交叉验证")
for train_index, test_index in kf.split(X):
    xgb_model = xgb.XGBClassifier().fit(X[train_index],y[train_index])
    predictions = xgb_model.predict(X[test_index])
    actuals = y[test_index]
    print("混淆矩阵:")
    print(confusion_matrix(actuals, predictions))

回归：


#回归问题：MSE
print("\n波士顿房价回归预测问题")
boston = load_boston()
y = boston['target']
X = boston['data']
kf = KFold(n_splits=2, shuffle=True, random_state=rng)
print("在2折数据上的交叉验证")
for train_index, test_index in kf.split(X):
    xgb_model = xgb.XGBRegressor().fit(X[train_index],y[train_index])
    predictions = xgb_model.predict(X[test_index])
    actuals = y[test_index]
    print("MSE:",mean_squared_error(actuals, predictions))

　接下来看一下如何利用网格搜索查找最优超参数。这种方法仅适用于使用sklearn接口建模，采用GridSearchCV方法。

#调参方法：使用sklearn接口的regressor + GridSearchCV
print("参数最优化：")
y = boston['target']
X = boston['data']
xgb_model = xgb.XGBRegressor()
param_dict = {'max_depth': [2,4,6],
              'n_estimators': [50,100,200]}

clf = GridSearchCV(xgb_model, param_dict, verbose=1)
clf.fit(X,y)
print(clf.best_score_)
print(clf.best_params_)

　可以看到网格搜索结果，最大深度为2，100个估计器。网格调参的方法就是将参数及参数的取值放入一个字典中，然后作为GridSearchCV这个方法的参数。
　再看一下xgboost如何采用早停的参数停止树的增长。早停参数的调整适用于两种xgb建模方法。

# 第1/2种训练方法的 调参方法：early stopping
X = digits['data']
y = digits['target']
X_train, X_val, y_train, y_val = train_test_split(X, y, random_state=0)
clf = xgb.XGBClassifier()
clf.fit(X_train, y_train, early_stopping_rounds=20, eval_metric="auc",
        eval_set=[(X_val, y_val)])

　该方法在训练集上学习模型，一颗一颗树添加，在验证集上看效果，当验证集效果不再提升，停止树的添加与生长。可以看到第10棵树时就不再提高，所以early_stopping_rounds的最佳值为10。关于xgboost调参的方法可以网上找一篇教程看一下，方法都是一样的，看一遍就懂了，附上很久之前整理的调参的基本思路。

　最后再画图看一下特征的重要性。

iris = load_iris()
y = iris['target']
X = iris['data']
xgb_model = xgb.XGBClassifier().fit(X,y)

print('特征排序：')
feature_names=['sepal_length', 'sepal_width', 'petal_length', 'petal_width']
feature_importances = xgb_model.feature_importances_
indices = np.argsort(feature_importances)[::-1]

for index in indices:
    print("特征 %s 重要度为 %f" %(feature_names[index], feature_importances[index]))

%matplotlib inline
import matplotlib.pyplot as plt
plt.figure(figsize=(16,8))
plt.title("feature importances")
plt.bar(range(len(feature_importances)), feature_importances[indices], color='b')
plt.xticks(range(len(feature_importances)), np.array(feature_names)[indices], color='b')

　xgboost特征重要性指标: weight, gain, cover,可以通过xgb_model.get_booster().get_score(importance_type=importance_type))中的importance进行设置。
　最后附上一个并行训练加速的代码，需要用到的时候再来看。

import os

if __name__ == "__main__":
    try:
        from multiprocessing import set_start_method
    except ImportError:
        raise ImportError("Unable to import multiprocessing.set_start_method."
                          " This example only runs on Python 3.4")
    # set_start_method("forkserver")

    import numpy as np
    from sklearn.model_selection import GridSearchCV
    from sklearn.datasets import load_boston
    import xgboost as xgb

    rng = np.random.RandomState(31337)

    print("Parallel Parameter optimization")
    boston = load_boston()

    os.environ["OMP_NUM_THREADS"] = "2"  # or to whatever you want
    y = boston['target']
    X = boston['data']
    xgb_model = xgb.XGBRegressor()
    clf = GridSearchCV(xgb_model, {'max_depth': [2, 4, 6],
                                   'n_estimators': [50, 100, 200]}, verbose=1,
                       n_jobs=2)
    clf.fit(X, y)
    print(clf.best_score_)
    print(clf.best_params_)

【作者】：Labryant
【原创公众号】：风控猎人
【简介】：某创业公司策略分析师，积极上进，努力提升。乾坤未定，你我都是黑马。
【转载说明】：转载请说明出处，谢谢合作！~

下一站深圳默琊
昨天已经买好3/15到深圳的机票了，原本上周还有点拖延症发作，不太积极，所以昨天就直接逼迫自己买机票，然后在订房，下周就是确认行业和把具体的面谈日程定下来。行业的选择上目前没有太大的偏好，上一份工作主要是风控和客服，客服部分也算是个小组长，有负责培训和一些案件SOP流程的制定等工作。总感觉客服这个职位的职涯发展只能是垂直的往更高的管理层走，对于横向发展似乎不容易，而鉴于做客服1年的感受，我不太喜欢
汤臣倍健，中建三局，宁德时代，金证科技，途游游戏，得物，蓝禾，顺丰，康冠科技24春招内推 weixin_53585422 c++python java 前端算法硬件工程嵌入式硬件
汤臣倍健，中建三局，宁德时代，金证科技，途游游戏，得物，蓝禾，顺丰，康冠科技24春招内推①汤臣倍健【内推岗位】：市场类、营销类、研发类、电商类、职能类、IT技术类、商业分析类、生产运营类【内推链接】https://sourl.cn/JSDhLU【推荐码】ES3W2T②得物【岗位】技术，设计，供应链，风控，产品，运营，商品研究等【内推码】:RTHEA59【一键内推】:https://poizon.j
汤臣倍健，三七互娱，得物，顺丰，快手，游卡，oppo，康冠科技，途游游戏，埃科光电25秋招内推 2401_86288678 c语言 python 算法前端 java
汤臣倍健，三七互娱，得物，顺丰，快手，游卡，oppo，康冠科技，途游游戏，埃科光电25秋招内推①得物【八大职类】技术、供应链、产品、运营、设计、职能、商品研究、风控等大类【内推码】RTHEA59【一键内推】https://poizon.jobs.feishu.cn/s/iMo1482J②汤臣倍健【招聘岗位】营销类、市场类、智造类、职能类【内推链接】https://sourl.cn/giXCGq【内
汤臣倍健，三七互娱，得物，顺丰，快手，游卡，oppo，康冠科技，途游游戏，埃科光电25秋招内推 2401_86288678 python 游戏 c++前端算法
汤臣倍健，三七互娱，得物，顺丰，快手，游卡，oppo，康冠科技，途游游戏，埃科光电25秋招内推①得物【八大职类】技术、供应链、产品、运营、设计、职能、商品研究、风控等大类【内推码】RTHEA59【一键内推】https://poizon.jobs.feishu.cn/s/iMo1482J②汤臣倍健【招聘岗位】营销类、市场类、智造类、职能类【内推链接】https://sourl.cn/giXCGq【内
头条网盘推广怎么赚钱？头条网盘拉新真的是骗局吗？内幕曝光清风导师
头条网盘推广项目怎么样?头条网盘推广赚钱是真的吗?今日头条网盘项目收益及亮点优势分析。2024年网盘拉新变现项目还是比较值得操作的，主要技术门槛相对低，而且项目稳定风控也比较少，老牌项目里面以夸克网盘为最，而新锐项目里面则推头条网盘为先。（原创内容抄袭必究）一、头条网盘赚钱是真的吗?项目逻辑分析其实大家担心这种项目是否合规是否长久，其实逻辑真的不用说那么多，就是我们给甲方平台推广引流新用户，他给我
远程收款单有哪些,什么收款码可以异地收款神州网络公司
1：首先我们来说说什么是远程收款远程收款就是微信收款码对外省的用户进行收款，不是本地或者面对面收款，统称为远程收款，现在严禁个人收款码不能异地收款，也不能远程收款很容易风控，所以各个商户都在找好用的远程收款码2：那我们在来说说什么是面对面收款，微信面对面收款什么意思，微信面对面收款是本地省内或者附近商城的那种收款，小摊的那种收款模式，本地收款统称面对面收款也叫本地收款，银行开的收款也就是本地商家聚
贝蓝相：3.23恒指、富时A50、上指行情分析策略连载贝蓝相
投资要做到，开仓有把握，建仓有着落，持仓有风控，平仓有利润。宁可明明白白放弃，不可稀里糊涂错过！复杂的行情简单做，简单的行情重复做，为什么我们总是在纠结行情本身，而忘了我们的目的不过是找准机会赚一笔钱，踏入市场那一刻请大家记住，无论行情如何变化，重要的是我们能做的有哪些。【恒指分析-恒生指数】恒指给出短线多单没给到进场机会，目前最高点位已经来到近期短线前高位置，小时线来看整体有回调趋势，日内依旧低
欧易限制提币火币C3认证火币风控币安风控 weixin_huobi667 html5 比特币
近期越来越多欧易用户莫名其妙的被风控，也就是okex风控，特别是欧易新账号，注册好之后买几次币就风控，限制提币、卖币，很多用户感到冤。。。还有写商家号也是无缘无故被风控，被冻结账户、押金，还不给解冻。欧易风控让很多人感到头疼。其次解欧易风控也是越来越难，要各种流水、视频、提币或者充币缘由等等资料，很多用户表示实在变态，这些资料怎么可能提供得了。小编告诉你，即使你按照要求提供了流水、视频，欧易也不会
32/1000 一月复盘范琳琳123
写在前面：临近月尾的表现，略欠佳。今早四点起，给自己点赞。二月的第一天，好的开始。一月再见，二月你好。学习：共读朱元璋传，了解农民思维。/交大开班。工作：中小担等放款社交：芒果乐乐/顾晚餐，了解很多产品二月计划，28天。几近整个春节。001上海落户辅助财务目标找关键人市场行情好002收房学习风控思维，请教，学习，蜀商，青商户，交大同学。了解政策，条件。根据往届送礼名单，找人脉节点，关键人。003视
2018-11-22 frank_you
&1.付出不亚于任何人的努力2.要谦虚，不要骄傲3.要每天反省4.活着，就要感谢5.积善行，思利他6.不要有感性的烦恼今日分享：活着，就要感谢这段时间主要是配合风控解决风险客户，上门催款比较多，感谢风控同事的努力工作，风险客户正在不断的消除中。
收款码如何避免风控,微信收款被限制如何立马解除神州网络公司
避免收款码风控的方法：1.了解风控规则：在使用收款码之前，商家应该详细了解对应收款平台的风控规则，包括交易限额、交易时间、交易次数、交易对象等。只有了解规则，才能更好地规避风险。2.合理安排收款方式：商家在使用收款码时，应该尽量避免使用过于单一的支付方式，结合多种收款方式来规避风险。例如，可以同时开通支付宝、微信支付、银联支付等不同的支付通道，以分散风险。3.避免短时间内大量交易：商家应该尽量避免
技术开发必读：热门好用的API资源海碗吃饭好用的Api api推荐精选API
IP应用场景-IPv4：IPv4应用场景是获取IP场景属性的在线调用接口，具备识别IP真人度，提升风控和反欺诈等业务能力。IP应用场景基于地理和网络特征的IP场景划分技术，将IP划分为含数据中心、交换中心、家庭宽带、CDN、云网络等共计18类应用场景。IP应用场景-IPv6：IPv6应用场景是获取IP场景属性的在线调用接口，具备识别IP真人度，提升风控和反欺诈等业务能力。IP应用场景基于地理和网络
什么样的收款码不受风控,线上收款码平台有哪些神州网络公司
如何选择不容易被风控的收款码？随着手机支付的快速普及，收款码已成为大众进行支付和收款的主要方式之一。然而，随之而来的风控问题也引起了人们的关注。如果收款码被风控，将会给用户带来许多不便和损失。那么，哪种收款码不容易被风控呢？以下是一些选择不易被风控的收款码的建议：关注抖音：宜昌神州网络远程收款码咨询办理1.选择正规机构提供的收款码：正规机构通常会严格审查商家的资质和信用，所提供的收款码更加安全可靠
远程收款风控怎么解决,怎样收款不被大数据监控神州网络公司
现如今无论是用户还是各大企业以及商户，在进行交易时，大多都非常重视扫码支付平台的选择，但无论是传统电商平台的支付工具还是当下各大商业卖场所选择的支付渠道，重点还是在于要有利于自身业务的开展，接下来就为大家简单解析、选择扫码支付平台所需要注意到的问题。费率不是重点需要注意的是，不少商家在选择扫码支付平台的过程中过多地重视所谓的费率，一旦偏高就选择不再使用。当然太高很有可能导致整体的交易成本上升，但是
远程收款二维码怎么申请,收款码可以远程付款吗神州网络公司
随着收款码的盛行，各行各业都离不开收款码，特别是做生意的商家，收款码已然成了商家收款的必备工具，想要实现远程收款也需要先注册成为商户。那么远程收款码怎么办理？个人怎么开通远程收款？接下来给大家说说远程收款。一、远程收款码怎么办理？1、远程收款码办理条件远程收款码主要是通过小程序的通道来进行收款，市面上所有的收款码都是不能远程收款的，会触发系统风控，导致收款码被限制使用，会影响门店的正常经营。想要实
游卡，得物，三七互娱，顺丰（提前批），快手，oppo，埃科光电，康冠科技25届秋招内推 2401_86288678 c语言 python 算法 java 前端
游卡，得物，三七互娱，顺丰（提前批），快手，oppo，埃科光电，康冠科技25届秋招内推①游卡【岗位】程序技术类、产品策划类、美术类、发型运营类、职能综合类、桌游业务类【一键内推】https://sourl.cn/PHiZZE【内推码】DSymte2c②得物【八大职类】技术类、供应链类、产品类、运营类、设计类、职能类、商品研究类、风控类；【三大城市】上海、杭州、北京【内推码】RTHEA59【一键内推
游卡，得物，三七互娱，顺丰（提前批），快手，oppo，埃科光电，康冠科技25届秋招内推 2401_86288678 游戏策划算法前端 python c语言
游卡，得物，三七互娱，顺丰（提前批），快手，oppo，埃科光电，康冠科技25届秋招内推①游卡【岗位】程序技术类、产品策划类、美术类、发型运营类、职能综合类、桌游业务类【一键内推】https://sourl.cn/PHiZZE【内推码】DSymte2c②得物【八大职类】技术类、供应链类、产品类、运营类、设计类、职能类、商品研究类、风控类；【三大城市】上海、杭州、北京【内推码】RTHEA59【一键内推
2019-07-11 珞珈樱year
币通市值管理流程风控一、出入金流程1.1账户入金（1）请款—币通Pro市值管理账户的请款申请，需明确请款事由、具体用途、请款人、风控监督人员、预计到账入金周期等信息；—请款日期请款人风控审核人员接收账户入金周期20190711张三李四张三：薪金卡：62166****eg：到账后两日内完成入金请款事由具体用途（2）审批—与币通Pro市值管理账户相关的资金申请，除按照正常审批流程，报经各个主管领导审批
虚拟信用卡风控方案介绍番茄风控番茄风控大数据公众号虚拟信用卡风控大数据金融互联网
金融领域最核心的两款信贷产品，就是贷款和信用卡。前者是给用户授信，然后支付一笔现金给用户；后者则是一个有支付场景、有授信额度的产品。在前几年，当时就有多家金融科技公司考察市场，提前布局进入这个虚拟信用卡领域。虚拟信用卡只所以成为热点，与当年年底监管在出台的现金贷监管细则有关，因为要求现金贷产品要有场景。什么是虚拟信用卡？它指的是银行信用卡中心发行的线上信用卡，用户通过线上申请，只有卡号，没有实体卡
浣熊理财_为什么有人只存钱不花钱？ lzzh雨滴
虽然很多人可能觉得不可思议，怎么会有只存钱不花钱的人，难道他不会有欲望吗？我以前也是这种想法，有欲望就会消费，除了已经看透红尘之人，怕是很少有人能够不花钱了吧！但是随着年龄的增长，我发现有几类人是真的可以只存钱不花钱的，浣熊理财先不作评价，看完了你自己心里都会有想法的。浣熊理财看风控能力浣熊理财完善的风控模式能更加有效地保障投资人的本金安全，可从平台风控部门的人员规模、团队高管的从业背景、平台公布
20240319金融读报：金融助力农业&科创企业风控模型墨_浅- 金融读报叭叭叭儿金融债券农业生产现代化风控模型新质生产力
1、农发行2023年第二十期金融债券票面利率为2.85%2、农业生产现代化转型-》农机：新疆尉犁县超级棉田里，农业无人机、采棉打包机、棉田打顶机器人等现代化机械设施，让两个人收种3000亩棉田成为了可能（金融机构可以结合农机购置补贴创新产品）3、金融支持三农短板：抵押物评估缺乏公信力-》农业供应链金融（类似于票据承兑、理财代销？）4、服务新质生产力：科创产业高地评估：“看未来、看技术、看团队”，针
一场持续三年的疫情，让我明白的道理周经年在读书写作
疫情三年感触颇多，生活无常，唯一不变的是变化本身。疫情三年让我明白了很多曾经都无法透彻理解的道理。1.人生百态，世事无常人生百态，世事无常，这句话我从小就听到很多人这么感慨，但我却没多少感触。也许是我的生活太过平常吧，按部就班平静如水。让我切身体会到人生百态，世事无常的是这场持续了三年并还将继续下去的疫情。疫情初期的风控居家，曾经以为在家宅着很快乐，疫情期间才发现宅家时间长了并不是一种幸福，伴随着
数据分析-Pandas数据探查初步：离散点图 Alex_StarSky 金融风控数据分析 pandas python Visualization
数据分析-Pandas数据探查初步：离散点图数据分析和处理中，难免会遇到各种数据，那么数据呈现怎样的规律呢？不管金融数据，风控数据，营销数据等等，莫不如此。如何通过图示展示数据的规律？数据表，时间序列数据在数据分析建模中很常见，例如天气预报，空气状态监测，股票交易等金融场景。数据分析过程中重新调整，重塑数据表是很重要的技巧，此处选择Titanic数据，以及巴黎、伦敦欧洲城市空气质量监测NO2NO_
在沪隔离的打工人——第一天：悲喜两重天负重前行普度众生
今日应了那句老话:你永远不知道明天和死亡是哪个先到。2022年3月1日在家中调休的我，由于小区出现一例确诊病例而被风控在家了。这时候的我真是悲喜两重天！悲剧的是病毒距我是如此之近，令我恐慌不已。整个人焦躁不安，抓耳挠腮地回忆着这几天自己在小区的行程，调出手机里所有的视频与照片，看是否与患者有交集点。突然想起昨天下班买了很多很多的菜的我路过小区小公园的时候，曾与小公园里闲聊的阿姨们打过招呼，于是乎整
异地收款不限制的聚合码，不风控的收款商户平台神州坦诚网络公司
异地收款用微信或者是支付宝收款码，其实大家在生活中总是会办理各种各样的业务，而且转账或者是收款也是大家在生活中经常都会进行操作的。大家如果是异地进行收款，那么你就可以选择使用支付宝或者是微信的收款码。一、异地收款用什么收款码？其实现在手机和电脑都已经非常普及了，而且大家在生活中也离不开这样的电子产品，如果大家在身边没有这样的电子产品，那么你就会发现生活会变得特别的复杂。所以大家通过使用这些电子产品
怎么办理远程收款码,不风控的二维码有哪些神州坦诚网络公司
随着移动支付的普及，远程扫码收款已成为商家和消费者之间的常见支付方式。在这篇文章中，我们将介绍如何办理远程扫码收款，包括收款码远程收款办理和远程收款码办理申请。一、问题概述本文将解答以下问题：如何办理远程扫码收款？收款码远程收款办理有哪些步骤？远程收款码办理申请需要注意哪些事项？常见问题解答。二、步骤介绍办理远程扫码收款的具体步骤如下：下载并安装远程收款码APP：商家需要在手机上下载并安装远程收款
Datawhale零基础入门金融风控Task1 赛题理解一缕阳光lyz python
Task1赛题理解Tip:本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第四场——零基础入门金融风控之贷款违约预测挑战赛。赛题以金融风控中的个人信贷为背景，要求选手根据贷款申请人的数据信息预测其是否有违约的可能，以此判断是否通过此项贷款，这是一个典型的分类问题。通过这道赛题来引导大家了解金融风控中的一些业务背景，解决实际问题，帮助竞赛新人进行自我练习、自我提高。项目地址：http
零基础入门金融风控-贷款违约预测Task2 数据分析一缕阳光lyz 数据分析数据挖掘
Task2数据分析此部分为零基础入门金融风控的Task2数据分析部分，带你来了解数据，熟悉数据，为后续的特征工程做准备，欢迎大家后续多多交流。赛题：零基础入门数据挖掘-零基础入门金融风控之贷款违约目的：1.EDA价值主要在于熟悉了解整个数据集的基本情况（缺失值，异常值），对数据集进行验证是否可以进行接下来的机器学习或者深度学习建模.2.了解变量间的相互关系、变量与预测值之间的存在关系。3.为特征工
孙萍10月16日感恩日志随风浮萍
孙萍10月16日感恩日志1.感恩天地万物护佑之恩；2.感恩祖先，父母的传承及养育之恩；3.感恩梁董事长，韩总共创的中钧互联网平台，感恩团队的每一位伙伴们!4.感恩晨会回归中心的引领，感恩伙伴们汇报本周及当日工作，吴涛对风控工作的提示5.感恩李总课程回来的分享，伙伴的回馈，洪政委的细致捕捉6.感恩小姨为我们美味午餐的付出，鹰嘴豆，葡萄干素抓饭，张姐的凉拌菜7.感恩思宁一起查看贷后，同晋姐姐，小晖，毛
2019.2.28感恩日志微风_f546
1.感恩天地的庇佑，父母的养育之恩2.感恩早晨孙姐的静心，韩总道德经的讲解3.感恩处理风控给的资料4.感恩中午的美味5.感恩今天韩总，薛总，风控，运营，财务，技术的努力，大家齐心协力为一个目标努力，最终创化我们想的结果6.感恩下午整理电脑资料7.感恩今天所有的发生对不起，请原谅，谢谢你，我爱你
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http

Xgboost简易入门教程

一、读取数据并指定参数建模

你可能感兴趣的:(风控)