BUPT-WT

不均衡学习

一、简介

在很多场景的数据集中，都会出现某一类数据的数量远远多于其它类的数据，一般都是以二分类的类别不平衡问题为主。一个简单的理解，假如某个数据集，10万个正样本(正常用户标签为0)与1000个负样本(有问题用户标签为1)，正负样本比例为100:1，如果模型学习每一次梯度下降使用全量样本，负样本的权重不到1/100，即使完全不学习负样本的信息，准确率也有99%，所以实际应用中不能完全用准确率衡量模型的效果，还会使用AUC等指标衡量模型的表现，但是依然没有办法保证模型将负样本很好的学习，这个例子就是说明数据集中正例和负例不平衡。为了使模型即对正例有很高的的准确率也对负例有很好的准确率，需要保持数据集相对平衡。

二、解决数据不平衡方法

通常解决数据不平衡的方法有下探、半监督学习、标签分裂、代价敏感、采样算法，下面为具体介绍:

(一) 下探

下探是最直接解决风控场景样本不均衡的方法。所谓下探，就是对评分较低被拒绝的人不进行监管，牺牲一部分收益，来积累坏样本，供后续模型学习。此外，随着业务开展，后续模型迭代的时候，使用的样本是有偏的，下探同样可以解决这个问题。

(二) 半监督学习

将有问题用户的数据通过半监督的方法逐渐生成标签，然后带入模型中进行训练。比较典型分方法有拒绝演绎、暴力半监督等等。

1）拒绝演绎

拒绝演绎或者叫拒绝推断，是一种根据经验对低分客户进行百分比采样的方法。比如最低分的客群百分之五十视为坏人，其次百分之四十等等。

2）暴力半监督

比较粗暴的做法是将样本的每一种标签方式进行穷举，带入模型看对模型是否有帮助，效率较低，容易过拟合。

3）模型筛选

用训练过的其他模型对无标签样本打标签，然后模型进行训练。很多公司会用当前模型在上面做预测，然后带入模型继续训练。很不推荐这样做，效果一般是很差的。可以考虑无监督算法或者用很旧的样本做训练然后做预测。

(三) 标签分裂

我们有时候会不止使用传统的一些定义来定义好坏。而是通过一些聚类手段对数据进行切分，然后分别在自己的样本空间内单独学习。基于模型的比如kmeans，分层聚类等等。基于经验的比如将失联客户、欺诈客户拆开，单独建模。

简单的理解如下面这个例子:

张三生了病，她的失散多年的哥哥找到有2家比较好的医院，医院A和医院B供张三选择就医。

张三的哥哥多方打听，搜集了这两家医院的统计数据，它们是这样的：

医院A最近接收的1000个病人里，有900个活着，100个死了。

医院B最近接收的1000个病人里，有800个活着，200个死了。

作为对统计学懵懵懂懂的普通人来说，看起来最明智的选择应该是医院A对吧，病人存活率很高有90%啊！总不可能选医院B吧，存活率只有80%啊。呵呵，如果张三的选择是医院A，那么她就中计了。

就这么说吧，如果医院A最近接收的1000个病人里，有100个病人病情很严重，900个病人病情并不严重。

在这100个病情严重的病人里，有30个活下来了，其他70人死了。所以病重的病人在医院A的存活率是30%。

而在病情不严重的900个病人里，870个活着，30个人死了。所以病情不严重的病人在医院A的存活率是96.7%。

在医院B最近接收的1000个病人里，有400个病情很严重，其中210个人存活，因此病重的病人在医院B的存活率是52.5%。

有600个病人病情不严重，590个人存活，所以病情不严重的病人在医院B的存活率是98.3%。

更直观的如下面图片所示:

实际上，我们刚刚看到的例子，就是统计学中著名的黑魔法之一——辛普森悖论（Simpson's paradox）。辛普森悖论就是当你把数据拆开细看的时候，细节和整体趋势完全不同的现象。

(四) 代价敏感

代价敏感学习则是利用不同类别的样本被误分类而产生不同的代价，使用这种方法解决数据不平衡问题。而且有很多研究表明，代价敏感学习和样本不平衡问题有很强的联系，并且使用代价敏感学习的方法解决不平衡学习问题要优于使用随机采样的方法。

1) 把误分类代价作为数据集的权重，然后采用 Bootstrap 采样方法选择具有最好的数据分布的数据集；
2) 以集成学习的模式来实现代价最小化的技术，这种方法可以选择很多标准的学习算法作为集成学习中的弱分类器；
3) 把代价敏感函数或者特征直接合并到分类器的参数中，这样可以更好的拟合代价敏感函数。由于这类技术往往都具有特定的参数，因此这类方法没有统一的框架；

(五) 采样算法

朴素随机过采样

from sklearn.datasets import make_classification
from collections import Counter
from imblearn.over_sampling import RandomOverSampler


X, y = make_classification(n_samples=5000, n_features=2, n_informative=2,
                           n_redundant=0, n_repeated=0, n_classes=2,
                           n_clusters_per_class=1,
                           weights=[0.01, 0.99],
                           class_sep=0.8, random_state=0)
Counter(y)

ros = RandomOverSampler(random_state=0)
X_resampled, y_resampled = ros.fit_sample(X, y)


sorted(Counter(y_resampled).items())

SMOTE

对于少数类样本a, 随机选择一个最近邻的样本b, 然后从a与b的连线上随机选取一个点c作为新的少数类样本；但是，SMOTE容易出现过泛化和高方差的问题，而且，容易制造出重叠的数据。

为了克服SMOTE的缺点，Adaptive Synthetic Sampling方法被提出，主要包括：Borderline-SMOTE和Adaptive Synthetic Sampling（ADA-SYN）算法。

Borderline-SMOTE：对靠近边界的minority样本创造新数据。其与SMOTE的不同是：SMOTE是对每一个minority样本产生综合新样本，而Borderline-SMOTE仅对靠近边界的minority样本创造新数据。如下图，只对A中的部分数据进行操作：

这个图中展示了该方法的实现过程，我们可以发现和SMOTE方法的不同之处：SMOTE对于每一个少数类样本都会产生合成样本，但是Borderline-SMOTE只会对邻近边界的少数类样本生成合成数据。ADA-SYN：根据majority和minority的密度分布，动态改变权重，决定要generate多少minority的新数据。

相对于基本的SMOTE算法, 关注的是所有的少数类样本, 这些情况可能会导致产生次优的决策函数。
因此SMOTE就产生了一些变体，这些方法关注在最优化决策函数边界的一些少数类样本, 然后在最近邻类的相反方向生成样本。、 SMOTE函数中的kind参数控制了选择哪种变体

regular
borderline1
borderline2
svm

from imblearn.over_sampling import SMOTE, ADASYN
X_resampled, y_resampled = SMOTE(kind='borderline1').fit_sample(X, y)

sorted(Counter(y_resampled).items())

三、实际应用

目前应用最多的是smote中变体为borderline1

1）构建baseline - LR模型

import glob
import numpy as np
import pandas as pd
import lightgbm as lgb
from sklearn.metrics import roc_auc_score,roc_curve,auc
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import GridSearchCV as gscv
from sklearn.neighbors import KNeighborsClassifier 
data = pd.read_csv('xxxxx.txt')

train = data[data.obs_mth != '2018-11-30'].reset_index().copy()
evl = data[data.obs_mth == '2018-11-30'].reset_index().copy()

x = train[feature_lst]
y = train['bad_ind']

evl_x =  evl[feature_lst]
evl_y = evl['bad_ind']

lr_model = LogisticRegression(C=0.1,class_weight='balanced')
lr_model.fit(x,y)

y_pred = lr_model.predict_proba(x)[:,1]
fpr_lr_train,tpr_lr_train,_ = roc_curve(y,y_pred)
train_ks = abs(fpr_lr_train - tpr_lr_train).max()
print('train_ks : ',train_ks)

y_pred = lr_model.predict_proba(evl_x)[:,1]
fpr_lr,tpr_lr,_ = roc_curve(evl_y,y_pred)
evl_ks = abs(fpr_lr - tpr_lr).max()
print('evl_ks : ',evl_ks)

from matplotlib import pyplot as plt
plt.plot(fpr_lr_train,tpr_lr_train,label = 'train LR')
plt.plot(fpr_lr,tpr_lr,label = 'evl LR')
plt.plot([0,1],[0,1],'k--')
plt.xlabel('False positive rate')
plt.ylabel('True positive rate')
plt.title('ROC Curve')
plt.legend(loc = 'best')
plt.show()

2) 优化

先用lgb做预测，然后做前融合，相比于不修改损失函数的xgb，lgb的优势只是比较快，思想类似于对训练样本做异常点检测只不过不是根据数据内部分布差异，而是使用精准度更高的集成模型，将难以辨认的样本，视为噪音。

首先做网格调参，给lgb找一组较好的参数

train_x,test_x,train_y,test_y = train_test_split(x,y,random_state=0,test_size=0.4)

params = {
            'boosting_type':'gbdt',
            'objective':'binary',
            'metric':'auc',
            'nthread':4,
            'learning_rate':0.1,
            'num_leaves':30,
            'max_depth':5,
            'subsample':0.8,
            'colsample_bytree':0.8,
        }

data_train = lgb.Dataset(train_x,train_y)

cv_results = lgb.cv(params,
                    data_train,
                    num_boost_round = 1000,
                    nfold = 5,
                    stratified = False,
                    shuffle = True,
                    metrics = 'auc',
                    early_stopping_rounds = 100,
                    seed = 0
                    )
print('best n_estimators:',len(cv_results['auc-mean']))
print('best cv score:',pd.Series(cv_results['auc-mean']).max())


best n_estimators: 24
best cv score: 0.8097663177199287

def  lgb_test(train_x,train_y,test_x,test_y):
    clf =lgb.LGBMClassifier(boosting_type = 'gbdt',
                           objective = 'binary',
                           metric = 'auc',
                           learning_rate = 0.1,
                           n_estimators = 24,
                           max_depth = 4,
                           num_leaves = 25,
                           max_bin = 40,
                           min_data_in_leaf = 5,
                           bagging_fraction = 0.6,
                           bagging_freq = 0,
                           feature_fraction = 0.8,
                           )
    clf.fit(train_x,train_y,eval_set = [(train_x,train_y),(test_x,test_y)],eval_metric = 'auc')
    return clf,clf.best_score_['valid_1']['auc'],
lgb_model , lgb_auc  = lgb_test(train_x,train_y,test_x,test_y)
feature_importance = pd.DataFrame({'name':lgb_model.booster_.feature_name(),
                                   'importance':lgb_model.feature_importances_}).sort_values(by=['importance'],ascending=False)

pred = lgb_model.predict_proba(train_x)[:,1]
fpr_lgb,tpr_lgb,_ = roc_curve(train_y,pred)
print(abs(fpr_lgb - tpr_lgb).max())
    
pred = lgb_model.predict_proba(test_x)[:,1]
fpr_lgb,tpr_lgb,_ = roc_curve(test_y,pred)
print(abs(fpr_lgb - tpr_lgb).max())

pred = lgb_model.predict_proba(evl_x)[:,1]
fpr_lgb,tpr_lgb,_ = roc_curve(evl_y,pred)
print(abs(fpr_lgb - tpr_lgb).max())


0.5064991567297175
0.48909811193341235
0.41935471928695134

粗略调参的lgb比lr无显著提升，下面进行权重调整。前后各取部分错分样本，减小权重，其余样本为1。虽然后面还会给予新的权重，但是这部分权重永远只有正常样本的固定比例。

sample = x[feature_lst]
sample['bad_ind'] = y
sample['pred'] = lgb_model.predict_proba(x)[:,1]
sample = sample.sort_values(by=['pred'],ascending=False).reset_index()
sample['rank'] = np.array(sample.index)/75522

def weight(x,y):
    if x == 0 and y < 0.1:
        return 0.1
    elif x == 1 and y > 0.7:
        return 0.1
    else:
        return 1

sample['weight'] = sample.apply(lambda x: weight(x.bad_ind,x['rank']),axis = 1)

def lr_wt_predict(train_x,train_y,evl_x,evl_y,weight):
    lr_model = LogisticRegression(C=0.1,class_weight='balanced')
    lr_model.fit(train_x,train_y,sample_weight = weight )
    
    y_pred = lr_model.predict_proba(train_x)[:,1]
    fpr_lr,tpr_lr,_ = roc_curve(train_y,y_pred)
    train_ks = abs(fpr_lr - tpr_lr).max()
    print('train_ks : ',train_ks)
    
    y_pred = lr_model.predict_proba(evl_x)[:,1]
    fpr_lr,tpr_lr,_ = roc_curve(evl_y,y_pred)
    evl_ks = abs(fpr_lr - tpr_lr).max()
    print('evl_ks : ',evl_ks)
    
lr_wt_predict(sample[feature_lst],sample['bad_ind'],evl_x,evl_y,sample['weight'])

train_ks :  0.4602564513254416
evl_ks :  0.4289610959476374

此时的lr，相比于最开始的lr，提升了1个百分点。这里省略了一些其他的探索，由于其他算法实验效果不理想，最终选取lgb作为筛选样本的工具。接下来考虑基于差值思想的过采样方法，增加一部分虚拟的负样本。这里需要注意，之前权重减小的样本是不应该用来做过采样的。所以将训练数据先拆分成两部分。weight=1的做过采样，其余的不变。

osvp_sample = sample[sample.weight == 1].drop(['pred','index','weight'],axis = 1)
osnu_sample = sample[sample.weight < 1].drop(['pred','index',],axis = 1)

train_x_osvp = osvp_sample[feature_lst]
train_y_osvp = osvp_sample['bad_ind']

#下面做基于borderline1的smote算法做过采样

def lr_predict(train_x,train_y,evl_x,evl_y):
    lr_model = LogisticRegression(C=0.1,class_weight='balanced')
    lr_model.fit(train_x,train_y)
    
    y_pred = lr_model.predict_proba(train_x)[:,1]
    fpr_lr,tpr_lr,_ = roc_curve(train_y,y_pred)
    train_ks = abs(fpr_lr - tpr_lr).max()
    print('train_ks : ',train_ks)
    
    y_pred = lr_model.predict_proba(evl_x)[:,1]
    fpr_lr,tpr_lr,_ = roc_curve(evl_y,y_pred)
    evl_ks = abs(fpr_lr - tpr_lr).max()
    print('evl_ks : ',evl_ks)
    return train_ks,evl_ks

from imblearn.over_sampling import SMOTE,RandomOverSampler,ADASYN
smote = SMOTE(k_neighbors=15, kind='borderline1', m_neighbors=4, n_jobs=1,
              out_step='deprecated', random_state=0, ratio=None,
              svm_estimator='deprecated')
rex,rey = smote.fit_resample(train_x_osvp,train_y_osvp)
print('badpctn:',rey.sum()/len(rey))
df_rex = pd.DataFrame(rex)
df_rex.columns =feature_lst
df_rex['weight'] = 1
df_rex['bad_ind'] = rey
df_aff_ovsp = df_rex.append(osnu_sample)
lr_predict(df_aff_ovsp[feature_lst],df_aff_ovsp['bad_ind'],evl_x,evl_y)

badpctn: 0.5

train_ks :  0.4859866821876423
evl_ks :  0.44085108654818894

下面尝试使用KNN做前融合，主要思想是knn和逻辑回归对样本的分布先验是相同的，虽然是弱分类器，识别出的异常值应该对模型影响更大。

首先寻找最优k值

lr_model = LogisticRegression(C=0.1,class_weight='balanced')
lr_model.fit(df_aff_ovsp[feature_lst],df_aff_ovsp['bad_ind'] )
    
y_pred = lr_model.predict_proba(df_aff_ovsp[feature_lst])[:,1]
fpr_lr_train,tpr_lr_train,_ = roc_curve(df_aff_ovsp['bad_ind'],y_pred)
train_ks = abs(fpr_lr_train - tpr_lr_train).max()
print('train_ks : ',train_ks)
    
y_pred = lr_model.predict_proba(evl_x)[:,1]
fpr_lr,tpr_lr,_ = roc_curve(evl_y,y_pred)
evl_ks = abs(fpr_lr - tpr_lr).max()
print('evl_ks : ',evl_ks)

from matplotlib import pyplot as plt
plt.plot(fpr_lr_train,tpr_lr_train,label = 'train LR')
plt.plot(fpr_lr,tpr_lr,label = 'evl LR')
plt.plot([0,1],[0,1],'k--')
plt.xlabel('False positive rate')
plt.ylabel('True positive rate')
plt.title('ROC Curve')
plt.legend(loc = 'best')
plt.show()


train_ks :  0.4859866821876423
evl_ks :  0.44085108654818894

可以看到，最终跨时间验证集上，是有3.5个百分点的提升的。而训练集上提升了5个百分点，较为符合预期，过拟合的风险不是很大。

风控系统之事件溯源，决策流程记录与版本控制后端
个人博客：无奈何杨（wnhyang）个人语雀：wnhyang共享语雀：在线知识共享Github：wnhyang-Overview背景一天，小明在风控管理台查看事件数据时，发现一笔决策结果为“拒绝”❌的交易事件，小明点开事件详情发现其触发了一条“24小时内向不同陌生账户转账超过30w”的规则，规则设置的处置方式是“拒绝”❌。小明通过策略规则却查不到那条“24小时内向不同陌生账户转账超过30w”的规则
基于LiteFlow的风控系统开源了！指标策略规则后端
个人博客：无奈何杨（wnhyang）个人语雀：wnhyang共享语雀：在线知识共享Github：wnhyang-Overview开篇先道个歉吧，因为大概会让很多人失望了，这次开源仅仅是开源，不是发版，也就是说开源并非非完全体，仅仅是开放源码。如果说1是发版，就算放低一些要求，现在只可能只算是0.2左右，还有很多很多很多事情要做。开源地址：https://github.com/wnhyang/coo
风控系统之规则重复触发后端
个人博客：无奈何杨（wnhyang）个人语雀：wnhyang共享语雀：在线知识共享Github：wnhyang-Overview简介前面已经发了很多关于风控系统的一些文章，是比较零碎的，这也是我知道的，但在边构思边实践时是这样的。从0到1中还有很多0.0001、0.0023424、0.1243，这些都是不可忽视，他们也是成长的一部分啊！这里提前预告一下（毕竟有人看不到文末），下周大概是10.24会
风控系统之指标回溯，历史数据重跑后端
个人博客：无奈何杨（wnhyang）个人语雀：wnhyang共享语雀：在线知识共享Github：wnhyang-Overview回顾默认你已经看过之前那篇风控系统指标计算/特征提取分析与实现01，Redis、Zset、模版方法。其中已经介绍了如何利用redis的zset结构完成指标计算，为了方便这篇文章的介绍，还是在正式开始本篇之前回顾一下。时间窗口zset是redis中的一种数据结构，表示有序集
风控系统建设，指标策略规则流程设计，LiteFlow隐式子流程，构造EL和Chain
个人博客：无奈何杨（wnhyang）个人语雀：wnhyang共享语雀：在线知识共享Github：wnhyang-Overview简介前面有很多文章已经说了，我要利用LiteFlow做风控系统。至于进度嘛，只能尽力而为，毕竟我的惰性也很强。下面是目前Git的提交记录，代码托管在Github和Gitee，但是是私有仓库，因为还不是开放的时候，还有很多要做的。其中能梳理的仅是主流程的TODO都有下面这么
下一站深圳默琊
昨天已经买好3/15到深圳的机票了，原本上周还有点拖延症发作，不太积极，所以昨天就直接逼迫自己买机票，然后在订房，下周就是确认行业和把具体的面谈日程定下来。行业的选择上目前没有太大的偏好，上一份工作主要是风控和客服，客服部分也算是个小组长，有负责培训和一些案件SOP流程的制定等工作。总感觉客服这个职位的职涯发展只能是垂直的往更高的管理层走，对于横向发展似乎不容易，而鉴于做客服1年的感受，我不太喜欢
汤臣倍健，中建三局，宁德时代，金证科技，途游游戏，得物，蓝禾，顺丰，康冠科技24春招内推 weixin_53585422 c++python java 前端算法硬件工程嵌入式硬件
汤臣倍健，中建三局，宁德时代，金证科技，途游游戏，得物，蓝禾，顺丰，康冠科技24春招内推①汤臣倍健【内推岗位】：市场类、营销类、研发类、电商类、职能类、IT技术类、商业分析类、生产运营类【内推链接】https://sourl.cn/JSDhLU【推荐码】ES3W2T②得物【岗位】技术，设计，供应链，风控，产品，运营，商品研究等【内推码】:RTHEA59【一键内推】:https://poizon.j
汤臣倍健，三七互娱，得物，顺丰，快手，游卡，oppo，康冠科技，途游游戏，埃科光电25秋招内推 2401_86288678 c语言 python 算法前端 java
汤臣倍健，三七互娱，得物，顺丰，快手，游卡，oppo，康冠科技，途游游戏，埃科光电25秋招内推①得物【八大职类】技术、供应链、产品、运营、设计、职能、商品研究、风控等大类【内推码】RTHEA59【一键内推】https://poizon.jobs.feishu.cn/s/iMo1482J②汤臣倍健【招聘岗位】营销类、市场类、智造类、职能类【内推链接】https://sourl.cn/giXCGq【内
汤臣倍健，三七互娱，得物，顺丰，快手，游卡，oppo，康冠科技，途游游戏，埃科光电25秋招内推 2401_86288678 python 游戏 c++前端算法
汤臣倍健，三七互娱，得物，顺丰，快手，游卡，oppo，康冠科技，途游游戏，埃科光电25秋招内推①得物【八大职类】技术、供应链、产品、运营、设计、职能、商品研究、风控等大类【内推码】RTHEA59【一键内推】https://poizon.jobs.feishu.cn/s/iMo1482J②汤臣倍健【招聘岗位】营销类、市场类、智造类、职能类【内推链接】https://sourl.cn/giXCGq【内
头条网盘推广怎么赚钱？头条网盘拉新真的是骗局吗？内幕曝光清风导师
头条网盘推广项目怎么样?头条网盘推广赚钱是真的吗?今日头条网盘项目收益及亮点优势分析。2024年网盘拉新变现项目还是比较值得操作的，主要技术门槛相对低，而且项目稳定风控也比较少，老牌项目里面以夸克网盘为最，而新锐项目里面则推头条网盘为先。（原创内容抄袭必究）一、头条网盘赚钱是真的吗?项目逻辑分析其实大家担心这种项目是否合规是否长久，其实逻辑真的不用说那么多，就是我们给甲方平台推广引流新用户，他给我
远程收款单有哪些,什么收款码可以异地收款神州网络公司
1：首先我们来说说什么是远程收款远程收款就是微信收款码对外省的用户进行收款，不是本地或者面对面收款，统称为远程收款，现在严禁个人收款码不能异地收款，也不能远程收款很容易风控，所以各个商户都在找好用的远程收款码2：那我们在来说说什么是面对面收款，微信面对面收款什么意思，微信面对面收款是本地省内或者附近商城的那种收款，小摊的那种收款模式，本地收款统称面对面收款也叫本地收款，银行开的收款也就是本地商家聚
贝蓝相：3.23恒指、富时A50、上指行情分析策略连载贝蓝相
投资要做到，开仓有把握，建仓有着落，持仓有风控，平仓有利润。宁可明明白白放弃，不可稀里糊涂错过！复杂的行情简单做，简单的行情重复做，为什么我们总是在纠结行情本身，而忘了我们的目的不过是找准机会赚一笔钱，踏入市场那一刻请大家记住，无论行情如何变化，重要的是我们能做的有哪些。【恒指分析-恒生指数】恒指给出短线多单没给到进场机会，目前最高点位已经来到近期短线前高位置，小时线来看整体有回调趋势，日内依旧低
欧易限制提币火币C3认证火币风控币安风控 weixin_huobi667 html5 比特币
近期越来越多欧易用户莫名其妙的被风控，也就是okex风控，特别是欧易新账号，注册好之后买几次币就风控，限制提币、卖币，很多用户感到冤。。。还有写商家号也是无缘无故被风控，被冻结账户、押金，还不给解冻。欧易风控让很多人感到头疼。其次解欧易风控也是越来越难，要各种流水、视频、提币或者充币缘由等等资料，很多用户表示实在变态，这些资料怎么可能提供得了。小编告诉你，即使你按照要求提供了流水、视频，欧易也不会
32/1000 一月复盘范琳琳123
写在前面：临近月尾的表现，略欠佳。今早四点起，给自己点赞。二月的第一天，好的开始。一月再见，二月你好。学习：共读朱元璋传，了解农民思维。/交大开班。工作：中小担等放款社交：芒果乐乐/顾晚餐，了解很多产品二月计划，28天。几近整个春节。001上海落户辅助财务目标找关键人市场行情好002收房学习风控思维，请教，学习，蜀商，青商户，交大同学。了解政策，条件。根据往届送礼名单，找人脉节点，关键人。003视
2018-11-22 frank_you
&1.付出不亚于任何人的努力2.要谦虚，不要骄傲3.要每天反省4.活着，就要感谢5.积善行，思利他6.不要有感性的烦恼今日分享：活着，就要感谢这段时间主要是配合风控解决风险客户，上门催款比较多，感谢风控同事的努力工作，风险客户正在不断的消除中。
收款码如何避免风控,微信收款被限制如何立马解除神州网络公司
避免收款码风控的方法：1.了解风控规则：在使用收款码之前，商家应该详细了解对应收款平台的风控规则，包括交易限额、交易时间、交易次数、交易对象等。只有了解规则，才能更好地规避风险。2.合理安排收款方式：商家在使用收款码时，应该尽量避免使用过于单一的支付方式，结合多种收款方式来规避风险。例如，可以同时开通支付宝、微信支付、银联支付等不同的支付通道，以分散风险。3.避免短时间内大量交易：商家应该尽量避免
技术开发必读：热门好用的API资源海碗吃饭好用的Api api推荐精选API
IP应用场景-IPv4：IPv4应用场景是获取IP场景属性的在线调用接口，具备识别IP真人度，提升风控和反欺诈等业务能力。IP应用场景基于地理和网络特征的IP场景划分技术，将IP划分为含数据中心、交换中心、家庭宽带、CDN、云网络等共计18类应用场景。IP应用场景-IPv6：IPv6应用场景是获取IP场景属性的在线调用接口，具备识别IP真人度，提升风控和反欺诈等业务能力。IP应用场景基于地理和网络
什么样的收款码不受风控,线上收款码平台有哪些神州网络公司
如何选择不容易被风控的收款码？随着手机支付的快速普及，收款码已成为大众进行支付和收款的主要方式之一。然而，随之而来的风控问题也引起了人们的关注。如果收款码被风控，将会给用户带来许多不便和损失。那么，哪种收款码不容易被风控呢？以下是一些选择不易被风控的收款码的建议：关注抖音：宜昌神州网络远程收款码咨询办理1.选择正规机构提供的收款码：正规机构通常会严格审查商家的资质和信用，所提供的收款码更加安全可靠
远程收款风控怎么解决,怎样收款不被大数据监控神州网络公司
现如今无论是用户还是各大企业以及商户，在进行交易时，大多都非常重视扫码支付平台的选择，但无论是传统电商平台的支付工具还是当下各大商业卖场所选择的支付渠道，重点还是在于要有利于自身业务的开展，接下来就为大家简单解析、选择扫码支付平台所需要注意到的问题。费率不是重点需要注意的是，不少商家在选择扫码支付平台的过程中过多地重视所谓的费率，一旦偏高就选择不再使用。当然太高很有可能导致整体的交易成本上升，但是
远程收款二维码怎么申请,收款码可以远程付款吗神州网络公司
随着收款码的盛行，各行各业都离不开收款码，特别是做生意的商家，收款码已然成了商家收款的必备工具，想要实现远程收款也需要先注册成为商户。那么远程收款码怎么办理？个人怎么开通远程收款？接下来给大家说说远程收款。一、远程收款码怎么办理？1、远程收款码办理条件远程收款码主要是通过小程序的通道来进行收款，市面上所有的收款码都是不能远程收款的，会触发系统风控，导致收款码被限制使用，会影响门店的正常经营。想要实
游卡，得物，三七互娱，顺丰（提前批），快手，oppo，埃科光电，康冠科技25届秋招内推 2401_86288678 c语言 python 算法 java 前端
游卡，得物，三七互娱，顺丰（提前批），快手，oppo，埃科光电，康冠科技25届秋招内推①游卡【岗位】程序技术类、产品策划类、美术类、发型运营类、职能综合类、桌游业务类【一键内推】https://sourl.cn/PHiZZE【内推码】DSymte2c②得物【八大职类】技术类、供应链类、产品类、运营类、设计类、职能类、商品研究类、风控类；【三大城市】上海、杭州、北京【内推码】RTHEA59【一键内推
游卡，得物，三七互娱，顺丰（提前批），快手，oppo，埃科光电，康冠科技25届秋招内推 2401_86288678 游戏策划算法前端 python c语言
游卡，得物，三七互娱，顺丰（提前批），快手，oppo，埃科光电，康冠科技25届秋招内推①游卡【岗位】程序技术类、产品策划类、美术类、发型运营类、职能综合类、桌游业务类【一键内推】https://sourl.cn/PHiZZE【内推码】DSymte2c②得物【八大职类】技术类、供应链类、产品类、运营类、设计类、职能类、商品研究类、风控类；【三大城市】上海、杭州、北京【内推码】RTHEA59【一键内推
2019-07-11 珞珈樱year
币通市值管理流程风控一、出入金流程1.1账户入金（1）请款—币通Pro市值管理账户的请款申请，需明确请款事由、具体用途、请款人、风控监督人员、预计到账入金周期等信息；—请款日期请款人风控审核人员接收账户入金周期20190711张三李四张三：薪金卡：62166****eg：到账后两日内完成入金请款事由具体用途（2）审批—与币通Pro市值管理账户相关的资金申请，除按照正常审批流程，报经各个主管领导审批
虚拟信用卡风控方案介绍番茄风控番茄风控大数据公众号虚拟信用卡风控大数据金融互联网
金融领域最核心的两款信贷产品，就是贷款和信用卡。前者是给用户授信，然后支付一笔现金给用户；后者则是一个有支付场景、有授信额度的产品。在前几年，当时就有多家金融科技公司考察市场，提前布局进入这个虚拟信用卡领域。虚拟信用卡只所以成为热点，与当年年底监管在出台的现金贷监管细则有关，因为要求现金贷产品要有场景。什么是虚拟信用卡？它指的是银行信用卡中心发行的线上信用卡，用户通过线上申请，只有卡号，没有实体卡
浣熊理财_为什么有人只存钱不花钱？ lzzh雨滴
虽然很多人可能觉得不可思议，怎么会有只存钱不花钱的人，难道他不会有欲望吗？我以前也是这种想法，有欲望就会消费，除了已经看透红尘之人，怕是很少有人能够不花钱了吧！但是随着年龄的增长，我发现有几类人是真的可以只存钱不花钱的，浣熊理财先不作评价，看完了你自己心里都会有想法的。浣熊理财看风控能力浣熊理财完善的风控模式能更加有效地保障投资人的本金安全，可从平台风控部门的人员规模、团队高管的从业背景、平台公布
20240319金融读报：金融助力农业&科创企业风控模型墨_浅- 金融读报叭叭叭儿金融债券农业生产现代化风控模型新质生产力
1、农发行2023年第二十期金融债券票面利率为2.85%2、农业生产现代化转型-》农机：新疆尉犁县超级棉田里，农业无人机、采棉打包机、棉田打顶机器人等现代化机械设施，让两个人收种3000亩棉田成为了可能（金融机构可以结合农机购置补贴创新产品）3、金融支持三农短板：抵押物评估缺乏公信力-》农业供应链金融（类似于票据承兑、理财代销？）4、服务新质生产力：科创产业高地评估：“看未来、看技术、看团队”，针
一场持续三年的疫情，让我明白的道理周经年在读书写作
疫情三年感触颇多，生活无常，唯一不变的是变化本身。疫情三年让我明白了很多曾经都无法透彻理解的道理。1.人生百态，世事无常人生百态，世事无常，这句话我从小就听到很多人这么感慨，但我却没多少感触。也许是我的生活太过平常吧，按部就班平静如水。让我切身体会到人生百态，世事无常的是这场持续了三年并还将继续下去的疫情。疫情初期的风控居家，曾经以为在家宅着很快乐，疫情期间才发现宅家时间长了并不是一种幸福，伴随着
数据分析-Pandas数据探查初步：离散点图 Alex_StarSky 金融风控数据分析 pandas python Visualization
数据分析-Pandas数据探查初步：离散点图数据分析和处理中，难免会遇到各种数据，那么数据呈现怎样的规律呢？不管金融数据，风控数据，营销数据等等，莫不如此。如何通过图示展示数据的规律？数据表，时间序列数据在数据分析建模中很常见，例如天气预报，空气状态监测，股票交易等金融场景。数据分析过程中重新调整，重塑数据表是很重要的技巧，此处选择Titanic数据，以及巴黎、伦敦欧洲城市空气质量监测NO2NO_
在沪隔离的打工人——第一天：悲喜两重天负重前行普度众生
今日应了那句老话:你永远不知道明天和死亡是哪个先到。2022年3月1日在家中调休的我，由于小区出现一例确诊病例而被风控在家了。这时候的我真是悲喜两重天！悲剧的是病毒距我是如此之近，令我恐慌不已。整个人焦躁不安，抓耳挠腮地回忆着这几天自己在小区的行程，调出手机里所有的视频与照片，看是否与患者有交集点。突然想起昨天下班买了很多很多的菜的我路过小区小公园的时候，曾与小公园里闲聊的阿姨们打过招呼，于是乎整
异地收款不限制的聚合码，不风控的收款商户平台神州坦诚网络公司
异地收款用微信或者是支付宝收款码，其实大家在生活中总是会办理各种各样的业务，而且转账或者是收款也是大家在生活中经常都会进行操作的。大家如果是异地进行收款，那么你就可以选择使用支付宝或者是微信的收款码。一、异地收款用什么收款码？其实现在手机和电脑都已经非常普及了，而且大家在生活中也离不开这样的电子产品，如果大家在身边没有这样的电子产品，那么你就会发现生活会变得特别的复杂。所以大家通过使用这些电子产品
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1