weixin_44049356

招商银行fintech评分卡案例

数据简介
数据预处理
变量筛选
相关性分析
模型建立和评价

数据简介

此次分享的数据案例是我的同学参加的2020年招商银行fintech项目时碰到的案例，我就正好拿这个案例来进行了一下评分卡的建模练习，首先此次数据主要包括三个数据集，分别是行为数据、标签数据、交易数据。

训练集和测试集都已经分好，最终的目的如下所示。

数据预处理

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import matplotlib as mpl
import scipy
mpl.rcParams['figure.figsize'] = (8, 5)

train_beh = pd.read_csv('data/训练数据集_beh.csv')
train_trade = pd.read_csv('data/训练数据集_trd.csv')
train_tag = pd.read_csv('data/训练数据集_tag.csv')
test_beh = pd.read_csv('data/评分数据集_beh_a.csv')
test_trade = pd.read_csv('data/评分数据集_trd_a.csv')
test_tag = pd.read_csv('data/评分数据集_tag_a.csv')

首先观察beh数据集，该数据集中包含字段如下：

我们这里构造两个特征，每个用户的app浏览时长，以及浏览次数最多的页面。

#统计客户最爱浏览网页和网页浏览次数
def most_like_page(df):
    dic = {}
    dic['app_use_times'] = df['page_no'].count()
    dic['most_like_page']= df['page_no'].value_counts().index[0]
    s = pd.Series(dic, index = ['app_use_times','most_like_page'])
    return s
train_beh_1 = train_beh.groupby('id').apply(most_like_page)

trade数据集字段主要有以下

我们统计每个用户总的交易金额，平均交易金额，最多的交易方向、最多的收支一级分类、最多的收支二级分类。

def trade_amt(df):
    dic = {}
    dic['trade_amt'] = df['cny_trx_amt'].sum()
    dic['most_Dat_Flg3_Cd'] = df['Dat_Flg3_Cd'].value_counts().index[0]
    dic['most_Trx_Cod1_Cd'] = df['Trx_Cod1_Cd'].value_counts().index[0]
    dic['most_Trx_Cod2_Cd'] = df['Trx_Cod2_Cd'].value_counts().index[0]
    dic['avg_trade_amt'] = df['cny_trx_amt'].sum() / len(df)
    s = pd.Series(dic, index = ['trade_amt','most_Dat_Flg3_Cd','most_Trx_Cod1_Cd','most_Trx_Cod2_Cd','avg_trade_amt'])
    return s
train_trade_1 = train_trade.groupby('id').apply(trade_amt)

最终我们可以得到合并后的train_data:

all_tag = train_tag.merge(train_beh_1, how = 'inner', on = 'id').merge(train_trade_1, how = 'inner', on = 'id')

观察整个数据，发现deg_cd这一列数据缺失较多，于是我们选择舍弃这一列，并将edu_deg_cd和atdd_type这两列数据缺失不多的特征将nan也作为一个特征

#删除deg_cd这一列特征
all_tag.drop('deg_cd', axis = 1, inplace = True)
all_tag.loc[all_tag['edu_deg_cd'].isnull(),'edu_deg_cd'] = 'nan'
all_tag.loc[all_tag['atdd_type'].isnull(), 'atdd_type'] = 'nan'

做好上述处理后，我们将对剩下来的特征分连续型和离散型进行处理。

#连续型变量
continues_variables = ['age','job_year','frs_agn_dt_cnt','l12mon_buy_fin_mng_whl_tms','l12_mon_fnd_buy_whl_tms',
                       'l12_mon_insu_buy_whl_tms','l12_mon_gld_buy_whl_tms','ovd_30d_loan_tot_cnt','his_lng_ovd_day',
                       'cur_debit_cnt','cur_credit_cnt','cur_debit_min_opn_dt_cnt','cur_credit_min_opn_dt_cnt','app_use_times'
                       ,'trade_amt','avg_trade_amt' ]
 #分类型变量
classified_variation = ['cur_debit_crd_lvl','hld_crd_card_grd_cd','crd_card_act_ind','l1y_crd_card_csm_amt_dlm_cd',
                      'atdd_type','perm_crd_lmt_cd','gdr_cd','mrg_situ_cd','ic_ind','fr_or_sh_ind','dnl_mbl_bnk_ind',
                      'dnl_bind_cmb_lif_ind','hav_car_grp_ind','hav_hou_grp_ind','l6mon_agn_ind','vld_rsk_ases_ind',
                      'fin_rsk_ases_grd_cd','confirm_rsk_ases_lvl_typ_cd','cust_inv_rsk_endu_lvl_cd','l6mon_daim_aum_cd',
                      'tot_ast_lvl_cd','pot_ast_lvl_cd','bk1_cur_year_mon_avg_agn_amt_cd','loan_act_ind','most_like_page',
                       'most_Dat_Flg3_Cd','most_Trx_Cod1_Cd','most_Trx_Cod2_Cd','pl_crd_lmt_cd','acdm_deg_cd', 'edu_deg_cd']
all_tag[classified_variation] = all_tag[classified_variation].astype(str)

变量筛选

我们对缺失值进行处理后，接下来就是进行变量的筛选，这里我们选用的woe值编码后通过IV值的筛选方法。
我们使用WoE值代替原始的分组值，WoE的计算公式如下：

$WoE_i = ln\left(\displaystyle \frac {^{\# G_i} / _{\# G_T}}{^{\# B_i} / _{\# B_T}}\right)$
$G_i$ 代表某分组好样例个数， $B_i$ 代表某分组坏样例个数， $G_T$ ， $B_T$ 则代表总的好样本和坏样本的个数。

WoE 值反应了某个特征类别对预测结果（违约率）的影响。

使用WoE对特征值进行编码的意义：

使用WoE编码值对特征进行合并，使得不同分类中的数据分布差异明显
使用WoE编码计算特征的IV值，根据IV值对特征进行筛选
用WoE编码值代替数据原始的分类标签，可以不需要引入哑变量，方便进行逻辑回归，计算出的系数可以直接进行比较
WoE编码可以处理特征中的空值

IV（Information Value）值主要反应自变量对因变量的预测能力，经常用于建模前的特征筛选。

特征筛选的作用：

提高模型泛化能力，减少过拟合
减少训练时间
IV 计算公式：

$IV_i =\left(\displaystyle{\frac{\# G_i}{\# G_T}} - {\frac{\# B_i}{\# B_T}}\right) * ln\left(\displaystyle \frac {^{\# G_i} / _{\# G_T}}{^{\# B_i} / _{\# B_T}}\right) = \left(\displaystyle{\frac{\# G_i}{\# G_T}} - {\frac{\# B_i}{\# B_T}}\right) * WoE_i$

$=\displaystyle \sum_i^n{IV_i}$

IV值解读：

IV	预测能力
< 0.02	不具备预测能力，应该放弃
0.02 - 0.1	弱预测能力
0.1 - 0.3	中等预测能力
0.3 - 0.5	强预测能力
>0.5	结果可疑，需要重新检查

对于连续型变量，我们采用等频分箱，并在等频的基础上加上卡方检验，分箱函数如下

#连续型变量的分箱
def graphforbestbin(DF, X, Y, n=5,q=20,graph=True):
    '''
    自动最优分箱函数，基于卡方检验的分箱

    参数：
    DF: 需要输入的数据
    X: 需要分箱的列名
    Y: 分箱数据对应的标签 Y 列名
    n: 保留分箱个数
    q: 初始分箱的个数
    graph: 是否要画出IV图像

    区间为前开后闭 (]

    '''
    try:
        DF = DF[[X,Y]].copy()

        DF["qcut"],bins = pd.qcut(DF[X], retbins=True, q=q,duplicates="drop")
        coount_y0 = DF.loc[DF[Y]==0].groupby(by="qcut").count()[Y]
        coount_y1 = DF.loc[DF[Y]==1].groupby(by="qcut").count()[Y]
        num_bins = [*zip(bins,bins[1:],coount_y0,coount_y1)]

        for i in range(q):
            if 0 in num_bins[0][2:]:
                num_bins[0:2] = [(
                    num_bins[0][0],
                    num_bins[1][1],
                    num_bins[0][2]+num_bins[1][2],
                    num_bins[0][3]+num_bins[1][3])]
                continue

            for i in range(len(num_bins)):
                if 0 in num_bins[i][2:]:
                    num_bins[i-1:i+1] = [(
                        num_bins[i-1][0],
                        num_bins[i][1],
                        num_bins[i-1][2]+num_bins[i][2],
                        num_bins[i-1][3]+num_bins[i][3])]
                    break
            else:
                break

        def get_woe(num_bins):
            columns = ["min","max","count_0","count_1"]
            df = pd.DataFrame(num_bins,columns=columns)
            df["total"] = df.count_0 + df.count_1
            df["percentage"] = df.total / df.total.sum()
            df["bad_rate"] = df.count_1 / df.total
            df["good%"] = df.count_0/df.count_0.sum()
            df["bad%"] = df.count_1/df.count_1.sum()
            df["woe"] = np.log(df["good%"] / df["bad%"])
            return df

        def get_iv(df):
            rate = df["good%"] - df["bad%"]
            iv = np.sum(rate * df.woe)
            return iv

        IV = []
        axisx = []
        #卡方检验
        while len(num_bins) > n:
            pvs = []
            for i in range(len(num_bins)-1):
                x1 = num_bins[i][2:]
                x2 = num_bins[i+1][2:]
                pv = scipy.stats.chi2_contingency([x1,x2])[1]
                pvs.append(pv)

            i = pvs.index(max(pvs))
            num_bins[i:i+2] = [(
                num_bins[i][0],
                num_bins[i+1][1],
                num_bins[i][2]+num_bins[i+1][2],
                num_bins[i][3]+num_bins[i+1][3])]

            bins_df = pd.DataFrame(get_woe(num_bins))
            axisx.append(len(num_bins))
            IV.append(get_iv(bins_df))

        if graph:
            plt.figure()
            plt.plot(axisx,IV)
            plt.xticks(axisx)
            plt.xlabel("number of box")
            plt.ylabel("IV")
            plt.show()
        return bins_df
    except:
        return -1

我们对于每个连续型变量分箱，拿job_year这个变量为例，分箱函数会出现如下结果：

我们观察发现当分为6箱的情况下，变量对应的iv值较原来差不多，但小于6箱时，iv值急速下降，这说明分为6箱能较好的保存信息，因此选择6箱作为分箱数。其他变量也采用这种方法。

auto_col_bins = {'age': 7
                ,'job_year':6
                ,"frs_agn_dt_cnt":6
                ,'cur_credit_min_opn_dt_cnt':7
                ,'app_use_times':7
                ,'trade_amt': 7
                ,'avg_trade_amt':8}
hand_bins = {'l12mon_buy_fin_mng_whl_tms':[0,1,4,5]
            ,'l12_mon_fnd_buy_whl_tms':[0,1,2,5]
            ,'l12_mon_insu_buy_whl_tms': [0,1]
            ,'l12_mon_gld_buy_whl_tms': [0,1]
            ,'his_lng_ovd_day':[0,1,3]}
hand_bins = {k:[-np.inf,*v[:-1],np.inf] for k,v in hand_bins.items()}

#连续型变量的分箱结果
continue_bins_of_col = {}

for col in auto_col_bins:
    bins_df = graphforbestbin(all_tag, col, 'flag',n = auto_col_bins[col], q =20,graph=False)
    bins_list = sorted(set(bins_df["min"]).union(bins_df["max"]))
    #保证区间覆盖使用 np.inf 替换最大值 -np.inf 替换最小值
    bins_list[0],bins_list[-1] = -np.inf,np.inf
    continue_bins_of_col[col] = bins_list
    
#合并手动分箱数据    
continue_bins_of_col.update(hand_bins)
 
#单独定义计算woe值和相应的iv值
def get_woe(df,col,y,bins):
    df = df[[col,y]].copy()
    df["cut"] = pd.cut(df[col],bins)
    bins_df = df.groupby("cut")[y].value_counts().unstack()
    bins_df["woe"] = np.log((bins_df[0]/bins_df[0].sum())/(bins_df[1]/bins_df[1].sum()))
    return bins_df

def get_iv(df):
    rate = df[0] / sum(df[0]) - df[1] /sum(df[1])
    iv = np.sum(rate * df.woe)
    return iv

最后我们筛选出iv值满足条件的特征

#得到连续型变量的iv字典
iv_all = {}

for col in continue_bins_of_col:
    iv_all[col] = get_iv(get_woe(all_tag,col,"flag",continue_bins_of_col[col]))
    
iv_all

#连续型变量的iv转换成dataframe
continues_iv = pd.DataFrame(iv_all,index = ['iv']).T
continues_iv[continues_iv['iv'] >0.2]

特征	iv
age	2.883654
frs_agn_dt_cnt	0.328761
cur_credit_min_opn_dt_cnt	3.557844
app_use_times	0.625965
trade_amt	1.272628
avg_trade_amt	0.607133
l12mon_buy_fin_mng_whl_tms	1.419786
l12_mon_fnd_buy_whl_tms	0.425162

接下来我们处理的是分类型的变量，分类型变量先按照类别分箱，在通过卡方检验合并相似的箱体

#分类型变量的分箱
def classified_variable(DF, X, Y):
    """分类型变量的woe和iv值计算"""
    DF = DF[[X,Y]].copy()
    coount = DF.groupby(X).apply(lambda df: df.groupby(Y).count())[X].unstack().fillna(0)
    coount_0 = coount[0]
    coount_1 = coount[1]
    
    num_bins = [*zip(coount.index, coount_0, coount_1)]
    
    q = len(num_bins)
    for i in range(q):
        if 0 in num_bins[0][1:]:
            num_bins[0:2] = [(str(num_bins[0][0]) + '/' +str(num_bins[1][0]),
                              num_bins[0][1] +num_bins[1][1], 
                              num_bins[0][2]+ num_bins[1][2])]
            
            continue
            
        for i in range(len(num_bins)):
            if 0 in num_bins[i][1:]:
                num_bins[i-1: i+1] = [(str(num_bins[i-1][0]) + '/' +str(num_bins[i][0]),
                                       num_bins[i-1][1] + num_bins[i][1],
                                       num_bins[i-1][2] + num_bins[i][2])]
                break
        else:
            break
            
    def get_woe(num_bins):
        columns = ["class","count_0","count_1"]
        df = pd.DataFrame(num_bins,columns=columns)
        df["total"] = df.count_0 + df.count_1
        df["percentage"] = df.total / df.total.sum()
        df["bad_rate"] = df.count_1 / df.total
        df["good%"] = df.count_0/df.count_0.sum()
        df["bad%"] = df.count_1/df.count_1.sum()
        df["woe"] = np.log(df["good%"] / df["bad%"])
        return df
    
    def get_iv(df):
        rate = df["good%"] - df["bad%"]
        iv = np.sum(rate * df.woe)
        return iv
    
    bins_df = pd.DataFrame(get_woe(num_bins))
    iv = get_iv(bins_df)
    
    return bins_df, iv


#计算分类型变量的iv值
dic = {}
for i in classified_variation:
#     print(i)
    bins,iv = classified_variable(all_tag, i, 'flag')
    dic[i] = iv
classified_iv = pd.DataFrame(dic,index = ['iv']).T
classified_iv[classified_iv['iv'] > 0.2]

通过IV值筛选过变量之后，我们建立一个映射，这个映射的输入是对应的特征值，输出的是对应特征值所在箱的woe编码。

#筛选出iv值大于0.2的变量，构建连续变量的woe的映射
continues_woe_map = {}
for col in list(continues_iv[continues_iv['iv'] >0.2].index):
    continues_woe_map[col] = get_woe(all_tag, col, 'flag',continue_bins_of_col[col])['woe']

#构建分类型变量的woe映射
def process_obj_map(df):
    result = []
    for idx, (cls, woe) in df.iterrows():
        label_list = str(cls).split('/')
        for label in label_list:
            result.append((label, woe))
    return pd.DataFrame(result,columns = ['cut','woe']).set_index('cut')
        

classified_woe_map = {}
classified_bins_of_col = {}
for col in list(classified_iv[classified_iv['iv'] >0.2].index):
    bins_df ,_ = classified_variable(all_tag, col, 'flag')
    classified_woe_map[col] = process_obj_map(bins_df[['class','woe']])['woe']
    classified_bins_of_col[col] = list(process_obj_map(bins_df[['class','woe']]).index)

model_data = all_tag[selected_variables].copy()
for col in selected_variables:
    if col in continues_woe_map.keys():
        model_data[col] = pd.cut(model_data[col],continue_bins_of_col[col]).map(continues_woe_map[col])
    elif col in classified_bins_of_col.keys():
        model_data[col] = model_data[col].map(classified_woe_map[col])

模型建立和评价

接下来我们进行建模，我们选择逻辑回归作为我们的模型，这个模型比较简单，但鲁棒性较强，同时可以比较好的拟合数据。

X = model_data[list(set(model_data.columns)-set(['flag']))]
y = model_data['flag']

from sklearn.model_selection import train_test_split
X_train, X_test,y_train,y_test = train_test_split(X, y, test_size =0.2, shuffle =True)

from sklearn.linear_model import LogisticRegression as LR

lr = LR().fit(X_train,y_train)
lr.score(X_test,y_test)

计算相关AUC值得到0.94

import scikitplot as skplt
 
#%%cmd
#pip install scikit-plot
 
test_proba_df = pd.DataFrame(lr.predict_proba(X_test))
skplt.metrics.plot_roc(y_test, test_proba_df,
                        plot_micro=False,figsize=(6,6),
                        plot_macro=False)

KS曲线与KS值：

KS曲线是tpr与fpr差值为纵坐标，以分类阈值（threshold）为横坐标形成的曲线
tpr与fpr差值绝对值的最大值即为KS值，KS值对应的threshold就是模型的最优分类阈值
KS值可以作为模型效果的判断标准，一般KS值更大的模型有更好的分类效果

下面再计算ks值，计算模型判定阈值。

fpr, tpr, threshold = roc_curve(y_test, lr.predict_proba(X_test)[:,1], pos_label=1)
# 计算 tpr 与 fpr 差值绝对值的最大值
ks = max(abs(tpr - fpr))
ks
# 找到 KS 值对应的threshold
best_threshold = threshold[np.argmax(abs(tpr - fpr))]
best_threshold
# 生成KS曲线
plt.plot(1 - threshold, tpr)
plt.plot(1 - threshold, fpr)
plt.plot(1 - threshold, tpr - fpr)
plt.xlim(0,(1-threshold).max())
plt.axvline(1 - best_threshold, color='y', linewidth=1)
plt.legend(['tpr', 'fpr', 'ks_cure'])

模型最大ks值为0.72，对应阈值为0.145

多种弹窗实现方法鸿蒙示例代码
本文原创发布在华为开发者社区。介绍本示例介绍以下五种常见的弹窗场景化案例。应用启动时的隐私政策和用户协议弹窗网络请求完成的结果提示弹窗应用返回上一级页面的退出确认弹窗个人信息填写的信息弹窗应用使用过程中出现的付费类广告弹窗弹窗场景化源码链接效果预览使用说明进入应用会立马弹出一个隐私协议窗口，点同意关闭该窗口，点不同意退出应用。点击网络请求完成的结果提示弹窗，会弹出一个等待的子窗口弹窗，网络请求完毕
golang接口用法-代码案例 JavaPub-rodert golang golang 开发语言后端
文章目录Go语言中接口（interface）的含义接口的常见应用场景示例1示例2（Dog和Cat）使用场景-多数据库Go语言中接口（interface）的含义接口在Go语言中是一种类型，它定义了一组方法的集合。一个类型只要实现了接口中定义的所有方法，就认为该类型实现了该接口。接口不关心具体的实现细节，只关心方法的签名（即方法的名称、参数和返回值类型）。接口可以看作是不同类型之间的桥梁，它允许不同类
引入 DeepSeek，企业人力成本优化利器小柔说科技人工智能大数据软件开发 deepseek
AI在销售领域的表现越来越惊艳。在销售成交过程中，从添加微信到完成咨询，AI全程对答如流，流程顺畅，宛如一位经验丰富的销售冠军。试想一下，如果将这样成熟的AI智能体应用到企业中，原本依赖大量人力的销售业绩，或许只需一个AI就能轻松完成。企业甚至可以从100名员工优化到30名、10名，最终迈向无人化运营。AI不仅提升了效率，更开启了企业运营的全新模式。1.AI销售的高效性在这个案例中，AI从客户咨询
Django系列教程（13）——Cookie和Session应用场景及案例 l软件定制开发工作室 Django教程 django
目录什么是cookie，cookie的应用场景及缺点Django中如何使用cookieCookie使用示例什么是session及session的工作原理Django中如何使用会话sessionSession使用示例小结HTTP协议本身是”无状态”的，在一次请求和下一次请求之间没有任何状态保持，服务器无法识别来自同一用户的连续请求。有了cookie和session，服务器就可以利用它们记录客户端的访
初学python100例-案例4 计算一年第几天多种不同解法少儿编程案例讲解小兔子编程初学python100例 python学习 python100例 python计算天数 python算法 python案例
题目输入某年某月某日，判断这一天是这一年的第几天？解法1程序分析1、以5月2日为例，应该先把前四个月的加起来，2、然后再加上2天即本年的第几天，3、特殊情况，闰年且输入月份大于2时需考虑多加一天：4、闰年1、年份能被4整除；2、年份若是100的整数倍的话需被400整除，否则是平年。程序源代码：year=int(input('year:\n'))month=int(input('month:\n')
Trae AI 上新 SSHremote：服务器 Python 接口日志排查实战指南芯作者 DD：日记人工智能深度学习机器学习
在当今的软件开发中，服务器端的稳定性和可靠性至关重要。然而，生产环境中的问题往往难以预测，尤其是接口返回502错误却无日志记录的情况，更是让开发者头疼不已。幸运的是，字节跳动推出的AI原生IDE——Trae，近期上线的SSHremote功能，为远程服务器日志排查提供了全新的解决方案。本文将结合实战案例，深入探讨如何利用TraeAI的SSHremote功能高效排查Python接口日志问题，并分享创新
MyBatis-Plus核心功能与实战案例千层冷面 mybatis java
MyBatis-Plus核心功能与实战案例，代码示例基于SpringBoot3.x+MyBatis-Plus3.5.3：一、MyBatis-Plus基础篇1.简介与核心优势MyBatis-Plus（MP）是MyBatis的增强工具，在保留MyBatis原生功能的基础上，通过内置通用Mapper、Service、条件构造器等，大幅简化开发。核心优势：无侵入：只做增强不做改变，可与MyBatis原生功
含光热电站、有机有机朗肯循环、P2G的综合能源优化调度（Matlab代码实现）创新优化代码学习能源 matlab 前端
‍个人主页欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述含光热电站、有机朗肯循环与P2G的综合能源优化调度研究一、技术基础与系统作用二、多技术协同机制三、优化调度模型构建四、典型案例与仿真分析五、未来研究方向结论2运行结果3参考文献4Matlab代码实现1概述光热发电(concentratingsolarp
DevOps中集成自动化测试的具体案例 Zachary AI CICD相关 devops 运维
在DevOps中集成自动化测试的具体案例可以从多个角度进行分析，包括金融行业、分布式系统、大型企业等不同领域的实践。以下是几个具体的案例：金融行业的DevOps实践：在金融行业中，DevOps被广泛应用于提升软件开发和运营的效率。例如，通过解析后台接口代码日志格式，自动化生成接口测试案例，解决了接口自动化测试过程中各交易输入值难以确定的问题，从而提高了接口测试效率[14]。此外，农行手机银行系统存
Java+Selenium+Cucumber自动化测试框架：高效软件测试的利器测试渣 java selenium
一、引言在当今软件开发的快速迭代的背景下，确保软件质量和功能的正确性变得愈发关键。自动化测试作为一种提高测试效率、降低成本的有效手段，受到了广泛的关注。Java作为一门功能强大且广泛应用的编程语言，与Selenium和Cucumber相结合的自动化测试框架，为软件测试领域带来了诸多优势。本文将深入探讨这一自动化测试框架，包括其简介、各组件的作用、环境搭建、实际应用案例以及未来发展趋势等内容。二、J
使用python seaborn创建配对图：从核心概念到实战案例梦想画家数据分析工程 #python 人工智能 python 机器学习
Seaborn的配对图（Pairplot）是一种用于探索多变量数据关系的可视化工具，尤其适合分析数据集中多个特征之间的相关性、分布模式或异常值。本文介绍如何生成数据集数值变量之间的配对图，并通过参数设置色系。配对图的核心作用矩阵式可视化生成一个N×N的网格图（N为特征数），每个单元格展示两列特征之间的关系。默认对角线显示单变量分布（直方图或KDE曲线），非对角线显示散点图或其他关系图。快速发现模式
Web自动化测试（一）树的鲨鱼前端自动化功能测试
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档Web自动化测试（一）前言一、自动化相关理论1.什么是自动化以及它的好处2.什么是软件测试3.什么是自动化测试4.自动化测试能解决什么问题4.自动化测试分类5.什么Web项目适合做自动化测试6.Web自动化测试所属分类7.主流的Web自动化测试化工具二、Selenium1.特点2.发展历程3.环境搭建4.第一个案例三、Selenium
去中心化金融的风起与未来：从边缘创新到主流趋势 Echo_Wish 前沿技术人工智能 python 区块链开发语言
去中心化金融的风起与未来：从边缘创新到主流趋势在区块链技术的大潮中，去中心化金融（DeFi，DecentralizedFinance）以其革命性的理念彻底颠覆了传统金融世界的规则。DeFi的发展让普通用户得以无需依赖银行或中介机构就能在全球范围内转账、借贷、投资。然而，DeFi的光环背后也隐藏着种种挑战，未来将如何发展？本文从现状分析入手，并结合实际案例，带你展望其广阔前景。DeFi的现状：金融民
React性能优化的深度解析：React.memo和useMemo的真相与误区今天也想MK代码持续学习持续总结 react.js 性能优化前端
引言在React应用开发中，性能优化始终是开发者关注的重点。随着应用规模的扩大，组件渲染效率成为影响用户体验的关键因素。React.memo和useMemo是React提供的两个常用性能优化API，但它们常常被误解和滥用。本文将深入剖析这两个API的工作原理、适用场景，并通过实际案例分析它们的优缺点，帮助开发者做出明智的性能优化决策。技术原理React.memo与useMemo的本质区别React
动态规划算法优化在资源分配问题中的应用 suyang199312 课程设计
摘要资源分配问题广泛存在于各类生产与管理场景，合理分配资源以实现效益最大化至关重要。本文深入剖析动态规划算法在资源分配问题中的应用，详细阐述其基本原理与常规解法，针对常规解法的不足提出创新优化思路，并给出具体实现步骤。通过实际案例分析与实验验证，展示优化后的动态规划算法在提升资源分配效率和效益方面的显著优势，为相关领域的决策制定提供有力支持。引言在经济、工程、计算机科学等众多领域，资源分配问题无处
代理IP防“开盒”？技术人实测后的真相与防护指南小白iP代理 tcp/ip 网络系统安全
近年来“开盒”攻击事件频发，最近更是暴出百度副总裁12岁女儿”开盒“他人。技术人该如何保护隐私？本文从代理IP的原理出发，结合实测数据与攻防案例，分析代理技术的真实作用与局限，并提供一套可落地的防护方案。一、什么是“开盒”攻击？“开盒”（Doxxing）是一种通过技术手段挖掘并公开他人隐私信息的网络暴力行为，常见攻击路径包括：IP追踪：通过社交平台、游戏服务器等获取目标IP地址数据关联：利用社工库
【前端网络深潜行者】信息化人员必备知识&面试宝典：TCP连接中断，客户端突然“玩失踪”怎么办？ DTcode7 IT信息技术相关 #信息化技能面试宝典 HTML5 前端 javascript 前端三大核心 JS
【前端网络深潜行者】信息化人员必备知识&面试宝典：TCP连接中断，客户端突然“玩失踪”怎么办？TCP的忠诚卫士：保活与重传保活机制（Keepalive）超时重传与超时前端策略：优雅的应对与重连案例一：心跳检测案例二：断线重连逻辑安全与性能考量实战经验之谈排错思路结语与探讨在网络通信的迷宫中，TCP/IP协议犹如稳固的桥梁，承载着数据的往来。然而，当客户端这个“信使”突然玩起了失踪”，我们如何确保这
c++ 创建dll以及调用dll的案例感叹号的豆浆 C++vs2012 语言 c++
1,新建一个空项目，定义头文件，源文件，//CameraDLLl.hextern"C"__declspec(dllexport)boolIAInitCamera(charcameraIp[]);extern"C"__declspec(dllexport)boolIASetCameraReady(charsaveImagePath[],inttimeOut);extern"C"__declspec(
lua调用c++dll 简单案例感叹号的豆浆 lua lua-5-1 c++dll文件
大家都知道lua和c++之间可以相互调用；方法有好多调用tolua++.exe,swig转化工具都行，下面演示一个lua调用c++dll简单案例：配置环境：vs2012,lua工程文件和tolua工程文件，lua安装环境1,新建一个工程project命名为CameraTest1,添加头文件cameraTest_function.h和cameraTest_function.cpp文件,写入自己想要实
淘宝API接口深度解析：用户行为分析与精准营销实战 lovelin+vI7809804594 爬虫人工智能 python 反向海淘 API
在电子商务领域，数据是驱动业务增长的关键要素之一。淘宝API接口作为连接商家与淘宝平台的桥梁，为商家提供了丰富的数据资源和强大的功能支持。其中，用户行为分析与精准营销是商家利用淘宝API接口实现业务增长的重要手段。本文将深入解析淘宝API接口在用户行为分析与精准营销方面的应用，并结合实战案例探讨其实际效果。一、淘宝API接口概述淘宝API接口是淘宝开放平台提供的一组标准化的网络接口，允许第三方开发
华为云在工业数字化方面的优势九河智造云华为云人工智能云计算制造
华为云在工业数字化领域展现出全方位的优势，为制造业的转型升级提供了强大的助力。一、专业的数字化诊断治理服务华为云的数字化诊断治理专家服务为企业提供全面的深度诊断、成熟度评估、产业升级分析、创新治理和专家咨询等服务。其诊断模型参考国际国内标准，结合多体系理论与华为自身实践，能够精准定位企业运营中的问题点，并提供针对性的解决方案。同时，华为云拥有丰富的诊断团队和案例，基于全国180余个赋能云创新中心、
计算机专业开题报告案例19：基于spring boot的养老院信息管理系统的设计与实现平姐设计计算机毕业设计100套 java项目实战网站开发与搭建实战项目 spring boot 后端 java 计算机毕业设计养老院信息管理系统开题报告老人信息
计算机毕业设计100套微信小程序项目实战java项目实战需要源码可以滴滴我一、课题论证1.1国内外研究动态目前，基于springboot的养老院信息管理系统的研究和开发已经在国内外得到了较多关注和实践。北京大学医学部的研究人员开发了一套养老院信息管理系统，该系统可以实现对老人的生活、医疗、营养等方面的全面管理和监测。此外，南开大学、清华大学等高校也都开展了相关研究。其中就有采取建立于微信小程序平台
05.静态代理设计模式 java
05.静态代理设计模式目录介绍01.静态代理模式基础1.1静态代理由来1.2静态代理定义1.3静态代理场景1.4静态代理思考02.静态代理原理与实现2.1罗列一个场景2.2用一个例子理解代理2.3案例演变分析03.静态代理分析3.1静态代理结构图3.2静态代理时序图04.代理模式优势4.1如何降低耦合4.2保护真实对象使用权限05.静态代理不足5.1静态代理类优缺点5.2静态代理缺乏灵活5.3静态
【AI Agent教程】各种Agent开发框架都是如何实现ReAct思想的？深入源码学习一下同学小张大模型人工智能学习笔记经验分享 AIGC AI Agent ReAct
大家好，我是同学小张，持续学习C++进阶知识和AI大模型应用实战案例，持续分享，欢迎大家点赞+关注，共同学习和进步。驱动大模型有很多种方式，例如纯Prompt方式、思维链方式、ReAct方式等。ReAct方式是AIAgent最常用的实现思路之一，它强调在执行任务时结合推理（Reasoning）和行动（Acting）两个方面，使得Agent能够在复杂和动态的环境中更有效地工作。本文我们来看看常用的那
agent实现：通过prompt方式实现agent自定义使用 loong_XL 深度学习大模型AI prompt agent 打磨下大模型
参看：https://github.com/TommyZihao/openvino_tonypihttps://github.com/QwenLM/Qwen/blob/main/examples/react_prompt.md（思想类似react）通过prompt形式，基本任何llm模型都可以使用来自定义agent，不用只能那些支持functioncall的大模型的，更灵活自由prompt案例：比
DeepSeek的实际应用场景：AI技术如何赋能多领域创新 2501_91189350 人工智能
DeepSeek作为新一代智能技术平台，凭借其强大的算法能力和灵活的部署方式，正在多个行业掀起效率革命。本文将从真实案例出发，解析DeepSeek在不同场景中的落地应用。‌场景一：金融风控建模‌在信贷风险评估领域，传统模型存在数据维度单一、更新滞后等问题。某银行引入DeepSeek的‌动态特征工程模块‌，通过实时整合用户行为数据、社交网络信息等100+维度特征，成功将坏账识别准确率提升至98.5%
Angular 18：从模块化到独立组件的转变 t0_54coder 编程问题解决手册 angular.js 前端 javascript 个人开发
随着Angular17的发布，Angular18继续推动开发者走向更简化的架构模式——独立组件（StandaloneComponents）。在这篇博客中，我们将探讨如何将一个使用模块化（NgModule）的Angular应用转变为使用独立组件的架构，并以一个具体的案例来说明这个过程。为什么选择独立组件？Angular18鼓励使用独立组件，主要有以下几个原因：减少冗余代码：不再需要为每个组件创建独立
【面试问题】Java 接口与抽象类的区别刘小炮吖i Java Java后端开发面试题 java 开发语言面试
引言在Java面向对象编程中，接口（Interface）和抽象类（AbstractClass）是两个重要的抽象工具。它们都能定义未实现的方法，但设计目标和使用场景截然不同。本文将通过语法、特性和实际案例，深入解析两者的核心区别。一、基础概念回顾抽象类（AbstractClass）定义：使用abstract关键字声明的类，包含抽象方法（无实现）和具体方法（有实现）。特点：不能被实例化，必须通过子类继
类的创建以及类的继承及其应用对象烈焰猩猩 python
类的创建以及类的继承及其应用场景一,类的创建格式:格式1:class类名:pass格式2:class类名():pass格式3:#class类名(父类名):class类名(object):pass案例:案例需求定义老师类.实现思路定义老师类(三种方式).函数内容.创建该类对象.打印该类对象.#1.定义老师类(三种方式).#classTeacher:#classTeacher():classTeach
AXI总线之相关应用逾越TAO fpga开发硬件工程笔记
AXI总线作为现代SoC设计的核心互连协议，其应用场景极为广泛，覆盖移动设备、AI加速器、FPGA、存储控制器等多个领域。以下是AXI在不同应用中的关键角色及具体实现案例：一、移动处理器与SoC应用场景：智能手机、平板电脑的SoC（如高通骁龙、苹果A系列、华为麒麟）中，AXI用于连接多核CPU、GPU、ISP（图像信号处理器）、DDR控制器等模块。典型案例：ARMCortex-A系列多核集群：AX
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

招商银行fintech评分卡案例