爱挠静香下巴的hp

使用toad做一张逻辑回归贷前评分卡

前言

对于金融信贷和保险行业，贷前/保前对客户的进行一个信用评级和打分是必要的，也就是需要构建一张评分卡，传统评分卡多是专家打分，基于机器学习的评分卡则更多是通过可解释更强的逻辑回归来构建，最近学习过程中，发现了一个第三方库，其中部分代码和功能还是较为有用的，这个项目作为一个学习过程中的记录。
由于数据特征被匿名化过，所以不进行分箱的调整，也不过多关注业务上的可解释性，仅记录从数据导入到建卡的一个流程。

所有代码和数据请点击数据、代码下载链接
fork后可下载

导入需要的库、读取数据

需要安装toad，加个镜像更快

pip install toad -i https://pypi.douban.com/simple

查看数据
obs_mth是时间
bad_ind是标签
uid是用户编码
其余10个特征（td_score jxl_score mj_score rh_score zzc_score zcx_score person_info finance_info credit_info act_info）被匿名化处理了

import toad
import pandas as pd
import numpy as np
data = pd.read_csv('/home/mw/input/A_data3225/Acard.csv')
print('Shape:',data.shape)
data.head(10)

共有2018年6、7、9、10、11五个月的数据

print('obs_mth:',data.obs_mth.unique())

obs_mth: [‘2018-10-31’ ‘2018-07-31’ ‘2018-09-30’ ‘2018-06-30’ ‘2018-11-30’]

选择三个月的数据作为训练数据，另外两个月作为时间外样本

train = data.loc[data.obs_mth.isin(['2018-06-30','2018-07-31','2018-09-30'])==True,:]
OOT = data.loc[data.obs_mth.isin(['2018-06-30','2018-07-31','2018-09-30'])==False,:]

print('train size:',train.shape,'\nOOT size:',OOT.shape)

train size: (65304, 13)
OOT size: (30502, 13)

EDA

toad.detect(data)用于检测数据情况。
输出每列特征的统计性特征和其他信息，主要的信息包括：缺失值、unique values、数值变量的平均值、离散值变量的众数等
从下表我们可以看出，坏样本占比为0.0167

输出每个变量的iv值，gini，entropy，和unique values，结果以iv值排序。”target”为目标列，”iv_only”决定是否只输出iv值。

注意：

对于数据量大或高维度数据，建议使用iv_only=True
要去掉主键，日期等高unique values且不用于建模的特征

to_drop = ['uid','obs_mth'] # 去掉ID列和month列
toad.quality(train.drop(to_drop,axis=1),'bad_ind',iv_only=True)

特征选择

toad.selection.select(dataframe, target=’target’, empty=0.9, iv=0.02, corr=0.7, return_drop=False, exclude=None):
根据缺失值占比，iv值，和高相关性进行变量筛选，赋值为：

（1）empty=0.9: 若变量的缺失值大于0.9被删除

（2）iv=0.02: 若变量的iv值小于0.02被删除

（3）corr=0.5: 若两个相关性高于0.5时，iv值低的变量被删除

（4）return_drop=False: 若为True，function将返回被删去的变量列

（5）exclude=None: 明确不被删去的列名，输入为list格式

这里没有筛掉特征

train_selected, dropped = toad.selection.select(train,target = 'bad_ind', empty = 0.5, iv = 0.02, corr = 0.5, return_drop=True, exclude=['uid','obs_mth'])
print(dropped)

{‘empty’: array([], dtype=float64), ‘iv’: array([], dtype=object), ‘corr’: array([], dtype=object)}

可以看出，原数据没有特征被筛选掉，我们继续下面的步骤。

分箱

toad的分箱功能支持数值型数据和离散型分箱，默认分箱方法使用卡方分箱。

卡方分箱

卡方分箱是基于卡方检验的一种分箱方式
它的基本思想:
对于精确的离散化，相对类频率在一个区间内应当完全一致。因此,如果两个相邻的区间具有非常类似的类分布，则这两个区间可以合并；否则，它们应当保持分开。而低卡方值表明它们具有相似的类分布。
简单来说，卡方分箱首先会将所有值单独分为一箱，然后进行两两卡方检验，然后进行合并，再进行下一轮卡方检验，如此往复，直到满足预设值。

toad的分箱代码

toad.transform.Combiner 是用来分箱的class，分箱步骤如下：

*** initalise: ***c = toad.transform.Combiner()
训练分箱: c.fit(dataframe, y = ‘target’, method = ‘chi’, min_samples = None, n_bins = None, empty_separate = False)
y: 目标列
method: 分箱方法，支持’chi’ (卡方分箱), ‘dt’ (决策树分箱), ‘kmean’ , ‘quantile’ (等频分箱), ‘step’ (等步长分箱)
min_samples: 每箱至少包含样本量，可以是数字或者占比
n_bins: 箱数，若无法分出这么多箱数，则会分出最多的箱数
empty_separate: 是否将空箱单独分开
查看分箱节点：c.export()
手动调整分箱: c.load(dict)
apply分箱结果: c.transform(dataframe, labels=False):
labels: 是否将分箱结果转化成箱标签。False时输出0,1,2…（离散变量根据占比高低排序），True输出(-inf, 0], (0,10], (10, inf)。
注意：1. 注意删去不需要分箱的列，特别是ID列和时间列

# initialise
c = toad.transform.Combiner()

# 使用特征筛选后的数据进行训练：使用稳定的卡方分箱，规定每箱至少有5%数据, 空值将自动被归到最佳箱。
c.fit(train_selected.drop(to_drop, axis=1), y = 'bad_ind', method = 'chi', min_samples = 0.05) #empty_separate = False

print('person_info:',c.export()['person_info'])

person_info: [-0.2610139784946237, -0.1286774193548387, -0.05371756272401434, 0.013863440860215051, 0.06266021505376344, 0.07885304659498207]

观察分箱并调整

toad.plot的module提供了一部分的可视化功能，帮助调整分箱节点，因为数据特征匿名化，此出不再对特征分箱做调整

时间内观察： toad.plot.bin_plot(dataframe, x = None, target = ‘target)
bar代表了样本量占比，红线代表了正样本占比（e.g. 坏账率）

x: 需要观察的特征
target: 目标列

from toad.plot import bin_plot
%matplotlib inline
col = 'td_score'

bin_plot(c.transform(train_selected[[col,'bad_ind']], labels=True), x=col, target='bad_ind')

跨时间观察： toad.plot.badrate_plot(dataframe, target = ‘target’, x = None, by = None)
输出不同时间段中每箱的正样本占比

target: 目标列
x: 时间列, string格式
by: 需要观察的特征
注意：时间列需要预先分好并设成string，不支持timestampe

开发者提供的文档中说敞口随时间变化而增大为优，代表了变量在更新的时间区分度更强。线之前没有交叉为优，代表分箱稳定。
只理解了后半句，以两个分箱为例，交叉代表某个时间点，两个分箱的坏贷率一致，甚至是相反了，所以分箱稳定性差。
下面看起来分箱的稳定性不太好，是需要调整的

from toad.plot import badrate_plot

col = 'td_score'

# 观察 'var_d2' 分别在时间内和OOT中的稳定性
badrate_plot(c.transform(train[[col,'bad_ind','obs_mth']], labels=True), target='bad_ind', x='obs_mth', by=col)
badrate_plot(c.transform(OOT[[col,'bad_ind','obs_mth']], labels=True), target='bad_ind', x='obs_mth', by=col)

badrate_plot(c.transform(data[[col,'bad_ind','obs_mth']], labels=True), target='bad_ind', x='obs_mth', by=col)

调整分箱：c.update(dict)

#设置分组
rule = {'td_score':[0.3,0.8]}

#调整分箱
c.update(rule)

#查看手动分箱稳定性
bin_plot(c.transform(train_selected[['td_score','bad_ind']], labels=True), x='td_score', target='bad_ind')
badrate_plot(c.transform(data[['td_score','bad_ind','obs_mth']], labels=True), target='bad_ind', x='obs_mth', by='td_score')

WOE转化

WOE转化在分箱调整好之后进行，步骤如下：

用调整好的Combiner转化数据: c.transform(dataframe, labels=False)

只会转化被分箱的变量

初始化woe transer: transer = toad.transform.WOETransformer()

fit_transform: transer.fit_transform(dataframe, target, exclude = None)

训练并输出woe转化的数据，用于转化train/时间内数据

target：目标列数据（非列名）
exclude: 不需要被WOE转化的列注意：会转化所有列，包括未被分箱transform的列，通过 ‘exclude’ 删去不要WOE转化的列，特别是target列
*根据训练好的transer，转化test/OOT数据：*transer.transform(dataframe)

根据训练好的transer输出woe转化的数据，用于转化test/OOT数据。

# 初始化
transer = toad.transform.WOETransformer()

# combiner.transform() & transer.fit_transform() 转化训练数据，并去掉target列
train_woe = transer.fit_transform(c.transform(train_selected), train_selected['bad_ind'], exclude=to_drop+['bad_ind'])
OOT_woe = transer.transform(c.transform(OOT))

print(train_woe)

逐步回归特征筛选

toad.selection.stepwise(dataframe, target=’target’, estimator=’ols’, direction=’both’, criterion=’aic’, max_iter=None, return_drop=False, exclude=None):
逐步回归特征筛选，支持向前，向后和双向（推荐）。

estimator: 用于拟合的模型，支持’ols’, ‘lr’, ‘lasso’, ‘ridge’
direction: 逐步回归的方向，支持’forward’, ‘backward’, ‘both’ （推荐）
criterion: 评判标准，支持’aic’, ‘bic’, ‘ks’, ‘auc’
max_iter: 最大循环次数
return_drop: 是否返回被剔除的列名
exclude: 不需要被训练的列名，比如ID列和时间列
tip: 经验证，direction = ‘both’效果最好。estimator = ‘ols’以及criterion = ‘aic’运行速度快且结果对逻辑回归建模有较好的代表性

# 将woe转化后的数据做逐步回归
final_data = toad.selection.stepwise(train_woe,target = 'bad_ind', estimator='ols', direction = 'both', criterion = 'aic', exclude = to_drop)

# 将选出的变量应用于test/OOT数据
final_OOT = OOT_woe[final_data.columns]

print(final_data) # 逐步回归从10个变量中选出了4个

# 确定建模要用的变量
col = list(final_data.drop(to_drop+['bad_ind'],axis=1).columns)
print(col)

[‘person_info’, ‘finance_info’, ‘credit_info’, ‘act_info’]

PSI

psi

群体稳定性指标（Population Stability Index，PSI）是衡量模型的预测值与实际值偏差大小的指标，计算公式为：

PSI = SUM( (实际占比 - 预期占比）* ln(实际占比 / 预期占比) )
0-0.1为稳定
0.1-0.25表示稳定性一般
0.25以上就代表不稳定

toad代码直接调用

toad.metrics.PSI(df_train, df_test):
输出每列特征的PSI，可以用于检验WOE转化后的特征稳定性

toad.metrics.PSI(final_data[col], final_OOT[col])

person_info 0.127526
finance_info 0.136522
credit_info 0.095688
act_info 0.221254
dtype: float64

常用模型评分

toad也有集成，当然也可以使用sklearn
toad. metrics. KS, F1, AUC

# 用逻辑回归建模
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import roc_auc_score,roc_curve,auc  

lr = LogisticRegression()
lr.fit(final_data[col], final_data['bad_ind'])

# 预测训练和隔月的OOT
pred_train = lr.predict_proba(final_data[col])[:,1]
pred_oot = lr.predict_proba(final_OOT[col])[:,1]
pred_OOT_10 =lr.predict_proba(final_OOT.loc[final_OOT.obs_mth == '2018-10-31',col])[:,1]
pred_OOT_11 =lr.predict_proba(final_OOT.loc[final_OOT.obs_mth == '2018-11-30',col])[:,1]

fpr_lr_train,tpr_lr_train,_ = roc_curve(final_data['bad_ind'],pred_train)  
fpr_lr_oot,tpr_lr_oot,_ = roc_curve(final_OOT['bad_ind'],pred_oot)  
fpr_lr_o10,tpr_lr_o10,_ = roc_curve(final_OOT.loc[final_OOT.obs_mth == '2018-10-31',['bad_ind']],pred_OOT_10) 
fpr_lr_o11,tpr_lr_o11,_ = roc_curve(final_OOT.loc[final_OOT.obs_mth == '2018-11-30',['bad_ind']],pred_OOT_11)

from toad.metrics import KS, AUC
train_auc = AUC(pred_train, final_data['bad_ind'])
oot_auc = AUC(pred_oot, final_OOT['bad_ind'])
oot_10_auc = AUC(pred_OOT_10, final_OOT.loc[final_OOT.obs_mth == '2018-10-31',['bad_ind']])
oot_11_auc = AUC(pred_OOT_11, final_OOT.loc[final_OOT.obs_mth == '2018-11-30',['bad_ind']])

print('train KS',KS(pred_train, final_data['bad_ind']))
print('train AUC',train_auc)
print('oot_auc AUC',oot_auc)
print('oot_10_auc AUC',oot_10_auc)
print('oot_11_auc AUC',oot_11_auc)

print('OOT结果')
print('10月 KS',KS(pred_OOT_10, final_OOT.loc[final_OOT.obs_mth == '2018-10-31','bad_ind']))
print('11月 KS',KS(pred_OOT_11, final_OOT.loc[final_OOT.obs_mth == '2018-11-30','bad_ind']))

train KS 0.4826763171846684
train AUC 0.8087959037951603
oot_auc AUC 0.7601026044556345
oot_10_auc AUC 0.7625868161325697
oot_11_auc AUC 0.756943881551361
OOT结果
10月 KS 0.43015905746501576
11月 KS 0.41412676317598485

也可以通过图来展示

from matplotlib import pyplot as plt  
%matplotlib inline

plt.plot(fpr_lr_train,tpr_lr_train,label = 'train LR:AUC = %0.2f'% train_auc) 
plt.plot(fpr_lr_oot,tpr_lr_oot,label = 'OOT LR:AUC = %0.2f'% oot_auc) 
plt.plot(fpr_lr_o10,tpr_lr_o10,label = 'OOT_10 LR:AUC = %0.2f'% oot_10_auc) 
plt.plot(fpr_lr_o11,tpr_lr_o11,label = 'OOT_11 LR:AUC = %0.2f'% oot_11_auc)  


plt.plot([0,1],[0,1],'k--')  
plt.xlabel('False positive rate')  
plt.ylabel('True positive rate')  
plt.title('ROC Curve')  
plt.legend(loc = 'best')

分数分箱评估

toad.metrics.KS_bucket(predicted_proba, y_true, bucket=10, method = ‘quantile’):
KS bucket输出模型预测分箱后评判信息，包括每组的分数区间，样本量，坏账率，KS等

bucket：分箱的数量
method：分箱方法，建议用’quantile’（等人数），或’step’ (等分数步长)

bad_rate为每组坏账率：（1）组之间的坏账率差距越大越好（2）可以用于观察是否有跳点（3）可以用与找最佳切点（4）可以对比

# 将预测等频分箱，观测每组的区别
toad.metrics.KS_bucket(pred_train, final_data['bad_ind'], bucket=10, method = 'quantile')

得分转换

具体转换原理可以看我之前发的项目点击跳转

toad.ScoreCard( combiner = {}, transer = None, pdo = 60, rate = 2, base_odds = 20, base_score = 750, card = None, C=0.1,kwargs):
逻辑回归模型转标准评分卡，支持传入逻辑回归参数，进行调参。

combiner: 传入训练好的 toad.Combiner 对象
transer: 传入先前训练的 toad.WOETransformer 对象
pdo、rate、base_odds、base_score:
e.g. pdo=60, rate=2, base_odds=20,base_score=750
实际意义为当比率为1/20，输出基准评分750，当比率为基准比率2倍时，基准分下降60分
card: 支持传入专家评分卡
**kwargs: 支持传入逻辑回归参数（参数详见 sklearn.linear_model.LogisticRegression）

card = toad.ScoreCard(
    combiner = c,
    transer = transer,
    class_weight = 'balanced',
    #C=0.1,
    base_score = 600,
    base_odds = 35 ,
    pdo = 50,
    #rate = 2
)

card.fit(final_data[col], final_data['bad_ind'])

#输出标准评分卡
card1=card.export(to_frame=True)
card1

# 自定义转card整数的函数，并包装成scordcard函数需要的字典格式
def dict_type(card1):
    card1.score=card1.score.round()
    card1.value.fillna('nan',inplace=True)
    namelist=list(set(card1.name))
    myvalue=[]
    for var in namelist:
        ind_loc=card1.name==var
        value_dict = dict(zip(card1.value.loc[ind_loc],card1.score.loc[ind_loc]))
        myvalue=myvalue+[value_dict]
    big_dict = dict(zip(namelist,myvalue))
    return big_dict
    
# card2是四舍五入的新卡
card2 = dict_type(card1)
card2

到这一步我们就得到了一张完整的评分卡了

# 重新拟合card
card3 = toad.ScoreCard(
    combiner = c,
    transer = transer,
    class_weight = 'balanced',
    #C=0.1,
    base_score = 600,
    card = card2, 
    base_odds = 35 ,
    pdo = 50,
    rate = 2
)
final_card = card3.export(to_frame=True) 
final_card

得到最终得分

final_score=pd.DataFrame(final_card.predict(data),index=data.index,columns=["score"])
final_score.to_excel("final_score.xlsx")
final_score.describe() #最终评分描述性统计预览

《数据结构》学习笔记二：算法（二）小曼blog
继续上节的学习，我们在这一篇文章里把“算法”这一章内容学习完。本节解决问题：算法的好坏到底是如何评估的？知识点：1.函数的渐进增长2.算法的时间复杂度3.常见的时间复杂度4.算法的空间复杂度1.函数的渐进增长这一知识点与数学相关，不过没关系都是很容易理解的内容。问题：假如两个算法的输入规模都是n,A的执行次数是2n+3,B的执行次数是3n+1,那么这两个算法哪一个更好呢？我们来分析一下，用数学的折
LLM初识
从零到一：用Python和LLM构建你的专属本地知识库问答机器人摘要：随着大型语言模型（LLM）的兴起，构建智能问答系统变得前所未有的简单。本文将详细介绍如何使用Python，结合开源的LLM和向量数据库技术，一步步搭建一个基于你本地文档的知识库问答机器人。你将学习到从环境准备、文档加载、文本切分、向量化、索引构建到最终实现问答交互的完整流程。本文包含详细的流程图描述、代码片段思路和关键注意事项，
CCF-GESP 等级考试 2025年6月认证Python四级真题解析
1单选题（每题2分，共30分）第1题2025年4月19日在北京举行了一场颇为瞩目的人形机器人半程马拉松赛。比赛期间，跑动着的机器人会利用身上安装的多个传感器所反馈的数据来调整姿态、保持平衡等，那么这类传感器类似于计算机的()。A.处理器B.存储器C.输入设备D.输出设备解析：答案：C。所有传感器都用于采集数据，属于输入设备，故选C。第2题小杨购置的计算机使用一年后觉得内存不够用了，想购置一个容量更
推荐开源项目：Milvus Lite —— 轻量级向量数据库，助力AI应用快速起飞穆希静
推荐开源项目：MilvusLite——轻量级向量数据库，助力AI应用快速起飞项目介绍MilvusLite是知名开源向量数据库Milvus的轻量级版本，专为需要在小型环境中进行向量嵌入和相似性搜索的AI应用设计。通过将MilvusLite导入您的Python应用，您可以直接使用Milvus的核心向量搜索功能。MilvusLite已集成在PythonSDKofMilvus中，只需通过pipinstal
2021-12-07 CalciumoxideCu
都说红箭头绿箭头是反向指标。实际看下来，大多数时候都是靠谱的。但也不尽然。比如这几天a的红箭头，确定是反向无疑了。昨天创的绿箭头却是坐实了的向下️了。居安思危，思则有备，有备无患。红的倒着看，绿的枕✔着看，多些风控意思✔不是坏事。
【华为419机考真题】服务器能耗统计，JAVA 题解梦想橡皮擦华为服务器 java 华为OD机试华为OD
最近更新的博客华为od2023|什么是华为od，od薪资待遇，od机试题清单华为OD机试真题大全，用Python解华为机试题|机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南华为od机试，独家整理已参加机试人员的实战技巧本篇题解：服务器耗能题目描述服务器有三种运行状态：空载，单任务，多任务，每个时间片的能耗的分别为111、333、444，每个任务由起始时间片和结束时间片定义运行时
python2.x里面的input（）和raw_input（）函数以及3.x中的input（）函数的区别 scuter_yu python python input函数 raw_input函数 3.x中的input函数
在python3.0及以上的版本中，raw_input（）函数已经和我们说再见了，但是呢，input（）函数则很好地替代了消失了的raw_input（）函数。而且现在的input（）函数所返回的值都是字符串，所以对于要有int，float等类型的数值必须进行强制的类型转换。下面让我对3.0的input（）函数做个小总结：>>>str=input("abc:")abc:15>>>str'15'(虽然
代码相关（python）一个月只能修改一次次代码 python
python程序崩溃提示符用python的时候的各个tips矩阵python判断某个矩阵是否满足要求python生成二维随机数文件/档python检查某个文件存不存在python添加有特定字段的文件到列表python矩阵保存为txt文档python按行读文档python写文档python文档操作字符串python用split来拆分字符串python搜索字符串某个字符的位置给字符串前/后添加字符画图
跨地区收款怎么避免风控,被风控了多久才会解除神州网络公司
被风控以后具体解除时间是不一定的，有些是隔天就能解除，有些是一周或者三个月、半年，有些甚至一直无法解除。这是因为风控是系统综合评估后的行为，人为是无法进行干预的，只与造成风控的原因有直接关系。情况越严重，相对的风控时间会越长，解除的可能性就越小。比如说用户因为更换了平时使用的手机设备，或者是在异地登录，那么很容易触发平台风控机制，被限制使用，这种情况一般只要和客服说明清楚，隔天就能正常使用了。再有
python 密码学模块_Python加密与解密 No module named 'Crypto' weixin_39827304 python 密码学模块
DES加密全称为DataEncryptionStandard，即数据加密标准，是一种使用密钥加密的块算法入口参数有三个：Key、Data、ModeKey为7个字节共56位，是DES算法的工作密钥；Data为8个字节64位，是要被加密或被解密的数据；Mode为DES的工作方式,有两种:加密或解密3DES(即TripleDES)是DES向AES过渡的加密算法使用两个密钥，执行三次DES算法加密的过程是
No module named "Crypto"，如何安装Python三方模块Crypto weixin_30342827 python 操作系统
前两天公司公司老总让我研究怎么用企业微信第三方应用进行官网对接，完成URL回调验证问题。具体如何进行Python的Django网站与企业微信第三方应用进行回调验证的博客地址为：https://www.cnblogs.com/ws17345067708/p/10522472.html这里讲讲，如何在win10下，安装一个非常坑爹的加密算法库，名字叫"Crypto"看了好多博客，没有一个管用的，要么就
在上海如何快速赚钱?人在上海怎么才能赚到大钱氧惠佣金真的高
上海是我们国家的金融中心，很多人都喜欢到上海去发展，因为大家都觉得上海挣钱容易，那么上海挣钱快的路子都有哪些？这几个生意你应该知道。先给大家介绍一个我一直在做的APP，无需押金下载氧惠APP填写邀请码123456即可首先来推荐做淘客赚钱，经过十多年的发展淘客市场非常大，网购用户都是你的目标群体，在氧惠APP创业，大家只要坚持分享就有钱赚。分享出去只要这个人网购，你就有钱赚，虽然前几个月很难，但是坚
Python 报错：ModuleNotFoundError: No module named ‘Crypto‘
Crypto报错解决方案Python报错：ModuleNotFoundError:Nomodulenamed'Crypto'前言问题解决方案Python报错：ModuleNotFoundError:Nomodulenamed‘Crypto’前言Crypto是一个加密模块，它包含了多种加密算法，如AES、DES、RSA等。它不是Python标准库的一部分，需要使用pip安装。pycrypto和Cry
【甲烷数据集】Sentinel-5P 卫星获取的全球甲烷数据集-TROPOMI L2 CH₄ WW、forever 数据集 sentinel
目录数据概述传感器&卫星信息监测目标：甲烷（CH₄）数据产品内容空间与时间覆盖云筛选与协同观测技术文档资源数据下载Python代码绘制CH4数据参考数据概述Sentinel-5PrecursorLevel2Methane(TROPOMIL2CH₄)数据集是由欧洲哥白尼计划的Sentinel-5P卫星获取的，用于监测大气中的甲烷浓度。数据集名称：Sentinel-5PrecursorLevel2Me
非对称加密算法（RSA、ECC、SM2）——密码学基础
对称加密算法（AES、ChaCha20和SM4）Python实现——密码学基础(Python出现Nomodulenamed“Crypto”解决方案)这篇的续篇，因此实践部分少些；文章目录一、非对称加密算法基础二、RSA算法2.1RSA原理与数学基础2.2RSA密钥长度与安全性2.3RSA实现工具与库2.4RSA的局限性三、椭圆曲线密码学(ECC)3.1ECC原理与数学基础3.2常用椭圆曲线标准3.
居心叵测!商小信第六届研究所姜新宁算力3.0不能提现提款!!被骗真实原因令人匪夷所思! 大盛律道
随着这几年经济的发展，股市也经历了一定的成长，股民越来越多。由于人性的贪婪，市场监管的缺陷，互联网平台监管不力，众多网络骗子便把目光顶到了股民，尤其是处于亏损状态，迫切渴望摆脱被套牢的命运。近期8月，有骗子冒充姜新宁，打着“算力3.0市场”“低成本高收益”“国家扶持项目”等幌子的非法金融活动时有发生，很多人在不懂投资、不追问平台是否合法、一心只想赚钱的心态下，被不法分子姜新宁（骗子假冒的）所利用，
结构洞竞争篇：从网络关系的视角重新理解竞争澹泊者的修炼笔记
01社会资本是竞争中获胜的最后仲裁者一个企业的利润由什么决定？很简单，利润=投资x回报率。这个公式中，“投资”部分是人可控的，包括金融资本、人力资本。“回报率”常包含运气、环境、政策等我们无法控制的因素。但是，还有一种很重要的回报率因素，它既可主观去争取，但又要依赖客观因素，而且还总是不能被摆上台面来探讨。这个因素就是“关系"，也就是罗纳德·S.伯特教授说的第三种资本：社会资本。罗纳德·S.伯特教
JAVA 和Python对比 xiayu98020214 在深蓝的日子 python
JAVA和Python对比1.数据类型pythonInt，float，complexnumbers都没有定义到底占用多少个字节空间。都是没有取值范围，也没有无符号的情况。JAVAJAVA有基础数据类型，都有确定占多少个字节2.全局变量python类似c语言，可以定义全局变量，全局的函数。JAVAjava都要定义类才行。3.变量声明python无需声明类型，直接使用。会造成一个困扰，这个变量到底是新
牛客华为机试题解（python版更新中）
目录一、字符串（知识点）HJ1字符串最后一个单词的长度（简单）HJ2计算某字符出现次数（简单）HJ4字符串分隔（简单）HJ5进制转换（简单）HJ10字符个数统计（简单）HJ11数字颠倒（简单）HJ12字符串反转（简单）HJ14字符串排序（简单）HJ17坐标移动（中等）HJ18识别有效的IP地址和掩码并进行分类统计（较难）自己研究的题解，也有借鉴评论区牛人思路，答案不唯一，仅供学习参考，也欢迎大家指
python比java_对比java和python对比
对比java和python对比java和python2011年04月18日1.难易度而言。python远远简单于java。2.开发速度。Python远优于java3.运行速度。java远优于标准python，pypy和cython可以追赶java，但是两者都没有成熟到可以做项目的程度。4.可用资源。java一抓一大把，python很少很少，尤其是中文资源。5.稳定程度。python3和2不兼容，造
QuecPython-正则表达式移远通信正则表达式 python
该模块通过正则表达式匹配数据。目前支持的操作符较少，部分操作符暂不支持。示例：importureres='''$GNRMC,133648.00,A,3149.2969,N,11706.9027,E,0.055,,311020,,,A,V*18$GNGGA,133648.00,3149.2969,N,11706.9027,E,1,24,1.03,88.9,M,,M,,*6C$GNGLL,3149.2
华为牛客网python考试题库及答案 2401_86114846 服务器
亲爱的朋友们，今天我们要讨论，牛客网华为软件测试题库牛客网华为机试题答案，让我们开始吧！目录一、字符串（知识点）HJ1字符串最后一个单词的长度（简单）HJ2计算某字符出现次数（简单）HJ4字符串分隔（简单）HJ5进制转换（简单）HJ10字符个数统计（简单）HJ11数字颠倒（简单）HJ12字符串反转（简单）HJ14字符串排序（简单）HJ17坐标移动（中等）HJ18识别有效的IP地址和掩码并进行分类统
【Python】LEGB作用域 + re模块 + 正则表达式
文章目录一LEGB作用域二re（RegularExpression）预览1.`re.match()`——从字符串开头匹配2.`re.search()`——搜索整个字符串3.`re.findall()`——返回所有匹配的字符串列表4.`re.finditer()`——返回所有匹配的迭代器5.`re.sub()`——替换匹配的字符串6.`re.split()`——按正则表达式分割字符串7.`re.co
大事件！庆衍书院郭庆旺KSD2.0光伏市场被骗惨重！被骗真相竟然是这样不成功不收费
（注意：本文出现的人名公司等均为骗子冒充，与真实公司以及本人无关，若有侵权可与我们联系删除）近日，一起骗子假冒知名金融专家庆衍书院郭庆旺老师，在所谓的“庆衍书院郭庆旺”中以荐股为诱饵，诱导股民进入虚假的检测市场平台。在投资者将资金转入平台后，骗子会通过各种手段让投资者认为自己的投资正在获得高额回报，从而不断追加投资。然而，当投资者试图提现时，却发现平台无法操作，资金无法取出。此时，骗子往往会以各种
java和ptyhon对比悟能不能悟 java 开发语言
1.语言特性对比维度JavaPython语法风格静态类型，需显式声明变量类型；代码冗长（需分号、大括号）动态类型，变量类型自动推断；简洁（缩进代替大括号，无分号）编程范式严格面向对象（OOP），强制类与对象结构多范式支持（OOP、函数式、命令式），更灵活执行方式编译型（JVM运行字节码）解释型（逐行执行）⚡2.性能与效率执行速度：Java：编译优化后运行效率高，尤其擅长高并发（如电商秒杀系统）。P
从0到1构建数据库安全审计系统：设计、实现与实战小张在编程数据库
引言2024年某金融机构发生数据泄露事件，内部审计日志显示，某运维人员在非工作时间执行了SELECT*FROMcustomer_info的全表查询，但当时未触发任何告警——这并非技术漏洞，而是数据库安全审计系统的“失效”。随着《数据安全法》《个人信息保护法》的落地，数据库作为企业核心资产，其操作行为的可追溯、风险的可预警已成为合规刚需。本文将从需求分析到代码实现，带你拆解一个企业级数据库安全审计系
数字图像处理与Python语言实现-Box模糊CUDA实现视觉与物联智能数字图像处理与Python实现 python 深度学习计算机视觉图像处理 CUDA
Box模糊CUDA实现文章目录Box模糊CUDA实现1、Box模糊的基本原理2、算法优化：滑动窗口技术3、参数对模糊效果的影响4、Box模糊的优缺点5、与高斯模糊的对比6、实际应用场景7、算法实现7.1PyCUDA实现7.2CuPy实现7.3C++与CUDA实现8、总结在图像处理领域，**Box模糊（方框模糊或均值模糊）**是一种基础且高效的模糊算法，其核心思想是通过对像素邻域内的颜色值取平均值来
关于Python3绕过指纹识别解决ja3指纹的案例水兵没月 python
注意！！！！某XX网站实例仅作为学习案例，禁止其他个人以及团体做谋利用途！！！场景Python采集某网址页面内容aHR0cHM6Ly9jcmVkaXRiai5qeGouYmVpamluZy5nb3YuY24vY3JlZGl0LXBvcnRhbC9jcmVkaXRfc2VydmljZS9wdWJsaWNpdHkvcmVjb3JkL2JsYWNr报错信息requests.exceptions.SSLE
网页返回title“Just a moment...“，python 绕过tls指纹的几种方式记录一下
第一种：使用tls_client第三方库进行绕过importtls_clientsession=tls_client.Session(ja3_string="771,4865-4866-4867-49195-49199-49196-49200-52393-52392-49171-49172-156-157-47-53,0-23-65281-10-11-35-16-5-13-18-51-45-43-
python如何抓取网页里面的文字_如何利用python抓取网页文字、图片内容？ weixin_39917437
想必新老python学习者，对爬虫这一概念并不陌生，在如今大数据时代，很多场景都需要利用爬虫去爬取数据，而这刚好时python领域，如何实现？怎么做？一起来看下吧~获取图片：1、当我们浏览这个网站时，会发现，每一个页面的URL都是以网站的域名+page+页数组成，这样我们就可以逐一的访问该网站的网页了。2、当我们看图片列表时中，把鼠标放到图片，右击检查，我们发现，图片的内容由ul包裹的li组成，箭
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name