nikita_zj

逻辑回归评分卡实战-toad

实战使用的数据集为天池-零基础入门金融风控-贷款违约预测的数据集。此处导入的数据集为已完成特征工程的数据集，特征工程思路可以参考：天池-金融风控训练营-task3-特征工程_nikita_zj的博客-CSDN博客天池-金融风控训练营-task3-特征工程https://blog.csdn.net/nikita_zj/article/details/122499348

toad官方文档可见：Welcome to toad’s documentation! — toad 0.1.0 documentationhttps://toad.readthedocs.io/en/latest/index.html

1. 数据导入

all_for_train = pd.read_csv('data/01_feature_all_for_train.csv', index_col = 0)
label_for_train = pd.read_csv('data/01_y_for_train.csv', index_col = 0)
all_for_train['isDefault'] = label_for_train.isDefault
data_test_a = pd.read_csv('data/01_test_for_predict.csv', index_col = 0)

2. EDA

-toad的eda部分类似dataframe的describe，展示一些基本信息。

eda_df = toad.detect(all_for_train)
eda_df.head()

3. 特征选择

特征选择同样在<天池-金融风控训练营>-task-特征工程中有提及，天池-金融风控训练营-task3-特征工程_nikita_zj的博客-CSDN博客天池-金融风控训练营-task3-特征工程https://blog.csdn.net/nikita_zj/article/details/122499348

此处补充两个特征选择的思路：

3.1 iv值

可以基于iv值进行特征选择，iv值的计算可用toad包实现：

to_drop = ['postCode', 'title']
toad_quality = toad.quality(all_for_train.drop(to_drop, axis = 1), target='isDefault', iv_only=True)
toad_quality.head()

3.2 psi值

在比赛中可以考虑训练集和测试集上的psi值，剔除psi值较大（比如大于0.3）的特征。使用toad计算psi值的代码如下：

feat_lst = list(data_test_a.columns[1:])  
psi_df = toad.metrics.PSI(all_for_train[feat_lst], data_test_a[feat_lst]).sort_values(0)  
psi_df_ = psi_df.to_frame().reset_index().rename(columns = {'index':'feat',0:'psi'})
psi_df_.to_csv('data/psi_df.csv')

train_col = psi_df[psi_df<0.3].index.to_list()

3.3 相关系数

toad可以通过对缺失值比例、iv值、相关系数阈值的设置，进行特征选择。相关系数阈值起作用的方式为，对于相关系数大于阈值的两个特征，只保留iv值较大的特征。

train_selected, dropped = toad.selection.select(all_for_train,target = 'isDefault', empty = 0.5, iv = 0.02, corr = 0.7, return_drop=True, exclude=to_drop)
print(dropped)
print(train_selected.shape)

{'empty': array([], dtype=float64), 'iv': array(['employmentLength', 'purpose', 'regionCode', 'delinquency_2years',
       'openAcc', 'pubRec', 'pubRecBankruptcies', 'revolBal', 'totalAcc',
       'initialListStatus', 'applicationType', 'earliesCreditLine',
       'policyCode', 'n0', 'n1', 'n4', 'n5', 'n6', 'n7', 'n8', 'n10',
       'n11', 'n12', 'n13'], dtype=object), 'corr': array(['grade_to_mean_n14', 'grade_to_mean_n11', 'grade_to_std_n11',
       'grade', 'grade_target_mean', 'grade_to_std_n12',
       'grade_to_mean_n12', 'grade_to_mean_n5', 'grade_to_std_n0',
       'grade_to_mean_n0', 'grade_to_mean_n13', 'grade_to_std_n13',
       'grade_to_mean_n8', 'grade_to_mean_n6', 'grade_to_std_n5',
       'grade_to_std_n6', 'grade_to_std_n4', 'grade_to_std_n8',
       'grade_to_std_n9', 'grade_to_std_n10', 'interestRate',
       'grade_to_std_n2', 'grade_to_mean_n10', 'grade_to_std_n7',
       'grade_to_std_n1', 'grade_to_mean_n4', 'grade_to_mean_n7',
       'grade_to_std_n14', 'grade_to_mean_n1', 'grade_to_mean_n9', 'n9',
       'grade_to_mean_n2', 'n3', 'loanAmnt', 'ficoRangeHigh',
       'subGrade_target_mean'], dtype=object)}
(612742, 16)

4. 特征分箱并调整

toad默认的分箱方式为‘卡方分箱’。

# initialise
c = toad.transform.Combiner()

# 使用特征筛选后的数据进行训练：使用稳定的卡方分箱，规定每箱至少有5%数据, 空值将自动被归到最佳箱。
c.fit(train_selected.drop(to_drop, axis=1), y = 'isDefault', method = 'chi', min_samples = 0.05) #empty_separate = False

{'term': [5],
 'installment': [161.42,  251.46,  301.11,  322.9,  451.73,  496.96,
  602.3,  662.21,  793.85],
 'subGrade': [3, 5, 8, 10, 13, 18],
 'employmentTitle': [55.0, 203741.0],
 'homeOwnership': [1, 2],
 'annualIncome': [28038.0,  37104.87,  45505.0,  54003.0,  60626.0,  65940.0,
  75500.0,  85002.0,  100671.0,  120024.0],
 'verificationStatus': [1, 2],
 'dti': [10.12, 14.85, 19.15, 21.45, 24.38, 26.81, 30.26],
 'ficoRangeLow': [665.0, 675.0, 685.0, 700.0, 710.0, 725.0, 740.0],
 'revolUtil': [19.5, 35.0, 42.6, 52.0, 62.0, 79.7],
 'n2': [4.0, 6.0, 8.0],
 'n14': [1.0, 2.0, 3.0, 4.0, 5.0],
 'issueDateDT': [2496, 3227]}

分箱是否需要调整可以通过可视化每个箱体内的badrate直观感受：

from toad.plot import bin_plot

col = train_selected.columns[2]
bin_plot(c.transform(train_selected[[col,'isDefault']], labels=True), x=col, target='isDefault')

分箱的调整可以如下进行：

rule = {'issueDateDT':[2496, 3227]}
c.update(rule)
bin_plot(c.transform(train_selected[['issueDateDT','isDefault']], labels=True), x='issueDateDT', target='isDefault')

5. woe转换

基于前面分箱的结果，可以对训练集和测试集进行woe转换：

transer = toad.transform.WOETransformer()

# combiner.transform() & transer.fit_transform() 转化训练数据，并去掉target列
train_woe = transer.fit_transform(c.transform(train_selected), train_selected['isDefault'], exclude=to_drop+['isDefault'])
test_woe = transer.fit_transform(c.transform(train_selected[train_selected.columns]), train_selected['isDefault'], exclude=to_drop+['isDefault'])

test_woe.head()

6. 逻辑回归模型训练

逻辑回归模型训练之前，toad提供了一种简单的方式来实现逐步回归。

逐步回归的基本思想是将变量逐个引入模型，每引入一个解释变量后都要进行F检验，并对已经选入的解释变量逐个进行t检验，当原来引入的解释变量由于后面解释变量的引入变得不再显著时，则将其删除。以确保每次引入新的变量之前回归方程中只包含显著性变量。这是一个反复的过程，直到既没有显著的解释变量选入回归方程，也没有不显著的解释变量从回归方程中剔除为止。以保证最后所得到的解释变量集是最优、最简单的。更多详细介绍可见文末关于逐步回归的文章。

# 将woe转化后的数据做逐步回归
final_data = toad.selection.stepwise(train_woe,target = 'isDefault', estimator='ols', direction = 'both', criterion = 'aic', exclude = to_drop)

# 确定建模要用的变量
col = list(final_data.drop(to_drop+['isDefault'],axis=1).columns)

toad.selection.stepwise参数相关

1.estimator:可选'ols','lr','lasso'（线性回归+l1范数）,'ridge'(线性回归+l2范数)

2.criterion:可选'ks','aic'

极小化aic可以在提高模型预测能力的同时，尽可能控制模型复杂程度。

aic：

其中l为似然函数。

ols、lasso、ridge等方法用极大似然估计的方式求解和对应损失函数求解方式是等价的【对模型参数进行相应的假设即可】

*tip: 经验证，direction = ‘both’效果最好。estimator = ‘ols’以及criterion = ‘aic’运行速度快且结果对逻辑回归建模有较好的代表性*

ref：

机器学习算法系列（五）- Lasso回归算法（Lasso Regression Algorithm）_Saisimonzs的博客-CSDN博客_lasso回归

极大似然估计的直观推导和应用（OLS、Lasso、Ridge）_To_be_thinking的博客-CSDN博客_极大似然估计推导

可以简单看下这些变量在训练集和测试集上的psi值：

# 输出每个变量的psi
toad.metrics.PSI(final_data[col], test_woe[col])

term                  0.0
installment           0.0
subGrade              0.0
employmentTitle       0.0
homeOwnership         0.0
annualIncome          0.0
verificationStatus    0.0
dti                   0.0
ficoRangeLow          0.0
revolUtil             0.0
n2                    0.0
n14                   0.0
issueDateDT           0.0
dtype: float64

调用sklearn包进行模型训练。

# 用逻辑回归建模
from sklearn.linear_model import LogisticRegression

lr = LogisticRegression()
lr.fit(final_data[col], final_data['isDefault'])

# 预测训练集和测试集上的结果
pred_train = lr.predict_proba(final_data[col])[:,1]
pred_test = lr.predict_proba(test_woe[col])[:,1]

7.模型结果查看

from toad.metrics import KS, AUC

print('train KS',KS(pred_train, final_data['isDefault']))
print('train AUC',AUC(pred_train, final_data['isDefault']))

train KS 0.3094248674341346
train AUC 0.7128617664579651

ks和auc可以通过scorecardpy进行可视化。

import scorecardpy as sc
# auc和ks值可视化输出
sc.perf_eva( final_data['isDefault'].values,pred_train)

psi验证分数稳定性

print(toad.metrics.PSI(pred_train,pred_test))

0.0

8. 评分卡转换及结果查看

card = toad.ScoreCard(
    combiner = c,
    transer = transer,
    #class_weight = 'balanced',
    #C=0.1,
    #base_score = 600,
    #base_odds = 35 ,
    #pdo = 60,
    #rate = 2
)

card.fit(final_data[col], final_data['isDefault'])

评分卡格式转化：

l_box_name = []
l_box_value = []
l_box_score = []
for key in card.export().keys():
    for box_value in card.export().get(key):
        l_box_name.append(key)
#         print(box_value)
        l_box_value.append(box_value)
#         print(card.export().get(key).get(box_value))
        l_box_score.append(card.export().get(key).get(box_value))

score_card = pd.DataFrame({'box_name':l_box_name,'box_value':l_box_value,'box_score':l_box_score})
score_card.head()

注意，toad在评分卡转换时，将逻辑回归模型的偏置项等分后加到各个特征的box_score中，计算公式如下：

9. 用评分卡进行预测

使用card进行预测时，要传入原始数据，而不要传入woe转化后的数据。

score_train = card.predict(train_selected)
score_test = card.predict(data_test_a)

plt.hist(score_train, label = 'train', bins = 100)
plt.hist(score_test, label = 'test', bins = 100)
plt.legend()
plt.show()

plt.hist(score_train[train_selected.isDefault == 0], label = 'good', bins = 100)
plt.hist(score_train[train_selected.isDefault == 1], label = 'bad', bins = 100)
plt.legend()
plt.show()

REF:

多元线性回归、逐步回归、逻辑回归的总结_大数据技术派-CSDN博客_逐步线性回归线性回归，前面用Python从底层一步一个脚印用两种方法实现了回归拟合。在这个高级语言层出不穷的年代，这样做显然不明智，所以我考虑用优秀的数据分析工具——R语言（不敢说最...https://blog.csdn.net/ddxygq/article/details/101351479?ops_request_misc=&request_id=&biz_id=102&utm_term=%E9%80%90%E6%AD%A5%E5%9B%9E%E5%BD%92&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-1-101351479.nonecase&spm=1018.2226.3001.4187

你可能感兴趣的:(模型,数据分析,逻辑回归,算法,机器学习)

四阶数独——深度优先搜索dfs 我爱工作&工作love我 c++深度优先算法
文章目录四阶数独例题讲解深度优先dfs搜索知识点算法思想应用代码框架四阶数独例题讲解题目描述这里讨论一种简化的数独——四阶数独。给出一个4×4的格子，每个格子只能填写1到4之间的整数，要求每行、每列和四等分更小的正方形部分都刚好由1到4组成。求总共有多少种不同的数独？输出结果：288思路常规思路就是根据格子序号挨个设置数如果每次都是从第一个开始设置，暴力枚举，一个格子四种选择，16个格子所以就有4
数据结构——图的遍历之深度优先遍历（DFS算法）_全世界最可爱的王小帅_CSDN博客全世界最可爱的王小帅数据结构图论算法 cpp c#
数据结构——图的遍历之深度优先遍历图的遍历一般分为深度优先遍历和广度优先遍历下面我们要说的是深度优先遍历**（DFS算法）**1，我们首先选择一个顶点作为起始点，假设我们选择顶点v作为起始点，首先访问v，然后找v的邻接点，访问v的一个还未被访问过邻接点w1,2，再以w1为起始点，然后去找w1的邻接点，访问w1的一个还未被访问过的邻接点w2，再以w2作为起始点继续往下访问…3，如果我们访问到一个顶点
YOLOv11革命性升级：基于MobileNetv4的UIB和ExtraDW模块重构C3k2架构，实现移动端推理性能飞跃博导ai君深度学习教学-附源码 YOLO 重构
引言与背景概述在当今人工智能飞速发展的时代，目标检测技术已成为计算机视觉领域的核心技术之一。从自动驾驶汽车到智能安防系统，从移动端AR应用到工业质检，目标检测无处不在。然而，随着应用场景的多样化，特别是移动端和边缘设备的普及，对模型的计算效率提出了更为严苛的要求。YOLO（YouOnlyLookOnce）系列算法作为目标检测领域的领军者，一直在精度与速度之间寻求最佳平衡。从YOLOv1到最新的YO
关于 java：8. Java 内存模型与 JVM 基础 shenyan~ java jvm 开发语言
一、堆Java堆是JVM中所有线程共享的运行时内存区域，用于存放所有对象实例、数组以及类的实例字段值。在Java中：Stringstr=newString("abc");newString("abc")创建的对象就分配在堆中。1.1堆的特点特性说明共享区域所有线程共享堆GC管理垃圾回收器对堆管理最频繁分代模型为提高GC性能，堆被划分为新生代/老年代等区域空间大堆是JVM管理内存中最大的区域慢速堆分
数据结构与算法：深度优先的实战指南
数据结构与算法：深度优先的实战指南关键词：深度优先搜索（DFS）、递归、栈、图遍历、路径查找、迷宫寻路、算法实战摘要：深度优先搜索（DFS）是计算机科学中最经典的算法之一，被广泛应用于路径查找、游戏AI、社交网络分析等场景。本文将用“迷宫探险”的故事串联核心概念，结合生活案例、代码实战和LeetCode经典题，带您从0到1掌握DFS的底层逻辑与实战技巧。即使你是算法新手，也能通过通俗易懂的讲解，真
从零开始：Python实现语音识别的完整教程 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 python 语音识别 xcode ai
从零开始：Python实现语音识别的完整教程关键词：Python、语音识别、完整教程、语音输入、文字输出摘要：本文将带领大家从零开始，用Python实现语音识别功能。我们会详细介绍语音识别的核心概念、相关算法原理，通过具体的代码示例，一步步教大家搭建开发环境、实现语音识别代码，并对代码进行解读。同时，还会探讨语音识别的实际应用场景、推荐相关工具和资源，最后分析未来发展趋势与挑战。背景介绍目的和范围
从零开始：Python实现语音识别的完整教程_副本 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 python 语音识别开发语言 ai
从零开始：Python实现语音识别的完整教程关键词：Python、语音识别、语音转文本、音频处理、机器学习、深度学习、自然语言处理摘要：本文将带你从零开始学习如何使用Python实现语音识别功能。我们将从基础概念讲起，逐步深入到实际代码实现，涵盖音频处理、特征提取、模型训练等关键环节，最终构建一个完整的语音识别系统。无论你是初学者还是有一定经验的开发者，都能从本教程中获得实用的知识和技能。背景介绍
从零开始：用Python构建AI语音识别应用的完整指南 AI大模型应用之禅人工智能 python 语音识别 ai
从零开始：用Python构建AI语音识别应用的完整指南关键词：Python语音识别、AI语音处理、语音转文本、SpeechRecognition库、端到端模型摘要：本文从0到1带您掌握用Python构建AI语音识别应用的全流程。我们将用“给小学生讲故事”的方式，拆解语音识别的核心概念（如音频采集、特征提取、模型解码），结合代码实战（从调用API到自定义模型），并覆盖环境搭建、常见问题和未来趋势。无
面向大语言模型幻觉的关键数据集：系统性综述与分类法致Great 语言模型人工智能自然语言处理
面向大语言模型幻觉的关键数据集：系统性综述与分类法摘要大语言模型（LargeLanguageModels,LLMs）在自然语言处理的多个领域取得了革命性进展，但其固有的“幻觉”问题——即生成看似合理但与事实不符或与上下文无关的内容——严重制约了其在关键应用中的可靠性与安全性。为了系统性地评估、理解并缓解LLM的幻觉现象，学术界和工业界开发了大量多样化的数据集与基准。本文对大模型幻觉领域的关键数据集
导师要求一天完成综述，我7分钟搞定——打造一个全本地DeepResearch助手小洛~·~ 人工智能深度学习 chatgpt gpt AI写作
1.项目背景LocalDeepResearcher是一个本地化运行的AI研究助手，旨在通过结合大语言模型（LLM）和搜索工具，实现自动化深度研究并生成结构化报告。该项目由LangChainAI开发，支持本地模型（例如通过Ollama运行的deepseek-r1:7b）和云端模型（例如Claude、GPT），并集成了多种搜索引擎（如Tavily、DuckDuckGo）。其本地优先的设计确保了数据隐私
【锂电池SOC估计】 Matlab基于BP神经网络的锂电池SOC估计天天Matlab代码科研顾问 matlab 神经网络开发语言
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍摘要:电池荷电状态(StateofCharge,SOC)的精确估计对于电动汽车、储能系统等应用至关重要。传统的SOC估计方法存在精度受限、算法复杂等问题。本文提出了一种基于反向传播(BackPropagation,BP)神经网络的锂电池SO
【LangGraph 】“工作流”的核心就是围绕一个共享的 `State` 等风来不如迎风去 AI入门与实战 langgraph
是的。LangGraph里“工作流”的核心就是围绕一个共享的State（也常被命名为AgentState或者类似的TypedDict/Pydantic模型）来组织的：State本质上是整个流程的“快照”，所有跨节点需要保留或传递的数据，都必须定义在这个结构里。LangGraph在执行节点（node）时，会把当前的State传入该节点，节点内部可以读写它，然后再返回一个新的（或被修改过的）State
结构力学优化算法：多目标优化：遗传算法与结构优化_2024-08-08_19-41-25.Tex chenjj4003 材料力学2 算法 javascript 前端人工智能线性代数
结构力学优化算法：多目标优化：遗传算法与结构优化绪论结构优化的重要性在工程设计中，结构优化扮演着至关重要的角色。它旨在通过最小化成本、重量或应力等目标，同时确保结构的强度、刚度和稳定性满足设计要求，来提高结构的性能和效率。结构优化可以帮助工程师在设计初期就避免潜在的结构问题，减少材料浪费，降低生产成本，同时提升产品的竞争力。多目标优化的概念多目标优化是指在优化过程中同时考虑多个目标函数的优化问题。
七天学完十大机器学习经典算法-05.从投票到分类：K近邻(KNN)算法完全指南
接上一篇《七天学完十大机器学习经典算法-04.随机森林：群众智慧的机器学习实践》想象一下，你搬进了一个新小区。想知道这个小区整体氛围如何？最直接的方法就是看看你最近的几家邻居是什么样的人——如果邻居们都很安静、整洁，小区大概率不错；如果邻居们深夜喧哗、环境杂乱，你可能就得重新考虑了。K近邻（K-NearestNeighbors,KNN）算法的核心思想，就如同这个观察邻居的过程。它是机器学习中最直观
分类预测 | MATLAB实现BP神经网络多特征分类预测 matlab科研社分类 matlab 神经网络
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍近年来，随着大数据时代的到来以及计算能力的显著提升，人工智能技术得到了飞速发展。在众多人工智能算法中，反向传播神经网络（BackPropagationNeuralNetwork,BP神经网络）凭借其强大的非
AI测试方法二狗子82 ai 功能测试测试用例 AIGC
1.创建高质量的测试数据集为了验证标签的准确性，需要构建一个丰富的测试数据集。该数据集应包括多种场景和风格的输入文本：正常对话、非正式对话、含有拼写错误或语法问题的文本等。包括模棱两可或复杂情境的文本，看看模型是否能正确分类。确保数据集中有足够的标签种类分布，这样可以测试模型是否能应对不同类别的文本内容。2.多轮对话的上下文跟踪对于涉及多轮对话或长文本的情况，模型需要正确理解整个对话的上下文。例如
非结构化文档的自动化敏感标识方法技术解析 KKKlucifer 自动化运维
在数字化时代，企业与组织面临的数据形态正发生深刻变革。据统计，非结构化数据占企业数据总量的80%以上，涵盖文本、邮件、PDF、日志、社交媒体内容等多种形式。这些数据中往往蕴含着大量敏感信息，如个人身份信息、商业机密、医疗记录等，一旦泄露将造成严重的安全风险。然而，非结构化文档缺乏统一的数据模型和格式规范，传统基于结构化数据的敏感信息识别方法难以直接应用，面临着三大核心挑战：语义理解复杂性：自然语言
信息抽取数据集全景分析：分类体系、技术演进与挑战_DEEPSEEK 致Great 分类数据挖掘人工智能
信息抽取数据集全景分析：分类体系、技术演进与挑战摘要信息抽取（IE）作为自然语言处理的核心任务，是构建知识图谱、支持智能问答等应用的基础。近年来，随着深度学习技术的发展和大规模预训练模型的兴起，IE数据集呈现爆发式增长，其分析与评估对模型研发和领域迁移至关重要。本文基于对158个主流IE数据集的系统性梳理，首次提出“信息提取与命名实体识别数据集分类体系”。该体系涵盖8大类别（命名实体识别、关系提取
自然语言处理之文本生成：Recurrent Neural Networks (RNN)：序列模型与语言模型 zhubeibei168 自然语言处理自然语言处理 rnn 语言模型人工智能机器翻译生成对抗网络
自然语言处理之文本生成：RecurrentNeuralNetworks(RNN)：序列模型与语言模型自然语言处理简介NLP的基本概念自然语言处理（NaturalLanguageProcessing，简称NLP）是人工智能领域的一个重要分支&#
C++ STL常用二分查找算法 basketball616 C++基础算法 c++数据结构
lower_boundlower_bound是C++标准库算法，通常用于有序序列中查找第一个不小于给定值的元素。它属于头文件，并且是基于二分查找实现的，因此要求输入序列必须是有序的。基本语法#include//引入算法库Iteratorlower_bound(Iteratorfirst,Iteratorlast,constT&value);first和last是迭代器，分别表示容器的起始位置和结束
物流数据行业分析（包含完整代码和流程）------python数据分析师项目Anaconda 欲梦yhd 数据分析项目大数据 conda python
一、引言数据分析流程为明确目的、获取数据、数据探索和预处理、分析数据、得出结论、验证结论、结果展现。物流业务中对数据进行深入挖掘和分析的过程，旨在提高运输效率、降低运输成本、提高客户满意度，以及提高公司的竞争力。本案例物流数据分析目的：a、配送服务是否存在问题b、是否存在尚有潜力的销售区域c、商品是否存在质量问题二、详细流程1、数据预处理（数据清洗）（1）数据导入使用panda库读取数据，编码方式
HoloViz Panel项目：跨环境无缝开发指南郁蝶文Yvette
HoloVizPanel项目：跨环境无缝开发指南panelholoviz/panel:Panel是一个开源的数据可视化库，专为Python生态设计，基于HoloViews构建，能够轻松将各种数据科学和数据分析结果转化为交互式仪表板应用。用户可以创建复杂的可视化界面，并与Bokeh、Plotly等其他可视化工具结合使用。项目地址:https://gitcode.com/gh_mirrors/pan/
学 Simulink：实时系统与嵌入式部署类场景ROS + Simulink 联合仿真的多传感器信号融合与滤波模块 amy_mhd simulink matlab
目录ROS+Simulink联合仿真的多传感器信号融合与滤波模块场景目标✅准备工作软件安装：硬件准备（可选）：步骤详解第一步：创建Simulink模型并配置ROS支持启用ROS工具箱支持：第二步：添加ROS输入接口（接收传感器数据）使用Subscribe模块接收ROSTopic数据：第三步：设计滤波与信号预处理模块方法一：IMU数据滤波（加速度+角速度）方法二：卡尔曼滤波器（KalmanFilte
【Go语言-Day 12】解密动态数组：深入理解 Go 切片 (Slice) 的创建与核心原理吴师兄大模型 Go 语言从入门到精通 golang 开发语言后端 go语言人工智能 LLM python
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
多模态大语言模型arxiv论文略读（144）胖头鱼爱算法 #mllm_arxiv 语言模型人工智能自然语言处理论文笔记论文阅读
LARP:TokenizingVideoswithaLearnedAutoregressiveGenerativePrior➡️论文标题：LARP:TokenizingVideoswithaLearnedAutoregressiveGenerativePrior➡️论文作者：HanyuWang,SakshamSuri,YixuanRen,HaoChen,AbhinavShrivastava➡️研究
Python 数据分析与可视化 Day 10 - 数据合并与连接
✅今日目标理解Pandas中数据合并的4种常用方式：concat、merge、join、combine掌握内连接、外连接、左连接、右连接等操作方式掌握按列对齐、按索引对齐的区别为后续数据整合、特征拼接等建模任务做准备一、concat合并（按行/列拼接）df1=pd.DataFrame({"姓名":["张三","李四"],"成绩":[85,90]})df2=pd.DataFrame({"姓名":["
使用Ultralytics YOLO进行数据增强 alpszero YOLO计算机视觉应用 YOLO 人工智能机器学习
概述数据增强是计算机视觉领域的一项重要技术，它通过对现有图像进行各种转换，人为地扩展训练数据集。在训练深度学习模型时，数据增强有助于提高模型的鲁棒性，减少过拟合，并增强对真实世界场景的泛化。在训练计算机视觉模型的过程中，数据增强具有多种重要作用：扩展数据集：通过创建现有图像的变体，可以有效增加训练数据集的规模，而无需收集新数据。提高泛化能力：模型学会在各种条件下识别物体，使其在实际应用中更加稳健。
算法竞赛备考冲刺必刷题（C++） | 洛谷 P1001 A+B Problem 热爱编程的通信人 c++算法
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺
「分布式事务」之数据一致性模型呼拉拉呼拉分布式事务分布式分布式事务分布式系统分布式数据一致性模型
概念分布式系统中的数据一致性模型定义了在事务处理过程中，系统如何保证数据在不同节点间的正确性和一致性。本文主要阐述了分布式系统六大类数据一致性模型，相关的概念、特点、缺点、实现方式、常见应用以及简单示例说明。分类在分布式系统中，一致性模型主要分为六大类：1.强一致性模型(StrongConsistency)2.弱一致性模型(WeakConsistency)3.最终一致性模型(Eventu
Python 数据分析与可视化 Day 11 - 特征工程基础蓝婷儿 python python 数据分析人工智能
✅今日目标理解特征工程在数据分析和机器学习中的意义掌握常见特征类型的处理方式：数值型、类别型、时间型学习特征提取、转换、标准化、独热编码（One-HotEncoding）等核心操作为后续建模任务做好特征准备工作一、什么是特征工程？特征工程是将原始数据转换为模型可学习的“特征向量”的过程，是机器学习效果好坏的核心因素之一。常见任务包括：缺失值处理（已学）异常值处理（已学）数值归一化、标准化类别变量编
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他