rejudge

【sklearn】模型融合_堆叠法

Stacking

参数含义
1. 工具库 & 数据
2. 定义交叉验证函数
- 2.1 对融合模型
- 2.2 对单个评估器
3. 定义个体学习器和元学习器
- 3.1 个体学习器
- 3.2 元学习器
4. 评估调整模型
5. 元学习器的特征矩阵
- 5.1 特征矩阵两个问题 & Stacking
- 5.2 StackingClassfier\Regressor参数cv - 解决样本量少
- 5.3 StackingClassfier参数stack_method - 解决特征少
- 5.3 StackingRegressor参数passthrough - 解决特征少
6. Blending
- 6.1 改进Stacking
- 6.2 代码实现

参数含义

'''
class sklearn.ensemble.StackingClassfier(estimators, final_estimator=None, *, stack_method='auto', cv=None, n_jobs=None, passthrough=False, verbose=0)
class sklearn.ensemble.StackingRegressor(estimators, final_estimator=None, *, cv=None, n_jobs=None, passthrough=False, verbose=0)

estimators 个体评估器列表
final_estimator 元学习器,只能一个. 分类任务必须为分类算法,回归任务必须为回归算法.
cv 指定交叉验证具体类型、折数, 或简单K折交叉验证
stack_method StackingClassfier独有参数,个体学习器输出的具体测试结果
passthrough 训练元学习器时,是否加入原始数据作为特征矩阵
n_jobs,verbose 线程数与监控参数 
'''

1. 工具库 & 数据

# 常用工具库
import re
import numpy as np
import pandas as pd
import matplotlib as mlp
import matplotlib.pyplot as plt
import time

# 算法辅助 & 数据
import sklearn
from sklearn.model_selection import KFold, cross_validate
from sklearn.model_selection import train_test_split

from sklearn.datasets import load_digits # 分类-手写数字数据集
from sklearn.datasets import load_iris
from sklearn.datasets import load_boston

# 算法(单一学习器)
from sklearn.neighbors import KNeighborsClassifier as KNNC
from sklearn.neighbors import KNeighborsRegressor as KNNR
from sklearn.tree import DecisionTreeClassifier as DTC
from sklearn.tree import DecisionTreeRegressor as DTR
from sklearn.linear_model import LinearRegression as LR
from sklearn.linear_model import LogisticRegression as LogiR
from sklearn.ensemble import RandomForestClassifier as RFC
from sklearn.ensemble import RandomForestRegressor as RFR
from sklearn.ensemble import GradientBoostingClassifier as GBC
from sklearn.ensemble import GradientBoostingRegressor as GBR
from sklearn.naive_bayes import GaussianNB
import xgboost as xgb

# 融合模型
from sklearn.ensemble import StackingClassifier
from sklearn.ensemble import StackingRegressor

data = load_digits()
X = data.data
y = data.target

print('X.shape =', X.shape)
print('类别:', np.unique(y)) # 10分类

'''
    X.shape = (1797, 64)
    类别: [0 1 2 3 4 5 6 7 8 9]
'''

Xtrain, Xtest, Ytrain, Ytest = train_test_split(X, y, test_size=0.2, random_state=1107)
print(Xtrain.shape, Xtest.shape, Ytrain.shape, Ytest.shape)
'''
    (1437, 64) (360, 64) (1437,) (360,)
'''

2. 定义交叉验证函数

2.1 对融合模型

def fusion_estimators(clf):
    '''
    对融合模型做交叉验证,对融合模型的表现进行评估
    
    模型融合很容易过拟合,需要保证交叉验证和测试集分数都漂亮.
    '''
    cv = KFold(n_splits=5, shuffle=True, random_state=1107)
    results = cross_validate(clf
                            ,Xtrain, Ytrain
                            ,cv=cv
                            ,scoring='accuracy'
                            ,n_jobs=-1
                            ,return_train_score=True
                            ,verbose=False)
    test = clf.fit(Xtrain, Ytrain).score(Xtest, Ytest)
    print('train_score:{}'.format(results['train_score'].mean())
         ,'\n cv_mean:{}'.format(results['test_score'].mean())
         ,'\n test_score:{}'.format(test)
         )

2.2 对单个评估器

def individual_estimators(estimators):
    '''
    对融合模型中的每个评估器做交叉验证,对单一评估器的表现进行评估
    '''
    for estimator in estimators:
        cv = KFold(n_splits=5, shuffle=True, random_state=1107)
        results = cross_validate(estimator[1]
                                ,Xtrain, Ytrain
                                ,cv=cv
                                ,scoring='accuracy'
                                ,n_jobs=-1
                                ,return_train_score=True
                                ,verbose=False
                                )
        test = estimator[1].fit(Xtrain, Ytrain).score(Xtest, Ytest)
        print('train_score:{}'.format(results['train_score'].mean())
             ,'\n cv_mean:{}'.format(results['test_score'].mean())
             ,'\n test_score:{}'.format(test)
             )

3. 定义个体学习器和元学习器

3.1 个体学习器

'''
沿用Voting投票法(模型融合_投票法)选出的七个模型
'''
# 逻辑回归没有增加多样性选项
clf1 = LogiR(max_iter=3000, C=0.1, random_state=1107, n_jobs=8)
# 增加特征多样性和样本多样性
clf2 = RFC(n_estimators=100, max_features='sqrt', max_samples=0.9, random_state=1107, n_jobs=8)
# 增加特征多样性, 稍微上调特征数量
clf3 = GBC(n_estimators=100, max_features=16, random_state=1107)
# 增加算法多样性,新增决策树与KNN
clf4 = DTC(max_depth=8, random_state=1107)
clf5 = KNNC(n_neighbors=8, n_jobs=8)
clf6 = GaussianNB()

# 新增随即多样性,相同的算法更换随机数种子
clf7 = RFC(n_estimators=100, max_features='sqrt', max_samples=0.9, random_state=1998, n_jobs=-1)
clf8 = GBC(n_estimators=100, max_features=16, random_state=1998)

estimators = [('Logistic Regression', clf1)
             ,('RandomForest', clf2)
             ,('GBDT', clf3)
             ,('Decision Tree', clf4)
             ,('KNN', clf5)
             # ,('Bayes', clf6) # 拖后腿不要了
             ,('RandomForest2', clf7)
             ,('GBDT2', clf8)
             ]

3.2 元学习器

'''
在此选择单个评估器中分数最高的随机森林作为元学习器

分类任务可以选择稍复杂的算法
回归任务需要选择简单的算法
'''
final_estimator = RFC(n_estimators=100
                     # 如果此分裂导致杂质减少大于或等于该值,则该节点将被分裂
                     # ,min_impurity_decrease=0.0025
                     ,random_state=1107
                     ,n_jobs=8
                     )
clf = StackingClassifier(estimators=estimators # Level0的个体学习器
                        ,final_estimator=final_estimator # Level1的元学习器
                        ,n_jobs=8
                        )

4. 评估调整模型

'''
没有过拟合限制,不如投票法
相对于投票法,交叉验证分数降低,测试集分数持平
'''
fusion_estimators(clf)

'''
    train_score:1.0 
     cv_mean:0.9825929152148664 
     test_score:0.9833333333333333
'''

'''
精调过拟合
min_impurity_decrease从0.1往后试
'''
fusion_estimators(clf)
'''
    train_score:1.0 
     cv_mean:0.9825929152148664 
     test_score:0.9833333333333333
'''

5. 元学习器的特征矩阵

5.1 特征矩阵两个问题 & Stacking

个体学习器在原始数据上训练预测,再把预测结果排布成新特征矩阵,供元学习器学习。

两个问题

元学习器特征矩阵的特征一定很少

个体学习器数量不多

元学习器特征矩阵的样本量不多

训练Stacking模型时,分为训练集、验证集和测试集。
测试集训练过程中不能用;
训练集用于训练个体学习器,已透露给个体学习器,再在上面预测则偏高;
只能用验证集,一般只占数据集的30%~40%。

个体学习器预测结果,即元学习器需要训练的矩阵如下排布:

Stacking堆叠法解决样本量少:

参数 cv
五折交叉验证训练了五个不同参数的模型,每个模型取五份数据中的一份作为预测集,将五次预测结果堆叠即得到一个算法在整个数据集上的预测结果。
如此，任意个体学习器输出的预测值数量 = 样本量;
特征矩阵的行数 = 原始数据样本量。

5.2 StackingClassfier\Regressor参数cv - 解决样本量少

'''
cv 
    None 默认5折交叉验证
    交叉验证对象 如cv = KFold(n_splits=5, shuffle=True, random_state=1107)
    任意整数 
        表示Stratified K折验证中的折数
        Stratified K折验证考虑标签类别的占比,保证原始标签中类别占比=训练标签中类别占比=验证标签中类别占比
        防止有的标签类别过少导致某一折该类标签不存在
'''

'''
Stacking内部交叉验证不验证泛化能力,只生产数据实现堆叠;
折数很小时,模型容易过拟合;
折数较大时,模型抗过拟合能力会上升,学习能力会略有下降;
数据量足够大时,折数过多不会带来好处,反而降低训练时间.
'''

5.3 StackingClassfier参数stack_method - 解决特征少

'''
特征量即个体学习器数量
一个个体学习器输出的是类别(如0,1,2)只能有一个特征,输出类型若是概率值、置信度等则可拓展多列.
StackingClassfier独有参数stack_method控制个体分类器的输出.
stack_method四种输入字符串:
    'auto' 按后三种顺序尝试,若个体学习器可以使用某一种就选择该种输出
    'predict_proba' 输出概率probability
        对于二分类,输出一列标签为1的概率
        对于n分类,输出n列标签为[0,1,2...,n]的概率
    'decision_function' 输出置信度
        对于二分类,输出一列标签为1的置信度
        对于n分类,输出n列标签为[0,1,2...,n]的置信度
    'predict' 输出预测结果
        输出一列预测标签
    后三种常在sklearn中使用
'''

LR = LogiR(max_iter=3000, random_state=1).fit(Xtrain, Ytrain)
LR.predict_proba(Xtest[:2])

'''
    array([[6.69189045e-15, 9.99986537e-01, 5.91250275e-13, 1.36647983e-11,
            1.33534349e-05, 5.70544031e-13, 1.47472860e-10, 3.56315884e-09,
            1.05798134e-07, 3.58877485e-10],
           [1.98852180e-07, 6.91956491e-07, 1.39758067e-11, 1.16336439e-09,
            3.50962095e-07, 9.99988643e-01, 8.28053059e-06, 2.56757567e-07,
            1.02535554e-06, 5.51767953e-07]])
'''

LR.decision_function(Xtest[:2])
'''
    array([[-12.125248  ,  20.51261851,  -7.64390501,  -4.50356608,
              9.28889507,  -7.67955407,  -2.12474498,   1.06001361,
              4.45089903,  -1.23540807],
           [ -0.91870057,   0.32826077, -10.48168984,  -6.05994616,
             -0.35058408,  14.51199217,   2.81040002,  -0.66312999,
              0.7215324 ,   0.10186528]])
'''

LR.predict(Xtest[:2])
'''
    array([1, 5])
'''

使用stack_method

# 使用stack_method
final_estimator = RFC(n_estimators=100
                     # 如果此分裂导致杂质减少大于或等于该值,则该节点将被分裂
                     # ,min_impurity_decrease=0.0025
                     ,random_state=1107
                     ,n_jobs=8
                     )
clf = StackingClassifier(estimators=estimators # Level0的个体学习器
                        ,final_estimator=final_estimator # Level1的元学习器
                        ,stack_method='auto'
                        ,n_jobs=8
                        )
clf = clf.fit(Xtrain, Ytrain)

'''
transform接口查看元学习器所使用的训练特征矩阵
特征矩阵样本数 = 原数据样本数
7个个体分类器,10分类数据,每个个体分类器输出10个类别对应的概率,共0个特征.
'''
clf.transform(Xtrain).shape , Xtrain.shape

'''
    ((1437, 70), (1437, 64))
'''

5.3 StackingRegressor参数passthrough - 解决特征少

'''
对于回归算法
passthrough
    True 将原始特征矩阵加入个体学习器的预测值,构成新特征矩阵.较高过拟合风险.
    False 不加入
'''

6. Blending

6.1 改进Stacking

数据量大、Stacking过拟合严重时使用Blending

Stacking

· 分训练集和测试集.

· 训练集在个体学习器上交叉验证, 验证结果进行堆叠形成元学习器的特征矩阵.

· 隐藏步骤: 之后使用全部训练数据对所有个体学习器训练, 为测试做准备.

Blending 学习浅,计算少,不易过拟合

· 分训练集、验证集和测试集.

· 所有个体学习器在训练集上训练, 在验证集上验证, 所有个体学习器验证结果横向拼接形成特征矩阵.

6.2 代码实现

import pandas as pd
from sklearn.model_selection import train_test_split

def BlendingClassifier(X, y, estimators, final_estimator, test_size=0.2, vali_size=0.4):
    '''
    该函数实现Blending分类融合
    X,y: 整体数据集, 会被分割为训练集、验证集和测试集三部分
    estimators: level0的个体学习器, 输入格式形如sklearn中要求的[('名字', 算法),('名字', 算法)...]
    final_estimator: 元学习器
    test_size: 测试集占全数据集的比例
    vali_size: 验证集占全数据集的比例
    '''
    # 分割数据集
    # 1. 分测试集
    # 2. 分训练集和验证集, 验证集占完整数据集的0.4, 因此占排除测试集后的0.4/0.8
    X_, Xtest, y_, Ytest = train_test_split(X,y,test_size=test_size,random_state=1107)
    Xtrain, Xvali, Ytrain, Yvali = train_test_split(X_,y_,test_size=vali_size/(1-test_size),random_state=1107)
    
    # 训练
    # 建立空dataframe用于保存个体学习器上的验证结果, 即用于生成特征矩阵
    # 新建空列表用于保存训练完毕的个体学习器, 以便在测试中使用、
    NewX_vali = pd.DataFrame()
    trained_estimators = []
    # 循环训练每个个体学习器, 并收集个体学习器在验证集上输出的概率
    for clf_id, clf in estimators:
        clf = clf.fit(Xtrain, Ytrain)
        val_predictions = pd.DataFrame(clf.predict_proba(Xvali))
        # 保存结果, 在循环中逐渐构建特征矩阵
        NewX_vali = pd.concat([NewX_vali, val_predictions], axis=1)
        trained_estimators.append((clf_id, clf))
    # 元学习器在特征矩阵上训练, 并输出训练分数
    final_estimator = final_estimator.fit(NewX_vali, Yvali)
    train_score = final_estimator.score(NewX_vali, Yvali)
    
    # 测试
    # 建立空dataframe用于保存个体学习器的预测结果,即用于生成特征矩阵
    NewX_test = pd.DataFrame()
    # 循环, 在每个训练完的个体学习器上进行预测, 并收集每个个体学习器上输出的概率
    for clf_id, clf in trained_estimators:
        test_prediction = pd.DataFrame(clf.predict_proba(Xtest))
        # 保存结果, 在循环中逐渐构建特征矩阵
        NewX_test = pd.concat([NewX_test, test_prediction], axis=1)
    # 元学习器在新特征上测试, 并输出测试分数
    test_score = final_estimator.score(NewX_test, Ytest)
    
    # 打印训练分数与验证分数
    print('train_score=', train_score)
    print('test_score=', test_score)

'''
沿用Voting投票法(模型融合_投票法)选出的七个模型
'''
# 逻辑回归没有增加多样性选项
clf1 = LogiR(max_iter=3000, C=0.1, random_state=1107, n_jobs=8)
# 增加特征多样性和样本多样性
clf2 = RFC(n_estimators=100, max_features='sqrt', max_samples=0.9, random_state=1107, n_jobs=8)
# 增加特征多样性, 稍微上调特征数量
clf3 = GBC(n_estimators=100, max_features=16, random_state=1107)
# 增加算法多样性,新增决策树与KNN
clf4 = DTC(max_depth=8, random_state=1107)
clf5 = KNNC(n_neighbors=8, n_jobs=8)
clf6 = GaussianNB()

# 新增随即多样性,相同的算法更换随机数种子
clf7 = RFC(n_estimators=100, max_features='sqrt', max_samples=0.9, random_state=1998, n_jobs=-1)
clf8 = GBC(n_estimators=100, max_features=16, random_state=1998)

estimators = [('Logistic Regression', clf1)
             ,('RandomForest', clf2)
             ,('GBDT', clf3)
             ,('Decision Tree', clf4)
             ,('KNN', clf5)
             # ,('Bayes', clf6) # 拖后腿不要了
             ,('RandomForest2', clf7)
             ,('GBDT2', clf8)
             ]

final_estimator = RFC(n_estimators=100
                     # ,max_depth=8
                     ,min_impurity_decrease=0.0025
                     ,random_state=1107
                     ,n_jobs=-1
                     )

from sklearn.datasets import load_digits

data = load_digits()
X = data.data
y = data.target

BlendingClassifier(X, y, estimators, final_estimator)

'''
    train_score= 0.9972183588317107
    test_score= 0.9777777777777777
'''

毕业设计--基于Python+Django框架的豆瓣图书评论推荐可视化系统源码空间站11 python 课程设计 django 毕业设计人工智能后端豆瓣图书爬虫
1.系统概述本系统是一个基于Python和Django框架的豆瓣图书评论推荐可视化系统。通过收集并分析豆瓣图书的评论数据，结合可视化技术，系统能够为用户推荐感兴趣的图书，并以直观的方式展示图书评论的统计信息和分析结果。2.项目目标本项目的主要目标是设计并实现一个豆瓣图书评论推荐系统，具体目标如下：图书评论数据采集与存储：系统能够从豆瓣平台抓取图书评论数据，并将其存储在本地数据库中（db.sqlit
python type函数_Python type（）函数 cunchi4221 python java javascript js php ViewUI
pythontype函数Pythontype（）函数(Pythontype()Function)Pythonhasalotofbuit-infunction.Thetype()functionisusedtogetthetypeofanobject.Python具有很多内置功能。type()函数用于获取对象的类型。Pythontype()functionsyntaxis:Pythontype（）函
Python 网页控制自动化 getEdgeDriver chenchihwen 服务器 mysql 运维
透过python使用edge执行自动化时，原来的代码出现报错了执行报错啦：messageinfo如下显示HTTPSConnectionPool(host='msedgedriver.azureedge.net',port=443):Maxretriesexceededwithurl:/130.0.2849/edgedriver_win64.zip(CausedbyNewConnectionErro
函数与lambda表达式叶清湑学习笔记 python lambda
函数与lambda表达式在Python中，函数分为普通函数与lambda函数。Lambda是一个匿名函数，它是一种简写，表达更快。写法如下:自定义函数名=lambda若干参数:操作表达式deffun1(a,b,c):returna*b*cprint(fun1(3,4,10))fun2=lambdaa,b,c:a*b*c;print(fun2(3,5,10))
Python VS Code报错ModuleNotFoundError: No module named ‘numpy‘以及No module named ‘xxx‘的原因及解决办法猛狗哭泣数据分析 python bug anaconda
ModuleNotFoundError的两种类型及解决方法Nomodulenamed'numpy'Nomodulenamed'xxx'Nomodulenamed‘numpy’有的时候我们想import常用的包比如numpy或者pandas，而且电脑上是有安装这些包并且在Jupyter中可以正常使用的，但在VSCode或者Pycharm中import却会出现如题的错误。发生这种报错的原因是VSCod
【20.5 python中的FastAPI】 wang151038606 python语言入门学习 python fastapi 开发语言
python中的FastAPIFastAPI是一个现代、快速（高性能）的Web框架，用于构建API，基于Python3.6+的类型提示。它利用了Python3.7+的新特性，如类型提示（TypeHints），来自动生成API文档（基于OpenAPI和SwaggerUI），以及进行参数校验和序列化/反序列化。FastAPI旨在简化API开发，同时保持高性能。FastAPI的特点快速：极高的性能，可与
华为OD机试E卷 --游戏分组--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od 游戏 java javascript c++c python
文章目录题目描述输入描述输出描述用例题目解析Js算法源码python算法源码java算法源码c++算法源码c算法源码题目描述部门准备举办一场王者荣耀表演赛，有10名游戏爱好者参与，分为两队，每队5人。每位参与者都有一个评分，代表着他的游戏水平。为了表演赛尽可能精彩，我们需要把10名参赛者分为示例尽量相近的两队。一队的实力可以表示为这一队5名队员的评分总和。现在给你10名参与者的游戏水平评分，请你根
python中报错“ModuleNotFoundError: No module named ‘openpyxl‘” wang151038606 python中bug python中的安装包 python
python中报错“ModuleNotFoundError:Nomodulenamed‘openpyxl’”importopenpyxl时报错“ModuleNotFoundError:Nomodulenamed‘openpyxl’”在Python中遇到ModuleNotFoundError:Nomodulenamed'openpyxl'这个错误，通常意味着你的Python环境中没有安装openpy
实现实时通信：使用Python WebSocket与服务器进行交互清水白石008 Python题库 python python websocket 交互
实现实时通信：使用PythonWebSocket与服务器进行交互在现代网络应用中，实时通信变得越来越重要。无论是在线聊天、股票交易还是游戏，能够即时交换数据是提升用户体验的关键。WebSocket协议作为一种实现双向通信的标准，提供了有效的解决方案。本文将带你深入理解如何使用Python编写一个简单的WebSocket客户端，与服务器进行实时通信。一、WebSocket协议概述1.1WebSock
Python中常见关键字及其用法介绍 xiaoweids 编程语言 Python python 开发语言
这篇文章主要介绍了Python中有哪些关键字及关键字的用法,分享python中常用的关键字，本文结合示例代码给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下Python有哪些关键字Python常用的关键字1and,del,from,not,while,as,elif,global,or,with,assert,else,if,pass,yield,break,e
Python使用QQ邮箱发送邮件提示高质量海王哦 python python
python发送qq邮件htmlimportbase64importsmtplibimporttimefromemail.mime.textimportMIMETextdefsend_QQ_mail_HTML():user='[email protected]'#发送方的邮箱账号passwd='xruuwiyxdcouddjg'#授权码receiver='[email protected]
python无人飞机 python无人驾驶医学芯片 python 开发语言
这是一个简单的无人飞机代码示例：classDrone:def__init__(self):self.flying=Falsedeftakeoff(self):ifnotself.flying:print("无人机起飞")self.flying=Trueelse:print("无人机已在空中")defland(self):ifself.flying:print("无人机降落")self.flying
第三章、python中的对象、变量、标识符、作用域、引用(调用)及地址的概念(3.1-3.2)------内存地址、创建对象、对象的类型及对象的划分问题 thefg Python基础详解教程对象的类型创建对象 in is id 内存地址逻辑地址
第三章、python中的对象、变量、标识符、作用域、引用(调用)及地址的概念本章讲述编程中对象、变量、地址的基本概念及其之间的关系，可迭代对象、可变对象、不可变对象的特点。
基于flask框架高校学生宿舍管理系统 (python+mysql+论文) 真纯Django毕设程序 python flask mysql
本系统（程序+源码）带文档lw万字以上文末可获取本课题的源码和程序系统程序文件列表系统的选题背景和意义选题背景：
Python中global的用法叉选手 python python
global是python中的一个关键字，作用在变量上，该关键字通常放在函数块中，用来声明该变量为全局变量。例如下面变量a，定义在函数外面的是全局变量a，定义在fun函数里面的a是另一个a，是局部变量a，两者没有任何关系。好比这个地区有个叫张三的人，公办室里有个另一个叫张三的人。他们是两个不同的人。a=10deffun():a=2fun()print(a)#输出10如果想要函数里面的那个a就代表外
巨潮PDF年报下载01——python request库圣道寺 python学习笔记 python
目录标题背景代码块背景(70条消息)迅雷API批量下载巨潮年报_无敌的前任的博客-CSDN博客代码块fromwin32com.clientimportDispatch#pipinstallwin32compat#pipinstallpywin32importosimportreimportopenpyxlimportrequestsimporturllib.requestimporttimedef
python中global的用法 Jqlender python python
python变量的作用域：Local局部作用域Enclosing闭包函数外的函数中Global全局作用域查找规则：以Local->Enclosing->Global规则查找，即：同名变量，优先引用的是局部变量，在局部找不到，便会去局部外的局部找（例如闭包），再找不到就会去全局找。global关键字x=5deffun_a():print(x)deffun_b():x=x+1print(x)fun_a
Python 潮流周刊#84：2024 年 Python 的最佳实践（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，全文2200字。以下是本期摘要：文章&教程①现代Python开发的良好实践②2024年最先进的Python③回顾一年：2024年的Flask④介绍Annotate
Python基于matplotlib-scalebar库绘制比例尺懒大王爱吃狼 python python matplotlib 开发语言自动化 Python基础 opencv
在Python中，你可以使用matplotlib-scalebar库来在图表上绘制比例尺。这个库是matplotlib的一个扩展，专门用于在绘图时添加比例尺。以下是一个简单的示例，展示了如何使用matplotlib-scalebar来绘制带有比例尺的图表。首先，你需要安装matplotlib-scalebar库。如果你还没有安装它，可以使用以下命令来安装：pipinstallmatplotlib-
Python 潮流周刊#77：Python 依赖管理就像垃圾场火灾？（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，2则热门讨论，全文2200字。以下是本期摘要：文章&教程①Python依赖管理一种垃圾场火灾②Python的膨胀：精细的项目间依赖关系分析③分享我的Django项
Python 潮流周刊#74：创下吉尼斯世界记录的 Python 编程课（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。本期分享了12篇文章，12个开源项目，2则音视频，全文2300字。好消息：即日起至万圣节（12.31），周刊限时99元/年，欢迎订阅！！以下是本期摘要：文章&教程①创下吉尼斯世界记录的Python
Python 潮流周刊#71：PyPI 应该摆脱掉它的赞助依赖（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，1则音视频，全文2000字。以下是本期摘要：文章&教程①PyPI应该摆脱掉它的赞助依赖②创建不分大小写的Python字符串类③用Tree-sitter&Jedi重
Python 潮流周刊#72：Python 3.13.0 最终版已发布！（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了14篇文章，12个开源项目，4则音视频，全文2300字。以下是本期摘要：文章&教程①Python3.13.0最终版已发布！②关于Python3.13，了解这些信息就够了③Python3.13
Python 潮流周刊#67：uv 的重磅更新（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，全文2000字。以下是本期摘要：文章&教程①uv：统一的Python打包工具②PyJWT和python-jose在处理JWT令牌时的差异③Kindle+Pytho
Python 潮流周刊#68：2023 年 Python 开发者调查结果（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，2则热门讨论，全文2100字。以下是本期摘要：文章&教程①2023年Python开发者调查结果②为什么在Docker中我仍然要用Python虚拟环境？③我如何用P
Python WebSocket服务器介绍一只会写程序的猫 Python python websocket 服务器
PythonWebSocket服务器介绍WebSocket是一种在Web浏览器和服务器之间实现全双工通信的协议。它允许服务器主动发送消息到浏览器，而不需要浏览器发起请求。Python提供了许多库和框架来实现WebSocket服务器，本文将介绍如何使用Python构建一个简单的WebSocket服务器。WebSocket协议和工作原理WebSocket协议是通过HTTP协议的升级实现的。在HTTP协
python如何读取csv文件？ gaogsf Python python 开发语言
CSV（CommaSeparatedValues）文件是一种常见的文件格式，它将数据以逗号分隔的形式存储，通常用于存储表格数据。在Python中，我们可以使用多种方法来读取CSV文件，本文将从多个角度分析Python如何读取CSV文件。一、Python内置的csv库Python内置了csv库，可以使用该库中的reader对象来读取CSV文件。下面是一个示例代码：importcsvwithopen(
探索装饰器的奥秘：Python里的超级英雄披风大梦百万秋知识学爆 python 开发语言
引言：每一行代码都可以是一件披风有没有想过，代码写得再帅气，读起来再优雅，它始终是千篇一律的套路？有时候，代码中的函数就像是穿着普通衣服的路人，默默地完成任务。而这时候，你可能会想：“嘿，我要给它们一点魔法，让它们更具超能力！”别担心，Python里的装饰器正是你需要的神秘工具，它能给你的函数加上一件“超级英雄披风”，让它们瞬间拥有更多的功能，且不改变它们原本的外貌。今天我们就来一起揭开装饰器的面
在 Python 中使用 PyPDF2 向 PDF 文件批量添加水印信息科技云课堂 python pdf
目录：使用PyPDF2添加水印到PDF文件批量添加水印到PDF文件所有页PDF文件广泛用于不同的设备和平台上，在某些情况下，可能需要在PDF文件中申明版权，需要将水印、条形码、二维码等添加到PDF中。PyPDF2提供了一种将另一个PDF文件作为水印，添加到PDF文件的方法。在下面的示例中，制作一个PDF水印文档，可以加入文字、二维码，通过合并的方法为PDF文件添加水印。使用PyPDF2添加水印到P
Python 潮流周刊#86：Jupyter Notebook 智能编码助手（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，全文2000字。以下是本期摘要：文章&教程①介绍JupyterNotebook智能助手②用纯Python写一个“Redis”，速度比原生Redis还快？③30分钟
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">

【sklearn】模型融合_堆叠法

Stacking

参数含义

1. 工具库 & 数据

2. 定义交叉验证函数

2.1 对融合模型

2.2 对单个评估器

3. 定义个体学习器和元学习器

3.1 个体学习器

3.2 元学习器

4. 评估调整模型

5. 元学习器的特征矩阵

5.1 特征矩阵两个问题 & Stacking

5.2 StackingClassfier\Regressor参数cv - 解决样本量少

5.3 StackingClassfier参数stack_method - 解决特征少

5.3 StackingRegressor参数passthrough - 解决特征少

6. Blending

6.1 改进Stacking

6.2 代码实现

你可能感兴趣的:(Python,sklearn,python)