Python风控模型与数据分析

catboost参数详解及实战（强推）

目录

一参数详解

二实战

1 导包

2 数据读取

3 贷后y标签分布，逾期率20%

4 预处理

5 特征分布

6 特征分组

7 初始参数

8 catboost建模函数

9 初始模型

10 特征重要性

11 贝叶斯调参

一参数详解

由于catboost参数较多，本文仅列出重要及常用参数（如需直接使用，可将：替换为 # ）

'''
公共参数
'''
params={
    'loss_function': , ： 损失函数，取值RMSE, Logloss, MAE, CrossEntropy, Quantile, LogLinQuantile, Multiclass, MultiClassOneVsAll, MAPE, Poisson。默认Logloss。
    'custom_loss': , ： 训练过程中计算显示的损失函数，取值Logloss、CrossEntropy、Precision、Recall、F、F1、BalancedAccuracy、AUC等等
    'eval_metric': , ： 用于过度拟合检测和最佳模型选择的指标，取值范围同custom_loss
    'iterations': , ： 最大迭代次数，默认500. 别名：num_boost_round, n_estimators, num_trees
    'learning_rate': , ： 学习速率,默认0.03 别名：eta
    'random_seed': , ： 训练的随机种子，别名：random_state
    'l2_leaf_reg': , ： l2正则项，别名：reg_lambda
    'bootstrap_type': , ： 确定抽样时的样本权重，取值Bayesian、Bernoulli(伯努利实验)、MVS(仅支持cpu)、Poisson(仅支持gpu)、No（取值为No时，每棵树为简单随机抽样）;默认值GPU下为Bayesian、CPU下为MVS
    'bagging_temperature': ,  ： bootstrap_type=Bayesian时使用,取值为1时采样权重服从指数分布；取值为0时所有采样权重均等于1。取值范围[0，inf)，值越大、bagging就越激进
    'subsample': , ： 样本采样比率（行采样）
    'sampling_frequency': , ： 采样频率，取值PerTree（在构建每棵新树之前采样）、PerTreeLevel（默认值，在子树的每次分裂之前采样）；仅支持CPU
    'random_strength': , ： 设置特征分裂信息增益的扰动项，用于避免过拟合。子树分裂时，正常会寻找最大信息增益的特征+分裂点进行分裂，此处对每个特征+分裂点的信息增益值+扰动项后再确定最大值。扰动项服从正态分布、均值为0，random_strength参数值会作为正态分布的方差，默认值1、对应标准正态分布；设置0时则无扰动项
    'use_best_model': , ： 让模型使用效果最优的子树棵树/迭代次数，使用验证集的最优效果对应的迭代次数（eval_metric：评估指标，eval_set：验证集数据），布尔类型可取值0，1（取1时要求设置验证集数据）
    'best_model_min_trees': , ： 最少子树棵树,和use_best_model一起使用
    'depth': , ： 树深，默认值6
    'grow_policy': , ： 子树生长策略，取值SymmetricTree（默认值，对称树）、Depthwise（整层生长，同xgb）、Lossguide（叶子结点生长，同lgb）
    'min_data_in_leaf': , ： 叶子结点最小样本量
    'max_leaves': , ： 最大叶子结点数量
    'one_hot_max_size': , ： 对唯一值数量

 
  二 实战 
  1 导包 
  import re
import os
import pandas as pd
import numpy as np
import warnings
warnings.filterwarnings('ignore')
import sklearn
from sklearn.model_selection import train_test_split
from sklearn.metrics import roc_curve,roc_auc_score
import matplotlib.pyplot as plt
import gc
from bayes_opt import BayesianOptimization
from catboost import Pool, cv 
  2 数据读取 
  df=pd.read_csv('E:/train.csv',engine='python').head(80000)
print(df.shape)
df.head() 
  3 贷后y标签分布，逾期率20% 
  pd.concat([df_copy['isDefault'].value_counts()
            ,df_copy['isDefault'].value_counts(normalize=True)],axis=1) 
   
  4 预处理 
          employmentLength字段为工作年限，提取出年数 
  df_copy['employmentLength']=df_copy['employmentLength'].replace(' years','')
dic={'< 1':0,'10+':20}
df_copy['employmentLength']=df_copy['employmentLength'].map(dic).astype('float') 
  5 特征分布 
  import seaborn as sns
sns.pairplot(df_copy.loc[:,'loanAmnt':'isDefault'].drop(['issueDate'],axis=1)
             , kind="scatter",hue="isDefault"
             , plot_kws=dict(s=80, edgecolor="white", linewidth=2.5)) 
   
  6 特征分组 
  float_col=list(df_copy.select_dtypes(exclude=['string','object']).drop(['id','isDefault'],axis=1).columns).copy()
cate_col=['grade', 'subGrade']
all_fea=float_col+cate_col 
  7 初始参数 
  params={
    'loss_function': 'Logloss', # 损失函数，取值RMSE, Logloss, MAE, CrossEntropy, Quantile, LogLinQuantile, Multiclass, MultiClassOneVsAll, MAPE, Poisson。默认Logloss。
    'custom_loss': 'AUC', # 训练过程中计算显示的损失函数，取值Logloss、CrossEntropy、Precision、Recall、F、F1、BalancedAccuracy、AUC等等
    'eval_metric': 'AUC', # 用于过度拟合检测和最佳模型选择的指标，取值范围同custom_loss
    'iterations': 50, # 最大迭代次数，默认500. 别名：num_boost_round, n_estimators, num_trees
    'learning_rate': 0.1, # 学习速率,默认0.03 别名：eta
    'random_seed': 123, # 训练的随机种子，别名：random_state
    'l2_leaf_reg': 5, # l2正则项，别名：reg_lambda
    'bootstrap_type': 'Bernoulli', # 确定抽样时的样本权重，取值Bayesian、Bernoulli(伯努利实验)、MVS(仅支持cpu)、Poisson(仅支持gpu)、No（取值为No时，每棵树为简单随机抽样）;默认值GPU下为Bayesian、CPU下为MVS
#     'bagging_temperature': 0,  # bootstrap_type=Bayesian时使用,取值为1时采样权重服从指数分布；取值为0时所有采样权重均等于1。取值范围[0，inf)，值越大、bagging就越激进
    'subsample': 0.6, # 样本采样比率（行采样）
    'sampling_frequency': 'PerTree', # 采样频率，取值PerTree（在构建每棵新树之前采样）、PerTreeLevel（默认值，在子树的每次分裂之前采样）；仅支持CPU
    'use_best_model': True, # 让模型使用效果最优的子树棵树/迭代次数，使用验证集的最优效果对应的迭代次数（eval_metric：评估指标，eval_set：验证集数据），布尔类型可取值0，1（取1时要求设置验证集数据）
    'best_model_min_trees': 50, # 最少子树棵树,和use_best_model一起使用
    'depth': 4, # 树深，默认值6
    'grow_policy': 'SymmetricTree', # 子树生长策略，取值SymmetricTree（默认值，对称树）、Depthwise（整层生长，同xgb）、Lossguide（叶子结点生长，同lgb）
    'min_data_in_leaf': 500, # 叶子结点最小样本量
#     'max_leaves': 12, # 最大叶子结点数量
    'one_hot_max_size': 4, # 对唯一值数量
 
  8 catboost建模函数 
  import catboost
from catboost import CatBoostClassifier
def catboost_model(df,y_name,params,cate_col=[]):
    x_train,x_test, y_train, y_test =train_test_split(df.drop(y_name,axis=1),df[y_name],test_size=0.2, random_state=123)
    
    model = CatBoostClassifier(**params)
    model.fit(x_train, y_train,eval_set=[(x_train, y_train),(x_test,y_test)],cat_features=cate_col)
    
    train_pred = [pred[1] for pred in  model.predict_proba(x_train)]
    train_auc= roc_auc_score(list(y_train),train_pred)
    
    test_pred = [pred[1] for pred in  model.predict_proba(x_test)]
    test_auc= roc_auc_score(list(y_test),test_pred)
    
    result={
        'train_auc':train_auc,
        'test_auc':test_auc,
    }
    return model,result 
   9 初始模型 
  model,model_result=catboost_model(df_copy[all_fea+['isDefault']]
                                    ,'isDefault',params,cate_col) 
   
   
  10 特征重要性 
  def feature_importance_catboost(model):
    result=pd.DataFrame(model.get_feature_importance(),index=model.feature_names_,columns=['FeatureImportance'])
    return result.sort_values('FeatureImportance',ascending=False)
feature_importance_catboost(model) 
    
   
  11 贝叶斯调参 
  （1）自定义调参目标，此处使用测试集的AUC值为调参目标 
  def catboost_cv(iterations,learning_rate,depth,subsample,rsm):
    params={
        'loss_function': 'Logloss', # 损失函数，取值RMSE, Logloss, MAE, CrossEntropy, Quantile, LogLinQuantile, Multiclass, MultiClassOneVsAll, MAPE, Poisson。默认Logloss。
        'custom_loss': 'AUC', # 训练过程中计算显示的损失函数，取值Logloss、CrossEntropy、Precision、Recall、F、F1、BalancedAccuracy、AUC等等
        'eval_metric': 'AUC', # 用于过度拟合检测和最佳模型选择的指标，取值范围同custom_loss
        'iterations': 50, # 最大迭代次数，默认500. 别名：num_boost_round, n_estimators, num_trees
        'learning_rate': 0.1, # 学习速率,默认0.03 别名：eta
        'random_seed': 123, # 训练的随机种子，别名：random_state
        'l2_leaf_reg': 5, # l2正则项，别名：reg_lambda
        'bootstrap_type': 'Bernoulli', # 确定抽样时的样本权重，取值Bayesian、Bernoulli(伯努利实验)、MVS(仅支持cpu)、Poisson(仅支持gpu)、No（取值为No时，每棵树为简单随机抽样）;默认值GPU下为Bayesian、CPU下为MVS
    #     'bagging_temperature': 0,  # bootstrap_type=Bayesian时使用,取值为1时采样权重服从指数分布；取值为0时所有采样权重均等于1。取值范围[0，inf)，值越大、bagging就越激进
        'subsample': 0.6, # 样本采样比率（行采样）
        'sampling_frequency': 'PerTree', # 采样频率，取值PerTree（在构建每棵新树之前采样）、PerTreeLevel（默认值，在子树的每次分裂之前采样）；仅支持CPU
        'use_best_model': True, # 让模型使用效果最优的子树棵树/迭代次数，使用验证集的最优效果对应的迭代次数（eval_metric：评估指标，eval_set：验证集数据），布尔类型可取值0，1（取1时要求设置验证集数据）
        'best_model_min_trees': 50, # 最少子树棵树,和use_best_model一起使用
        'depth': 4, # 树深，默认值6
        'grow_policy': 'SymmetricTree', # 子树生长策略，取值SymmetricTree（默认值，对称树）、Depthwise（整层生长，同xgb）、Lossguide（叶子结点生长，同lgb）
        'min_data_in_leaf': 500, # 叶子结点最小样本量
    #     'max_leaves': 12, # 最大叶子结点数量
        'one_hot_max_size': 4, # 对唯一值数量
 
   （2）调参 
  param_value_dics={
                'iterations':(20, 50),
                'learning_rate':(0.02,0.2),
                'depth':(3, 6),
                'subsample':(0.6, 1.0),
                'rsm':(0.6, 1.0)
                }

cat_bayes = BayesianOptimization(
        catboost_cv,
        param_value_dics
    )        
cat_bayes.maximize(init_points=1,n_iter=20) #init_points-调参基准点，n_iter-迭代次数 
   
  cat_bayes.max.get('params') 
   
  （3）设置最优参数并重新训练模型 
  cat_bayes.max.get('params')
params.update(
    {
        'depth': 5,
        'iterations': 45,
        'learning_rate': 0.189,
        'rsm': 0.707,
        'subsample': 0.890 
    }
)
model,model_result=catboost_model(df_copy[all_fea+['isDefault']],'isDefault',params,cate_col)
model_result 
   
   获取数据及完整代码，关注公众号Python风控模型与数据分析、回复catboost实战获取


    
        你可能感兴趣的:(机器学习,python,机器学习,数据分析)
        
            
                
                    conda install 和 pip install 的区别
                        不知江月待何人..
深度学习
                        condainstall和pipinstall是两个常用的包安装命令，但它们在很多方面存在差异。1.所属管理系统不同1.1condainstallcondainstall是Anaconda和Miniconda发行版自带的包管理工具conda的安装命令。conda是一个跨平台的开源包管理系统和环境管理系统，它不仅可以管理Python包，还能管理其他语言（如R、C++等）的包。conda更侧重于数据科
                    
                    蓝桥杯备赛计划
                        laitywgx
蓝桥杯职场和发展
                        1-2小时的蓝桥杯PythonB组冲刺日程表（持续1个月，聚焦高频考点）：第一周：核心算法突破Day1（周一）学习重点：动态规划（01背包问题）学习资源：AcWing《蓝桥杯辅导课》第8讲（背包问题模板）代码模板速记：#一维01背包模板n,V=map(int,input().split())dp=[0]*(V+1)for_inrange(n):w,v=map(int,input().split()
                    
                    机器学习怎么做特征工程
                        全栈你个大西瓜
人工智能机器学习人工智能特征工程数据预处理特征变换特征降维特征构造
                        一、特征工程通俗解释特征工程就像厨师做菜前的食材处理：原始数据是“生肉和蔬菜”，特征工程是“切块、腌制、调料搭配”，目的是让机器学习模型（食客）更容易消化吸收，做出更好预测（品尝美味）。二、为什么要做特征工程？数据质量差：原始数据常有缺失、噪声、不一致问题（如年龄列混入“未知”）。模型限制：算法无法直接理解原始数据（如文本、日期需要数值化）。提升效果：好特征能显著提升模型性能（准确率提升10%~5
                    
                    【机器学习】机器学习四大分类
                        藓类少女
机器学习机器学习分类人工智能
                        机器学习的方法主要可以分为四大类，根据学习方式和数据标注情况进行分类：1.监督学习（SupervisedLearning）特点：有标注数据（即训练数据有明确的输入(X)和输出(Y)）。学习目标是找到一个映射(f(X)\approxY)。适用于分类和回归问题。主要算法：分类（Classification）：逻辑回归（LogisticRegression）支持向量机（SVM）朴素贝叶斯（NaïveBa
                    
                    Conda常用命令汇总（持续更新中）
                        X-future426
condalinux运维
                        原文章：安装和使用Miniconda来管理Python环境-CSDN博客一、Miniconda的使用Miniconda没有GUI界面，只能通过conda命令对Python环境和软件包进行管理，所以这里主要介绍一下conda的常用命令。1.Conda相关(1)查询conda版本conda--version(2)更新conda版本condaupdateconda2.环境管理(1)查询已创建的虚拟环境c
                    
                    Python 爬虫实战：从知乎盐选专栏，爬取优质内容付费数据
                        西攻城狮北
python爬虫开发语言实战案例知乎
                        目录一、前言二、准备篇2.1确定目标2.2工具与库2.3法律与道德声明三、实战篇3.1分析知乎盐选专栏页面3.2模拟登录3.3获取文章列表3.4爬取更多文章数据3.5数据存储四、分析篇4.1数据清洗4.2热门文章分析4.3收藏数分析4.4评论数分析五、总结与展望六、注意事项一、前言知乎盐选专栏作为知乎平台上的优质内容付费板块，汇聚了众多创作者的高质量文章。了解这些文章的付费数据，如点赞数、收藏数、
                    
                    机器学习——KNN超参数
                        练习AI两年半
机器学习人工智能深度学习
                        sklearn.model_selection.GridSearchCV是scikit-learn中用于超参数调优的核心工具，通过结合交叉验证和网格搜索实现模型参数的自动化优化。以下是详细介绍：一、功能概述GridSearchCV在指定参数网格上穷举所有可能的超参数组合，通过交叉验证评估每组参数的性能，最终选择最优参数组合。其核心价值在于：自动化调参：替代手动参数调试，提升效率3。交叉验证支持：通
                    
                    Python 常用函数全解析，轻松提升编码效率
                        jiajia651304
python开发语言windows
                        Python常用函数全解析，轻松提升编码效率Python常用函数全解析，轻松提升编码效率1.基础内置函数1.1`print()`与`input()`1.2`len()`、`type()`与`isinstance()`2.数学与数值处理函数2.1`abs()`、`round()`与`pow()`2.2`divmod()`与`max()/min()`3.序列与迭代相关函数3.1`range()`与`e
                    
                    编程内容简述！
                        恶霸不委屈
开发语言青少年编程汇编javapython
                        编程是指通过计算机语言来开发软件、程序和应用的过程，通常通过编写一系列的指令，来让计算机完成特定的任务。编程可以涉及多个领域和技术，以下是一些主要的编程内容：1.编程语言编程语言是程序员与计算机进行沟通的桥梁，不同的编程语言适用于不同的任务。常见的编程语言有：Python：简单易学，适用于数据分析、人工智能、网页开发等。JavaScript：网页开发中不可或缺的语言，用于动态网页和前端开发。Jav
                    
                    新手如何使用 Milvus
                        巴依老爷coder
数据库milvus向量数据库数据库
                        一文带你入门Milvus：详细指南新手如何使用Milvus：详细指南一、Milvus简介主要特点应用领域二、安装Milvus安装DockerCompose基于DockerCompose安装Milvus服务端安装attu-可视化界面工具三、快速入门安装PythonSDK连接数据库方式1方式2（方式1的封装）数据库操作核心概念集合操作数据操作插入数据精准查询数据-get条件查询数据-query查询数据
                    
                    nginx-部署Python网站项目
                        skyQAQLinux
pythonlinuxnginx服务器
                        一、部署Python网站项目实验要求配置Nginx使其可以将动态访问转交给uWSGI安装Python工具及依赖1)拷贝软件到proxy主机[root@server1~]#scp-r/linux-soft/s2/wk/python/192.168.99.5:/root2)安装python依赖软件[root@proxy~]#yum-yinstallgccmakepython3python3-devel
                    
                    Python 3.6.8 64位独立安装程序
                        霍娴果Myrtle

                        Python3.6.864位独立安装程序【下载地址】Python3.6.864位独立安装程序Python3.6.864位独立安装程序欢迎使用Python3.6.64位版安装包！本资源专门针对需要在64位操作系统上进行Python环境搭建的用户项目地址:https://gitcode.com/open-source-toolkit/98d19欢迎使用Python3.6.64位版安装包！本资源专门针对
                    
                    Python 3.6.8 安装包下载
                        何盼思Kit

                        Python3.6.8安装包下载【下载地址】Python3.6.8安装包下载Python3.6.8安装包下载本仓库提供适用于Windows操作系统的Python3.6.8安装包，支持x86和x64架构项目地址:https://gitcode.com/open-source-toolkit/d9647本仓库提供适用于Windows操作系统的Python3.6.8安装包，支持x86和x64架构。Pyt
                    
                    Python匿名函数Lambda，不止是省略函数名这么简单
                        橙色小博
python的学习之旅python开发语言
                        目录1.前言2.Lambda函数的基本用法3.关于Lambda函数的应用3.1与map函数结合3.2lambda与if-else语句3.3多参数lambda3.4嵌套lambda3.5字典与lambda（也是我本人最喜欢的用法）3.6lambda其他用法4.总结：Lambda的编程哲学1.前言在Python的广阔天地里，Lambda函数宛如一颗璀璨的明珠，以其简洁优雅的姿态，为代码增添了一份独特的
                    
                    AtCoder备赛冲刺必刷题（C++） | 洛谷 AT_abc396_a Triple Four
                        热爱编程的通信人
c++算法开发语言
                        本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：AT_abc396_a[ABC396A]
                    
                    python 捕获异常
                        weixin_30730151
python数据库
                        异常：由于代码的逻辑或者语法错误导致的程序中断。在学习Python的过程当中，大家一定要区分清楚异常和布尔值False布尔值的False只是一个值，通常代表的是一个条件的不成立，常用于逻辑判断比如：1num=22print(num>3)3ifnum>3:4print("num>3")异常指的是由于代码的逻辑或者语法错误导致的程序中断比如：1num=222+"2"了解了上面的逻辑之后，我们来看看大家
                    
                    python爬虫Redis数据库
                        Æther_9
Python爬虫零基础入门数据库python爬虫
                        Redis数据库Redis简介Redis是完全开源免费的，遵守BSD协议，是一个高性能的key-value数据库。Redis与其他key-value缓存产品有以下三个特点：Redis支持数据的持久化，可以将内存中的数据保存在磁盘中，重启的时候可以再次加载进行使用。Redis不仅仅支持简单的key-value类型的数据，同时还提供list，set，zset，hash等数据结构的存储。redis：半持
                    
                    python sympy的安装与使用
                        范哥来了
python开发语言
                        为了安装和使用sympy，您可以按照以下步骤进行操作：安装SymPy首先，您需要确保已经安装了Python。接着，可以通过pip来安装sympy。打开命令行工具（如终端或命令提示符），然后输入以下命令来安装sympy：pipinstallsympy如果您使用的是特定的Python环境，请确保激活该环境后再执行上述安装命令。使用SymPy安装完成后，您就可以在Python项目中导入并使用sympy了
                    
                    重要重要！！fisher矩阵是怎么计算和更新的，以及计算过程中参数的物理含义
                        ZhangJiQun&MXP
教学2021论文2024大模型以及算力矩阵概率论线性代数windows微信机器学习
                        fisher矩阵是怎么计算和更新的，以及计算过程中参数的物理含义Fisher信息矩阵（FisherInformationMatrix,FIM）用于衡量模型参数估计的不确定性，其计算和更新在统计学、机器学习和优化中具有重要作用。以下是其计算和更新的关键步骤：一、Fisher矩阵的计算定义Fisher矩阵的元素表示对数似然函数关于参数的二阶导数的期望值的负数，即：Fi,j=−
                    
                    facefusion AI换脸软件的本地部署过程记录
                        kfrealme
人工智能
                        tags:AI驾驭facefusion我的环境Win10+N卡安装步骤安装Python3.10方案手动安装Python官网下载安装包安装PythonReleasesforWindows|Python.org我的蓝奏云分享https://www.lanzoub.com/i9La81s1o5gb密码:h17b命令行安装1以管理员身份打开「命令提示符」2删除Microsoft官方源wingetsourc
                    
                    Python中手动实现进制转换
                        棉猴
Python进制转换十进制二进制十六进制八进制
                        在《Python中进制转换》中提到可以使用bin()、oct()、int()和hex()等函数编程实现数字间的进制转换。除了编程实现进制转换外，还可以通过手动实现。1手动实现二进制数转换为十进制可以通过“填空法”手动将二进制数转换为十进制数，例如将二进制数“0b1101”转换为十进制数的方法如图1所示。“填空法”可以归纳为四个步骤：首先“画空格”，接下来“写次方”，然后“填数字”，最后“列算式”。
                    
                    Python中的进制转换
                        棉猴
#Python数据类型Python进制转化二进制八进制十六进制binoct
                        常用的进制有二进制、八进制、十进制和十六进制。1四种进制简介最常用的十进制基本原理是“逢十进一”，因此十进制包括的数字是“0-9”;同理，二进制的基本原理是“逢二进一”，包含的数字是“0-1”;八进制是“逢八进一”，包含的数字是“0-7”；十六进制是“逢十六进一”，包含的数字是“0-15”，其中用“A、B、C、D、E、F”分别表示“10-15”这五个数。2四种进制数的表示对于一个数字“11”,可能
                    
                    小菜鸟的Python笔记001：将Word文档中数据汇总到Excel表格
                        蜉蝣2805
小菜鸟的Python笔记python数据分析
                        将Word文档中数据汇总到Excel表格前言一、应用场景二、程序思路及准备工作思路如下：准备工作：三、程序代码1、主程序2、获取Word文档列表3、提取文档内数据4、导入到Excel表格四、遇到的问题1、错误AttributeError:word.Application.Quit2、word文档中复选框的识别总结前言我并非一个专业的程序员，只是一个普通的编程爱好者、一只小菜鸟。得益于网络上各路大神
                    
                    31天Python入门——第9天:再学函数
                        安然无虞
Python手把手教程python开发语言后端pyqt
                        你好，我是安然无虞。文章目录再学函数1.变量在函数中的作用域2.函数的参数传递.补充学习:不定长参数*args和**kwargs3.值传递和引用传递补充学习:把函数作为参数传递4.匿名函数5.python中内置的常用函数zip()map()filter()all()any()6.函数练习再学函数1.变量在函数中的作用域变量的作用域是指变量的作用范围.局部变量:在函数体或局部范围内声明的变量称为局部
                    
                    Scrapy 入门教程
                        zru_9602
爬虫scrapy
                        Scrapy入门教程Scrapy是一个用于爬取网站数据的Python框架，功能强大且易于扩展。本文将介绍Scrapy的基本概念、安装方法、使用示例，并展示如何编写一个基本的爬虫。1.什么是Scrapy？Scrapy是一个开源的、用于爬取网站数据的框架，主要特点包括：高效、异步的爬取机制强大的XPath和CSS选择器解析能力内置中间件，支持代理、去重等功能易于扩展，适用于各种爬虫需求2.安装Scra
                    
                    python批量替换word内容_python win32com 库批量替换word文件内容
                        weixin_39657300

                        前言win32com模块主要为Python提供调用windows底层组件对word、Excel、PPT等进行操作的功能，只能在Windows环境下使用，并且需要安装office相关软件才行(WPS也行)。实例代码下方代码实现批量替换当前路径下word文档的指定文本内容。importwin32com.clientimportosimporttimedefupdate_replace(file):wo
                    
                    python strip()
                        编号1993
pythonpython
                        参考：http://www.jb51.net/article/37287.htm###############################s.strip(del)：在字符串s的开头结尾处，删除del中存在的字符s.lstrip(del)：在字符串s的开头处，删除del中存在的字符s.rstrip(del)：在字符串s的结尾处，删除del中存在的字符s='asdf'#前后均有空格s.strip(
                    
                    Python调用WPS进行文档转换PDF及PDF转图片
                        IT孔乙己
python开发语言后端
                        这里是利用WPS进行转换，要先安装WPS。安装依赖pipinstallpypiwin32代码#!/usr/bin/python#-*-coding:UTF-8-*-importosimportwin32com.clientdefConvertByWps(sourceFile,targetFile):ifnotos.path.exists(sourceFile):print(sourceFile+"
                    
                    Apache大数据旭哥优选大数据选题
                        Apache大数据旭
大数据定制选题javahadoopspark开发语言ideahive数据库架构
                        定制旭哥服务，一对一，无中介包安装+答疑+售后态度和技术都很重要定制按需求做要求不高就实惠一点定制需提前沟通好怎么做，这样才能避免不必要的麻烦python、flask、Django、mapreduce、mysqljava、springboot、vue、echarts、hadoop、spark、hive、hbase、flink、SparkStreaming、kafka、flume、sqoop分析+推
                    
                    Python strip() 方法详解：用途、应用场景及示例解析（中英双语）
                        阿正的梦工坊
Pythonpython开发语言
                        Pythonstrip()方法详解：用途、应用场景及示例解析在Python处理字符串时，经常会遇到字符串前后存在多余的空格或特殊字符的问题。strip()方法就是Python提供的一个强大工具，专门用于去除字符串两端的指定字符。本文将详细介绍strip()的用法、适用场景，并通过多个示例解析其应用。1.strip()方法简介strip()方法用于去除字符串两端的指定字符（默认为空格和换行符）。它的
                    
                                基本数据类型和引用类型的初始值
                                    3213213333332132
java基础
                                    package com.array;

/**
 * @Description 测试初始值
 * @author FuJianyong
 * 2015-1-22上午10:31:53
 */
public class ArrayTest {
    
	ArrayTest at;
	String str;
	byte bt;
	short s;
	int i;
	long
                                
                                摘抄笔记--《编写高质量代码：改善Java程序的151个建议》
                                    白糖_
高质量代码
                                            记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。 
  
        看完整本书，也记了不少笔记
                                
                                【备忘】Django 常用命令及最佳实践
                                    dongwei_6688
django
                                    注意：本文基于 Django 1.8.2 版本 
  
生成数据库迁移脚本（python 脚本） 
python manage.py makemigrations polls 
 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整 
  
查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： 
python manage.p
                                
                                阶乘算法之一N! 末尾有多少个零
                                    周凡杨
java算法阶乘面试效率
                                                                     &n
                                
                                spring注入servlet
                                    g21121
Spring注入
                                    传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： 
ServletContext application = getServletContext();
WebApplicationContext wac = WebApplicationContextUtil
                                
                                Jenkins 命令行操作说明文档
                                    510888780
centos
                                     
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 
 
 
 
基本的格式为 
 
java 
 
基本的格式为 
 
java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 
 
 
 
 
下面具体介绍各个命令的作用及基本使用方法 
 
 
 
1. &nb
                                
                                UnicodeBlock检测中文用法
                                    布衣凌宇
UnicodeBlock
                                    /**  * 判断输入的是汉字  */ public static boolean isChinese(char c) {        Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);    
                                
                                java下实现调用oracle的存储过程和函数
                                    aijuans
javaorale
                                      1.创建表：STOCK_PRICES 
   
  2.插入测试数据： 
   
  3.建立一个返回游标：  
PKG_PUB_UTILS 
   4.创建和存储过程：P_GET_PRICE 
  
   5.创建函数： 
   6.JAVA调用存储过程返回结果集 
JDBCoracle10G_INVO
                                
                                Velocity Toolbox
                                    antlove
模板toolboxvelocity
                                    velocity.VelocityUtil 
package velocity;

import org.apache.velocity.Template;
import org.apache.velocity.app.Velocity;
import org.apache.velocity.app.VelocityEngine;
import org.apache.velocity.c
                                
                                JAVA正则表达式匹配基础
                                    百合不是茶
java正则表达式的匹配
                                      
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作 
  
正则表达式的用途; 
字符串的匹配

字符串的分割

字符串的查找

字符串的替换
 
  
  
  
正则表达式的验证语法 
    
  [a]    //[]表示这个字符只出现一次  ,[a] 表示a只出现一
                                
                                是否使用EL表达式的配置
                                    bijian1013
jspweb.xmlELEasyTemplate
                                            今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。 
        网
                                
                                精通Oracle10编程SQL(1-3)PLSQL基础
                                    bijian1013
oracle数据库plsql
                                    --只包含执行部分的PL/SQL块
--set serveroutput off
begin
  dbms_output.put_line('Hello,everyone!');
end;


select * from emp;

--包含定义部分和执行部分的PL/SQL块
declare
   v_ename varchar2(5);
begin
   select 
                                
                                【Nginx三】Nginx作为反向代理服务器
                                    bit1129
nginx
                                    Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能： 
  
 
 接受客户端请求 
 将请求转发给被代理的服务器 
 从被代理的服务器获得响应结果 
 把响应结果返回给客户端 
 实例 
本文把Nginx配置成一个简单的代理服务器 
 
 对于静态的html和图片，直接从Nginx获取 
 对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
                                
                                Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin
                                    blackproof
maven报错
                                    转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin 
  
maven报错： 
Plugin execution not covered by lifecycle configuration: 
                                
                                发布docker程序到marathon
                                    ronin47
docker 发布应用
                                    1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry 
docker pull docker-registry
docker run -t -p 5000:5000 docker-registry
 下载docker镜像并发布到私有registry 
docker pull consol/tomcat-8.0

                                
                                java-57-用两个栈实现队列&&用两个队列实现一个栈
                                    bylijinnan
java
                                    
import java.util.ArrayList;
import java.util.List;
import java.util.Stack;

	/*
	 * Q 57 用两个栈实现队列
	 */

public class QueueImplementByTwoStacks {

	private Stack<Integer> stack1;
	pr
                                
                                Nginx配置性能优化
                                    cfyme
nginx
                                    转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 
  
大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
                                
                                [JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术
                                    comsci
java
                                     
 
     对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... 
 
  &nb
                                
                                MonkeyRunner的使用
                                    dai_lm
androidMonkeyRunner
                                    要使用MonkeyRunner，就要学习使用Python，哎 
 
先抄一段官方doc里的代码 
作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 
 

# Imports the monkeyrunner modules used by this program
from com.android.monkeyrunner import MonkeyRun
                                
                                Hadoop-- 海量文件的分布式计算处理方案
                                    datamachine
mapreducehadoop分布式计算
                                    csdn的一个关于hadoop的分布式处理方案，存档。 
原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 
 
    Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
                                
                                以資料庫驗證登入
                                    dcj3sjt126com
yii
                                    以資料庫驗證登入 
由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼:    public function authenticate()    {        $users=array( &nbs
                                
                                github做webhooks：[2]php版本自动触发更新
                                    dcj3sjt126com
githubgitwebhooks
                                    上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。       
工具/原料  
 
   git   
   github   
     
方法/步骤  
 
       在github的setting里面的webhooks里把我们的url地址填进去。   
       钩子更新的代码如下： error_reportin
                                
                                Eos开发常用表达式
                                    蕃薯耀
Eos开发Eos入门Eos开发常用表达式
                                    Eos开发常用表达式 
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 
蕃薯耀 2014年8月18日 15:03:35 星期一 
  
  
&
                                
                                SpringSecurity3.X--SpEL 表达式
                                    hanqunfeng
SpringSecurity
                                    使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： 
  
<http auto-config="true"  use-expressions="true"> 
这样就会在投票器中自动增加一个投票器：org.springframework
                                
                                Redis vs Memcache
                                    IXHONG
redis
                                    1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 
2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 
3. Redis支持数据的备份，即master-slave模式的数据备份。 
4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 
Red
                                
                                Python - 装饰器使用过程中的误区解读
                                    kvhur
JavaScriptjqueryhtml5css
                                    大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。 
原文链接：http://www.gbtags.com/gb/share/5563.htm 
Python语言本身提供了装饰器语法（@），典型的装饰器实现如下：     
 
 @function_wrapper 
  de
                                
                                架构师之mybatis-----update 带case when 针对多种情况更新
                                    nannan408
case when
                                    1.前言. 
   如题. 
2. 代码. 
  

	<update id="batchUpdate" parameterType="java.util.List">
			<foreach collection="list" item="list" index=&
                                
                                Algorithm算法视频教程
                                    栏目记者
Algorithm算法
                                    课程：Algorithm算法视频教程 
 
百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 
 
 
程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。 
 一、课程内容： 
课时1、算法的基本概念 + Sequential search 
课时2、Binary search 
课时3、Hash table 
课时4、Algor
                                
                                C语言算法之冒泡排序
                                    qiufeihu
c算法
                                    任意输入10个数字由小到大进行排序。 
代码： 
#include <stdio.h>
int main()
{
	int i,j,t,a[11];        /*定义变量及数组为基本类型*/
	for(i = 1;i < 11;i++){
		scanf("%d",&a[i]);     /*从键盘中输入10个数*/
	}
	for
                                
                                JSP异常处理
                                    wyzuomumu
Webjsp
                                    1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: 
<%@ page errorPage="errors.jsp"%> 
  
2.在处理异常的网页中做如下声明： 
errors.jsp: 
<%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc
                                
                
            
        
    


    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    


    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.