小黄油块跑

机器学习（二）：基于XGBoost的分类与预测

XGBoost介绍

xgboost的安装、参数说明

XGBoost是2016年由华盛顿大学陈天奇老师带领开发的一个可扩展机器学习系统。严格意义上讲XGBoost并不是一种模型，而是一个可供用户轻松解决分类、回归或排序问题的软件包。它内部实现了梯度提升树(GBDT)模型，并对模型中的算法进行了诸多优化，在取得高精度的同时又保持了极快的速度，在一段时间内成为了国内外数据挖掘、机器学习领域中的大规模杀伤性武器。

更重要的是，XGBoost在系统优化和机器学习原理方面都进行了深入的考虑。毫不夸张的讲，XGBoost提供的可扩展性，可移植性与准确性推动了机器学习计算限制的上限，该系统在单台机器上运行速度比当时流行解决方案快十倍以上，甚至在分布式系统中可以处理十亿级的数据。

其主要优点：

简单易用。相对其他机器学习库，用户可以轻松使用XGBoost并获得相当不错的效果。
高效可扩展。在处理大规模数据集时速度快效果好，对内存等硬件资源要求不高。
鲁棒性强。相对于深度学习模型不需要精细调参便能取得接近的效果。
XGBoost内部实现提升树模型，可以自动处理缺失值。

主要缺点：

相对于深度学习模型无法对时空位置建模，不能很好地捕获图像、语音、文本等高维数据。
在拥有海量训练数据，并能找到合适的深度学习模型时，深度学习的精度可以遥遥领先XGBoost。

XGBoost的重要参数

xgboost函数的主要调参参数

重要参数：

num_round(最大迭代次数，没有默认值，必须要自己设定)
seed(随机数种子，默认值为0)
objective(任务目标，默认值为reg:linear)具体取值可查看help文档
二分类可设置为“binary:logistic”，其子模型为树，只是最后会将case的权重做Logistic变换以获得预测概率值
多分类可设置为“multi:softmax”，处理方式与二分类相同，只是用了softmax函数将权重转换为概率
回归可采用“reg:linear”
max_depth(树的最大深度，默认值为6)：越大则树模型越复杂、越容易过拟合
min_child_weight(叶节点中所有观测权重和的阈值，默认值为1)：小于该阈值时，树就不会再分裂；越大则模型越保守（不易过拟合）
colsample_bytree(变量抽样比例，默认值为1)：越大则计算越耗时、树模型精度越高（但也可能导致过拟合）

次重要参数：

eta(学习率,默认值为0.3)：为了防止过拟合，更新过程中用到的收缩步长。在每次提升计算之后，算法会直接获得新特征的权重, eta通过缩减特征的权重使提升计算过程更加保守。eta越大则模型越容易过拟合
gamma(划分叶节点的损失变化量阈值，默认值为0) ：越大则模型越保守
lambda(L2正则项系数，默认值为1)：越大则模型越保守
alpha(L1正则项系数，默认值为0)：越大则模型越保守
scale_pos_weight(处理类别不平衡的参数，默认值为1)
subsample(观测值的抽样比例，默认值为1)：越大则模型越容易过拟合

若在scikit-learn框架下实现XGBoost时的重要参数

1.eta[默认0.3]
通过为每一颗树增加权重，提高模型的鲁棒性。
典型值为0.01-0.2。

2.min_child_weight[默认1]
决定最小叶子节点样本权重和。
这个参数可以避免过拟合。当它的值较大时，可以避免模型学习到局部的特殊样本。
但是如果这个值过高，则会导致模型拟合不充分。

3.max_depth[默认6]
这个值也是用来避免过拟合的。max_depth越大，模型会学到更具体更局部的样本。
典型值：3-10

4.max_leaf_nodes
树上最大的节点或叶子的数量。
可以替代max_depth的作用。
这个参数的定义会导致忽略max_depth参数。

5.gamma[默认0]
在节点分裂时，只有分裂后损失函数的值下降了，才会分裂这个节点。Gamma指定了节点分裂所需的最小损失函数下降值。这个参数的值越大，算法越保守。这个参数的值和损失函数息息相关。

6.max_delta_step[默认0]
这参数限制每棵树权重改变的最大步长。如果这个参数的值为0，那就意味着没有约束。如果它被赋予了某个正值，那么它会让这个算法更加保守。
但是当各类别的样本十分不平衡时，它对分类问题是很有帮助的。

7.subsample[默认1]
这个参数控制对于每棵树，随机采样的比例。
减小这个参数的值，算法会更加保守，避免过拟合。但是，如果这个值设置得过小，它可能会导致欠拟合。
典型值：0.5-1

8.colsample_bytree[默认1]
用来控制每棵随机采样的列数的占比(每一列是一个特征)。
典型值：0.5-1

9.colsample_bylevel[默认1]
用来控制树的每一级的每一次分裂，对列数的采样的占比。
subsample参数和colsample_bytree参数可以起到相同的作用，一般用不到。

10.lambda[默认1]
权重的L2正则化项。(和Ridge regression类似)。
这个参数是用来控制XGBoost的正则化部分的。虽然大部分数据科学家很少用到这个参数，但是这个参数在减少过拟合上还是可以挖掘出更多用处的。

11.alpha[默认1]
权重的L1正则化项。(和Lasso regression类似)。
可以应用在很高维度的情况下，使得算法的速度更快。

12.scale_pos_weight[默认1]
在各类别样本十分不平衡时，把这个参数设定为一个正值，可以使算法更快收敛。

ps:必须处理定性变量！进行独热编码。不必处理缺失值。

算法实战

参考链接

基于天气数据集的XGBoost分类实战

import numpy as np 
import pandas as pd

import matplotlib.pyplot as plt
import seaborn as sns

data = pd.read_csv('train.csv')

数据的各个特征描述如下：

## 进行简单的数据查看，我们可以利用 .head() 头部.tail()尾部
data.head()
data = data.fillna(-1)#发现有缺失值，对缺失值用-1填充
## 利用value_counts函数查看训练集标签的数量
pd.Series(data['RainTomorrow']).value_counts()##发现数据不平衡

简单可视化

## 选取三个特征与标签组合的散点可视化
sns.pairplot(data=data[['Rainfall',
'Evaporation',
'Sunshine'] + ['RainTomorrow']], diag_kind='hist', hue= 'RainTomorrow')
plt.show()

从上图可以发现，在2D情况下不同的特征组合对于第二天下雨与不下雨的散点分布，以及大概的区分能力。相对的Sunshine与其他特征的组合更具有区分能力

for col in data[numerical_features].columns:
    if col != 'RainTomorrow':
        sns.boxplot(x='RainTomorrow', y=col, saturation=0.5, palette='pastel', data=data)
        plt.title(col)
        plt.show()

利用箱型图我们也可以得到不同类别在不同特征上的分布差异情况。我们可以发现Sunshine,Humidity3pm,Cloud9am,Cloud3pm的区分能力较强。

tlog = {}
for i in category_features:
    tlog[i] = data[data['RainTomorrow'] == 'Yes'][i].value_counts()
flog = {}
for i in category_features:
    flog[i] = data[data['RainTomorrow'] == 'No'][i].value_counts()

plt.figure(figsize=(10,10))
plt.subplot(1,2,1)
plt.title('RainTomorrow')
sns.barplot(x = pd.DataFrame(tlog['Location']).sort_index()['Location'], y = pd.DataFrame(tlog['Location']).sort_index().index, color = "red")
plt.subplot(1,2,2)
plt.title('Not RainTomorrow')
sns.barplot(x = pd.DataFrame(flog['Location']).sort_index()['Location'], y = pd.DataFrame(flog['Location']).sort_index().index, color = "blue")
plt.show()

从上图可以发现不同地区降雨情况差别很大，有些地方明显更容易降雨。

plt.figure(figsize=(10,2))
plt.subplot(1,2,1)
plt.title('RainTomorrow')
sns.barplot(x = pd.DataFrame(tlog['RainToday'][:2]).sort_index()['RainToday'], y = pd.DataFrame(tlog['RainToday'][:2]).sort_index().index, color = "red")
plt.subplot(1,2,2)
plt.title('Not RainTomorrow')
sns.barplot(x = pd.DataFrame(flog['RainToday'][:2]).sort_index()['RainToday'], y = pd.DataFrame(flog['RainToday'][:2]).sort_index().index, color = "blue")
plt.show()

# 把所有的相同类别的特征编码为同一个值
def get_mapfunction(x):
    mapp = dict(zip(x.unique().tolist(),
         range(len(x.unique().tolist()))))
    def mapfunction(y):
        if y in mapp:
            return mapp[y]
        else:
            return -1
    return mapfunction
for i in category_features:
    data[i] = data[i].apply(get_mapfunction(data[i]))

进行训练与预测

# 为了正确评估模型性能，将数据划分为训练集和测试集，并在训练集上训练模型，在测试集上验证模型性能。
from sklearn.model_selection import train_test_split

## 选择其类别为0和1的样本 （不包括类别为2的样本）
data_target_part = data['RainTomorrow']
data_features_part = data[[x for x in data.columns if x != 'RainTomorrow']]

## 测试集大小为20%， 80%/20%分
x_train, x_test, y_train, y_test = train_test_split(data_features_part, data_target_part, test_size = 0.2, random_state = 2020)

from xgboost.sklearn import XGBClassifier
## 定义 XGBoost模型 
clf = XGBClassifier()
# 在训练集上训练XGBoost模型
clf.fit(x_train, y_train)

# 在训练集和测试集上分布利用训练好的模型进行预测
train_predict = clf.predict(x_train)
test_predict = clf.predict(x_test)
from sklearn import metrics

## 利用accuracy（准确度）【预测正确的样本数目占总预测样本数目的比例】评估模型效果
print('The accuracy of the Logistic Regression is:',metrics.accuracy_score(y_train,train_predict))
print('The accuracy of the Logistic Regression is:',metrics.accuracy_score(y_test,test_predict))

## 查看混淆矩阵 (预测值和真实值的各类情况统计矩阵)
confusion_matrix_result = metrics.confusion_matrix(test_predict,y_test)
print('The confusion matrix result:\n',confusion_matrix_result)

# 利用热力图对于结果进行可视化
plt.figure(figsize=(8, 6))
sns.heatmap(confusion_matrix_result, annot=True, cmap='Blues')
plt.xlabel('Predicted labels')
plt.ylabel('True labels')
plt.show()

利用XGBoost进行特征选择

sns.barplot(y=data_features_part.columns, x=clf.feature_importances_)

从图中我们可以发现下午3点的湿度与今天是否下雨是决定第二天是否下雨最重要的因素。

除此之外，我们还可以使用XGBoost中的下列重要属性来评估特征的重要性。

weight:是以特征用到的次数来评价
gain:当利用特征做划分的时候的评价基尼指数
cover:利用一个覆盖样本的指标二阶导数（具体原理不清楚有待探究）平均值来划分。
total_gain:总基尼指数
total_cover:总覆盖

from sklearn.metrics import accuracy_score
from xgboost import plot_importance

def estimate(model,data):

    #sns.barplot(data.columns,model.feature_importances_)
    ax1=plot_importance(model,importance_type="gain")
    ax1.set_title('gain')
    ax2=plot_importance(model, importance_type="weight")
    ax2.set_title('weight')
    ax3 = plot_importance(model, importance_type="cover")
    ax3.set_title('cover')
    plt.show()
def classes(data,label,test):
    model=XGBClassifier()
    model.fit(data,label)
    ans=model.predict(test)
    estimate(model, data)
    return ans
 
ans=classes(x_train,y_train,x_test)
pre=accuracy_score(y_test, ans)
print('acc=',accuracy_score(y_test,ans))

调参

# 从sklearn库中导入网格调参函数
from sklearn.model_selection import GridSearchCV

## 定义参数取值范围
learning_rate = [0.1, 0.3, 0.6]
subsample = [0.8, 0.9]
colsample_bytree = [0.6, 0.8]
max_depth = [3,5,8]

parameters = { 'learning_rate': learning_rate,
              'subsample': subsample,
              'colsample_bytree':colsample_bytree,
              'max_depth': max_depth}
model = XGBClassifier(n_estimators = 50)

## 进行网格搜索
clf = GridSearchCV(model, parameters, cv=3, scoring='accuracy',verbose=1,n_jobs=-1)
clf = clf.fit(x_train, y_train)
clf.best_params_##网格搜索后的最优参数

# 在训练集和测试集上分布利用最好的模型参数进行预测

## 定义带参数的 XGBoost模型 
clf = XGBClassifier(colsample_bytree = 0.6, learning_rate = 0.3, max_depth= 8, subsample = 0.9)
# 在训练集上训练XGBoost模型
clf.fit(x_train, y_train)

train_predict = clf.predict(x_train)
test_predict = clf.predict(x_test)

## 利用accuracy（准确度）【预测正确的样本数目占总预测样本数目的比例】评估模型效果
print('The accuracy of the Logistic Regression is:',metrics.accuracy_score(y_train,train_predict))
print('The accuracy of the Logistic Regression is:',metrics.accuracy_score(y_test,test_predict))

## 查看混淆矩阵 (预测值和真实值的各类情况统计矩阵)
confusion_matrix_result = metrics.confusion_matrix(test_predict,y_test)
print('The confusion matrix result:\n',confusion_matrix_result)

# 利用热力图对于结果进行可视化
plt.figure(figsize=(8, 6))
sns.heatmap(confusion_matrix_result, annot=True, cmap='Blues')
plt.xlabel('Predicted labels')
plt.ylabel('True labels')
plt.show()

原本有2470 + 790个错误，现在有 2112 + 939个错误，带来了明显的正确率提升。但是该调参只是简单的尝试，从结果来看错误率仍然比较高，因此可以考虑扩大调参范围或者进行特征工程来增加变量以提高模型的预测效果。

思考：国内自由职业者平台富庶之地
国内的威客（国外称为自由职业者）平台，如猪八戒网和一品威客网。不知道能不能称为自由职业者平台，跟国外的UpWork比起来，似乎比不倾向自由职业者，更多的是为雇主发布在线需求，让有能力的组织来承接任务。虽然也有个人做的不错，但是整个平台的氛围，是把需求托管给团队来做。再者，即使是世界顶尖的UpWork平台，浏览发布的需求，也大多是小企业主和个人创业者的需求居多。创业者的时代，人人可创业。借着互联网的
Windows后台运行jar包 BillKu windows jar java
在Windows系统中，可以通过以下几种方法让JAR文件在后台静默运行：方法1：使用javaw命令javaw是Java的无控制台版本，不会显示命令行窗口。直接运行命令：cmd复制下载javaw-jaryour-app.jar进程会在后台运行，但关闭当前命令提示符窗口时进程可能会终止（取决于启动方式）。持久化后台运行（推荐）：新建一个批处理文件（如run.bat），内容如下：bat复制下载@echo
危机四伏，河南地级市及县城房价还能撑多久？ e0530409996a
如果说2018年河南三四线城市最火的是什么，非房价莫属，随便在河南一个地级市房价都超5000元/平米，高者甚至过万元/㎡，让广大老百姓望房兴叹！2018年上半年，全省各地棚户区改造仍旧如火如荼，还有借着黄河滩区搬迁、脱贫攻坚等各种口号，推波助澜房价的上升！一边理想中要求控制房价，一边现实中抬高房价，老百姓本来有的可以长期赖以生存的家园毁灭，让希望扼杀在所谓的理所应当之中！2017年是河南各地级市出
2022/5/26随笔 jane与你一起成长
2022/5/26随笔今天，已经是星期四。客户说本周六会下单，希望客户真的会在本周六下单，不然，我5月份又要亏本了。最近体重下降了2斤多，这几天体重一直保持在101.8斤或者102.4斤。这些天不能吃零食，不能喝太多水，中午和晚上不能吃的太饱。希望就一直保持在101.8斤到102.4斤之间。对于这个体重我还是比较满意，只要不达到103斤，我便可以了。现在，每天过得真是很快啊。早上5点半左右起床，然
感恩日记利益众生
1.感恩妈妈为孩子做的一切！2.感恩国家给予民众的一切！3.感恩人生的一切善缘！4.感恩孩子们身体越来越好！5.感恩夫君回家！6.感恩蓝老师分享的说课稿！7.感恩单位给予的一切！8.感恩办公桌！9.感恩支持我的一切资源！10.感恩生命中的每一个助缘！
猫说（14）事情……好像很多狂小烹
女主回来时，已是深夜。小车停在门口，男主抬头看了一下，继续玩他的手机——没见过这么没仪式感的人，老婆孩子大老远回来了，不该站起来迎接一下吗？这家，隐约藏着某种不可言状的危机哦……两个孩子走下来，一脸疲惫，也没叫爸爸，只是看着爸爸——爸爸说，回来啦。她们嗯了一声，坐在凳子上，不说话了——看样子，累极了！女主大包小包提进来，一边走一边说，快洗澡快洗澡，道道先洗，雅歌找好自己的东西，去那边，快点快点……
《苏东坡传》读后感可可_8695
今年暑假，我读完的第一本书就是《苏东坡传》。或许是小时候背了他太多的诗吧，我对他的印象实在是不好，可在读这本书之后，我的心情和以往不同了。从憎恶到感激，从痛恨到崇拜，四年级，我学习了他的诗句——但愿人长久，千里共婵娟。五年级，我学习了——竹杖芒鞋轻胜马。六年级，我还学习了——老夫聊发少年狂。直到现在，我才理解到其思想的细腻，洒脱以及豪迈。苏东坡生在一个富有文化教养的家庭，父亲苏洵是极有名气的散文家
4.2教学勇气《现实是群体共享的》 N3049解革
今天阅读第四章认知于共同体中—为伟大事物的魅力所凝聚《现实是群体共享的》现实是共同联系的关系网，我们只有存在于这种共同联系中才能认识现实。真正的共同体是拥抱所有事物所依赖的生存巨网又拥抱那些恰好对我们认知是有益无害的事实，我们寻求的共同体就是能够担任认知、教学和学习的教育使命的管理模式。
剪不断，理还乱燕婉依
夜空漆黑如泼墨一弯弦月高空挂犹如弯弯钩子般泛着请冷的银光然月光皎洁凄寒越看越使人伤心同一个月亮之下不知多少人叹息从此无心爱良夜任他明月下西楼这段有感于李煜的《相见欢》无言独上西楼，月如钩，寂寞梧桐深院，锁清秋。剪不断，理还乱，是离愁。别是一番滋味在心头。
三行诗·写给青年节童心_8c86
图片发自App1青春和五月不停的编织梦写满了葱茏的日志热情里埋下殷实的种子2不知疲倦的数着星星年轮悄悄的刻下印记回头处芳草依旧萋萋3季节往复着青春人生却像小溪东去不能重来，却要充满诗意2018.5.4（青年节）
淘宝联盟新手怎么赚钱?怎么用淘客联盟赚钱? 高省APP珊珊
淘宝联盟是能赚钱的，如果我们渠道多，然后分享出去的商品，购买的人也多的话，赚的钱还是挺多的。如果是刚开始做的小伙伴，淘宝联盟新手怎么赚钱?网上购物用高省APP更优惠！高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入。珊珊导师，高省邀请码666123，注册送2皇冠会
五大编程竞赛平台终极对比 2401_86601498 c++
LeetCodeLeetCode是一个流行的在线编程平台，提供大量算法和数据结构题目。题目分为简单、中等和困难三个难度级别。LeetCode的题目涵盖各种主题，包括数组、字符串、树、动态规划等。LeetCode支持多种编程语言，包括C++，并提供在线代码编辑器和即时反馈。LeetCode还提供竞赛和面试模拟功能，适合准备技术面试的用户。CodeforcesCodeforces是一个以竞赛为主的在线
日更23天，还在坚持中半夏且舒
今天是我日更的第23天了，就快到我当初给自己定的初步目标：30天了。坚持住，我可以达成，然后继续做得更好的。最近两天陷入了写作倦怠期。两天上班时间，写了三篇稿子给领导。上周五也写了一篇领导的发言稿。这个星期差点就陷入写作PTSD。现在处于一种我说好的要坚持日更，虽然我有点点恐惧写东西了。不过这种情况应该在周末消失吧，我猜。我的工作也不是那种专门写稿子的工作，我其实是一个不擅长写东西的人，当初找这份
李清照与赵明诚荷塘恋雨
看《金石录序》我泪流满面。她的丈夫赵明诚，那个懂她、疼她、欣赏她的男人永远的去了。战乱中，她要带着和丈夫一起收集的金石逃难，这样一个弱女子，往往保护不了这些沉重的金石，每每少了一个，那都是血肉模糊的疼，那是他们共同生活的见证，是他们爱的记忆……李清照，当你看着日渐减少的金石箱，你的苦无边，你的痛无底，“寻寻觅觅，凄凄惨惨戚戚。”赵明诚这个名字是因为李清照我才得知的，然而了解李清照的生活后，我才知道
你提辞职，领导说等做完这个项目给你申请加薪，可信吗？诸葛明职场教练
你是在问领导会不会去给你申请加薪，还是问公司会不会给你加薪，这可是两个完全不一样的概念呀！有时候某些领导为了顺利推进项目，他只能先稳住你，以防你在这个节骨眼上离职或者＂掉链子＂！领导在这样的情况下作出的承诺，多少有点无奈的成分，往往未必出自真心！有些不道德的领导过河拆桥，翻脸比翻书还快；弄不好到时候，他还会来出＂猪八戒倒打一耙＂——说你就是趁上项目讹他，分分钟钟颠覆你的三观！比起明着耍坏的领导，还
opencv常用函数汇总 Sky.Kevin opencv 计算机视觉
一、色彩空间类型转换1、cv2.cvtColordst=cv2.cvtColor(src,code[,dstCn])式中：dst表示输出图像，与原始输入图像具有同样的数据类型和深度。src表示原始输入图像。可以是8位无符号图像、16位无符号图像，或者单精度浮点数等。code是色彩空间转换码，表4-2展示了其枚举值。dstCn是目标图像的通道数。如果参数为默认的0，则通道数自动通过原始输入图像和co
数据库第四次作业 dustcell. 数据库
1.将mydb9_stusys数据库下的student、sc和course表，备份到本地主机保存为st_msg_bak.sql文件，然后将数据表恢复到自建的db_test数据库中；--备份mysqldump-uroot-pmydb9_stusysstudentsccourse>st_msg_bak.sql#创建目标数据库mysql-uroot-p-e"CREATEDATABASEdb_test;"
永远的女先生杨绛章海萍
图书馆里寻得两本关于杨绛的书，一本是《永远的女先生杨绛》，一本是《杨绛传》，因为第一本书编排的字体大，作为首选先读。这一本《永远的女先生》并非是关于杨绛先生的传记，而是杨绛先生离世后，她曾经的同事、朋友、亲属撰写的纪念文集。文集作者有社科院、清华大学的领导；有和先生晚年打官司的法学专家；有先生的同事、亲属和邻居；有先生的忘年交，有中外友人。。。，51位作者46片文章，不同的人从不同的侧面回忆和先生
坚持锻炼、严格自律，我和儿子的假期功课伍拾范儿
图片发自App书法、英语、素描，这个假期被孩子妈妈安排的满满当当，但无论如何，每天的身体锻炼成了爸爸做主的“必须完成的任务”——俯卧撑、引体向上和深蹲，每天坚持，严格自律，而且是爸爸陪着儿子一起做。假期两周下来，锻炼成绩已达到甚至超出我的预料。上午的锻炼已经结束，孩子利用所学制作了7月15号父子三项的数据柱状图，制作了引体向上这个单项运动父子三天的数据图，从一开始的只能做一个最多两个，每一项都取得
2020 11 22日精进 ee4012386710
今日体验:一个人如果下决心要成为什么样的人，或者下决心要做成什么样的事，那么，意志或者说动机的驱动力会使他心想事成，如愿以偿。
Python 装饰器使用详解
文章目录0.引言1.什么是装饰器？2.装饰器的基本语法3.装饰器的工作原理4.常见装饰器应用场景4.1.日志记录4.2.权限校验4.3.缓存5.多重装饰器的执行顺序6.装饰器的高级用法6.1.带参数的装饰器6.2.使用`functools.wraps`6.3.类装饰器7.图示说明7.1.单一装饰器的执行流程2.多重装饰器的执行流程3.带参数装饰器的执行流程总结8参考资料0.引言Python装饰器(
场景压测：真实业务下的性能挑战
文章摘要场景压测通过模拟真实用户的操作路径（如电商的登录-浏览-下单流程），评估系统在多接口协同、复杂业务场景下的性能与稳定性。与单接口压测不同，它更关注全链路瓶颈、资源协作及异常处理。实施需梳理业务流程、设计用户模型、编排压测脚本，并分析系统整体表现。其核心价值在于提前暴露生产环境中可能出现的流程级问题，为业务高峰期的系统承压能力提供保障。1.场景压测和接口压测的区别接口压测：通常只针对单一接口
dos命令driverquery图文教程，显示系统已安装设备驱动程序批处理老盖聊技术
大家好，我是老盖，首先感谢观看本文，本篇文章做的有视频，视频讲述的比较详细，也可以看我发布的视频。今天我们学习dos中driverquery这个命令，输入命令driverquery/?可以查看这个命令的介绍和一些参数，它这个命令就是查看系统已经安装的驱动程序。直接输入命令driverquery，以看到本机已经安装的驱动程序，可以看到模块名，显示名字，驱动程序类型和链接日期。我们也可以通过图形化界面
桃朵官方邀请码是多少?注册桃朵app没有邀请码怎么办? 高省APP珊珊
桃朵是一款专注于电商导购优惠券返利的平台，内测上线红利期。在社交电商上提供一些新的玩法，简单一点说，就是提供优惠券给广大用户在各大平台购物，不仅能优惠购物，而且还能返佣金，省钱加赚钱。实则意义上跟桃朵，桃朵，桃朵，桃朵等等这些是同一类型的网购赚钱app。那么桃朵相比于其他平台有什么优势呢?在这里，小编给大家分享一下。至于我为何从桃朵转到高省呢，当然是高省佣金更高，模式更好。【高省】是一个可省钱佣金
生活中为什么需要仪式感？白痴旭旭
小红书上看了一个樊登老师的视频分享，2分钟的视频中，提到了“《行为设计学》-如何打造峰值体验”中的一个小故事。这是一个打动人心、让人听后热泪盈眶的温馨的小故事，它告诉我们生活中的仪式感到底有多么重要。故事是这样的：有一个小男孩和他的粑粑麻麻一起去旅行。度假回来到家以后，小男孩发现自己最心爱的长颈鹿（长颈鹿的名字叫乔西）玩偶丢了，他感到非常的难过和伤心。一家人找来找去也找不到，做了各种回忆也是于事无
宠妻为后⑤ 樱泽佳奈子_
甄国公府大房里，大夫人今儿心情很好，穿着粉紫色裙袄歪靠在南窗下的暖榻上，手里拿着根竹筷，侧躺着挑.逗笼子里的小白鼠。“蹦哒呀，蹦哒呀，趁着还活着，赶紧多蹦哒几下。”大夫人秦氏嘴角翘着，任谁一看，都知道心情好。三姑娘甄宝琴今儿个也心情好，因为昨日晌午四妹妹与唐月儿决裂了，今日一起床又听说唐月儿卧床不起，药石无灵。甄宝琴最讨厌唐月儿了，明明她每次只是揪揪唐月儿的小辫子，或者让她爬在地上当马骑一会罢了，
“妈，我忘带书了，帮我送到学校”。宝妈回应出彩，自己的责任自担说书人熊二娘
眼瞅着寒假就快到了。一年级的小朋友的宝妈宝爸们有什么感受呀。9月份开学，身边不少朋友家的小朋友们读小学一年级三个月了，听到他们争议最多的一个问题就是：到底要不要帮小朋友整理书包？01我的朋友邱姐的回应很出彩。他家大宝一年级，性格比较大大咧咧，总是丢三落四。邱姐对我说：昨天他上班没多久，孩子的爷爷给他打电话说他家大宝忘了带英语书，让她赶快帮忙把英语书送到学校去。邱姐让孩子爷爷立刻回家，然后挨个给班主
UItableVIewCell添加网络图片动态计算图片高度恩哼恩哼蹦擦擦GH
1.建一个数据modelmodel.h文件内容,pic为图片urlmodel.m文件2.需要建立一个计算图片高度的model------frameModelFrameModel.h,height为计算完model返回的图片高度为数据model写set方法,然后计算图片高度,为FrameModel的height赋值3.为UIImage写一个延展,添加计算图片高度的方法UIImage+GH_Image
2018-11-09 94min呀
我以为蒙上了眼睛，就可以看不见这个世界；以为捂住了耳朵，就可以听不到所有的烦恼；以为脚步停了下来，心就可以不再远行；以为我需要的爱情，其实只是一个拥抱。。。。。。图片发自App即使这个社会很现实，我们也要过好当下的每一天~晚安~2018.11.9共修（晓敏）
豆包教你如何用Python向女生表白 51reboot
一年一度的考试大会又拉开了帷幕其中的一个重头戏就是python了不知道正处于手机前的你为python又掉了多少头发呢but！！！python绝不只是你脱发的工具善于使用你将收获多多比如你知道如何利用python向女生表白吗如果不知道少年，你可要当心啦考试很危险的呢后记：某年月日，某许愿池推文：震惊！某旦python考试题新鲜出炉，考题震惊十几亿中国人！原因竟是。。。待豆包点开推文：一看考试题，嘿哈
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那