【原】关于AdaBoost的一些再思考

一、Decision Stumps：

Decision Stumps称为单层分类器，主要用作Ensemble Method的组件（弱分类器）。一般只进行一次判定，可以包含两个或者多个叶结点。对于离散数据，可以选取该属性的任意一个数据作为判定的分割点；对于连续数据，可以选择属性的一个阈值做为分割点进行判定（大于该阈值分配到一类，小于该阈值分配到另一类；当然也可以选取多个阈值并由此得到多个叶结点）。

二、AdaBoost的理解：

1、基本流程

简单的说，AdaBoost框架就是根据指定的参数，进行轮训练得到个弱分类器及每个弱分类器对应的权重，最后将这些弱分类器的结果进行线性组合得到最终的结果。

关于多属性数据集的处理：

在每一轮训练过程中，在每个属性上根据分割的阈值不同得到多个单层分类器。在这些从所有属性上得到的分类器中选取一个带权误差率最小的单层分类器作为该轮训练的弱分类器。

2、带权分类误差

在进行训练之前，为训练集中的每个样本分配一个权重，使用向量表示。在第轮训练结束后，根据得到的弱分类器的性能计算该分类器对应的权值，并由的在训练集上的分类结果对权重向量进行更新。

分类器的性能度量和该分类器在训练集上的结果，都是通过计算该分类器在训练集上的带权分类误差获取。所谓带权分类误差，是指将待分类的样本包含的权重（此处的权重就是之前为该样本分配的权重），结合在该数据集上的分类误差得到分类器在该数据集上的一个考虑样本权重的分类误差，其定义如下：

(1.1)

其中，表示第个弱分类器的带权分类误差值，表示第次更新后样本的权重，表示使用第个弱分类器对样本的分类结果，表示样本的真实标签，是一个指示函数，其值如下：

(1.2)

通过公式（1.1）和（1.2）可以看出带权分类误差与两方面的因素相关：

1) 分类器在样本上的误差值；

2) 样本集中每个样本的权重；

注意：AdaBoost就是通过该值与弱分类器产生关系。

3、带权分类误差再分析

以DS（Decision Stumps）弱分类器为例，对于一个数据集包含多个属性，要在该数据集上学习一个DS，可以使用不同的属性作为分割判断条件。对于同一个属性，也可以选择多个不同的分割点（离散型）/阈值（连续性）作为判断条件。因此，对于一个数据集实质上可以产生很多不同的DS，那么究竟选择哪一个DS作为我们从该数据集上最终学习得到的弱分类器？

很直观的想法，我们可以使用穷举产生所有的DS，然后分别计算每个DS的分类误差，选择具有最小分类误差的DS作为从该数据集上学习到的弱分类器。然而，问题出在我们学习的这个数据集中的所有样本权重（此处可以理解为每个样本的价值、贡献度等）并不相同。我们在考虑选择哪个DS最为最终的弱分类器时不但要考虑该DS的分类错误率，还要考虑每个样本的权重问题，因为将高权重的样本分错造成的后果远比将低权重样本分错更为严重。

考虑公式（1.1）中带权分类误差的定义，该指标有效的将分类器的分类误差和待分类样本的权重结合起来，因此可以作为选择弱分类器时的一个标准使用。

总结起来简单的说，带权分类误差将分类器的分类误差和样本本身的权重进行结合，可以作为模型选择的一个标准使用。

4、弱分类器的权重计算

弱分类器对应的权重与其本身的带权分类误差相关，其计算公式如下：

(1.3)

通过简单分析可以知道，带权分类误差的范围是[0,1]，绘制分类器的权重函数的图像，如下所示：

Fig. 1. 弱分类器权重函数分布

由Fig. 1.可以看出，弱分类器的权重与其对应的带权分类误差呈反比关系，即就是带权分类误差越小，该分类器对应的权值越大；反之亦然。

5、训练样本的权重更新

训练得到新的弱分类器后需要对样本权值进行更新，更新的公式如下：

(1.4)

公式（1.4）定义了计算弱分类器对应的权值后，对样本的权重更新过程。如果该分类器在该样本上分类正确，则降低该样本的权值；如果分类错误，则提高该样本的权值。公式中前半部分主要用于对整个权值向量进行归一化，以使其和为1。

6、参考

维基百科关于AdaBoost算法的介绍：

用 xⁱ 和 y_i 表示原始样本集D的样本点和它们的类标（注意，y_i的取值只能是+1或-1）。用 W_k(i) 表示第k次迭代时全体样本的权重分布。这样就有如下所示的AdaBoost算法：

1. begin initial D={x¹，y₁，...，xⁿ，y_n}，k_max(最大循环次数)，W_k(i)=1/n，i=1，...，n

2. k ← 0

3. do k ← k+1

4. 训练使用按照 W_k(i) 采样的 D 的弱学习器 C_k

5. E_k ← 对使用 W_k(i) 的 D 测量的 C_k 的训练误差

6.

7.

8. until k=k_max

9. return C_k和α_k，k=1，...，k_max（带权值分类器的总体）

10. end

注意第5行中，当前权重分布必须考虑到分类器 C_k 的误差率。在第7行中， Z_k 只是一个归一化系数，使得 W_k(i) 能够代表一个真正的分布，而 h_k(xⁱ) 是分量分类器 C_k 给出的对任一样本点 xⁱ 的标记（+1或-1），h_k(xⁱ) = y_i 时，样本被正确分类。第8行中的迭代停止条件可以被换为判断当前误差率是否小于一个阈值。

最后的总体分类的判决可以使用各个分量分类器加权平均来得到：

这样，最后对分类结果的判定规则是:

三、整体流程再梳理

按照自己的理解将AdaBoost的框架再进行梳理一遍，整个Boost框架分为两部分：训练和分类。

假设样本的类别为：

1、训练部分

a) 为训练集中每个样本分配权重；

b) 训练弱分类器；

c) 计算带权分类误差；

d) 计算弱分类器对应的权重

e) 更新样本权重

最终得到个不同的弱分类器及其对应的权重。

2、分类部分

a) 对待分类样本计算函数

b) 对该样本最终的分类结果为

四、核心问题再讨论

1、带权分类误差的作用：

在第二部分详细讨论了带权样本误差的生成机制问题，描述了如何计算带权样本误差和它怎样对AdaBoost框架产生影响。这里，将带权样本误差的作用再做以简单的总结，带权分类误差的主要作用有两个：

1、在训练弱分类器时，使用该指标在训练的多个DS中选择带权分类误差最小的最为该轮训练的弱分类器；

2、在AdaBoost框架中，使用该指标计算该轮训练得到的弱分类器对应的权值；

2、弱分类器的误差和AdaBoost框架的误差：

实质上，在整个训练的过程中，每轮训练得到的弱分类器可能一直会存在分类错误的问题（不论训练了多少轮，生成的单个弱分类器都有分类错误），然而整个AdaBoost框架却有可能快速收敛（整个AdaBoost框架的错误率为0）。造成这个现象的原因是：

每轮训练结束后，AdaBoost框架会对样本的权重进行调整，该调整的结果是越到后面被错误分类的样本权重会越高。这样到后面，单个弱分类器为了达到较低的带权分类误差都会把样本权重高的样本分类正确。虽然单独来看，单个弱分类器仍会造成分类错误，但这些被错误分类的样本的权重都较低，在AdaBoost框架的最后输出时会被前面正确分类的高权重弱分类器“平衡”掉。这样造成的结果就是，虽然每个弱分类器可能都有分错的样本，然而整个AdaBoost框架却能保证对每个样本进行正确分类，从而实现快速收敛。

你可能感兴趣的:(boost)

梯度提升机 (Gradient Boosting Machines, GBM) ALGORITHM LOL boosting 集成学习机器学习
梯度提升机(GradientBoostingMachines,GBM)通俗易懂算法梯度提升机（GradientBoostingMachines，GBM）是一种集成学习算法，主要用于回归和分类问题。GBM本质上是通过训练一系列简单的模型（通常是决策树），然后将这些模型组合起来，从而提高整体预测性能。基本步骤初始模型：首先，我们用一个简单的模型（如一个常数值）作为预测模型，记为F0(x)F_0(x)F
鸿蒙开发（NEXT/API 12）【应用传输体验反馈】网络加速服务移动开发技术栈鸿蒙开发 harmonyos 网络华为 openharmony 鸿蒙移动开发鸿蒙系统
场景介绍当应用传输体验发生变化时，应用将传输体验和传输的业务类型信息通过实时反馈接口传输给系统网络业务模块，系统网络业务模块进行精细化调度，实现网络加速。例如：视频类App播放过程中卡顿，将卡顿信息上报后，NetworkBoostKit将信息反馈给系统网络加速模块，该模块会记录播放卡顿信息，并根据当前网络情况，启用网络加速能力。接口说明接口名描述reportQoe(appQoe:AppQoe):v
十大机器学习算法-梯度提升决策树（GBDT） zjwreal 机器学习 GBDT 机器学习梯度提升提升树梯度提升决策树
简介梯度提升决策树（GBDT）由于准确率高、训练快速等优点，被广泛应用到分类、回归合排序问题中。该算法是一种additive树模型，每棵树学习之前additive树模型的残差。许多研究者相继提出XGBoost、LightGBM等，又进一步提升了GBDT的性能。基本思想提升树-BoostingTree以决策树为基函数的提升方法称为提升树，其决策树可以是分类树或者回归树。决策树模型可以表示为决策树的加
AdaBoost算法（AdbBoost Algorithm）—有监督学习方法、非概率模型、判别模型、非线性模型、非参数化模型、批量学习剑海风云 Artificial Intelligence 人工智能机器学习提升方法 AdaBoost
定义输入:训练数据集T={(x1,y1),(x2,y2),⋯ ,(xN,yN)}T=\{(x_1,y_1),(x_2,y_2),\cdots,(x_N,y_N)\}T={(x1,y1),(x2,y2),⋯,(xN,yN)},其中，xi∈χ⊆Rn,yi∈y={−1,+1}x_i\in\chi\subseteqR^n,y_i\in{\tty}=\{-1,+1\}xi∈χ⊆Rn,yi∈y={−1,+1}
cmake介绍（八）--cmake的高级特性小蘑菇二号 cmake
目录1.自定义CMake模块和脚本自定义模块示例：创建自定义模块2.构建配置和目标多配置生成器示例：使用VisualStudio生成器定义多个构建目标示例：定义多个目标3.高级查找和配置灵活地查找包示例：查找和配置Boost库配置构建选项示例：配置构建选项4.生成自定义构建步骤添加自定义命令示例：添加自定义命令添加自定义目标示例：添加自定义目标5.跨平台和交叉编译支持不同平台示例：配置跨平台编译交
《机器学习》—— XGBoost（xgb.XGBClassifier）分类器张小生180 机器学习人工智能
文章目录一、XGBoost分类器的介绍二、XGBoost（xgb.XGBClassifier）分类器与随机森林分类器（RandomForestClassifier）的区别三、XGBoost（xgb.XGBClassifier）分类器代码使用示例一、XGBoost分类器的介绍XGBoost分类器是一种基于梯度提升决策树（GradientBoostingDecisionTree，GBDT）的集成学习算
.NET Core —如何使用Redis缓存提高应用程序性能 weixin_26737625 redis java 缓存 python mysql
Redisisaverypowerfuldistributedcachingengineandoffersverylowlatencykey-valuepaircaching.Ifusedintherightbusinesscontext,Rediscansignificantlyboostapplicationperformance.Inthisarticlewewilldoawalkthrou
Python处理大数据，如何提高处理速度 RS& #python python 大数据 pandas
Python处理大数据，如何提高处理速度？一、利用大数据分析工具Dask：https://dask.org/Dask简介：Dask支持Pandas的DataFrame和NumpyArray的数据结构，并且既可在本地计算机上运行，也可以扩展到在集群上运行。Dask可支持pandas、Numpy、Sklearn、XGBoost、XArray、RAPIDS等等。原理及使用方法：https://blog.
2024 数学建模国赛 C 题模型及算法（无废话版）不染53 数学建模数学建模算法 python
目录写在开始需要掌握的数学模型/算法评价体系/评价类问题时间序列处理数据降维聚类问题（无监督）分类问题（有监督）集成学习（Bagging/Boosting）回归问题关联分析统计学方法/统计模型智能优化算法需要掌握的Python专业库需要掌握的软件/工具写在开始本人获2023年数学建模国赛C题国家级一等奖，备赛期间专攻C题。本文总结了在备赛期间总结的模型和算法，足以应对90%国赛C题中涉及到的问题。
英伟达A100算力卡性能及应用算力资源比较多算力英伟达大模型人工智能 gpu算力语言模型大数据推荐算法
英伟达A100是一款高性能计算卡，基于英伟达Ampere架构，专为数据中心和高性能计算领域设计。以下是关于A100的性能参数及应用的详细介绍：性能参数架构与制程：架构：Ampere制程：7纳米核心与频率：CUDA核心数：6912个Tensor核心数：432个Boost时钟频率：1.41GHz性能：FP32性能：19.5TFLOPSFP64性能：9.7TFLOPSTensor性能：624.6TFLO
2024年Python最新Python爬虫教程-新浪微博分布式爬虫分享(2) 2401_84584682 程序员 python 爬虫新浪微博
开发语言：Python2.7开发环境：64位Windows8系统，4G内存，i7-3612QM处理器。数据库：MongoDB3.2.0、Redis3.0.501（Python编辑器：Pycharm；MongoDB管理工具：MongoBooster；Redis管理工具：RedisStudio）爬虫框架使用Scrapy，使用scrapy_redis和Redis实现分布式。分布式中有一台机充当Maste
XGBoost调参demo（Python）妄念驱动机器学习算法 python 机器学习 XGBoost python
XGBoost我们用的是保险公司的一份数据#各种库importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.linear_modelimportLogisticRegressionfromsklearn.ensembleimportRandomForestClassifierfromsklearn.metricsi
【python】Python实现XGBoost算法的详细理论讲解与应用实战景天科技苑 python轻松入门基础语法到高阶实战教学 python 算法开发语言 XGBoost算法 XGBoost python实现XGBoost 人工智能
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，PyQt5和Tkinter桌面开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，云原生K
VScode C++ 一键注释东半球第一攻城狮 vscode c++ide
1.注释：首选选中要注释的部分；intmain(){usingnamespacestd;cout>weight;stringgain="A10%increaseraises";stringwt=boost::lexical_cast(weight);gain=gain+wt+"to";//stringoperator()weight=1.1*weight;gain=gain+boost::lexi
mac版QQ聊天信息备份与导出方法 iHTCboy
前言最近，我司终于更换新电脑的计划落实啦！！！Macmini3.0GHz双核IntelCorei7处理器(TurboBoost高达3.5GHz)16GB1600MHzLPDDR3SDRAM1TB融合硬盘IntelIrisGraphics图形处理器非常值的可贺！然而，就是新电脑，一切都是新！一切都是白！！非常多工具的数据需要迁移，开发环境需要配置，最近也打算总结一下新电脑配置方面的文章，作为自己备份
基于Python的机器学习系列（18）：梯度提升分类（Gradient Boosting Classification）会飞的Anthony 信息系统机器学习人工智能机器学习 python 分类
简介梯度提升（GradientBoosting）是一种集成学习方法，通过逐步添加新的预测器来改进模型。在回归问题中，我们使用梯度来最小化残差。在分类问题中，我们可以利用梯度提升来进行二分类或多分类任务。与回归不同，分类问题需要使用如softmax这样的概率模型来处理类别标签。梯度提升分类的工作原理梯度提升分类的基本步骤与回归类似，但在分类任务中，我们使用概率模型来处理预测结果：初始化模型：选择一个
基于Python的机器学习系列（17）：梯度提升回归（Gradient Boosting Regression）会飞的Anthony 人工智能信息系统机器学习机器学习 python 回归
简介梯度提升（GradientBoosting）是一种强大的集成学习方法，类似于AdaBoost，但与其不同的是，梯度提升通过在每一步添加新的预测器来减少前一步预测器的残差。这种方法通过逐步改进模型，能够有效提高预测准确性。梯度提升回归的工作原理在梯度提升回归中，我们逐步添加预测器来修正模型的残差。以下是梯度提升的基本步骤：初始化模型：选择一个初始预测器h0(x)，计算该预测器的预测值。计算残差：
基于Python的机器学习系列（16）：扩展 - AdaBoost 会飞的Anthony 信息系统机器学习人工智能 python 机器学习开发语言
简介在本篇中，我们将扩展之前的AdaBoost算法实现，深入探索其细节并进行一些修改。我们将重点修复代码中的潜在问题，并对AdaBoost的实现进行一些调整，以提高其准确性和可用性。1.修复Alpha计算中的问题在AdaBoost中，如果分类器的错误率e为0，则计算出的权重α将是未定义的。为了解决这个问题，我们可以在计算过程中向分母中添加一个非常小的值，以避免除零错误。2.调整学习率sklearn
基于CNN-BiLSTM-Adaboost风电功率预测研究（Matlab代码实现）创新优化代码学习 cnn matlab 人工智能
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述一、研究背景与意义二、研究方法1.数据准备与预处理2.CNN特征提取3.BiLSTM序列建模4.Adaboost集成学习5.模型训练与评估三、研究优势四、未来展望2运行结果3参考文献4Matlab代码、数据⛳️赠与读者‍做科研，涉及到一个深在的思想系
SD3337C 恒流Boost DC/DC转换器的白色LED驱动器芯片IC 奥科迪科技13798477800 单片机嵌入式硬件
一般描述SD3337C是一款升压型DC/DC转换器，具有恒定电流，可驱动白色LED或类似器件。该器件可以从锂离子电池驱动多达八个串联的LED。LED电流由外部电阻器(RsET)设置，并由反馈(FB)电压(典型值:200mV)直接调节，该电压跨接在外部电阻器RsET上。为了确保操作过程中的最大安全性，该输出具有集成的过压保护功能，可在某些故障条件下防止设备损坏。OVP电压可以通过两个外部电阻器进行编
hiphop-php【未能成功编译YII】 zhengdl126 linux运维 php 运维 git
==================测试环境redhat6.064bitcmake2.6istheminimumversiong++/gcc4.3istheminimumversionBoost1.37istheminimumversionlibicu4.2istheminimumversiontbbIntel'sThreadBuildingBlocks===64bit====https://gi
【KELM回归预测】基于麻雀算法优化核极限学习SSA-KELM-Adaboost实现风电回归预测附matlab代码天天酷科研粉丝福利算法回归学习 SSA-KELM-Ada
以下是使用麻雀算法优化核极限学习机（SSA-KELM）和Adaboost算法实现风电回归预测的MATLAB代码示例：matlab复制%导入风电数据load(‘wind_data.mat’);%假设数据存储在wind_data.mat文件中X=wind_data(:,1:end-1);%输入特征Y=wind_data(:,end);%输出标签%数据归一化X=normalize(X,‘range’);
ZCC5429 异步升压芯片 ZCWC123 社交电子
一、产品综述ZCC5429芯片是一款自动调频、最高600KHz工作频率、高效率、宽输入电压范围的电流模式异步升压（BOOST）芯片，且可调输入限流功能。用户可灵活地通过外部补偿建立动态环路，获得在所有条件下最优瞬态性能。ZCC5429芯片还包括欠压锁存，过流保护和过温保护，以防止在输出过载时产生损害。ZCC5429采用ESOP8小型封装，外围电路简单，功率管外置，可根据实际使用情况，实现更宽功率范
ZCC5429 异步升压芯片 ZCWC123 社交电子
一、产品综述ZCC5429芯片是一款自动调频、最高600KHz工作频率、高效率、宽输入电压范围的电流模式异步升压（BOOST）芯片，且可调输入限流功能。用户可灵活地通过外部补偿建立动态环路，获得在所有条件下最优瞬态性能。ZCC5429芯片还包括欠压锁存，过流保护和过温保护，以防止在输出过载时产生损害。ZCC5429采用ESOP8小型封装，外围电路简单，功率管外置，可根据实际使用情况，实现更宽功率范
ZCC5429-宽输入电压异步升压芯 HPT_Lt 嵌入式硬件
一、产品综述ZCC5429芯片是一款自动调频、最高600KHz工作频率、高效率、宽输入电压范围的电流模式异步升压（BOOST）芯片，且可调输入限流功能。用户可灵活地通过外部补偿建立动态环路，获得在所有条件下最优瞬态性能。ZCC5429芯片还包括欠压锁存，过流保护和过温保护，以防止在输出过载时产生损害。ZCC5429采用ESOP8小型封装，外围电路简单，功率管外置，可根据实际使用情况，实现更宽功率范
3.0 V-22V 宽输入电压，高效率异步升压芯片-ZCC5429 HPT_Lt 嵌入式硬件
一、产品综述ZCC5429芯片是一款自动调频、最高600KHz工作频率、高效率、宽输入电压范围的电流模式异步升压（BOOST）芯片，且可调输入限流功能。用户可灵活地通过外部补偿建立动态环路，获得在所有条件下最优瞬态性能。ZCC5429芯片还包括欠压锁存，过流保护和过温保护，以防止在输出过载时产生损害。ZCC5429采用ESOP8小型封装，外围电路简单，功率管外置，可根据实际使用情况，实现更宽功率范
每天一个数据分析题（五百零五）- 提升方法跟着紫枫学姐学CDA 数据分析题库数据分析
提升方法（Boosting），是一种可以用来减小监督式学习中偏差的机器学习算法。基于Boosting的集成学习，其代表算法不包括？A.AdaboostB.GBDTC.XGBOOSTD.随机森林数据分析认证考试介绍：点击进入题目来源于CDA模拟题库点击此处获取答案数据分析专项练习题库内容涵盖Python，SQL，统计学，数据分析理论，深度学习，可视化，机器学习，Spark八个方向的专项练习题库，数据
每天一个数据分析题（五百零六）- 装袋方法跟着紫枫学姐学CDA 数据分析数据挖掘
装袋方法(bagging)也叫做bootstrapaggregating,是在原始数据集有放回地重采样S次后得到新数据集的一种技术，其代表算法有？A.AdaboostB.GBDTC.XGBOOSTD.随机森林数据分析认证考试介绍：点击进入题目来源于CDA模拟题库点击此处获取答案数据分析专项练习题库内容涵盖Python，SQL，统计学，数据分析理论，深度学习，可视化，机器学习，Spark八个方向的专
随机森林（Random Forest）VS 提升树（Boosting Trees）高大黑白涂鸦随机森林 boosting 算法机器学习人工智能
随机森林（RandomForest）和提升树（BoostingTrees）都是常见的机器学习算法，它们都基于决策树，但使用的策略和目标不同。随机森林（RandomForest）通俗的类比：想象你有一个班级里的多位老师（决策树），你让他们每个人都独立地给出意见（预测）。每个老师的意见可能不完全一致，因为他们对问题的理解和方法不同。然后，你把所有老师的意见汇总，得到一个“班级意见”的结果。优点：减少过
英伟达A100、A800、H100、H800、V100以及RTX 4090的详细性能参数对比算力资源比较多算力英伟达 H100 gpu算力大数据人工智能语言模型
英伟达A100、A800、H100、H800、V100以及RTX4090的详细性能参数对比：英伟达A100架构与制程：架构：Ampere制程：7纳米核心与频率：CUDA核心数：6912个Tensor核心数：432个Boost时钟频率：1.41GHz性能：FP32性能：19.5TFLOPSFP64性能：9.7TFLOPSTensor性能：624.6TFLOPS内存：显存容量：提供40GB和80GBH
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他