Orange_Spotty_Cat

4.3.4.集成学习（一） - 袋装法(Bagging)，提升法(Boosting)，随机森林(Random Forest)

简介

集成学习（Ensemble Learning）是通过聚合多个分类器的预测结果来提高分类的准确率。比如，在集成学习中，会生成多个分类树模型，从中选取表现较好的那些树模型，在通过投票等筛选方式决定最终输出的分类器。在聚合算法中，以Bagging，Boosting与Random Forest（随机森林）最为典型。这三个算法，因为能够显著改善决策树的缺陷而被广泛应用。

一句话解释版本：

Bagging是决策树的改进版本，通过拟合很多决策树来实现降低Variance。

Random Forrest是Bagging的改进版本，通过限制节点可选特征范围优化Bagging。

Boosting是Bagging的改进版本，通过吸取之前树的经验建立后续树优化Bagging。

数据分析与挖掘体系位置

集成学习是数据建模中的一种，虽然集成学习大多是决策树的优化，但是它建立的模型数量庞大，因此我并没有将其归类于有监督学习中，而是另外建立一个分支。

Bagging

Bagging的目的

决策树的缺点在于High Variance，也就是说，我们将样本一分为二，用两个子样本分别拟合模型，得到的结果很可能不一样。而Bagging，又称Bootstrap Aggregation，就是为了降低分类器的Variance。

这就是说，应用了Bagging后，不同样本子集产出的分类器结果将会更相似。

Bagging的基本理念

Bagging的基本理念是：求平均值会降低Variance。

想要降低模型的Variance，并提高准确率的方法就是，从样本总体中抽取很多个训练集（Training Set），对每个训练集分别拟合模型。将每个模型的结果求平均（Average）。

因此，Bagging的方法就是：

通过Bootstrap的方法，从一个Training Set中反复提取出多个样本集，假设样本集数量为B。
用这B个样本分别拟合出B个预测性模型
将B个模型的结果取平均值，得到Bagging的预测结果。

其公式表达为：

对于回归树而言，Bagging的结果就是B个没有经过Prune（剪枝）树的结果平均值。

对于分类树而言，我们通过Majority Vote，多数投票制，计算大多数模型认为结果应当属于哪一类，Bagging认为多数的结果是最终的分类结果。

Bagging的优缺点

Bagging提高了模型的准确率，降低了模型的Variance。

但是，由于模型在最后用了平均值，因此Bagging结果的可解释性降低了。

Random Forest（随机森林）

Random Forest的目的

随机森林是Bagging的改进版本，它在Bagging的基础上做出了一个小调整，使得各个树之间的相关性降低了（decorrelate trees）。

Random Forest的基本理念

随机森林的理念是，在建立随机森林时，在每个树的分支点，大部分可用的特征值是不能被考虑的。

在Bagging中，由于对每个Split的选择范围没有限定，会使得某几个特别重要的特征每次都会别优先选中，所以Bagged Trees产出的结果都会是很类似的，也就是说，Bagged Trees的结果是高相关度的。将这些高相关度的树取个平均值并不能减少太多variance。所以Bagging的结果也不能比决策树好出多少。

随机森林解决了这一问题，因为它迫使模型每次只能考虑一部分的特征值。所以，这就让其他相对没那么重要的特征值有了出场的机会。这个过程叫做decorrelates tree。

这也是随机森林区别于Bagging的地方，每个分支点上，Bagging能够考虑所有m=p个特征，而Random Forest只能考虑m=sqrt(p)个特征。如果random forest的m取成p，那么它与Bagging是相同的。

Boosting

Boosting的目的

Boosting同样是Bagging的改进版本。它与Bagging的不同在于：树的推导是有序的，每个树的生成都借鉴了之前树的经验。Boosting方法不采用Boostrap的取样方法，每个树用的都是修正后的原始数据集（Original Dataset）。

Boosting的基本理念

在Boosting中，有如下参数需要考虑：

（1）B：树的数量。要生成多少棵树。

（2）d：每个树中的分支（split）数。它掌握每棵树的复杂度，若d=1，则树只有一个节点。

（3）λ：Shrinkage parameter，压缩参数。一个非常小的正数。它掌握着Boosting学习的速率。代表着每个树的作用大小。一般可以设定为0.01或0.001.一个非常小的λ代表每个树的作用很小，所以需要非常大的B，非常多的树去得到优秀的结果。

Boosting方法通过以上的步骤，以很慢的学习方式拟合模型。Boosting将残差引入拟合模型的过程中，它在模型表现的不太好的地方慢慢的去优化它。也就是说，Boosting先拟合出一个原始的模型，之后的模型希望能够一点点的优化原始模型中的Residual。在拟合过程中，每个树的权重，即发挥效用的大小就是shrinkage parameter。

Boosting的学习方法是有时间循序（Sequential）的，在T时刻生成的树的Residual，会在T+1时刻生成的树中被改善优化。

因此，Boosting是与原始模型息息相关的。同时，这种学习方法一般训练成本较高，学习结果比较慢。

AdaBoosting

在AdaBoost初始化时，对每个训练的样本给出相等的权重。之后对每个样本进行模型的拟合。每一次训练后，对之前失败的训练样本集给予较大的权重。所以，之后的训练会更加侧重之前失败的样本集。最后，得到的模型按照预测效果给出权重，最终回归或者分类的结果会按照加权平均，或者加权投票结果给出判别。

Gradient Boosting（GBM）

Gradient Boosting是Boosting的一种实现方法，在Boosting中，GBM定义了损失函数（Loss Function）的概念。GMB主要的理念在于，后建立的模型是在之前建立模型的梯度下降方向的。损失函数就是模型的误差程度，损失函数越大，模型越容易出错。如果我们的模型能够让损失函数持续的下降，则说明我们的模型在不停的改进，而最好的方式就是让损失函数在其梯度（Gradient）的方向下降。

Ensemble方法在Python上的实现

这些方法都是用的scikit-learn包实现的。没有编程，只有调参。谢谢！

##################   Bagging   ##############
from sklearn.datasets import make_blobs
from sklearn.ensemble import BaggingClassifier
import matplotlib as plt

X, y = make_blobs(n_samples=100, n_features=3, centers=10, cluster_std=1)

plt.pyplot.scatter(X[:,0],X[:,1], c=y)
plt.pyplot.show()

clf_bagging = BaggingClassifier(n_estimators=100,random_state=1,warm_start=True)

# fitting bagging model
clf_bagging.fit(X,y)

# predict bagging model
prediction_list = clf_bagging.predict(X)




############################# random forest ################################

from sklearn.model_selection import cross_val_score
from sklearn.datasets import make_blobs
from sklearn.ensemble import RandomForestClassifier
import matplotlib as plt

X, y = make_blobs(n_samples=10000, n_features=10, centers=10,random_state=0)
# X = data, y=label

plt.pyplot.scatter(X[:, 0], X[:, 1], c=y)
plt.pyplot.show()

# 模型1
clf_rf = DecisionTreeClassifier(max_depth=None, min_samples_split=2,random_state=0)
# 通过cross validation进行结果的输出
scores = cross_val_score(clf, X, y)
scores.mean()                             

# 直接输出结果
clf_rf.fit(X,y)
clf_rf.predict(X)



############################# Ada boosting #####################################

from sklearn.model_selection import cross_val_score
from sklearn.ensemble import AdaBoostClassifier
from sklearn.datasets import make_blobs
import matplotlib as plt


X, y = make_blobs(n_samples=10000, n_features=10, centers=10,random_state=0)
# X = data, y=label

plt.pyplot.scatter(X[:,0],X[:,1], c=y)

clf_adaboost = AdaBoostClassifier(n_estimators=100)

# 通过cross validation进行结果的输出
scores = cross_val_score(clf_adaboost, X, y)
scores.mean()                             

# 正常拟合
clf_adaboost.fit(X,y)
clf_adaboost.predict(X)




############################# gradient boosting #####################################
# classification

from sklearn.model_selection import cross_val_score
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.datasets import make_blobs
import matplotlib as plt

X, y = make_blobs(n_samples=10000, n_features=10, centers=10,random_state=0)

clf_GBM = GradientBoostingClassifier(n_estimators=100, learning_rate=1.0,max_depth=1, random_state=0)

clf_GBM.fit(X, y)
clf_GBM.predict(X)

你可能感兴趣的:(数据分析与挖掘框架,Python模型)

python实现二分查找（对新手友好，内容通俗易懂） dlage python 列表 python 数据结构
python实现二分查找二分查找又名折半查找。优点：查询速度快，性能好。缺点：要求查询的表为有序表原理：将表中间位置（mid）的数字与待查数字（data）做比较，如果相等：返回true，结束。如果不相等：则使用中间位置的记录将表分为前后两个子表。若data>mid则进一步查找后一个表。若datadata:last=mid-1elifalist[mid]data:last=mid-1elifalis
零基础程序员如何快速学会python Java进阶营菌程序员职场 Python python 开发语言后端 pycharm 程序人生
学会Python能做的事情也很多，常见的就有网络爬虫，数据分析，前端开发，机器学习，都能很好地提高工作效率，往任何一个领域发展，工作前景是非常不错的。接下来我从基本的软件安装开始，仔细的给大家分析新手入门应该怎样学习Python吧，如果有讲得不到位的地方也欢迎大家指正，我会及时进行修改。一、软件的安装和选择1、配置环境关系到实操，所以在选择资料的同时，你还需要安装好Python需要的软件，软件版本
Dify理论：漫话RAG 几道之旅 Dify与Langflow 智能体（Agent）知识库人工智能自然语言处理 nlp
兜兜转转，RAG依旧是绕不开的话题。RAG，检索增强生成。给大语言模型一个大型图书馆。大语言模型在回答问题前，不要急于回答。先去图书馆里查阅一番，再根据所获取的知识进行回答。大语言模型，由闭卷考试，变成了开卷考试。第一：减轻了大模型的幻觉。大模型在不知道答案时，往往会胡编乱造。如今，有人把答案告诉了它，它只需要整理一下语言即可。使用大语言模型回答问题时，最极端的情况下，它收到的问题是：请根据背景知
新手0基础路由器刷机（小米WR30U） frank_double 路由器刷机智能路由器
准备工作：登陆恩山论坛搜237去下载刷路由器别人已经备好的各种包目录一、#######开SSH###########1、进小米路由系统设置“启用与智能网关的无线配置同步”为开启、再DHCP为自动配置DNS，最后设置wan口为第一个端口。2、将笔记本电脑与wan1口用网线连接，笔记本进入控制面板-网络管理-无线网卡-右键无线网卡属性，将网络共享给WR30U。3、CMD运行python.exeserv
一文搞懂Python的yield关键字（新手友好）蜘蛛侠在写码 python python 开发语言
在python中，yield是一个不好理解的概念，Up初学Python时看了一些教程，但还是似懂非懂。今天，Up尝试用通俗易懂的语言说清楚yield的用法和原理。想要更好的理解yield，需要先理解Python的迭代器，墙裂建议先看一下Up上一期的文章：一文搞懂Python迭代器注：本文长期有效，持续迭代完善，建议收藏。提前划重点为什么yield难理解口诀一：调用时不要看成return口诀二：ne
Python实现三维空间中的RRT避障路径规划算法 C_mony 机械臂 python 算法机器人
文章目录前言一、算法原理二、代码实现1.定义节点2.碰撞检测3.RRT算法4.完整代码运行结果前言基于快速随机搜索树（Rapidly-exploringRandomTree,RRT）的优化算法，通过对状态空间中的采样点进行碰撞检测，避免了对空间的建模，能够有效地解决高维空间和复杂约束的路径规划问题，在机械臂路径规划与避障中扮演着关键角色。RRT算法通过随机生成的树状结构来探索高维空间，尤其适合于解
SQL-o1：一种用于Text-to-SQL的自奖励启发式动态搜索方法数之何人工智能 ai 语言模型 sql
1引言文本到SQL(Text2SQL)任务旨在将自然语言查询转换为可执行的SQL查询。得益于大规模语言模型(LLMs)的应用，该领域取得了显著进展。然而，模型的可扩展性、生成空间的限制以及SQL生成过程中的连贯性问题仍然存在。为了解决这些问题，我们提出了SQL-o1，一种基于自奖励的启发式搜索方法，旨在增强LLMs在SQL查询生成中的推理能力。SQL-o1结合了蒙特卡洛树搜索(MCTS)进行过程级
Deepseek相关梳理 stars and seas 人工智能
发展历程及重要节点2023年：7月17日杭州深度求索人工智能基础技术研究有限公司成立。2024年1月5日，发布首个大模型DeepSeekLLM。5月，宣布开源第二代MoE大模型DeepSeek-V2。9月5日，升级推出DeepSeekV2.5新模型。11月20日，推理模型DeepSeek-R1-Lite预览版上线。12月26日，DeepSeek-V3首个版本上线并开源。2025年1月20日，正式发
Python中的__slots__ 李星星BruceL 问题集 python
在Python中，__slots__的用途是什么？以及在哪些情况下应避免使用它？简而言之（TL;DR）：特殊属性__slots__允许你明确声明对象实例应该具有的实例属性，并带来以下预期效果：更快的属性访问。节省内存空间。内存节省来自于：将值引用存储在__slots__中，而不是在__dict__中。如果父类禁止创建__dict__和__weakref__，并且你声明了__slots__，则会阻止
【AI带来的机遇】调皮的芋头人工智能神经网络 AIGC
一、AI大模型技术革命的底层逻辑与历史机遇类比AI大模型的普及与DeepSeek等技术的突破，正形成类似互联网初期的技术红利窗口期。其核心特征表现为：技术门槛骤降、生态边界模糊、应用场景裂变。类比房地产黄金期中介赚取信息差、移动互联网初期应用商店分发红利，当前AI领域存在三大核心机遇：基础设施重构机遇（类比域名投资）AI大模型开源浪潮下，高质量训练数据资产、特定领域微调模型、模型中间件将成为新时代
【datetime】Python datetime模块常用用法晨风_Chenfeng python
1.datetime模块中的主要类date:处理日期（年、月、日）。time:处理时间（时、分、秒、微秒）。datetime:处理日期和时间。timedelta:处理时间间隔（两个日期或时间之间的差）。tzinfo:处理时区信息。2.date类date类用于表示日期（年、月、日）。2.1创建date对象fromdatetimeimportdate#使用年、月、日创建date对象d=date(202
【数据分析】R语言的广义线性混合模型（GLMM）分析案例生信学习者1 数据分析数据分析 r语言数据挖掘数据可视化
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍原理步骤加载R包数据下载导入数据数据预处理成对相关性GLMMs标准化数据字符向量转换成因子化变量构建模型FishesAmphibiansReptilesBirdsMammals画图总结系统信息介绍广义线性混合模型（GeneralizedLinearMixedModels,GLMM）是一种统计模型，用于分析具有非
如何用AI写程序 Honmaple 人工智能
一、AI写程序之工具选择（一）主流AI编程工具介绍如今市面上有诸多AI编程工具可供选择，以下为大家介绍几种常见且实用的工具：ChatGPT：由OpenAI开发的一款基于Transformer架构的预训练模型，它的自然语言处理能力十分强大，能够理解和生成人类语言，并进行文本分类、情感分析、机器翻译等自然语言处理任务。它经过大量的训练和优化，可以准确地理解用户的意图和需求，从大量文本数据中提取有用信息
机器学习第一章绪论太炀机器学习机器学习人工智能
1.1引言什么是机器学习（machinelearning）？机器学习是致力于研究如何通过计算手段，利用经验来改善系统自身的性能的学科。在计算机系统中，“经验”以“数据”的形式表现。通过这些数据产生模型（model）的算法，即“学习算法”（learningalgorithm）。如果说计算机科学是研究“算法”的学问，那机器学习就是研究“学习算法”的学问。ps：本系列所说“模型（model）”泛指数据学
编程入门难？Python 十大核心知识点，手把手教你！编程咕咕gu- Python基础 python 开发语言 Python教程网络爬虫
如果你对编程感兴趣，但又不知道从哪里开始，那么Python会是你的好选择。它简单易学，是初学者学习编程的好帮手。这篇文章会用轻松的方式，带你了解Python的十个重要概念，一步步帮助你从零开始！1.Python文件与扩展名学习Python的第一步是创建一个Python文件。Python文件的名字后面都会加上.py作为扩展名。例如，你可以创建一个名为main.py的文件，这就是一个Python脚本。
使用 nodejs 和 ElasticSearch 快速搭建全文检索 dbLenis 数据库 java 编程语言大数据 linux
点击蓝色“有关SQL”关注我哟加个“星标”，天天与10000人一起快乐成长上次群友问我，Python怎么学，我说四个小时足够了，你们不信。这次，我用2个小时，仅仅用Google，快速搭建了一个nodejs+Elasticsearch的小Demo.足可见，在有搜索的年代，快速上手一门技术，已经不是什么难事。1安装1.1下载地址https://nodejs.org/en/download提供windo
Vue 系列之：基础知识程序员SKY VUE vue.js
什么是MVVMMVVM（Model-View-ViewModel）一种软件设计模式，旨在将应用程序的数据模型（Model）与视图层（View）分离，并通过ViewModel来实现它们之间的通信。降低了代码的耦合度。Model代表数据模型，是应用程序中用于处理数据的部分。在Vue.js中，Model通常指的是组件的data函数返回的对象，或者Vue实例的data属性。View是用户界面，是用户与应用
MATLAB基础应用精讲-【数模应用】主成分(pca)分析（附python代码实现）林聪木 matlab 人工智能大数据
目录前言知识储备降维概述算法原理什么是PCAPCA降维过程PCA算法数学步骤选择主成分个数（即k的值）sklearn中参数的解释数学模型协方差协方差矩阵编辑编辑原理推导编辑编辑编辑编辑实际操作主成分分析的计算方法方法1.协方差+特征值分解方法2：奇异值分解对比不同方法计算效率物理意义算法步骤SPSSAU主成分(pca)分析说明1、信息浓缩2、权重计算3、综合得分【综合竞争力】疑难解惑成分得分后用于
模型优化之强化学习（RL）与监督微调（SFT）的区别和联系搏博深度学习人工智能机器学习架构 transformer
强化学习（RL）与监督微调（SFT）是机器学习中两种重要的模型优化方法，它们在目标、数据依赖、应用场景及实现方式上既有联系又有区别。想了解有关deepseek本地训练的内容可以看我的文章：本地基于GGUF部署的DeepSeek实现轻量级调优之一：提示工程（PromptEngineering）（完整详细教程）_deepseekgguf-CSDN博客本地基于GGUF部署的DeepSeek实现轻量级调优
华为战略解码-162页八大章节精读智慧化智能化数字化方案华为学习专栏华为
该文档主要解读了华为战略解码的过程和内容，强调了领导力在战略管理中的重要性，介绍了华为战略管理的七个关键点以及领导力的七个特质。文档详细阐述了华为在战略解码过程中如何利用BLM模型等工具，以及如何从市场洞察、业务设计等方面制定和执行战略。同时，也介绍了华为干部九条素质与领导力专项素质能力的层级划分，强调领导力对华为战略实施的重要性。目录(一)前四章节总结解析...41.战略成长...4
基于Python的网络漏洞扫描系统的设计与实现毕设工作室_wlzytw python论文项目 python 网络开发语言 django tornado dash pygame
摘要随着互联网不断发展、贴近生活，电子化的生活安全依赖着网络安全。在漏洞泛滥的今天，网络安全状态不容乐观，许多机构都因没有及时处理漏洞导致被恶意入侵，若网络安全保护不当，将会影响现实安全。中小型网络运维人员常因为外部因素影响难以开展网络安全行动。为了应对这一问题，本文研究尝试用Python语言尝试做一个集成漏洞扫描系统的设计与实现。运用以Python为基础的DjangoWeb框架实现快速的业务开发
在nodejs中使用ElasticSearch（三）通过ES语义检索,实现RAG konglong127 nodejs elasticsearch 搜索引擎 node.js 全文检索后端
RAG（Retrieval-AugmentedGeneration）是一种结合了信息检索和生成模型的技术，旨在提高生成模型的知识获取和生成能力。它通过在生成的过程中引入外部知识库或文档（如数据库、搜索引擎或文档存储），帮助生成更为准确和丰富的答案。RAG在自然语言处理（NLP）领域，特别是在对话生成、问答系统和文本摘要等任务中，具有非常重要的应用。它的核心思想是，生成模型不仅依赖于模型内部的知识，
基于 Python 的漏洞扫描工具的设计与实现计算机毕业设计指导 python 开发语言信息安全
引言随着信息技术的快速发展，网络安全问题成为了各类组织和个人面临的重要挑战之一。漏洞是网络安全中的一个重要问题，黑客和恶意攻击者往往通过利用这些漏洞来侵入系统，窃取敏感信息或进行其他恶意行为。因此，及时发现和修复漏洞是确保网络安全的重要手段。本项目旨在设计和实现一个基于Python的漏洞扫描工具，帮助用户快速发现系统中的潜在漏洞，并提供修复建议。该工具将包括对Web应用程序、操作系统、服务等的漏洞
DeepMind首席科学家最新万字访谈：模型「慢思考」，能力大幅提升！ datawhale
DatawhaleDatawhale分享访谈：JackRae，编译：数字开物2月25日，谷歌DeepMind首席科学家JackRae接受访谈，就谷歌思维模型的发展进行深入讨论。JackRae指出，推理模型是AI发展的新范式，推理模型并非追求即时响应，而是通过增加推理时的思考时间来提升答案质量，这导致了一种新的ScalingLaw，“慢思考”模式是提升AI性能的有效途径。JackRae认为长语境对于
python代码实现支持神经网络对鸢尾花分类邀_灼灼其华机器学习及概率统计 python 神经网络分类 sklearn
1、导入支持向量机模型，划分数据集fromsklearnimportdatasetsfromsklearnimportsvmiris=datasets.load_iris()iris_x=iris.datairis_y=iris.targetindices=np.random.permutation(len(iris_x))iris_x_train=iris_x[indices[:-10]]iri
首发实测：地表最强AI？马斯克发布新一代AI模型Grok3 Code_流苏 AI漫谈先知实用软件与高效工具人工智能 grok3 AI实测首发测评 AI
近年来，人工智能的迅猛发展让人们对其未来充满了无限期待。尤其是以马斯克为首的企业家们，始终走在AI技术的前沿。就在近期，马斯克宣布推出新一代AI模型——Grok3。这一消息无疑引起了行业的广泛关注，大家都在猜测，这款新AI模型究竟有何独特之处，是否能够在众多强大AI模型中脱颖而出？名人说：悟已往之不谏，知来者之可追。——《归去来兮辞》陶渊明创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的
Grok 3 vs. DeepSeek vs. ChatGPT：2025终极AI对决一点一木人工智能人工智能 chatgpt 前端
2025年，AI领域的竞争愈发激烈，三个重量级选手争夺霸主地位：Grok3（由xAI开发）、DeepSeek（国内AI初创公司）和ChatGPT（OpenAI产品）。每个模型都有自己独特的优势，无论是在深度思考、速度、编程辅助、创意输出，还是在成本控制方面，都展现出强大的实力。但究竟谁能脱颖而出？没有一个万能的答案。最终的选择取决于你的AI需求和应用场景。在这场史诗级对决中，我将深入探讨这些模型的
大模型在白血病诊疗全流程风险预测与方案制定中的应用研究 LCG元围术期危险因子预测模型研究人工智能
目录一、绪论1.1研究背景与意义1.2国内外研究现状1.3研究目的与内容二、大模型技术与白血病相关知识2.1大模型技术原理与特点2.2白血病的病理生理与诊疗现状三、术前风险预测与手术方案制定3.1术前数据收集与预处理3.2大模型预测术前风险3.3根据预测制定手术方案四、术中风险预测与麻醉方案优化4.1术中实时数据监测与采集4.2大模型动态风险预测4.3基于预测调整麻醉方案五、术后风险预测与护理方案
大模型在心力衰竭预测及临床方案制定中的应用研究报告 LCG元围术期危险因子预测模型研究人工智能
目录一、引言1.1研究背景与意义1.2研究目的1.3研究方法与创新点二、大模型技术与心力衰竭概述2.1大模型技术原理与发展2.2心力衰竭的病理机制与现状三、大模型在心力衰竭术前风险预测中的应用3.1数据收集与预处理3.2预测模型的构建与训练3.3模型评估与验证3.4基于预测结果的手术方案制定四、大模型在心力衰竭术中风险预测中的应用4.1术中数据监测与获取4.2风险预测模型的实时更新与应用4.3针对
volatile关键字 SJLoveIT java jvm 开发语言
volatile可以保证变量的可见性。这里的变量包括类变量、实例变量，但不包括局部变量和方法参数，因为后者是线程私有的，不存在线程竞争问题java内存模型（JMM）规定,所有变量都存储在主内存中，同时每个线程还有自己的工作内存。线程对变量的所有操作（读取、赋值等），都必须在工作内存中进行，而不能直接读写主存中的数据不同线程也无法访问对方工作内存中的变量，线程间变量值的传递需要通过主存来完成（引自周
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他