Lyndon_zheng

机器学习（5）——决策树（上）原理

Decision tree

决策树是机器学习中一种基本的分类和回归算法，是依托于策略抉择而建立起来的树。其主要优点是模型具有可读性，分类速度快，易于理解。决策树的思想主要来源于Quinlan在1986年提出的ID3算法和1993年提出的C4.5算法，以及有Breiman等人在1984年提出的CART算法。由于本章内容较多，将分两篇介绍决策树的原理和算法实现。

1.什么是决策树

决策树简单来说就是带有判决规则（if-then）的一种树，可以依据树中的判决规则来预测未知样本的类别和值。用一个网上通俗易懂的例子（相亲）来说明：

女儿：年纪多大了？
母亲：26
女儿：长相如何？
母亲：挺帅的
女儿：收入如何？
母亲：不算很高，中等情况
女儿：是公务员不？
母亲：是，在税务局上班
女儿：那好，我去见见

这个女孩的在决定是否去相亲的过程就是一个典型的分类决策过程。相当于通过年纪、长相、收入和是否公务员等标准来决定是否去相亲，其决策过程可以用下面的决策树来表示：

简单来说，就是女孩会依据一定的规则来选择是否相亲。而且如果她事先将这个规则告诉自己的母亲，母亲就可以直接依据这个分类规则知道女儿是否想去参加这个相亲，即分类结果的是与否。

2.决策树模型和学习

在了解决策树的一个直观定义后，我们来看在数学上如何表达这种分类方法。
定义： 决策树是一个属性结构的预测模型，代表对象属性和对象值之间的一种映射关系。它又节点（node）和有向边（directed edge）组成，其节点有两种类型：内节点（internal node）和叶节点（leaf node），内部节点表示一个特征或属性，叶节点表示一个类。
如上图所示的相亲例子，蓝色的椭圆内节点表示的是对象的属性，橘黄色的矩形叶节点表示分类结果（是否相亲），有向边上的值则表示对象每个属性或特征中可能取的值。
决策树的学习本质上是从训练集中归纳出一组分类规则，得到与数据集矛盾较小的决策树，同时具有很好的泛化能力。决策树学习的损失函数通常是正则化的极大似然函数，通常采用启发式方法，近似求解这一最优化问题。
决策树学习算法包含特征选择、决策树生成与决策树的剪枝。决策树表示的是一个条件概率分布，所以深浅不同的决策树对应着不同复杂程度的概率模型。决策树的生成对应着模型的局部选择（局部最优），决策树的剪枝对应着全局选择（全局最优）。决策树常用的算法有ID3，C4.5，CART，下面通过一个简单的例子来分别介绍这几种算法。

上图是一个比较典型的决策树分类用的贷款申请样本数据集：样本特征 x(i) 的类型有年龄、是否有工作、是否有房子和信贷情况，样本类别 y(i) 取值是两类是、否，最终的分类结果就是根据样本的特征来预测是否给予申请人贷款。在介绍算法之前，我们先介绍几个相关的概念：

奥卡姆剃刀定律（Occam’s Razor, Ockham’sRazor）又称“奥康的剃刀”，是由14世纪逻辑学家、圣方济各会修士奥卡姆的威廉（William of Occam，约1285年至1349年）提出。这个原理称为“如无必要，勿增实体”，即“简单有效原理”。该定律在算法结构、机器学习等程序设计中有广泛的应用，在吴军所著的《数学之美》中也多次提到google大牛在设计算法时会优先考虑该准则。决策树的构建也是如此，越是小型的决策树越是有性能优势。
信息熵 H(X) ：信息熵是香农在1948年提出来量化信息的信息量的。熵的定义如下：
$H (X) = - \sum i = 1 n p i log p i$
其中，X表示的是该事件取的有限个值的离散随机变量， pi 则是每个随机变量在整个事件中的概率。如上图所示，没分类前是否贷款的信息熵为： H(X)=−615log615−915log915=0.971 熵的大小就表明了随机变量的不确定性。比如如果给这15个人都贷款，即贷款结果都是是，那么信息熵则为： H(X)=−1515log1515=0 ，即信息是确定的。分类的最终目的就是使信息熵最小，即通过特征可以最大概率的确定事件。
条件熵 H(Y|X) ： 表示在已知随机变量 X 的条件下随机变量 Y 的不确定性，定义为：
$H (Y | X) = \sum i = 1 n p i H (Y | X = x i)$
其中 pi=P(X=xi) ，即变量中 xi 的概率； H(Y|X=xi) 是 X=xi 时 Y 的熵，即 Y 的不确定度。如上图所示， X 为年龄时， H(Y|X=1)=−25log25−35log35=0.971 同理可得 H(Y|X=2)=0.971，H(Y|X=3)=0.722 ，最后的条件熵为： H(Y|X)=13∗0.971+13∗0.971+13∗0.722=0.888
信息增益 g(Y,X) ： 表示已知特征 X 的信息而使得类别 Y 的信息不确定性减少的程度，定义为：
$g (Y, X) = H (Y) - H (Y | X)$
其中 H(Y) 为样本类别 Y 的经验熵， H(Y|X) 为经验条件熵，以上图为例则是： g(Y,X)=H(Y)−H(Y|X)=0.971−0.888=0.083 ，在ID3算法中，特征选取就是依据这种方式。
但是这种特征选取有一个很大的弊端，没考虑特征中可能取的多个值。还是以上述信贷为例，假设我在这15个样本中新增加一个有多个值的特征，极端情况下，该特征有15个不同的值，那么根据该特征可以将这15个样本完全区分开。分类后信息熵为0，分类结果完全确定，信息增益最大。但是很明显这种方式训练出来的是一颗庞大且深度及其浅的树，这样的划分在极端情况下很不合理，所以在C4.5中改进了特征选取方式，用的是下述的信息增益比。
信息增益比 gR(Y,X) :信息增益率类似于归一化处理，不同之处归一化所用的信息是“分裂信息值”。在此，我们用信息熵来定义每个特征的熵，则最终的信息增益为：
$g R (Y, X) = H ( Y ) - H ( Y | X ) H ( X )$
如果出现上信息增益中所说的某类特征有很多值得情况，则特征 X 的不确定度很大，即信息熵 H(X) 很大，会使整个信息增益比变小。
基尼指数：在分类问题中，假设有 K 个类，样本点属于第 K 的概率为 pk ，则概率分布的基尼指数为：
$G i n i (p) = \sum k = 1 K p k (1 - p k) = 1 - \sum k = 1 K p 2 k$
基尼指数与熵类似，都表示样本的不确定度。在CART算法中特征选择就是用的基尼指数。

3.算法介绍

ID3算法

在前面我已经介绍了信息增益计算的方法，在ID3算法中，我们通过信息增益来选取相应的特征，首先计算每个特征对样本类别的信息增益：
(1)年龄：

g (Y, X 1) = H (Y) - H (Y | X 1) = 0.971 - 0.888 = 0.083

(2)工作：

g (Y, X 2) = H (Y) - H (Y | X 2) = 0.971 - (5 15 * 0 + 10 15 * (- 4 10 * log 4 10 - 6 10 * log 6 10)) = 0.324

(3)房子：

g (Y, X 3) = H (Y) - H (Y | X 3) = 0.971 - (6 15 * 0 + 9 15 * (- 3 9 * log 3 9 - 6 9 * log 6 9)) = 0.420

(2)贷款情况：

g (Y, X 4) = H (Y) - H (Y | X 4) = 0.971 - (4 15 * 0 + 6 15 * (- 4 6 * log 4 6 - 2 6 * log 2 6) + 5 15 * (- 4 5 * log 4 5 - 1 5 * log 1 5)) = 0.363

比较各特征的信息增益值，可以看到房子作为先知条件时，信息增益值最大，所以选取房子作为最优特征，选取出来的分类树为：

从图中可以看到，有房子的是肯定能够借到贷款的，没房子的，要依据别的条件继续判断。在没有房子的样本中，我们继续计算每个特征在此表上的增益，这样一直到所有样本完全分开就能得到一个适应样本集的决策树。本示例的最终决策树为：

ID3算法流程：

Algotithm 4.1 ID3(D)
Input: an attribute-valued dataset D
Output: a decision tree
1. if D is “pure” OR Attribute is null then
2. return class
3. end if
4. for all attribute a∈D do
5. computer the imformation gain and select best feature
6. end for
7. abest= Best attribute feature
8. Tree= Create a decision node that feature abest in root
9. Dv= Induced sub-dataset for feature abest
10. for all Dv do
11. Treev=ID3(Dv)
12. end for
13. return Tree

算法具体实现将在下一章进行详细的说明。ID3算法只有树的生成，没有树的剪枝，所以容易产生过拟合现象。

C4.5算法

C4.5算法与ID3算法在整体流程上很相似，不同之处在于特征选择用的是信息增益，然后最后有剪枝的过程。依据信息增益率，我们来计算上述例子：
(1)年龄：

H (X 1) = - 5 15 log 5 15 - 5 15 log 5 15 - 5 15 log 5 15 = 1.585

g R (Y, X 1) = H ( Y ) - H ( Y | X 1 ) H ( X 1 ) = 0.052

(2)工作：

H (X 2) = - 5 15 log 5 15 - 10 15 log 10 15 = 0.9183

g R (Y, X 2) = H ( Y ) - H ( Y | X 2 ) H ( X 2 ) = 0.3529

(3)房子：

H (X 3) = - 6 15 log 6 15 - 9 15 log 9 15 = 0.9709

g R (Y, X 3) = H ( Y ) - H ( Y | X 3 ) H ( X 3 ) = 0.4325

(2)贷款情况：

H (X 4) = - 5 15 log 5 15 - 6 15 log 6 15 - 4 15 log 4 15 = 1.5656

g R (Y, X 4) = H ( Y ) - H ( Y | X 4 ) H ( X 4 ) = 0.2254

通过上述计算可以看出，增益比最大的还是第三个特征：房子，因此还是选择第三个特征作为最优特征进行初始决策。
C4.5算法流程图与ID3相似，在此就不赘述。

CART算法

CART算法主要有两部分组成：
(1) 决策树的生成：基于训练数据集生成决策树，生成的决策树要尽量打。这与ID3算法类似，不同之处也是特征选取的方式；
(2) 决策树的剪枝：用验证数据集对已生成的树进行剪枝并选择最优子树，此时用损失函数最小作为剪枝的标准。
CART算法可以用于回归，即建立回归树。在终于分类时，其算法流程与ID3较为类似，不同的是特征选取，选择的是最小基尼指数。

4.决策树剪枝

决策树生成算法是递归地生成决策树，知道不能终止。这样产生的决策树往往分类精细，对训练数据集分类准确，但是对未知数据集却没有那么准确，有比较严重的过拟合问题。因此，为了简化模型的复杂度，使模型的泛化能力更强，需要对已生成的决策树进行剪枝。
剪枝的过程是通过极小化决策树整体损失函数来实现的。假设树的叶节点数为 |T| , t 是树 T 的叶节点，该叶节点上有 Nt 个样本点，其中属于 k 类的样本点有 Ntk 个， Ht(T) 为叶节点的经验熵， α≥0 为参数。则决策树学习的整体损失函数可以定义为：

C a (T) = \sum i = 1 | T | N t H t (T) + α | T |

其中经验熵

Ht(T)=−∑kNtkNtlogNtkNt ，则第一项可以表示为：

C (T) = \sum i = 1 | T | N t H t (T) = - \sum i = 1 | T | \sum k N t k log N t k N t

C a (T) = C (T) + α | T |

其中

C(T) 表示模型对训练数据的预测误差，

|T| 表示模型的复杂度，参数

α≥0 控制两者之间的影响，当

α 较大时，促使模型变得简单，

α=0 时表示模型损失函数只与训练数据集拟合程度相关，与模型复杂度无关。
决策树的剪枝，就是在

α 确定时，选择损失函数最小的决策树。当

α 确定时，子树越大，模型复杂度越高，往往与训练数据拟合越好，但是在未知数据集上表现可能会较差；相反，子树越小，模型复杂度越低，训练数据拟合不好，但是泛化能力好。
PS：
本文为机器学习（5）总结笔记，主要介绍了决策树的原理和生成过程，决策树在直观上易于理解，在实际分类中也有很多应用。本文理论主要参考李航《统计学习方法》

React Native 安卓、苹果、鸿蒙5.0 三端适配方案：条件编译 + 平台适配层追影的React开发者 react native android harmonyos
下面我提供一个完整的条件编译+平台适配层实现方案，让同一套ReactNative代码能同时支持Android、iOS和鸿蒙5.0设备。整体架构设计AndroidiOSHarmony业务代码平台检测当前平台调用Android实现调用iOS实现调用鸿蒙实现原生模块ArkTS适配层项目结构my-app/├──src/│├──common/#完全平台无关的代码│├──components/#普通React
Python咒语大全（学习笔记与使用指南）桑迪Sandy.Q Python python 开发语言
目录字符串格式限制，%xd（整数），%x.yf（小数点浮点数）f“内容{变量}快速格式化案例1：股价预测INPUT语句案例2：INPUT登陆界面语句布尔类型函数基础运用案例3:比较运算符的运用IF语句基本格式案例4:IF语句+INPUT语句练习案例5:IFELSE语句案例6:IFELIFELSE语句案例7:猜数字小游戏案例8:IFELSE嵌套规则案例9:IFELSE嵌套（符合工龄的员工可享受旅游）
高考计算机专业选择万能小贤哥 python 人工智能机器学习高考
高考计算机专业选择：从认知到决策的全面指南在数字经济蓬勃发展的今天，计算机专业已成为高考志愿填报的热门之选。但计算机领域分支众多，专业名称相近却差异显著，如何结合自身特点做出合适选择，需要理性分析与规划。一、计算机类专业的“家族图谱”计算机类专业并非单一学科，而是包含多个细分方向，不同专业培养目标和侧重领域各有不同：-计算机科学与技术：这是计算机领域的“基础款”，涵盖计算机原理、编程语言、算法、操
FFmpeg 视频编码灬Sunnnnn FFmpeg 实战项目-视频播放器 ffmpeg 音视频
1.简介编码视频数据，如下图所示，将原始的YUV数据编码为H.264或者H.265。使用FFmpeg进行视频编码的流程通常包括以下几个步骤：注册编解码器：通过av_register_all()函数注册FFmpeg所有编解码器，这是使用任何编解码器的前提条件。初始化输出上下文：使用avformat_alloc_output_context2()函数来初始化输出码流的AVFormatContext，这
大专学历软件技术专业万能小贤哥人工智能网络协议网络机器学习
大专软件技术专业：深耕技术，出路亦广阔在数字化浪潮席卷各行各业的今天，软件技术专业早已成为就业市场的“香饽饽”。对于大专学历的软件技术专业毕业生而言，或许会因学历门槛略感迷茫，但实际上，凭借扎实的技术能力和清晰的职业规划，同样能在行业中找到属于自己的一席之地。以下从就业、升学、技能提升等多个维度，详细解析大专软件技术专业的发展路径。一、聚焦技术岗位：从基层扎根，积累实战经验软件行业更看重“能解决问
Android 车载应用开发概述
前言介绍Android车载应用开发文章目录前言一、AndroidAutomotiveOS概述二、AndroidAutomotiveOS架构三、常见的车载应用1、系统应用1）SystemUI是什么开发工作2）Launcher是什么开发工作3）Settings是什么开发工作4）多媒体应用5）工具类应用6）车控应用7）辅助驾驶应用8）车辆互联一、AndroidAutomotiveOS概述车载Androi
计算机编译原理ppt,编译原理课件.ppt 知知与终生计算机编译原理ppt
文档介绍：高级语言汇编语言SOURCEPROGRAMAssemblePROGRAM?翻译程序?TRANSLATER为什么要学****编译原理程序设计语言是计算机软件专业的重要核心学****编程的历程:C语言--汇编语言--数据结构Monday,July03,2017编译原理为什么要学****编译原理必修主干课程,操作系统和编译系统构成程序设计者与计算机之间的基本界面。通过学****该课程,掌握编译
使用pyarmor对python文件进行加密 robot_future ubuntu pycharm linux
在pycharm上开发python后，需要对python文件进行加密。进行了调研，采用pyarmor进行加密。PyArmor是一个用于加密和保护Python脚本的工具。它能够在运行时刻保护Python脚本的二进制代码不被泄露。因为代码是python3代码，windows上的默认python是2.7版本。所以换到ubuntu上进行操作。ubuntu上：sudoapt-getinstallpython
基于昇腾910B部署Qwen3-embedding-8B模型（通过vllm 推理引擎部署）萌新--加油 embedding 人工智能经验分享
目前基于知识库搭建，会涉及到embedding和rerank模型，目前阿里通义千问Qwen3-embedding-8B模型在网上测评效果还不错，本文基于vllm部署Qwen3-embedding-8B模型，使用的国产化算力910B2-64G单卡资源。1、环境要求：软件支持版本CANN>=8.1.RC1torch-npu>=2.5.1torch>=2.5.1Python>=3.9,<3.122、to
【SNN脉冲神经网络2】AdEx神经网络软件仿真 XvnNing SNN脉冲神经网络神经网络人工智能深度学习
本文使用AdEx神经元搭建一个完整的神经网络来进行生物神经脉冲现象的仿真。主要的目的是为了验证数学原理，因此只调用的numpy函数包。对应的代码例程如下：1.导入所需的Python函数库importnumpyasnpimportmatplotlib.pyplotaspltimportreimportos2.定义均值函数以及一些常用函数defbin_data(data):try:returnnp.m
LangChain4j 学习教程项目 Chengdu.S #LangChain4j 教程 langchain4j
LangChain4j学习教程项目地址项目简介主要功能使用的技术和库项目环境配置环境要求依赖版本每天学习内容和目标Day01Day02Day03Day04Day05Day06Day07Day08Day09Day10Day11Day12重点学习内容RAG经过为期12天（日均1小时）的LangChain4j源码深度研读，已完成核心模块的代码解析工作。研究过程中同步编写了配套示例代码，后续将通过系列技术
Qwen3 Embedding 结构-加载-训练看透模型设计哲学
看透一个顶级AI句向量模型的设计秘密，从文件结构到加载原理，再到其背后的训练哲学。1Qwen3-Embedding模型结构拆解说明：目录包含了运行一个基于Transformer的句向量模型所需的所有组件文件类别核心文件作用核心模型model.safetensors,config.jsonmodel.safetensors存储了模型所有训练好的权重分词器tokenizer.json,vocab.js
理解WebGL中的顶点着色器和片元着色器程序猿全栈の董（董翔） webgl 着色器
WebGL是一种基于OpenGLES的JavaScriptAPI，它允许我们在网页上直接渲染3D图形而无需任何插件。WebGL的核心是着色器编程，它主要包含两种着色器：顶点着色器(VertexShader)和片元着色器(FragmentShader)。顶点着色器负责处理每个顶点的位置，它决定了顶点在屏幕上的最终位置。而片元着色器则负责计算每个像素的颜色值。这两个着色器共同工作，构成了WebGL渲染
Python 之指针（Pointers）的理解与应用ぃ曦晔° python java 前端
Python之指针（Pointers）的理解与应用1.变量与对象的引用关系2.可变对象与不可变对象3.模拟指针操作4.函数参数传递机制5.“空指针”“双指针”的详解和应用场景6.垃圾回收与引用计数7.应用场景在Python中，虽然没有显式的指针概念（如C/C++中的int*p），但所有变量本质上都是对对象的引用（类似于指针的抽象）。理解这一点对掌握Python的内存管理、参数传递和可变/不可变对象
【免费下载】 Axure谷歌浏览器插件 axure-chrome-extension 下载指南
Axure谷歌浏览器插件axure-chrome-extension下载指南项目地址:https://gitcode.com/open-source-toolkit/c5c2d简介当您遇到AxureRP生成的交互原型在谷歌浏览器中无法正常预览的问题时，通常原因在于浏览器缺失专为此设计的“axure-chrome-extension”插件。此插件是浏览和交互Axure生成的HTML文件的关键组件，确
增刊第5章：模型性能优化技术与健康人工智能 python
第5章：模型性能优化完成DeepSeek大模型的部署和基本运维后，下一步就是对其进行性能优化。在大模型推理场景下，性能优化主要关注两个核心指标：推理速度（Latency）和吞吐量（Throughput）。本章将详细介绍几种关键的优化技术，帮助您在现有硬件条件下，榨干模型的每一滴性能。5.1量化策略进阶(INT4/INT8)在第2章中我们简要介绍了量化，这里我们将深入探讨量化策略。**量化（Quan
Python 进攻性渗透测试（一）
原文：annas-archive.org/md5/dccde1d96c9ad81f97529d78e3e69c9b译者：飞龙协议：CCBY-NC-SA4.0序言Python是一种易学的跨平台编程语言，具有无限的第三方库。许多开源黑客工具都是用Python编写的，可以轻松地集成到你的脚本中。本书被分成了清晰的小部分，你可以按照自己的节奏学习，并专注于对你最有兴趣的领域。你将学会如何编写自己的脚本，并
无限弹窗（python）在线码BUG python
生活中当我们给朋友发消息不回时就可以为他发送一个无限弹窗打代码，他因为好奇打开了那么他就中计了，没有中计我们也不会损失什么importtkinterastkimportrandomimportthreadingimporttimedefdow():window=tk.Tk()window.title('你是XX')window.geometry("200x50"+"+"+str(random.ra
【ARM Cache 与 MMU 系列文章 4 – Cache 与 CPU 乱序执行】主公讲 ARM #【ARM Cache与MMU/MPU 专栏】jvm CPU 乱序执行 CPU Pipline store buffer
请阅读【ARMCache及MMU/MPU系列文章专栏导读】及【嵌入式开发学习必备专栏】文章目录1.1Cache之乱序执行1.1.1CPUPipline1.1.2CacheStoreBuffer引入背景1.1.3CacheStoreBuffer1.1.4InvalidataQueue1.1.5StoreBuffer引入乱序执行1.1.5Invalidqueue引入乱序执行1.1.6内存屏障1.1.7
构建企业级提示词管理平台 AI人工智能与大数据 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
构建企业级提示词管理平台关键词：提示词管理平台、企业级、数据处理、用户交互、系统架构设计摘要：本文将详细探讨如何构建企业级提示词管理平台。我们将从问题背景出发，逐步深入分析核心概念、算法原理、系统设计与项目实战，提供一套完整的解决方案。1.背景介绍1.1问题背景在现代企业中，提示词作为一种重要的信息传递工具，广泛应用于客户服务、市场营销和内部沟通等多个领域。然而，随着数据量的爆炸式增长和业务场景的
TryHackMe-进攻性渗透测试-02_Alfred
Alfred在这个房间里，我们将学习如何利用广泛使用的自动化服务器上的常见错误配置（Jenkins-此工具用于创建持续集成/持续开发管道，允许开发人员在更改代码后自动部署其代码）。之后，我们将使用一种有趣的权限提升方法来获得完整的系统访问权限。由于这是一个Windows应用程序，我们将使用Nishinang来获得初始访问权限。存储库包含一组有用的脚本，用于初始访问、枚举和权限提升。在本例中，我们将
实现边框设置0.5px 岁月如歌_ 前端
border-top:1pxsolid#ededed; 显示太粗或者不满足UI设计稿显示修改position:relative;&::after{content:"";position:absolute;top:0;left:0;box-sizing:border-box;width:200%;height:2px;border-top:1pxsolid#ededed;transform-orig
出个5桩120KW的整体建设方案可以吗？配多大的箱式变压器、对应补贴要求、实施流程等吧 - 慧知开源充电桩平台文慧的科技江湖更新日志 -(慧哥)慧知充电桩平台大数据人工智能架构开源直流充电桩 ocpp 云快充协议
出个5桩120KW的整体建设方案可以吗？配多大的箱式变压器、对应补贴要求、实施流程等吧，位置在广东广州-慧知开源充电桩平台，结合广州最新政策与行业数据，财务建设方案：⚡一、核心设备充电桩采购方案价格校正：市场价：120kW直流桩主流价格为4万～4.5万元/台（国产一线品牌，含基础功能）按您要求的3万元/台：属行业最低价，需警惕以下风险：可能为简化功能机型（如无功率动态分配、通信模块简化）故障率较高
设置时区GMT和UTC 思静鱼 Linux&运维安装时区
GMT（格林尼治标准时间）和UTC（协调世界时）都表示“世界时间标准”，它们经常互换使用，但严格来说，它们并不完全相同。下面是它们的详细对比：1.概念上的区别项目GMT（GreenwichMeanTime）UTC（CoordinatedUniversalTime）起源来自英国，基于地球自转（天文时间）国际标准时间，基于原子钟（原子时间）定义方式天文测量法，基于格林尼治天文台子午线原子钟计算的国际协
Linux 日志监控工具对比：从 syslog 到 ELK 实战指南 Clownseven linux elk jenkins
更多云服务器知识，尽在hostol.com你有没有被Linux上满屏飞滚的日志整崩溃过？看着/var/log目录越来越肥，关键日志像大海捞针一样藏在里面，每次出故障就像拆盲盒，赌你能不能第一眼看出问题。日志系统，说起来简单，干起来头疼。很多人一开始用的是最经典的syslog，后来慢慢用上了rsyslog、journald，进阶点的就开始上ELK或者Graylog这些“现代化战斗系统”。但你真的了解
为什么选择YashanDB作为您的数据存储解决方案？数据库
在现代数据库管理中，如何在保持快速查询响应并确保数据一致性的基础上，有效管理海量数据，成为许多企业面临的挑战。优化查询性能、加速数据处理流程、确保高可用性和数据安全是数据库技术的关键需求。YashanDB作为一种新兴的数据库解决方案，以其灵活的架构和强大的性能优化能力，逐渐被视为满足这一需求的理想选择。领先的体系架构YashanDB的体系架构灵活且高效，支持单机部署、共享集群部署以及分布式集群部署
Python 进攻性渗透测试（二）
原文：annas-archive.org/md5/dccde1d96c9ad81f97529d78e3e69c9b译者：飞龙协议：CCBY-NC-SA4.0第四章：追捕我吧！在今天的世界里，绕过和劫持软件在互联网上到处都是。然而，明确的使用和执行方式才是让你成为一名优秀的业余黑客的关键。这可以通过正确选择工具并遵循必要的过程，完美地完成手头的任务来实现。在本章中，我们将涵盖以下主题，帮助你实现这一
C++主流编辑器特点比较 FrostedLotus·霜莲 c++编辑器开发语言
在C++开发中，选择一款合适的编辑器或集成开发环境(IDE)至关重要。本文将介绍几款常见的C++编辑器/IDE的特点，帮助开发者根据自身需求做出选择。1.Dev-C++Dev-C++是一款经典的轻量级C/C++IDE，特别适合初学者和教育用途。**主要特点：**-**轻量简洁**：安装包小(约50MB)，启动快速，系统资源占用低-**集成开发环境**：内置编辑器、编译器、调试器，无需复杂配置-**
android 卡顿和丢帧区别 summerkissyou1987 android
以下是Android卡顿（Jank）与丢帧（FrameDrop）的核心区别详解，结合技术原理与用户感知进行对比：一、本质差异维度卡顿（Jank）丢帧（FrameDrop）定义界面长时间无响应（如点击延迟>200ms）动画/滚动不连贯（如帧率从60fps突降至40fps）触发根源主线程阻塞（耗时计算、I/O、锁竞争）GPU渲染超时或错过垂直同步（VSync）信号关键指标单帧渲染时间>16.6ms（6
Android Profiler 丢帧分析教程及案例 summerkissyou1987 android
以下为基于最新实践的‌AndroidProfiler丢帧分析全流程指南及实战案例‌，结合权威技术文档与优化经验（2025年更新）：一、Profiler丢帧分析核心流程环境配置与数据抓取‌bashCopyCode启用GPU渲染分析（开发者选项）adbshellsettingsputglobalgpu_debug_layers1adbshellsettingsputglobalgpu_debug_ap
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的