铁猴

程序员的机器学习入门笔记（六）：决策树的入门介绍

介绍

历史背景

决策树算法是最早的机器学习算法之一。早在 1966 年 Hunt,Marin 和 Stone 提出的CLS 学习系统就有了决策树算法的概念。但到了 1979 年， J.R. Quinlan 才给出了 ID3算法的原型， 1983 年和 1986 年他对 ID3 算法进行了总结和简化，正式确立了决策树
学习的理论。从机器学习的角度来看，这是决策树算法的起点。到 1986 年， Schlimmer和 Fisher 在此基础上进行改造，引入了节点缓冲区，提出了 ID4 算法。在 1993 年，Quinlan 进一步发展了 ID3 算法，改进成 C4.5 算法，成为机器学习的十大算法之一。
ID3 的另一个分支是分类回归决策树算法(Classification Regression Tree)，与 C4.5 不同的是， CART 的决策树主要用于预测，这样决策树理论完整地覆盖了机器学习中分类和回归两个领域了。

基本思想

决策树的思想来源非常朴素，每个人大脑中都有类似 if-then 这样的判断逻辑，其中 if 表示条件， then 就是选择或决策。程序设计中，最基本的语句条件分支结构就是if-then 结构。而最早的决策树就是利用这类结构分隔数据的一种分类学习方法。

例子说明

假定某间 IT 公司销售笔记本电脑产品，为了提高销售收入，公司对各类客户建立了统一的调查表，统计了几个月销售数据之后收集到中的数据，为了提高销售的效率，公司希望通过上表对潜在客户进行分类，并根据上述特征制作简单的销售问卷。以利于销售人员的工作。这就出现两个问题：
- 如何对客户分类？
- 如何根据分类的依据，并给出销售人员指导的意见？

调查表的结果如下

计数	年龄	收入	学生	信誉	是否购
64	青	高	否	良	不买
64	青	高	否	优	不买
128	青	中	否	良	不买
64	青	低	是	良	买
64	青	中	是	优	买
128	中	高	否	良	买
64	中	低	是	优	买
32	中	中	否	优	买
32	中	高	是	良	买
60	老	中	否	良	买
64	老	低	是	良	买
64	老	低	是	优	不买
132	老	中	是	良	买
64	老	中	否	优	不买

现在，将年龄特征等于青年的选项剪切出一张表格，选择第二个特征：收入，并根据收入排序

计数	年龄	收入	学生	信誉	是否购
64	青	高	否	良	不买
64	青	高	否	优	不买
128	青	中	否	良	不买
64	青	中	是	优	买
64	青	低	是	良	买

其中，高收入和低收入的特征值只有一个类别标签买。将其作为叶子节点。然后继续划分中等收入的下一个特征：学生，于是有了下表

计数	年龄	收入	学生	信誉	是否购
128	青	中	否	良	不买
64	青	中	是	优	买

学生特征只有两个取值，当取否时，对应的标签为不买；当取是时，对应的标签为买。此时，学生特征就生成了决策树左侧分支的所有节点。

下图中的圆角矩阵为根节点或内部节点：就是可以继续划分的节点；图中的椭圆形节点就是叶子节点，即不能在划分的节点，一般叶子节点都指向一个分类标签，即产生一种决策。

在上面图的基础上，我们再进行如下操作：
- 接下来，我们继续右侧的分支的划分，但在划分时我们做一个简单的变化，划分的顺序为信誉>收入>学生>计数。
这样整个划分过程就变得简单了，当信誉取值为良时，类别标签仅有一个选项就是买。那么信誉为良就是叶子节点。当信誉取值为优时，类别标签仅有一个选项就是不买

在展示最终的结果前，再对图做一点调整，为了便于做出判断，我们对这棵树的方向做了调整，即将所有确定购买的叶子节点都放到了树的右侧，不买的节点都放到了树的左侧
到目前为止，都是从定性的角度对潜在用户的判断，为了便于从量上进行考量，在图的节点上加上量的标识

最终结果如下

从上面的图，我们得到如下结论
- 如果是中年人，一般会购买本公司的产品；
- 如果是青年人，低收入层都会购买，中等收入层还需要做进一步判断，如果是学生就会购买。
- 如果是老年客户，那么首先看一下他们的信誉，如果是良就会购买，如果信誉为优，多数不会购买。
- 全部的计数特征总数为 1024，将上图中路径边的数据除以 1024 这个总数，就得到了每个节点的购买概率

决策树的执行过程

决策树框架主要包含下面4个部分

决策树主函数

各种决策树的主函数都大同小异，本质上是个递归函数。该函数主要的功能是按照某种规则生长出决策树的各个分支节点，并根据终止条件结束算法。一般来讲，主函数需要完成如下几个功能：
1. 输入需要分类的数据集和类别标签；
2. 根据某种分类规则得到最优的划分特征，并创建特征的划分节点—计算最优特征子函数；
3. 按照该特征的每个取值划分数据集为若干部分—划分数据集子函数；
4. 根据划分子函数的计算结果构建出新的节点，作为树生长出的新分支；
5. 检验是否符合递归的终止条件
6. 将划分的新节点包含的数据集和类别标签作为输入，递归执行上述步骤

计算最优特征子函数

该函数是继主函数外最重要的函数。每种决策树之所以不同一般都因为最优特征选择的标准上有所差异，不同的标准导致不同类型的决策树，例如 ID3 的最优特征选择标准是信息增益、C4.5 是信息增益率，
CART 是节点方差的大小等等。后面所讲的理论部分，都是对特征选择标准而言的。算法逻辑上，一般选择最优特征需要遍历整个数据集，评估每个特征，找到最优的那一个返回。

划分数据集

划分数据集函数的主要功能是分隔数据集，有的需要删除某个特征轴所在的数据列，返回剩余的数据集。有的干脆就将数据集一份为二。
虽然实现有所不同，但基本含义都是一致的。

分类器

所有的机器学习算法要用于分类或回归预测。决策树的分类器就是将测试遍历整个生成的决策树，并找到最终的叶子节点的类别标签。这个标签就是返回的结果。

信息熵测度

虽然我们手工实现了上例的决策过程，但是将这种实现方法使用编程形式自动计算还存在一些问题。首先，特征集中的数据常常表现为定性字符串数据，称为标称数据，使用这些数据的算法缺乏泛化能力，在实际计算中需要将这些数据定量化为数字，也就是所谓的离散化。

我们可以将年龄、收入、学生、信誉这些特征的特征值转换为 0,1,2,…,n的形式。这样，年龄={0（青） ,1（中） ,2（老） }；收入={0（高） ,1（中） ,2（低） }；学生={0（是） ,1（否） }；信誉={0（优） ,1（良） }
完成了特征离散化，回顾一下前面的手工计算过程，我们可以总结出这样一条规律，数据特征的划分过程是一个将数据集从无序变为有序的过程。这样我们就可以处理特征的划分依据问题，即对于一个有多维特征构成的数据集，如何优选出某个特征作为根节点。进一步扩展这个问题，如何每次都选择出特征集中无序度最大的那列特
征作为划分节点。

为了衡量一个事物特征取值的有(无)序程度，下面我们引入一个重要的概念：信息熵。

熵是事物不确定性的度量标准，也称为信息的单位或“测度”。在决策树中它不仅能用来度量类别的不确性，可以来度量包含不同特征的数据样本与类别的不确定性。即某个特征列向量的信息熵越大，就说明该向量的不确定性程度越大，即混乱
程度越大，就应优先考虑从该特征向量着手来进行划分。信息熵为决策树的划分提供最重要的依据和标准。

不同决策树算法的差异，基本都体现在“熵”的计算方法不同，下面对各种算法的计算思路做一个简单的介绍

主要算法以及介绍

ID3算法

ID3 是比较早的机器学习算法，于 1979 年 Quinlan 就提出了算法的思想。它以信息熵为度量标准，划分出决策树特征节点，每次优先选取信息量最多的属性，即使信息熵变为最小的属性，以构造一棵信息熵下降最快的决策树。

但在另一方面， ID3 在使用中也暴露除了一些问题：
- ID3 算法的节点划分度量标准采用的是信息增益，信息增益偏向于选择特征
值个数较多的特征，而取值个数较多的特征并不一定是最优的特征。所以需
要改进选择属性的节点划分度量标准。
- ID3 算法递归过程中依次需要计算每个特征值的，对于大型数据会生成比较
复杂的决策树：层次和分支都很多，而其中某些分支的特征值概率很小，如
果不加忽略就造成了过拟合的问题。即决策树对样本数据的分类精度较高，
但在测试集上，分类的结果受决策树分支的影响很大。

C4.5算法

针对 ID3 算法存在的一些问题， 1993 年， Quinlan 将 ID3 算法改进为 C4.5 算法。该算法成功的解决了 ID3 遇到的诸多问题。在业界得到广泛的应用，并发展成为机器学习的十大算法之一。

C4.5 并没有改变 ID3 的算法逻辑，基本的程序结构仍与 ID3 相同，但在节点的划分标准上做了改进。 C4.5 使用信息增益率（ GainRatio）来替代信息增益（ Gain）进行特征的选择，克服了信息增益选择特征时偏向于特征值个数较多的不足

CART(Classification And Regression Tree)

CART（ Classification And RegressionTree）算法是目前决策树算法中最为成熟的一类算法，应用范围也比较广泛。它既可用于分类，也可用于预测.
西方预测理论一般都是基于回归的， CART 是一种通过决策树方法实现回归的算
法，它有很多其他全局回归算法不具有的特性。
在创建回归模型时，样本的取值分为观察值和输出值两种，观察值和输出值都是
连续的，不像分类函数那样有分类标签，只有根据数据集的数据特征来创建一个预测的模型，反应曲线的变化趋势。

在预测中， CART 使用最小剩余方差(Squared Residuals Minimization)来判定回归树的最优划分，这个准则期望划分之后的子树与样本点的误差方差最小。这样决策树
将数据集切分成很多子模型数据，然后利用线性回归技术来建模。如果每次切分后的数据子集仍然难以拟合就继续切分。在这种切分方式下，创建出的预测树，每个叶子节点都是一个线性回归模型。这些线性回归模型反应了样本集合（观测集合）中蕴含的模式，也被称为模型树。因此， CART 不仅支持整体预测，也支持局部模式的预测，并有能力从整体中找到模式，或根据模式组合成一个整体。整体与模式之间的相互结
合，对于预测分析非常有价值。因此 CART 决策树算法在预测中的应用非常广泛。

代码样例

本章节只通过Scikit-Learn 库中的CART实现，来演示如果通过CART来达到预测的效果

# encoding:utf-8
"""CART 的实现有很多种，源码在很多地方都可以找到，相信读者在阅读完前面的
部分之后，有能力看懂，并且实现出 CART 的算法，
这里使用 Scikit-Learn 中的决策树算法来看一下 CART 的预测效果，使读者有一个
直观的认识。"""

__author__ = 'eric.sun'

import matplotlib.pyplot as plt
import numpy as np
from numpy import *
from sklearn.tree import DecisionTreeRegressor

def plotfigure(X,X_test,y,yp):
    plt.figure()
    plt.scatter(X, y, c="k", label="data")
    plt.plot(X_test, yp, c="r", label="max_depth=5", linewidth=2)
    plt.xlabel("data")
    plt.ylabel("target")
    plt.title("Decision Tree Regression")
    plt.legend()
    plt.show()

x = np.linspace(-5,5,200)
print x
siny = np.sin(x) # 给出 y 与 x 的基本关系
X = mat(x).T
y = siny+np.random.rand(1,len(siny))*1.5 # 加入噪声的点集
y = y.tolist()[0]
# Fit regression model
clf = DecisionTreeRegressor(max_depth=4) # max_depth 选取最大的树深度，类似前剪枝
clf.fit(X, y)
# Predict
X_test = np.arange(-5.0, 5.0, 0.05)[:, np.newaxis]
yp = clf.predict(X_test)
plotfigure(X,X_test,y,yp)

C 语言奇幻之旅 - 第03篇：C 语言基本语法码力全開 C 语言奇幻之旅 c语言开发语言 windows 个人开发物联网
文章目录引言1.程序结构：C语言的骨架1.1头文件引用1.1.1头文件的类型1.1.2`#include`的工作原理1.2main()函数-程序的入口1.2.1main()函数的参数1.2.2main()函数的返回值1.3一个简单的C程序示例1.4注意事项2.注释：代码的备忘录2.1单行注释2.2多行注释2.4条件编译与伪注释2.5注释的重要性2.6注释的最佳实践3.标识符与关键字：C语言的词汇3
Spring Boot中HttpMessageConverters的使用与实践 2501_90323865 spring boot 前端后端个人开发
在SpringBoot应用开发中，HttpMessageConverters是一个非常实用的工具，它允许我们灵活地管理HTTP消息转换器（HttpMessageConverter），从而实现对请求和响应数据的自定义处理。本文将通过具体实例，详细介绍如何在SpringBoot中使用HttpMessageConverters来添加、替换默认转换器，以及如何将自定义转换器注册为Bean。一、HttpMe
走进JavaWeb技术世界11：单元测试框架Junit 程序员黄小斜走进JavaWeb技术世界 Java
本系列文章将整理到我在GitHub上的《Java面试指南》仓库，更多精彩内容请到我的仓库里查看https://github.com/h2pl/Java-Tutorial喜欢的话麻烦点下Star哈文章首发于我的个人博客：www.how2playlife.com本文是微信公众号【Java技术江湖】的《走进JavaWeb技术世界》其中一篇，本文部分内容来源于网络，为了把本文主题讲得清晰透彻，也整合了很多
MySQL进阶：SQL高级技巧 - 窗口函数（Window Function）墨夶数据库学习资料1 mysql sql android
MySQL进阶：SQL高级技巧-窗口函数（WindowFunction）❓引言：为什么需要了解窗口函数❓窗口函数（WindowFunction）是SQL标准中的一个高级特性，它允许用户在不改变查询结果集行数的情况下，对每一行执行聚合计算或其他复杂的计算。这些计算是基于当前行与结果集中其他行之间的关系进行的。窗口函数在处理复杂的统计分析问题时非常有用，例如移动平均、累计总和、百分比排名等。本文将深入
基于CISCO PACKET TRACER企业网仿真的设计与实现 QWQ雨落轻尘网络
第1章背景1.1设计背景随着企业信息化建设不断深入，企业的生产业务系统、经营管理系统、办公自动化系统均得到大力发展，对于企业园区网的建设要求越来越高。传统园区网建设初期往往面临网络拓扑相对混乱，不便于对网络性能瓶颈进行正确评估和有效扩容，给日常网络管理也带来很大难度，对于网络可靠性考虑不够，网络中既存在单点故障导致网络可靠性低、影响企业生产和经营管理行为，同时也存在网络过度冗余、造成投资浪费的现象
Python基础—用python读取xml文件！小尤笔记 python xml 开发语言
读取XML文件在Python中是一个常见的任务，通常可以使用内置的xml.etree.ElementTree模块来完成。这个模块提供了简单而高效的XML解析和生成功能。下面是一个详细的代码示例和讲解，展示了如何使用xml.etree.ElementTree来读取XML文件。代码示例假设我们有一个名为example.xml的XML文件，内容如下：120081411004201159900我们的目标是
深入探秘 Java 网络编程：从基础到多线程服务器的全方位指南 2的n次方_ java 网络服务器
我的主页：2的n次方_Java作为一门功能强大的编程语言，不仅在桌面应用、移动开发、后端开发等领域表现出色，还在网络编程中拥有广泛的应用。网络编程涉及在两个或多个设备之间通过网络进行通信，这对于构建分布式系统、客户端-服务器应用程序、以及互联网服务至关重要。在这篇博客中，我们将详细探讨Java网络编程的基础知识，并通过代码示例展示如何在Java中实现网络通信。1.Java网络编程基础Java网络编
【机器学习】多模态AI——融合多种数据源的智能系统 2的n次方_ 人工智能
随着人工智能的快速发展，单一模态（如文本、图像或语音）已经不能满足复杂任务的需求。多模态AI（MultimodalAI）通过结合多种数据源（如文本、图像、音频等）来提升模型的智能和表现，适用于多样化的应用场景，如自动驾驶、医疗诊断、跨语言翻译等。一、多模态AI简介多模态AI是一种将不同形式的数据（如文本、图像、音频等）融合在一起的技术，旨在让模型从多个维度感知和理解信息。这种融合使得AI系统能够从
2.6 聚焦：Word Embedding 少林码僧 AI大模型应用实战专栏 word embedding
聚焦：WordEmbeddingWordEmbedding（词嵌入）是一种将词语转化为低维向量表示的技术，使得词语在数学空间中具有语义上的相似性。它是自然语言处理（NLP）中不可或缺的一部分，为文本数据提供了强大的表示能力。与传统的基于词频的词袋模型（Bag-of-Words）相比，WordEmbedding能够捕捉到词语之间更深层的语义和上下文信息。1.词嵌入的定义与作用WordEmbeddin
Python OpenAI 库开发指南：从入门到实战精通 senger_lcc python 开发语言
在人工智能（AI）领域，OpenAI无疑是全球最受瞩目的机构之一。它推出的GPT系列模型、DALL·E等创新技术，正在深刻改变各行各业。作为Python开发者，我们该如何快速上手并高效利用OpenAI的API，成为了提升个人竞争力的关键。本文将带你从零开始，深入解析Python语言中的openAI库，助你掌握AI开发的核心工具，成为AI领域的专家。一、什么是openAI库？它能为开发者带来什么？1
DETRs with Collaborative Hybrid Assignments Training论文阅读与代码分享总结快乐论文阅读
关键词：协作混合分配训练【目标检测】Co-DETR：ATSS+FasterRCNN+DETR协作的先进检测器（ICCV2023）-CSDN博客摘要：在这篇论文中，作者观察到在DETR中将过少的Query分配为正样本，采用一对一的集合匹配，会导致对编码器输出的监督稀疏，严重损害编码器的区分特征学习，反之亦然，也会影响解码器中的注意力学习。为了缓解这个问题，作者提出了一种新颖的协同混合分配训练方案，名
上海家化新掌舵人押注兴趣电商：内部架构大变革，三季报业绩仍降港湾商业观察用户运营
《港湾商业观察》杨忆宋10月29日，上海家化（600315.SH）公布了2024年第三季度业绩报告。上海家化拥有125年的品牌历史，是中国第一家上市的美妆日化企业，旗下品牌包括六神、佰草集、典萃、玉泽、双妹、高夫、家安、美加净、启初和汤美星。长期以来，上海家化一直是国货美妆行业的领跑者。然而，近年来公司业绩却每况愈下。2024年前三季度，公司营收和净利润双双下滑，第三季度，归属净利润更是出现上市以
SQLite 3.48.0 发布，有哪些更新？不剪发的Tony老师 SQLite sqlite 数据库
SQLite开发团队于2025年1月14日发布了SQLite3.48.0版本，我们来解读一下新版本的改进功能。EXPLAINQUERYPLANSQLite使用EXPLAINQUERYPLAN命令获取查询语句的执行计划，新版本改进了执行计划输出结果中的覆盖索引优化信息：sqlite>createtablet1(idint,nametext,priceint,desctext);sqlite>crea
Python入门：4.Python中的运算符平凡程序猿~ Python python
引言Python是一间强大而且便捷的编程语言，支持多种类型的运算符。在Python中，运算符被分为算术运算符、赋值运算符、复合赋值运算符、比较运算符和逻辑运算符等。本文将从基础到进阶进行分析，并通过一个综合案例展示其实际应用。1.算术运算符算术运算符用于执行基本的数学操作。常见的算术运算符以下是Python常见算术运算符的表格：运算符描述示例结果+加法3+25-减法3-21*乘法3*26/除法（浮
计算机创造的奇迹——C语言 UnwaterBreathing C c语言开发语言
一.简介C语言是一种较早的程序设计语言，诞生于1972年的贝尔实验室。1972年，DennisRitchie设计了C语言，它继承了B语言的许多思想，并加入了数据类型的概念及其他特性。尽管C语言是与UNIX操作系统一起被开发出来的，但它不只支持UNIX。C是一种通用（广泛可用）的编程语言。程序设计语言实与编译器是一体的，C编译器有著名的GCC（GNUCompilerCollection）等。广泛应用
Golang学习笔记_28——工厂方法模式 LuckyLay Golang学习笔记 golang 学习笔记设计模式工厂方法模式
Golang学习笔记_25——协程Golang学习笔记_26——通道Golang学习笔记_27——单例模式文章目录工厂方法模式1.介绍2.优点3.类图4.实现源码工厂方法模式1.介绍工厂方法模式（FactoryMethod）是一种创建型设计模式，它提供了一种创建对象的接口，但由子类决定要实例化的类是哪一个。工厂方法模式让类的实例化推迟到子类中进行2.优点解耦：将对象的创建与使用分离，客户端不需要知
鸿蒙Flutter实战：15-Flutter引擎Impeller鸿蒙化、性能优化与未来星释鸿蒙 Flutter 实战鸿蒙 flutter harmonyos
Flutter技术原理Flutter是一个主流的跨平台应用开发框架，基于Dart语言开发UI界面，它将描述界面的Dart代码直接编译成机器码，并使用渲染引擎调用GPU/CPU渲染。渲染引擎的优势使用自己的渲染引擎，这也是Flutter与其他跨平台框架最大的区别。与ReactNative等高度依赖原生组件的框架不同，Flutter摆脱了原生组件依赖，界面布局更加灵活，多端展示效果高度一致。由于渲染引
使用腾讯云AI代码助手快速实现一个办公AI助手星释编程实践腾讯云AI代码助手
使用腾讯云AI代码助手快速实现一个办公AI助手作品简介这是一个基于Vue.js和TDesign的AI聊天演示项目，旨在为用户提供便捷的办公交流体验。技术架构本项目采用了前端框架Vue.js结合TDesign组件库进行开发，同时集成了相关的AI聊天功能模块。实现过程开发环境、开发流程开发环境：Node.js版本v18+开发流程：克隆项目代码。在项目根目录下运行npmi安装依赖。运行npmrundev
作为一名Flutter开发，我骗老板我会前端，她竟然要给我升职加薪星释 FlutterWeb实战前端 flutter
起始那天，办公室的气氛突然凝固，老板把我叫进她的办公室，眼中带着期待，问：“你会前端吗？”这句话简单，但我知道背后暗藏玄机。我愣了一下，脑海一片空白，内心像是被投进了一颗巨石，掀起层层涟漪。我呢喃了一声：“会一点。”然而，这话对我来说却显得虚假。毕竟，我只是一个App开发，至于前端,我完全不知。老板的眼睛立刻亮了起来，笑容灿烂：“那太好了！公司现在缺前端，你顶上吧！”她笑着拍了拍我的肩膀，转身离开
鸿蒙 Flutter 实战：14-现有 Flutter 项目支持鸿蒙 II 星释鸿蒙 Flutter 实战 harmonyos flutter 华为
引言在之前的文章鸿蒙Flutter实战：09-现有Flutter项目支持鸿蒙中，介绍了如何改造项目，适配鸿蒙平台。文中讲述了整体的理念和思路，本文更进一步，结合可实操的项目代码，详细说明如何实施。通过模块化、鸿蒙壳工程，结合FVM管理多版本FlutterSDK，最终，保持原Flutter代码纯净，最小化修改，完成了鸿蒙化的适配示例。本项目代码地址:https://gitee.com/zacks/f
C语言编程笔记：文件处理的艺术就爱学编程新星杯 c语言笔记开发语言
大家好，这里是小编的博客频道小编的博客：就爱学编程很高兴在CSDN这个大家庭与大家相识，希望能在这里与大家共同进步，共同收获更好的自己！！！本文目录引言正文一、为什么要用文件二、文件的分类三、文件指针四、文件的打开与关闭1.文件的打开2.文件的关闭五、文件缓冲区六、文件的基本操作（1）打开文件（2）关闭文件（3）检测文件末尾和错误（4）清除文件错误标志七、顺序读写文件（1）字符级操作函数fgetc
GitHub无法访问、下载文件慢以及加速方法 yunfanleo github
1.GitHub加速器为了解决访问速度慢以及无法访问等GitHub访问不稳定的问题，可以通过修改hosts文件来解决DNS污染问题，直接访问GitHub的CDN节点，从而加速访问。有些GitHub加速器就是为此而生，比较适合需要访问GitHub官网的开发者用户以及其他经常需要使用GitHub网站的用户。GitHub加速器：GitHub加速-办公人导航https://www.bgrdh.com/si
一文大白话讲清楚Node文件系统（filesystem）的应用 16年上任的CTO node node.js filesystem node文件系统 node文件操作
文章目录一文大白话讲清楚Node文件系统（filesystem）的应用1.啥是Node的文件系统1.1啥是fs1.2fs的文件属性1.2.1权限位mode1.2.2标识位1.2.3文件描述1.3文件操作方法1.3.1文件读取readFile(url,options，callback)和readFileSync(url,options)1.3.2文件写入writeFileSync(url,data,
为什么你的网站总是有安全漏洞 16年上任的CTO 网络安全安全漏洞网络安全 web安全安全性测试前端服务器
目录一、什么是安全漏洞二、安全漏洞的一般表象1.网站瘫痪2.链接指向篡改3.数据篡改4.挂入黑链5.信息泄露6.横向攻击7.流量损耗8.其他现象三、造成安全漏洞的原因1.SQL注入漏洞2.验证码前端校验3.表单重复提交4.文件上传格式校验不合格5.第三方框架的固有漏洞6.密码缺省7.端口开放太多8.Options不过滤9.XSS，CSRF漏洞10.X-Frame-Options劫持11.HTTP获
Golang 中强大的重试机制，解决瞬态错误 Ai 编码 Golang教程 golang 开发语言后端
文章精选推荐1JetBrainsAiassistant编程工具让你的工作效率翻倍2ExtraIcons：JetBrainsIDE的图标增强神器3IDEA插件推荐-SequenceDiagram，自动生成时序图4BashSupportPro这个ides插件主要是用来干嘛的？5IDEA必装的插件：SpringBootHelper的使用与功能特点6Aiassistant,又是一个写代码神器7Cursor
curl的使用 workingman_li java
curl的使用1.1URL访问访问一个网页时，可以使用curl命令后加上要访问的网址：$curlitbilu.com301MovedPermanently301MovedPermanentlynginx/1.6.2如上所示，我们就看到所访问网址的页面源码。重定向跟踪在上面示例中，页面使用了301重定向，这时我们可以添加-L参数来跟踪URL重定向：$curl-Litbilu.com页面保存如果需要将
Python 中 PIL 构建图片裁剪工具 winfredzhang python crop
概述这篇博客将为您展示如何使用wxPython和PIL库开发一个图片裁剪工具。本工具能够加载图片，允许用户通过拖拽选择框裁剪图片，并保存裁剪后的结果。以下是完整代码和实现步骤。C:\pythoncode\new\cropimageandsave.py功能特性图片加载：支持加载JPG和PNG格式的图片。动态裁剪：通过鼠标绘制矩形选择框进行裁剪。缩放适配：图片会根据面板大小自动缩放显示。保存裁剪结果：
程序员如何培养技术领导力？借雨醉东风管理及面试心得职场和发展
关注我，持续分享逻辑思维&管理思维&面试题；可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导；推荐专栏《10天学会使用asp.net编程AI大模型》，目前已完成所有内容。一顿烧烤不到的费用，让人能紧跟时代的浪潮。从普通网站，到公众号、小程序，再到AI大模型网站。干货满满。学成后可接项目赚外快，绝对划算。不仅学会如何编程，还将学会如何将AI技术应用到实际问题中，为您的职业生涯增添一笔宝贵的财富
Python3.13来了！编程爱好者必看 Python之栈人工智能 python 开发语言
Python3.13于近期发布，其中包含大量重要更新。Python作为机器学习、数据科学和人工智能领域使用最广泛的编程语言，一直在不断发展，以满足这些领域日益增长的需求。最新发布的Python3.13提供了多项具有影响力的改进，旨在提高性能和生产力，对于从事ML和AI项目的开发人员来说是一个重要的里程碑。Python在ML和AI领域的主导地位主要归功于它的简单性、广泛的库支持和庞大的社区。然而，随
模型部署工具01：Docker || 用Docker打包模型 Build Once Run Anywhere Tiandaren 模型部署 docker java 容器服务器深度学习人工智能 linux
Docker是一个开源的容器化平台，可以让开发者和运维人员轻松构建、发布和运行应用程序。Docker的核心概念是通过容器技术隔离应用及其依赖项，使得软件在不同的环境中运行时具有一致性。无论是开发环境、测试环境，还是生产环境，Docker都能够提供高效、可靠的解决方案。在本教程中，我们将详细介绍Docker的核心概念、安装方法，以及如何使用Docker进行容器化操作。Docker是什么？为什么值得学
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟