爱吃肉爱睡觉的Esther

机器学习【西瓜书/南瓜书】--- 第四章决策树

一、决策树理论分析

1.1 通俗理解

决策树是一种非常经典的机器学习算法，通俗理解的话我们可以举一个例子，比如现在别人要找你借钱，那么按照首先是不是要判断你和他的关系如何?如果关系不好，我就直接拒绝他。如果关系很好，我就直接借给他了，那么如果关系一般，我要判断一下他是男是女？如果是男生，那么就不借，如果是女生，我要继续考虑她的人品好不好？如果人品不好，就不借，如果人品不错，就借。这也就是所谓的决策树。用python画出决策树的图，可以看到相当的直观。也可以说是一个决策的依据。

1.2 理论分析

决策树（decision tree）是一种常用的机器学习算法，是一种描述对实例进行分类的树形结构。而之前的一个决策树构造，我们往往是根据“经验”来进行构造的，而这些“经验都是来自于我们平时的获取数据”。因此决策树的合理构造也需要数据。
为了便于理解，我们介绍下一个实际的例子。借贷公司根据借贷人是否有房子，是否有工作来决定是否给借贷人发放贷款。

如下图所示是我们根据数据构造的决策树，你或许会有很多问题，比如我是先判断他是否有房子，还是先判断他是否有工作呢？这也是要构造决策树需要解决的问题。
决策树属于是基于“树”结构来进行决策。
这个树的内部节点也就是方形的内容代表数据集的属性，也就是借钱人的性别啊，关系啊，人品啊，而分支呢？就是属性的取值，也就是性别是男还是女。而最后的叶子节点（通俗来说就是树向下最后一个节点），就是yes和no。这就是一个决策时包含的内容。

1.3 构造方法

1.3.1 这“棵树怎么长”？

读了上面的内容你就认为你学会了决策树吗？这还仅仅理论内容，实际的代码实现需要算法的思想。因为涉及到树，所以递归属于最核心的算法，构造决策树的策略“分而治之”，决策树的构造是实际上是自根至叶的递归过程。更通俗来说就是说这“棵树怎么长”？
（1）选择一个最优的属性，根据属性值划分成若干个子集；
（2）在每个子集继续构造决策树。

1.3.2 这棵树长到什么时候停？

其中有三种情形导致递归返回，也就是说这棵树长到什么时候停？
（1）当前节点包含的样本全属于同一类别，无需划分；（比如给出的数据都是同意贷款，那么决策树就是一个agree，无需划分。）

（2）当前属性集为空，或是所有样本在所有属性上的取值都相同，无法划分。（给出的数据都是有房子，没工作，无法根据属性值划分，递归返回）

（3）当前结点包含的样本集合为空，不能划分。（很容易理解，空的递归返回）

1.4 属性划分选择

其实构造决策树的关键是如何选择最优划分属性。一般而言，随着划分过程的不断进行，我们希望划分后可以分出更多的结果，也就是节点的纯度越来越高。
常用的划分准则有
（1）ID3:信息增益，
（2）C4.5:增益率，
（3）CART：基尼指数。
要说清楚这些问题，我们不得不说一下信息熵的概念。

1.4.1 信息熵

信息奠基人香农（Shannon）认为“信息是用来消除随机不确定性的东西”，也就是说衡量信息量的大小就是看这个信息消除不确定性的程度。
“太阳从东边升起”，这条信息并没有减少不确定性，因为太阳肯定是从东边升起的，这是一句废话，信息量为0。”
2018中国队成功进入世界杯“从直觉上来看，这句话具有很大的信息量。因为中国队进入世界杯的不确定性因素很大，而这句话消除了进入世界杯的不确定性，所以按照定义，这句话的信息量很大。
根据上述可总结如下：信息量的大小与信息发生的概率成反比。概率越大，信息量越小。概率越小，信息量越大。

1.4.2 信息量的计算

设某一事件发生的概率为P(x)，其信息量表示为：

其中I ( x )表示信息量，这里log表示以e为底的自然对数。就是高中学的lnx。
3.2 信息熵
信息熵也被称为熵，用来表示所有信息量的期望。
期望是试验中每次可能结果的概率乘以其结果的总和。（可以理解最可能获得的结果）
所以信息量的熵可表示为：（这里的X是一个离散型随机变量）

对于0-1分布的问题，由于其结果只用两种情况，是或不是，设某一件事情发生的概率为，则另一件事情发生的概率为，所以对于0-1分布的问题，计算熵的公式可以简化如下：

可以总结，信息熵来说，信息熵越大，那么这个事件X发生的不确定性越大，信息熵越小，这个事件X发生的不确定性越小。例如：事件X发生的概率为1，那么事件X不发生的概率为0.这样带入公式计算，H（X）=0，即代表事件X一定发生，也即不确定性为0。
可以看到信息熵最大的特点就是两个概率一样。信息增益越多说明该特征越重要，回到决策树的话题，我们就是根据信息增益来选择特征构造决策树的，这也是这颗决策树怎么长的解决办法。

1.5 划分准则

1.5.1 ID3:信息增益

信息增益：在划分数据集之前之后信息发生的变化。按照属性的特征值划分数据集，计算信息增益，获得信息增益最高的属性就是最好的选择。

根据这个准则，需要计算通过不同特征划分后的信息增益率，选择最大值划分数据集，进而构造决策树。信息增益：对可取值数目较多的属性有所偏好，有明显弱点，例如：考虑将“编号”作为一个属性.为了便于读者理解，附上一个例子。

1.5.2 C4.5:增益率

刚才说到，ID3算法通过信息增益构造决策树，有明显弱点，例如：考虑将“编号”作为一个属性，为了对这一问题改进，产生了C4.5算法，他的划分标准是根据信息增益率划分。

属性a的可能取值数目越多(即V越大)，则IV(a)的值通常就越大。信息增益比本质：是在信息增益的基础之上乘上一个惩罚参数。特征个数较多时，惩罚参数较小；特征个数较少时，惩罚参数较大。不过有一个缺点：信息增益率偏向取值较少的特征。为了便于读者理解，举个例子。

使用信息增益率：基于以上缺点，并不是直接选择信息增益率最大的特征，而是现在候选特征中找出信息增益高于平均水平的特征，然后在这些特征中再选择信息增益率最高的特征。

1.5.3 CART:基尼指数

数学家们想到了另外一个表示纯度的方法，叫做基尼指数。表达式如下：

基尼指数表示在样本集合中一个随机选中的样本被分错的概率。举例来说，现在一个袋子里有3种颜色的球若干个，伸手进去掏出2个球，颜色不一样的概率，这下明白了吧。Gini(D)越小，数据集D的纯度越高。
属性 a 的基尼指数：

在候选属性集合中，选取那个使划分后基尼指数最小的属性。

1.6 树形结构为什么不需要归一化?

因为数值缩放不影响分裂点位置，对树模型的结构不造成影响。
按照特征值进行排序的，排序的顺序不变，那么所属的分支以及分裂点就不会有不同。而且，树模型是不能进行梯度下降的，因为构建树模型（回归树）寻找最优点时是通过寻找最优分裂点完成的，因此树模型是阶跃的，阶跃点是不可导的，并且求导没意义，也就不需要归一化。

既然树形结构（如决策树、RF）不需要归一化，那为何非树形结构比如Adaboost、SVM、LR、Knn、KMeans之类则需要归一化。

对于线性模型，特征值差别很大时，运用梯度下降的时候，损失等高线是椭圆形，需要进行多次迭代才能到达最优点。但是如果进行了归一化，那么等高线就是圆形的，促使SGD往原点迭代，从而导致需要的迭代次数较少。

1.7 决策树如何剪枝

决策树的剪枝基本策略有预剪枝 (Pre-Pruning) 和后剪枝 (Post-Pruning)。

预剪枝:其中的核心思想就是，在每一次实际对结点进行进一步划分之前，先采用验证集的数据来验证如果划分是否能提高划分的准确性。如果不能，就把结点标记为叶结点并退出进一步划分；如果可以就继续递归生成节点。
后剪枝:后剪枝则是先从训练集生成一颗完整的决策树，然后自底向上地对非叶结点进行考察，若将该结点对应的子树替换为叶结点能带来泛化性能提升，则将该子树替换为叶结点。
两种方法的对比:

1.8 Bagging 与随机森林

随机森林一句话来说就是三个臭皮匠顶个诸葛亮，人多力量大，也就是说一颗树解决不了问题，那就一堆，大家都发表意见，最终取最多的。这也是随机森林的基本思想。

随机森林：以决策树作为基学习器，同时引入了随机属性选择。即先从属性集合(假定有d个属性)中随机选择一个包含k个属性的子集,再从这个子集中选择一个最优属性进行划分.
（1）当k=d时,基决策树与传统决策树相同.
（2）当k=1时,则随机选择一个属性用于划分.
一般推荐k=log2d.

二、代码实现

为了降低读者的门槛，这里仅附上调用sklearn的代码。详细代码小程序员将放在百度网盘，供大家参考。
下面是ex4.csv的内容，大家可以新建一个记事本，拷贝下面内容，然后更改文件后缀名为csv.复现代码。

0,0,0,0,0,0,0
1,0,1,0,0,0,0
1,0,0,0,0,0,0
0,0,1,0,0,0,0
2,0,0,0,0,0,0
0,1,0,0,1,1,0
1,1,0,1,1,1,0
1,1,0,0,1,0,0
1,1,1,1,1,0,1
0,2,2,0,2,1,1
2,2,2,2,2,0,1
2,0,0,2,2,1,1
0,1,0,1,0,0,1
2,1,1,1,0,0,1
1,1,0,0,1,1,1
2,0,0,2,2,0,1
0,0,1,1,1,0,1

训练决策树

from pandas import read_csv
df = read_csv("ex4.csv",header=None)
data = df.values
X = data[:,:-1]
y = data[:,-1]
names_chinese = ['色泽','根蒂','敲声','纹理','脐部','触感']
names_english = ['color','root','sound','texture','navel','feeling']
label_chinese = ['好瓜','坏瓜']
label_english = ['good','bad']
from sklearn.tree import DecisionTreeClassifier
model = DecisionTreeClassifier(criterion='entropy')
#model = DecisionTreeClassifier(criterion='entropy',max_depth=3)
#model = DecisionTreeClassifier(criterion='entropy',min_samples_leaf=3)
#model = DecisionTreeClassifier(criterion='entropy',min_samples_split=3)
model.fit(X,y)

决策树可视化
这里可视化需要安装graphviz，报错的可以参考这里

from sklearn.externals.six import StringIO
from sklearn.tree import export_graphviz
from pydotplus import graph_from_dot_data
from IPython.display import Image


dot_data = StringIO()
export_graphviz(model,out_file=dot_data,
               feature_names=['color','root','sound','texture','navel','feeling'],\
               class_names=['good','bad'])
graph = graph_from_dot_data(dot_data.getvalue())
Image(graph.create_png()) #在jupyter中直接显示
#graph.write_pdf("tree.pdf")

结果

三、代码文件

小程序员将代码文件和相关素材整理到了百度网盘里，因为文件大小基本不大，大家也不用担心限速问题。后期小程序员有能力的话，将在gitee或者github上上传相关素材。
链接：https://pan.baidu.com/s/1Ce14ZQYEYWJxhpNEP1ERhg?pwd=7mvf
提取码：7mvf

2. 马科维茨资产组合模型+CAMP优化方案（理论+Python实战）金融OG 金融资产组合模型进化论人工智能大数据金融 python 数据库机器学习
目录0.承前1.资本资产定价模型(CAPM)优化的现代投资组合理论1.1WhatisCAPM优化的现代投资组合理论1.2WhyisCAPM优化的现代投资组合理论1.3HowtoCAPM优化的现代投资组合理论2.数据要素&计算流程2.1参数集设置2.2数据获取&预处理2.3收益率计算2.4CAPM预期收益率计算2.5协方差矩阵计算2.6投资组合表现计算2.7夏普比率优化2.8持仓筛选3.汇总代码4.
【AI量金术师：简易代码领悟高深金融术语】02.马科维茨资产组合模型Python实战金融OG 高深金融术语私厨人工智能金融 python
目录1.马科维茨资产组合模型简介1.1模型的起源与发展1.2核心概念2.模型的基本假设2.1投资者行为假设2.2市场环境假设3.模型的应用与局限性3.1实际应用3.2局限性探讨4.Python代码案例：实现马科维茨资产组合模型4.1环境准备与数据获取4.2数据收集4.3计算收益率与协方差矩阵4.4随机生成投资组合4.5绘制有效前沿4.6优化求解最优投资组合5.结论与展望1.马科维茨资产组合模型简介
svm python 模型绘图_1SVM处理数据并绘图张炜大师傅 svm python 模型绘图
爬虫Python基础、数据分析扩展包Numpy、pandas、matplotlib，Python读取MySQL数据，Python爬虫及Scrapy框架，无监督机器学习算法聚类分析等，以及案例：互联网金融行业客户价值分析等。机器学习机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有
服务器ibmc无法加载js文件,华为服务器IBMC批量巡检代码 1ce0ear 服务器ibmc无法加载js文件
selenium需要下载Chrome驱动webdriver，具体下载的版本根据自己的谷歌浏览器版本进行下载，然后将下载好的驱动webdriver放到自己python解释器同级目录中即可，下载地址http://npm.taobao.org/mirrors/chromedriver/此代码可用于华为服务器批量巡检，前提要在脚本存放的同级目录下建立一个ipList.txt文件存储服务器管理IP地址格式为
python数据分析与可视化盆蒂 python 开发语言
一、Python数据分析概述Python是一种解释型、交互式的编程语言，其设计理念强调代码的可读性和简洁性。Python的语法结构简单，支持面向对象、过程式和函数式三种编程范式，使得Python成为一种强大而灵活的编程语言。Python数据分析主要包括数据清洗、数据探索和数据可视化三个部分。数据清洗是数据分析的重要环节，主要是对数据进行预处理，包括缺失值处理、异常值处理、数据类型转换等。数据探索则
Python操作MongoDB看这一篇就够了 Python3.7 Python进阶 python
MongoDB是由C++语言编写的非关系型数据库，是一个基于分布式文件存储的开源数据库系统，其内容存储形式类似JSON对象，它的字段值可以包含其他文档、数组及文档数组，非常灵活。在这一节中，我们就来看看Python3下MongoDB的存储操作。1.准备工作在开始之前，请确保已经安装好了MongoDB并启动了其服务，并且安装好了Python的PyMongo库。2.连接MongoDB连接MongoDB
python加密解密算法_Python-AES加密算法接口测试 weixin_39602737 python加密解密算法
前言先前已经学过了Python-SHA256加密算法接口测试，今天我跟大家讲解一下AES加密算法的接口如何写python脚本进行测试。一：安装pycryptodome模块pipinstallpycryptodome二：定义AES加密的方法，本次使用ECB模式加密importbase64fromCrypto.CipherimportAESfromCrypto.Util.Paddingimportpa
深入理解AES加密算法：原理与Python实现闲人编程密码学与信息安全 python 开发语言 AES 加密解密密码学
目录深入理解AES加密算法：原理与Python实现1.AES算法简介2.AES加密解密流程3.Python实现AES加密解密4.结论深入理解AES加密算法：原理与Python实现AES(AdvancedEncryptionStandard)是目前最广泛使用的对称加密算法之一。它具有高效、安全和灵活的特点，被广泛应用于数据加密、通信加密以及各种安全协议中。本文将详细介绍AES算法的加密和解密流程，并
gradio库的基本使用 Echo..... python python
Gradio（通过pipinstallgradio安装）是一个用于创建交互式界面的Python库。它允许你基于预训练模型、函数或任意代码块创建实时演示和部署模型的图形用户界面（GUI）。使用Gradio库，你可以轻松创建Web界面，用于输入数据、调用模型、显示结果，并为用户提供与模型交互的功能。它支持多种输入类型（如文本框、图片上传、滑块等）和输出展示方式（如图像展示、文本展示等）。你可以根据需要
利用Python的jieba和wordcloud第三方库制作精美词云博客冲浪 Python python
一：《红楼梦》高频中文词语统计importjiebaf=open('红楼梦.txt','r')txt=f.read()f.close()words=jieba.icut(txt)counts={}forwordinwords:iflen(word)==1:continueelse:counts[word]=counts.get(word,0)+1items=list(counts.items())
【AI中数学-概率论-综合实例-包括python实现】预测的守望者：动态贝叶斯网络在风险预警中的应用云博士的AI课堂 AI中的数学人工智能概率论 python 贝叶斯网络机器学习 AI数学
第四章：概率论-综合实例第2节预测的守望者：动态贝叶斯网络在风险预警中的应用在许多现实世界的应用中，预测和风险评估通常不仅依赖于静态的输入数据，而是需要考虑时间维度和动态变化。动态贝叶斯网络（DBN,DynamicBayesianNetwork）作为一种扩展了传统贝叶斯网络的工具，可以有效地处理时间序列数据，并进行时序预测。与静态贝叶斯网络不同，DBN能够通过建模系统状态随时间的变化，揭示出更为复
jave五子棋人机对战 aqfcca c++算法笔记 java 开发语言
这是pythonpythonAI五子棋对战-CSDN博客这是c++c++五子棋代码-CSDN博客这又是javeimportjavax.imageio.ImageIO;importjavax.swing.*;importjava.awt.*;importjava.awt.event.MouseEvent;importjava.awt.event.MouseListener;importjava.aw
python高级加密算法AES对信息进行加密和解密 Python数据分析与机器学习 python 开发语言
AES（高级加密标准）是一种广泛使用的对称加密算法，它以字节为单位处理数据，将明文分组加密成密文。AES算法的核心在于一个轮函数，该函数会对数据执行多次变换，包括字节代换、行移位、列混合和轮密钥加。这些操作确保了数据的安全性，使得原始数据经过AES加密后变得无法识别。AES加密过程AES加密过程涉及以下几个关键步骤：字节代换：这一步使用一个预定义的S盒（替换表）来替换状态矩阵中的每个字节。这是一个
c#视觉应用开发中如何在C#中进行图像颜色空间转换？ openwin_top C#视觉应用开发问题系列 c#开发语言计算机视觉视觉检测 .net
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位在C#中进行图像颜色空间转换，通常涉及将图像从一种颜色空间转换到另一种颜色空间，例如从RGB转换到灰度、HSV或YUV等。为了实现这些转换，您可以使用多种库和技术，包括.NET自带的System.D
【在 PyTorch 中使用 tqdm 显示训练进度条，并解决常见错误TypeError: ‘module‘ object is not callable】 weixin_48705841 人工智能
在PyTorch中使用tqdm显示训练进度条，并解决常见错误TypeError:'module'objectisnotcallable在进行深度学习模型训练时，尤其是在处理大规模数据时，实时了解训练过程中的进展是非常重要的。为了实现这一点，我们可以使用tqdm库，它可以非常方便地为你提供进度条显示。1.什么是tqdm？TQDM是一个快速、可扩展的Python进度条库。它可以用来显示迭代的进度，帮助
如何在Python中高效地读写大型文件？ python
大家好，我是V哥。上一篇给大家介绍如何使用Python进行文件读写操作的方法，问题来了，如何读写的是大型文件，有没有什么方法来提高效率呢，不要捉急，这一篇来聊聊如何在Python中高效地读写大型文件。以下是在Python中高效读写大型文件的一些方法：一、逐行读取大型文件：defread_large_file_line_by_line(file_path):withopen(file_path,'r
python的print输出txt 张小特 python
方法一：importsysnewfile='C:\VisualSTUDIO\climbdouban\soup.txt'data=open(newfile,'w',encoding="utf-8")sys.stdout=data……data.close()方法二（推荐）：data=open("newfile.txt",'w',encoding="utf-8")print(content,file=d
python081（包02—封装模块、设置__init__和外界导入包） weixin_42681308 Python
案例演练新建一个hm_message的包在目录下，新建两个文件send_message和receive_message在send_message文件中定义一个send函数在receive_message文件中定义一个receive函数在外部直接导入hm_message的包__init__.py要在外界使用包中的模块，需要在__init__.py中指定对外界提供的模块列表
python查看进程-kill进程 weixin_41183901 python python
psutil查看进程-kill进程psutil官网：https://github.com/giampaolo/psutil测试代码importpsutilimportosimportsignalprint("-----------------------------showallprocessesinfo--------------------------------")#showprocesse
机器学习、基础算法、python常见面试题必知必答系列大全：（面试问题持续更新） promptllm人工智能
基础算法常见面试篇1.1过拟合和欠拟合常见面试篇一、过拟合和欠拟合是什么？二、过拟合/高方差（overfiting/highvariance）篇2.1过拟合是什么及检验方法？2.2导致过拟合的原因是什么？2.3过拟合的解决方法是什么？三、欠拟合/高偏差（underfiting/highbias）篇3.1欠拟合是什么及检验方法？3.2导致欠拟合的原因是什么？3.3过拟合的解决方法是什么？1.2Bat
Python交互式查看进程信息 bustled python 开发语言
实现功能：根据进程号查看进程、根据进程查看进程信息、根据进程号杀进程importpsutilimportosimporttimedefdesc():choice=input("""1、根据进程号查看进程信息2、根据进程查看进程信息3、根据进程号杀进程q、退出请输入选项：""")returnchoicedefinfo_pid(pid):print("名称\tPID\t内存占用率\tCPU占用率\tC
Windows不用anaconda安装labelImg及bug解决欢天喜地小姐姐解决bug技巧 bug
1.Windows不用anaconda安装labelImg：安装labelImg所需环境–打开#安装labelImg所需环pipinstllpyqt5lxml#打开labelImgpythonlabelImg.py2.Windows:‘pip’不是内部或外部命令,也不是可运行的程序或批处理文件2.1原因分析系统环境变量没配置好2.2解决方法1.控制面板\系统和安全\系统”→“高级系统设置”→“高级
set()函数用法欢天喜地小姐姐 python编程学习 python
python内置函数文章目录python内置函数描述set()语法返回值实例描述set（）是集合的一种。set()函数创建一个无序不重复元素集，可进行关系测试，删除重复数据，还可以计算交集、差集、并集等。set()语法classset([iterable])iterable–可迭代对象对象；返回值返回新的集合对象实例>>>x=set('runoob')>>>y=set('google')>>>x,
Python软件包中的__init__.py文件的作用 python_136 python
当然可以，我会尽量用更详细和易懂的方式来说明Python软件包中的__init__.py文件的作用。一、__init__.py文件的基本作用在Python中，一个包含__init__.py文件的目录被视为一个Python包。这个文件的存在告诉Python解释器，这个目录应该被当作一个整体来对待，里面的Python文件（.py文件）可以被当作模块（module）来导入。二、__init__.py文件
Python自动化运维：一键掌控服务器的高效之道蒙娜丽宁 Python杂谈运维 python 自动化
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在互联网和云计算高速发展的今天，服务器数量的指数增长使得手动运维和管理变得异常繁琐。Python凭借其强大的可读性和丰富的生态系统，成为实现自动化运维的理想语言。本文以“Python自动化运维：编写自动化脚本进行服务器管理”为主题，深入探讨了如何利用Py
蓝桥杯Python组最后几天冲刺———吐血总结,练题总结,很管用我学会了晚风时亦鹿学习笔记 Python算法笔记 python
一、重要知识要点1、穷举法2、枚举法3、动态规划4、回溯法5、图论6、深度优先搜索（DFS）7、广度优先搜索（BFS）8、二叉树9、递归10、分治法、矩阵法11、排列组合12、素数、质数、水仙花数13、欧几里得定理gcd14、求最大公约数、最小公倍数15、海伦公式（求三角形面积）16、博弈论17、贪心18、二分查找法19、hash表20、日期计算21、矩形快速幂22、树形DP23、最短路径24、最
Python二叉树用法介绍很酷的站长编程笔记 python 开发语言
二叉树是一种非常重要的数据结构，它在计算机科学中得到了广泛应用，例如在搜索算法、图形渲染和游戏AI等领域。本文将以Python二叉树为中心，从多个角度对其进行详细阐述，包括二叉树定义、二叉树遍历、二叉搜索树、平衡二叉树等内容。一、二叉树定义二叉树是一种有根树，它满足以下条件：每个节点最多有两个子节点每个节点只有一个父节点左子节点是其父节点的左子树，而右子节点是其父节点的右子树按照这个定义，我们可以
在VSCode中更改专用终端的Conda环境小白也有IT梦 python vscode
步骤打开VSCode：启动VSCode并打开你需要的工作目录。打开命令面板：使用快捷键Ctrl+Shift+P（Windows/Linux）或Cmd+Shift+P（macOS）打开命令面板。选择Conda环境：在命令面板中输入Python:SelectInterpreter并选择该选项。在出现的列表中选择你需要的Conda环境。这个步骤会改变当前工作目录下Python解释器的环境。打开终端：使用
Python 最最最使用的动态规划入门教程 + 10道经典例题我是阿核 Python 动态规划算法 python leetcode
不多废话，直接开讲动态规划三大步骤动态规划是一种将问题分解为若干个子问题，并存储这些子问题的解（通常使用数组或矩阵等数据结构），以便在后续计算中重复使用，从而避免了重复计算，提高了算法的效率。需要注意的是，动态规划并非一种特定的算法，而是一种解决问题的思想和方法。在实际应用中，需要根据具体问题的特点来设计合适的动态规划算法。动态规划的根本在于用已知项的求出未知项，并再次调用已经求出的未知项来解决更
Python : CCF-CSP真题——坐标变换（其一）我是阿核 Python 算法 leetcode python 经验分享
试题编号：202309-1试题名称：坐标变换（其一）时间限制：1.0s内存限制：512.0MB问题描述：问题描述对于平面直角坐标系上的坐标(x,y)，小P定义了一个包含n个操作的序列T=(t1,t2,⋯,tn)。其中每个操作ti（1≤i≤n）包含两个参数dxi和dyi，表示将坐标(x,y)平移至(x+dxi,y+dyi)处。现给定m个初始坐标，试计算对每个坐标(xj,yj)（1≤j≤m）依次进行T
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不