小波LFZZB

决策树ID3算法

决策树

决策树概念

决策树，一种基于规则的机器学习方法，主要用于分类和回归，常用作机器学习中的预测模型。树形结构图，树中每个节点表示某个对象，每个分叉路径代表的某个可能的属性值，每个叶结点对应从根节点到该叶节点所经历的路径所表示的对象的值。它通过递归地划分数据空间并在每个分区内拟合一个简单的预测模型来工作。选择分区是为了在每个细分中最大化目标变量的同质性。

决策树特点

1. 树形结构

决策树由根节点、内部节点、分支和叶节点组成,呈树形结构。代表了从特征到类别的分类规则。

2. 递归分割

通过递归的方式将训练数据分割成更小的子集,在子集上重复创建树形结构,直到满足停止条件。

3. 信息增益特征选择

使用信息增益、信息增益比等指标选择对类别区分作用最大的特征作为分割属性。

4. 高维空间划分

决策树通过递归二元切分,将高维特征空间切分为不同的区域,与目标类别对应。

5. 概率输出

叶节点存储类别分布概率信息,根据样本特征,给出目标类别概率。

6. 剪枝优化

使用预剪枝和后剪枝优化决策树,防止过拟合。

决策树学习简单高效,输出模型可解释性强。主要应用于分类与回归等任务,是基本的机器学习方法之一。常用算法包括 ID3、C4.5、CART 等。

决策树实现

这里给出一个简单的决策树分类代码示例(使用Python中的scikit-learn库):

sklearn是机器学习常用工具包，包括了一些已经实现好的简单模型和一些常用数据处理方法、评价指标等函数。

from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier

# 加载鸢尾花数据集
iris = load_iris()
X = iris.data 
y = iris.target

# 建立决策树模型
clf = DecisionTreeClassifier()

# 训练模型
clf.fit(X, y)  

# 进行预测
y_pred = clf.predict(X)

# 模型评估
from sklearn.metrics import accuracy_score
print(accuracy_score(y, y_pred))

这个例子加载了著名的鸢尾花数据集,建立了一个决策树分类器,在训练数据上训练模型,并做出预测。然后计算预测准确率来评估模型效果。

决策树代码主要分为以下几步:

准备训练数据(特征矩阵X,目标向量y)
建立决策树模型对象
使用训练集训练模型
对测试集或新数据进行预测
使用评估指标评价模型效果

可以通过调节决策树的参数如最大深度、叶子节点最小样本数等来改进模型。这是一个简单的决策树分类的示例。

决策树的应用

决策树的应用如:

分类与回归。决策树可以用于解决分类问题,预测数据属于哪个类别。也可以用于回归,预测一个连续性数值。
分段函数逼近。决策树可以看作是对 piecewise constant function 的逼近,可以用来逼近复杂的非线性关系。
不需要进行变量选择。决策树可以自动进行特征选择,不需要人为进行特征筛选。
处理多种类型的数据。决策树可以同时处理离散型和连续型数据。
可解释性强。决策树结果比较直观,可以清楚地展示分类的决策路径,便于理解。
处理缺失值。决策树可以通过统计分枝中的样本数量,来处理含有缺失值的特征。
决策支持。决策树可以作为决策支持系统,帮助我们进行决策。
处理非线性数据。决策树可以模拟复杂的非线性关系。

主要应用包括信用评级、借贷决策、目标营销、医学诊断、质量控制、语音识别等领域。总体上,决策树适合解释性强且数据特征稳定的场景。

补充数据结构相关内容

包含叶节点(Leaf Node)、非叶节点(Non-leaf Node)、子节点(Child Node)、根节点(Root Node)、内部节点(Internal Node)、分支(Branch)。

决策树中的节点可以分为叶节点(leaf node)和非叶节点(non-leaf node),两者之间的主要区别是:

叶节点(Leaf Node):

树的终端节点,不再有子节点。
代表一个分类或预测。
包含归属于该节点的样本数目及分类结果。

非叶节点(Non-leaf Node):

也称为内部节点(Internal Node)。
不是树的终端节点,至少有两个子节点。
表示某个属性测试或者决策规则。
根据测试的结果,将样本集合分割到子节点中。

子节点(Child Node):

非叶节点的下级节点。
继承自上级节点的样本,根据上级节点的测试将样本进一步分割。
一个非叶节点可有多个子节点(通常是2个)。

因此：

叶节点是终端节点,给出分类决策。
非叶节点根据测试对数据进行分割。
子节点继承自父节点的数据并进行进一步的分割。

所以它们之间是树结构的层级关系,通过递归地分割样本空间来学习决策规则。

根节点(Root Node):

是树形结构的起点,位于决策树的顶端。
根节点没有进入分支,包含了整个训练数据集。

内部节点(Internal Node):

除根节点和叶节点以外的节点都是内部节点。
代表了某个特征上的测试或者分割操作，一个内部节点可以分支成多个子节点。

根节点和内部节点主要有以下不同:

根节点只有一个,位于树顶,而内部节点可以有多个。
根节点包含全部训练数据,内部节点只包含部分训练数据。
从根节点开始递归进行特征测试和数据分割,内部节点是分割后的子集。
根节点没有分支条件,内部节点有针对某特征的具体分割条件。
数据会从根节点 recurs 到内部节点,逐步减少,最后到达叶节点。

所以根节点是决策树的起点,内部节点代表了数据被递归分割的中间过程。它们共同定义了决策树的树形结构。

分支(Branch):

在树中,分支是父节点和子节点之间的连接。一个节点可以有多个分支,分支代表节点间的关系。

分支通常有以下几个关键特征:

分支连接两个节点,代表节点间的逻辑关系。
分支常有方向性,指明了从一个节点到达另一个节点的路径。
分支可以带有权重信息,表示节点间连接的代价或距离。
遍历分支可以访问树或图的所有节点。
删去某些关键分支可以切断节点间的连通性。
分支具有动态性,树和图结构可以通过添加和删除分支进行修改。

所以分支是组织节点关系,定义树形或图形数据结构拓扑结构的核心元素,它反映了数据之间的逻辑关联。

ID3算法

ID3概念

ID3（Iterative Dichotomiser 3）算法由Quinlan提出，是一种决策树学习算法，用于从训练数据集中构建决策树模型。它是基于信息增益准则来选择最佳属性进行分割的。

ID3算法的基本思想是通过在每个节点选择最佳属性来构建决策树。它使用信息增益作为属性选择的准则，信息增益表示在给定属性的条件下，类别的不确定性减少的程度。

具体步骤如下：

从根节点开始，选择最佳属性作为当前节点的判断条件，将训练样本划分为不同的子集。
对于每个子集，如果所有样本都属于同一类别，则将该子集标记为叶节点，并将该类别作为输出结果。
如果子集中的样本属于不同的类别，则递归地应用步骤1和步骤2，直到所有样本属于同一类别或者已经没有属性可用为止。

ID3算法的优点是简单易懂，计算效率高。然而，它也存在一些缺点，例如对于连续型属性处理不方便，容易产生过拟合等问题。针对这些问题，后续的C4.5、CART等算法对ID3进行了改进和扩展。

ID3算法原理

ID3算法的基本原理:

1. 计算当前数据集D的信息熵Ent(D),表示数据集的混乱程度。

2. 对每一个特征A,按其可能取值计算信息增益(IG):
Gain(A) = Ent(D) - ∑Values_v(A) * Ent(Dv)

其中Dv表示在特征A取值为v的数据子集。熵越大，IG越大。

使训练样本被更完美地分类，当所有属性熵增为0或不再有明显变化时停止分裂节点。

3. 选择信息增益最大的特征作为节点的分割属性。

4. 用该特征的信息增益最大的取值,将D分割为若干非空子集{D1, D2,...}。

5. 递归地对每一个子集调用步骤1-3,构建决策树,直到满足停止条件。

6. 终止条件:数据集D的所有实例属于同一类C。则将节点标记为C类叶节点。

7.最佳属性节点:倾向于使用简洁的具有较少节点的树

8.归纳偏置：

假设空间H是作用在样本集合X上的，没有对假设空间作限制。
偏向于在靠近根节点处的属性具有更大信息增益的树。
- 尝试找到最短的树。
- 对假设具有一些偏好(描述偏置，preference)，而不是对假设空间做限制(描述偏置,restrictions)。
奥卡姆剃刀(Occam's Razor):偏向于符合数据的最短的假设。

算法伪代码:

ID3(D, A)
1. If all examples in D belong to the same class C, return leaf node labeled C
2. If A is empty, return leaf node with majority class in D
3. Choose attribute A with maximum information gain to split on
4. Split D into {D1, D2,...} on attribute values {v1, v2,...} of A
5. Return node with attribute A and branches ID3(D1, A), ID3(D2, A),...

ID3算法特点

主要优点：

1. 简单易于理解

ID3算法采用简单的信息增益准则选择特征,生成决策树的过程容易理解。

2. 不需要预处理数据

ID3可以直接处理原始数据,不需要进行特征归一化、标准化等预处理。

3. 可以处理离散和连续数据

ID3可以处理离散类别特征,也可对连续特征进行离散化后处理。

4. 对缺失值具有一定的容错性

ID3使用不同的分枝样本数量来处理缺失信息。

5. 对异常值具有一定的鲁棒性

信息增益准则对异常值较为稳定,不易受其影响。

6. 可以排序重要特征

根据信息增益大小可以得到特征重要性排序。

7. 没有参数需要选择和调整

ID3自身没有参数需要人工设定,使用简单。

8. 计算效率高,分类速度快

ID3决策树学习和预测的计算复杂度不高。

9. 输出模型简单易解释

ID3决策树模型可以可视化,利于解释,这是其最大优点。

总体来说,ID3算法简单、高效,输出模型可解释性强,适合作为入门算法学习。

主要缺点：

1. 只支持分类,不支持回归

ID3只能生成分类决策树,不能处理回归问题。

2. 只支持离散属性,不能处理连续属性

ID3算法在处理连续属性时需要进行离散化,信息损失影响效果。

3. 存在过拟合问题

ID3倾向于生成过深过复杂的决策树,导致过拟合。

4. 对训练数据敏感

训练数据集的细微变化可能导致完全不同的决策树。

5. 无剪枝处理

ID3没有后剪枝或预剪枝来控制树的复杂度。

6. 对属性值缺失敏感

ID3对缺失属性信息的处理比较简单,效果不佳。

7. 属性选取准则单一

ID3只使用信息增益作为属性选择标准,容易偏向高基尼指数的属性。

8. 多值属性处理问题

ID3处理多值属性时分裂出的分支过多,信息增益低。

9. 只能处理分类标签完全互斥的问题

ID3不能很好地处理类别标签互相重叠的问题。

后继算法如C4.5对许多问题进行了改进,但基本思路类似,需要配合剪枝等方法来提高效果。

总体上,决策树更适用于类区分明显且特征稳定的数据集。

综上所述，决策树对于预测非常有用，同时也提供了复杂数据的可解释模型，有助于深入了解核心关系。它们的可解释性和速度使它们对各种各样的问题都非常有效。

【深度学习】Adam（Adaptive Moment Estimation）优化算法辰尘_星启机器学习--深度学习深度学习算法人工智能 Adam pytorch python
概述Adam算法结合了动量法（Momentum）和RMSProp的思想，能够自适应调整每个参数的学习率。通过动态调整每个参数的学习率，在非平稳目标（如深度神经网络的损失函数）中表现优异目录基本原理和公式笼统说明：为什么Adam算法可以帮助模型找到更好的参数基本概念动量（Momentum）：跟踪梯度的指数衰减平均（一阶矩），加速收敛并减少震荡。自适应学习率：跟踪梯度平方的指数衰减平均（二阶矩），调整
机器视觉3D上下料技术上的分析视觉人机器视觉杂说 3d c#人工智能 AI编程 opencv 开发语言
机器视觉3D上下料是工业自动化领域的重要应用，通过3D视觉技术引导机器人完成物料的精准抓取、定位和放置，尤其适用于复杂、无序或高精度的场景。以下是其核心内容梳理：核心组成3D视觉系统：硬件：常用3D相机（结构光、ToF、双目视觉等），如Kinect、IntelRealSense、工业级品牌（Keyence、康耐视，苏州大视通智能科技有限公司）。软件：点云处理（如PCL库）、三维匹配算法（ICP、深
算法竞赛中常用的STL容器メ稀饭你的笑 stl 算法 c++开发语言
目录前言一、STL是什么？二、竞赛中常见STL的容器1.string类2.vector3.stack4.queue5.priority_queue6.set7.map8.pair总结前言在我们的算法竞赛中，为了节约时间，我们不可能去手撕一个数据结构，所以在赛场上我们就要引入STL，以便我们节约时间，能有更多的时间处理更复杂的算法。一、STL是什么？STL（StandardTemplateLibra
C++ STL 算法竞赛常用模板归纳汇总小桥儿流水人家 c++算法开发语言蓝桥杯 stl
向量vector(相当于可变长数组）/*STL库vector、deque、list、set、map、multiset、multimap、unordered_set、unordered_map、unordered_multiset、unordered_multimap、stack、queue、priority_queue、string、pair*/#include#includeusingnames
putty运行python代码_当我关闭putty时如何保持python脚本运行 weixin_39943000 putty运行python代码
我准备在VPS上运行Ubuntu上的python脚本.这是机器学习培训过程,因此需要花费大量时间进行培训.如何在不停止该过程的情况下关闭腻子.解决方法:您有两个主要选择：>使用nohup运行命令.这会将它与您的会话取消关联,并在断开连接后让它继续运行：nohuppythonScript.py请注意,该命令的stdout将附加到名为nohup.out的文件中,除非您重定向它(nohuppythonS
算法竞赛C++常用STL（自用收藏！！！！！！） gusiler 算法 c++stl 数据结构算法
①vectorvector：又称变长数组，定义在头文件中，vector容器是动态空间，随着元素的加入，它的内部机制会自动扩充空间以容纳新的元素。因此vector的运用对于内存的合理利用与运用的灵活性有很大的帮助。vector的定义方式vectorv;//定义一个vector，其中的元素为int类型vectorv[N];//定义一个vector数组，其中有N个vectorvectorv(len);/
benchmark和baseline的联系与区别 Lntano__y 人工智能深度学习机器学习
在深度学习算法中，benchmark（基准）和baseline（基线）是两个常用的概念，用于评估算法的性能和进行比较。尽管它们有一些相似之处，但它们在定义和使用上有一些区别。Benchmark（基准）：基准是指作为参考标准的一组算法或数据集，通常是在特定任务或领域中广泛接受的准则。基准的目标是提供一个衡量算法性能的标准，以便其他算法可以与之进行比较。基准可以是一种算法、一个数据集或者是两者的结合。
同一个问题看看Grok3怎么回答-什么是智能体？释迦呼呼 AI一千问架构深度学习人工智能机器学习自然语言处理
关键要点研究表明，智能体（可能是“智能代理”的意思）在人工智能中是一个能够感知环境、自主行动以实现目标的系统。证据倾向于认为，智能体可以是简单的（如恒温器），也可以是复杂的（如自动驾驶汽车），并可能通过机器学习改进性能。关于“智能体”这一术语，存在争议，可能指的是人工智能中的智能代理，或在某些上下文中指具有物理身体的AI系统（如机器人）。什么是智能体？定义智能体在人工智能中似乎是一个能够感知其环境
C/C++算法编程竞赛标准模板库(STL)篇：队列(queue) BoFeather C/C++算法学习之路 c++c语言算法 visual studio
目录前言这个栏目是对我算法学习过程的同步记录，我也希望能够通过这个专栏加深自己对编程的理解以及帮助到更多像我一样想从零学习算法并参加竞赛的同学。在这个专栏的文章中我会结合在编程过程中遇到的各种问题并提出相应的解决方案。当然，如果屏幕前的你有更好的想法或者发现的错误也欢迎交流和指出！不喜勿喷！不喜勿喷！不喜勿喷！这章的内容非常重要！！那么事不宜迟，我们马上开始吧！一、queue队列1.基本介绍2.q
决策树（Decision Tree）：机器学习中的经典算法 Jason_Orton 机器学习算法决策树随机森林人工智能
1.什么是决策树？决策树（DecisionTree）是一种基于树形结构的机器学习算法，适用于分类和回归任务。其核心思想是通过一系列的规则判断，将数据集不断划分，最终形成一棵树状结构，从而实现预测目标。在决策树中，每个内部节点表示一个特征，每个分支代表一个特征的取值，每个叶子节点对应一个类别或预测值。决策树的目标是构建一棵能够有效区分不同类别的树，并在测试数据上保持较好的泛化能力。2.决策树的工作原
算法与竞赛(第7章) - C++与STL基础三：队列以及优先队列的应用 Ssaty. 算法 c++动态规划
第1关：STL模板之queue实例一：最少个数本关任务：给定N个非负整数，求解至少需要选多少个连续的数，它们的和不小于给定的整数S，特别的，若没有解，则输出0。//请在这里补充代码，完成本关任务/*********Begin*********/intn;ints;queueque;intans=
AI产品大模型学习指南：清晰路线，AI产品经理必备知识点一网打尽！_AI产品经理 AGI大模型学习人工智能产品经理 LLM 大模型学习学习知识图谱 AI产品经理
一、AI产品经理知识扫盲1️⃣【AI的产品形态到底是什么】？没有固定形态。实际上AI只是一种对传统产品或服务赋能的手段而已，将各种“中间件”（通常是一种训练好的模型，当输入一定数据后自动返回一定的输出值）、传感器等不同形式的软件、硬件融入传统产品或服务的使用或体验流程中。AI只是一种工具而已，产品的终极目标仍然不变为用户创造最大价值，提供最佳用户体验。2️⃣【AI产品的三要素】算法+计算能力+数据
学习总结项目苏小夕夕学习人工智能深度学习机器学习
近段时间学习了机器学习、线性回归和softmax回归、多层感知机、卷积神经网络、Pytorch神经网络工具箱、Python数据处理工具箱、图像分类等的知识，学习了利用神经网络实现cifar10的操作、手写图像识别项目以及其对应的实验项目报告总结。项目总结本次项目我使用了VGG19模型、AlexNet模型和已使用的VGG16模型进行对比，在已有的条件下，对代码进行更改是，结果展示中，VGG19模型的
C++算法竞赛常用STL知识笔记 a东方青个人笔记 c++算法笔记
最后更新于2024-11-15下标访问vector,deque,map可以用下标访问vectorstd::vectorv={1,2,3,4,5};intelement=v[2];//访问下标为2的元素，这里将得到3。dequestd::dequedq={21,22,23,24,25};intitem=dq[1];//访问下标为1的元素，这里将得到22。map特殊：1：如果下标对应的键已经存在于ma
C++ 算法竞赛STL以及常见模板 fqsword STL c/c++常用函数语法 c++算法
目录STL/*═══════════════Vector═══════════════*//*════════════════Pair════════════════*//*══════════════String════════════════*//*══════════════Queue═════════════════*//*═════════PriorityQueue═══════════
使用Python从酷狗音乐网站下载音乐 0zxm 爬虫实战项目 python 网络爬虫前端 xhtml
当然可以！以下是你的博客文章的Markdown格式：使用Python从酷狗音乐网站下载音乐!!!本程序仅供学习参考1.程序介绍这个程序使用了Python的requests库，以及一些哈希算法来实现从酷狗音乐网站搜索歌曲并下载的功能。下面是它的主要功能：从酷狗音乐网站搜索歌曲展示搜索结果列表选择并下载指定的歌曲2.代码实现#代码实现部分，包括get_signature、get_list、show_l
华为OD面经 - 二战失利C++视觉算法华为题库c++cjava
24届河南大学本，计算机科学与技术专业。因为考研没有成功，毕业后一直在家准备二战，二战再次失利，gap半年后决定找工作，找了一些国企和私企的面试机会，但一直没有找到满意的offer。经过朋友推荐，决定尝试华为OD的岗位。由于本科期间有做过一些C++相关的项目和开源贡献，投递了C++视觉算法岗位。机考准备：因为考研期间的刷题基础还在，所以准备机考并没有花太多时间。主要集中在数据结构和算法题目上，尤其
基础算法：归并排序奋斗吧！骚年！ #基础算法 C++归并排序递归
归并排序C++模板：注意：需要用到辅助数组，帮助两个部分进行合并时的结果保存intq[N],tmp[N];voidmerge_sort(intq[],intl,intr){if(l>=r)return;intmid=l+r>>1;merge_sort(q,l,mid);merge_sort(q,mid+1,r);inti=l,j=mid+1,k=0;while(iusingnamespacestd
数学建模与优化算法在确定X和Y值时，如何处理实验数据的不确定性？学术乙方油纸绝缘算法经验分享
在数学建模与优化算法中处理实验数据的不确定性以确定油纸绝缘系统中的X和Y值，可以参考以下方法和步骤：建立数学模型油纸绝缘系统的几何结构可以用X-Y模型来描述，其中X表示挡板厚度与总厚度的比值，Y表示间隔器宽度与总宽度的比值。这些参数直接影响油纸绝缘的介电特性。通过实验数据（如介电谱曲线）和理论模型，可以建立数学方程来描述X和Y对介电特性的影响。引入不确定性建模实验数据通常存在测量误差、环境变化等因
【C++】树状数组的使用、原理、封装类、样例软件架构师何志丹 #算法基础 c++数据结构树状数组求和异或和最值动态开点
前言本博文代码打包下载C++算法与数据结构分类汇总最常见的应用有序集合包括若干整数,求小于x的数量。autoit=s.lower(x),it-s.begin()，这个时间复杂度是O(n)。由于查询和插入交替进行，故不能用向量。树状数组的用途令原始数组是a，长度为n。基础操作一，求前缀和。即∑j:0ia[j]\sum_{j:0}^ia[j]∑j:0ia[j]。时间复杂度：O(logn)。二，a[i]
【初探数据结构】带环链表：原理、判断与数学证明我想吃余数据结构篇数据结构链表
欢迎讨论：在阅读过程中有任何疑问，欢迎在评论区留言，我们一起交流学习！点赞、收藏与分享：如果你觉得这篇文章对你有帮助，记得点赞、收藏，并分享给更多对数据结构感兴趣的朋友文章目录一、何为带环链表1.1带环链表的定义1.2典型示例二、环路检测：Floyd判圈算法2.1快慢指针实现2.2算法特性三、数学证明与深度解析3.1步长差为1的必然性证明（快2步/慢1步）3.2广义步长分析（快n步/慢1步）四、环
2025年大模型AI产品经理学习路线图：零基础到精通，一篇收藏，开启学习之旅！悄悄努力然后惊艳所有人 AGI大模型老王人工智能产品经理学习 AI大模型大模型学习大模型 AI产品经理
随着人工智能技术的发展，尤其是大模型（LargeModel）的兴起，越来越多的企业开始重视这一领域的投入。作为大模型产品经理，你需要具备一系列跨学科的知识和技能，以便有效地推动产品的开发、优化和市场化。以下是一份详细的大模型产品经理学习路线，旨在帮助你构建所需的知识体系，从零基础到精通。一、基础知识阶段1.计算机科学基础数据结构与算法：理解基本的数据结构（如数组、链表、树、图等）和常用算法（如排序
Nginx高性能负载均衡：算法与策略详解墨夶 Nginx学习资料1 nginx 负载均衡算法
Nginx高性能负载均衡：算法与策略详解在当今快速发展的互联网时代，Web应用程序需要处理大量并发请求以提供稳定高效的用户体验。为了应对日益增长的流量压力，负载均衡成为了一种不可或缺的技术手段。Nginx作为一款高性能的HTTP和反向代理服务器，凭借其卓越的性能和灵活的配置能力，在负载均衡领域占据了举足轻重的地位。本文将深入探讨如何利用Nginx实现高效、可靠的负载均衡，涵盖常用负载均衡算法、配置
深度学习和机器学习的差异 The god of big data 教程深度学习机器学习人工智能
一、技术架构的本质差异传统机器学习（MachineLearning）建立在统计学和数学优化基础之上，其核心技术是通过人工设计的特征工程（FeatureEngineering）构建模型。以支持向量机（SVM）为例，算法通过核函数将数据映射到高维空间，但特征提取完全依赖工程师的领域知识。这种"人工特征+浅层模型"的结构在面对复杂非线性关系时容易遭遇性能瓶颈。深度学习（DeepLearning）作为机器
第十一届蓝桥杯总结（广东省赛区一等奖、全国总决赛二等奖）可乐学算法思考-总结-感悟蓝桥杯 ACM 算法
其实这本来是上半年的比赛，由于疫情就拖到了下半年，一共本来有四五场比赛的，好多都参加不了，就只剩下了蓝桥杯和天梯赛，今年真的太难了，一个疫情打乱了好多计划。本来是抱着拿javab组国特去的，无奈最后拿了个国二，省赛发挥得不好，但省一的排名还是比较前，国赛感觉发挥一般般，没想到拿了个国二。接下来说下备赛，大四的时候基本没怎么备赛，不过还是经常上leetcode刷题，刷那些经典算法的题目，比如
计算机学习的五大避坑指南新手必藏编程诗人华仔架构设计学习 java 软件工程 golang 开发语言 c语言 python
避坑一：盲目跟风学习编程语言技术性深化：在选择编程语言时，要考虑语言的特点、适用场景以及未来发展趋势。例如，Java适合企业级应用开发，Python在数据分析和人工智能领域有广泛应用，而JavaScript则是前端开发的基础。明确自己的职业发展方向，选择与之匹配的语言进行深入学习。避坑二：忽视基础知识的掌握技术性深化：深入理解算法如排序、搜索等，熟悉常见的数据结构如链表、栈、队列、树等，并掌握设计
PyBroker: 使用Python进行机器学习驱动的算法交易指南任铃冰Flourishing
PyBroker:使用Python进行机器学习驱动的算法交易指南pybrokerAlgorithmicTradinginPythonwithMachineLearning项目地址:https://gitcode.com/gh_mirrors/py/pybroker一、项目目录结构及介绍PyBroker项目遵循了清晰的组织结构来简化其源码管理和维护。以下是该仓库的主要目录及其简介：├──docs#文
必看！计算机毕设答辩高分技巧，让你脱颖而出源码姑娘毕业设计
必看！计算机毕设答辩高分技巧，让你脱颖而出一、答辩前的充分准备：技术与内容的“双向打磨”1.吃透项目，技术实现了然于胸计算机毕设的核心在于技术逻辑与系统设计的合理性。答辩前需反复回顾代码实现、架构设计、数据库模型等关键细节，确保能清晰阐述以下问题：技术选型依据：为何选择SpringBoot而非其他框架？所选算法的优势与局限性是什么？系统功能验证：如何通过测试用例或用户反馈验证系统可行性？若涉及机器
技术人实测 | 如何用AI工具2分钟突破知网AIGC检测线 LL06210721 人工智能 AIGC
最近在GitHub发现个有意思的本地化算法工具，其核心是通过对抗式语义重组技术重构文本逻辑链。测试时发现：将GPT生成的论文导入后，系统会保留原始参考文献格式，同时用学术同义词替换引擎重写表达结构。实测数据：某985实验室的AI生成稿经处理，知网AIGC率从38%→9.7%（检测截图已脱敏），维普重复率从24%→8.3%。工具最实用的三个细节：保留公式编号和图表位置不变支持LaTeX源码级修改追踪
从前端程序员到大模型工程师的转型攻略七七Seven～前端语言模型人工智能学习 chatgpt 算法
在科技日新月异的今天，人工智能（AI）特别是大规模预训练模型（大模型）的发展正引领着新一轮的技术革命。对于一位有志于从专注于用户界面设计和开发的前端程序员转向这个充满潜力领域的专业人士来说，这不仅是一次技术栈的转换，更是一个思维方式和个人职业发展的重大转变。本文将提供一个详尽的指南，帮助你顺利地完成这一过渡。第一阶段：打牢基础（第1-4周）深入了解AI与机器学习概念理解：阅读相关书籍、在线课程或观
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开