吴师兄大模型

决策树算法全解析：从零基础到Titanic实战，一文搞定机器学习经典模型

Langchain系列文章目录

01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南
02-玩转 LangChain Memory 模块：四种记忆类型详解及应用场景全覆盖
03-全面掌握 LangChain：从核心链条构建到动态任务分配的实战指南
04-玩转 LangChain：从文档加载到高效问答系统构建的全程实战
05-玩转 LangChain：深度评估问答系统的三种高效方法（示例生成、手动评估与LLM辅助评估）
06-从 0 到 1 掌握 LangChain Agents：自定义工具 + LLM 打造智能工作流！
07-【深度解析】从GPT-1到GPT-4：ChatGPT背后的核心原理全揭秘

PyTorch系列文章目录

Python系列文章目录

机器学习系列文章目录

01-什么是机器学习？从零基础到自动驾驶案例全解析
02-从过拟合到强化学习：机器学习核心知识全解析
03-从零精通机器学习：线性回归入门
04-逻辑回归 vs. 线性回归：一文搞懂两者的区别与应用
05-决策树算法全解析：从零基础到Titanic实战，一文搞定机器学习经典模型

文章目录

Langchain系列文章目录
PyTorch系列文章目录
Python系列文章目录
机器学习系列文章目录
前言
一、决策树入门：从概念到应用
- 1.1 什么是决策树
- - 1.1.1 决策树的定义
  - 1.1.2 决策树的工作原理
- 1.2 决策树的应用场景
- - 1.2.1 现实中的案例
  - 1.2.2 为什么选择决策树
二、决策树的构建：从零到一
- 2.1 决策树的基本原理
- - 2.1.1 数据划分的核心思想
  - 2.1.2 停止条件有哪些
- 2.2 特征选择：如何找到最佳划分
- - 2.2.1 信息增益：基于熵的衡量
  - 2.2.2 基尼指数：简单高效的选择
  - 2.2.3 信息增益 vs 基尼指数
- 2.3 经典算法：ID3、C4.5和CART
- - 2.3.1 ID3算法
  - 2.3.2 C4.5算法
  - 2.3.3 CART算法
三、决策树的优化：剪枝技术
- 3.1 为什么要剪枝
- - 3.1.1 过拟合的风险
  - 3.1.2 剪枝的好处
- 3.2 剪枝的两种方法
- - 3.2.1 预剪枝：提前止步
  - 3.2.2 后剪枝：事后修剪
  - - （1）后剪枝的实现步骤
四、决策树的可视化：让模型“说话”
- 4.1 为什么需要可视化
- - 4.1.1 可视化的价值
- 4.2 如何可视化决策树
- - 4.2.1 使用Python实现
  - 4.2.2 可视化结果解读
五、决策树在实际项目中的应用：以Titanic生存预测为例
- 5.1 引言
- 5.2 案例研究：Titanic生存预测
- - 5.2.1 数据集简介
  - 5.2.2 获取数据集
- 5.3 数据预处理
- - 5.3.1 处理缺失值
  - 5.3.2 编码分类变量
  - 5.3.3 选择特征和目标变量
- 5.4 模型训练
- - 5.4.1 划分训练集和测试集
  - 5.4.2 训练决策树模型
- 5.5 模型评估
- - 5.5.1 计算准确率
  - 5.5.2 绘制混淆矩阵
- 5.6 可视化决策树
- - 5.6.1 使用plot_tree可视化
  - 5.6.2 特征重要性
六、总结

前言

你是否曾好奇，机器学习如何从海量数据中挖掘出隐藏的规律？或者，一个简单的模型如何帮助医生诊断疾病、银行评估信用，甚至预测泰坦尼克号上的生还者？答案就在决策树算法中。作为机器学习领域的“常青树”，决策树以其直观易懂和强大的实用性，深受初学者和专业人士的喜爱。我还记得自己第一次接触决策树时的兴奋——用几行代码，就能让计算机像人类一样“思考”问题、分步决策。那一刻，我意识到它的潜力远超想象。

这篇文章将带你走进决策树的世界，从零基础的构建过程，到信息增益与基尼指数的奥秘，再到剪枝优化和真实案例的实战演练。无论你是想快速入门机器学习，还是希望优化现有模型，这篇干货满满的指南都将点燃你的学习热情。

一、决策树入门：从概念到应用

1.1 什么是决策树

1.1.1 决策树的定义

决策树是一种树状结构的监督学习算法，通过一系列“问题”（特征测试）将数据集逐步划分，最终得出预测结果。它的结构包括：

根节点：整个数据集的起点。
内部节点：表示特征的测试条件。
分支：测试结果的不同路径。
叶节点：最终的类别标签（分类）或数值（回归）。

打个比方，决策树就像玩“20个问题”游戏：通过不断提问（比如“花瓣长度大于3厘米吗？”），逐步缩小范围，直到得出答案。

1.1.2 决策树的工作原理

假设我们要用决策树判断一个人是否喜欢运动。决策树可能会先问：“年龄小于30岁吗？”如果是，就进入下一层问题：“每周锻炼时间超过3小时吗？”最终得出“是”或“否”。这种分步决策的过程直观且易于理解。

1.2 决策树的应用场景

1.2.1 现实中的案例

决策树在各领域大放异彩：

金融：判断贷款申请者是否会违约。
医疗：根据症状预测疾病类型。
电商：分析用户购买偏好。

1.2.2 为什么选择决策树

决策树最大的优势是可解释性强，你能清楚地看到每个决策的依据。这在需要透明性的场景（如医疗诊断）尤为重要。

二、决策树的构建：从零到一

2.1 决策树的基本原理

2.1.1 数据划分的核心思想

决策树的构建是一个递归过程：从根节点开始，选择一个“最佳特征”划分数据集，使子集的“纯度”更高（即类别更一致）。这个过程持续进行，直到满足停止条件，比如所有样本属于同一类。

2.1.2 停止条件有哪些

所有样本属于同一类。
没有剩余特征可划分。
达到预设的最大深度。

2.2 特征选择：如何找到最佳划分

2.2.1 信息增益：基于熵的衡量

信息增益衡量的是特征划分后数据集“不确定性”的减少。不确定性用熵（entropy）表示，公式为：

$\text{Entropy}(D) = -\sum_{k=1}^{K} p_k \log_2 p_k ]$

其中，(p_k) 是第 (k) 类样本的比例。熵越小，纯度越高。

信息增益的计算是：

$\text{Gain}(D, A) = \text{Entropy}(D) - \sum_{v=1}^{V} \frac{|D_v|}{|D|} \text{Entropy}(D_v) ]$

选择信息增益最大的特征。比如，在判断“是否下雨”时，“湿度”可能比“温度”带来更大的信息增益。

2.2.2 基尼指数：简单高效的选择

基尼指数是另一种纯度指标，公式为：

$\text{Gini}(D) = 1 - \sum_{k=1}^{K} p_k^2 ]$

基尼指数越小，纯度越高。特征划分后的基尼指数为加权平均，选择基尼指数最小的特征。相比信息增益，基尼指数计算更快，常用于CART算法。

2.2.3 信息增益 vs 基尼指数

指标	优点	缺点
信息增益	理论依据强，直观	对多值特征有偏好，计算复杂
基尼指数	计算简单，适用于二叉树	对噪声稍敏感

2.3 经典算法：ID3、C4.5和CART

2.3.1 ID3算法

ID3用信息增益选择特征，适用于离散数据。缺点是偏好取值多的特征，且无法处理连续值。

2.3.2 C4.5算法

C4.5改进ID3，用信息增益比代替信息增益，还能处理连续特征和缺失值，更实用。

2.3.3 CART算法

CART（分类与回归树）用基尼指数，支持分类和回归，生成二叉树，应用范围更广。

三、决策树的优化：剪枝技术

3.1 为什么要剪枝

3.1.1 过拟合的风险

未经剪枝的决策树可能“长得太深”，完美拟合训练数据，但在新数据上表现不佳，这就是过拟合。

3.1.2 剪枝的好处

剪枝通过简化树结构，减少过拟合，提高泛化能力。

3.2 剪枝的两种方法

3.2.1 预剪枝：提前止步

在树生长时设置限制条件：

最大深度（如5层）。
最小样本数（如每个叶节点至少10个样本）。

优点：简单高效。
缺点：可能错过潜在的重要划分。

3.2.2 后剪枝：事后修剪

树完全生长后，基于验证集性能移除不必要的分支。
优点：更精确。
缺点：计算成本高。

（1）后剪枝的实现步骤

用全部训练数据构建完整树。
从底部向上，尝试移除每个节点。
用验证集评估性能，若移除后性能提升，则剪掉。

四、决策树的可视化：让模型“说话”

4.1 为什么需要可视化

4.1.1 可视化的价值

可视化能直观展示决策过程，帮助我们：

理解模型逻辑。
检查特征重要性。
发现潜在问题。

4.2 如何可视化决策树

4.2.1 使用Python实现

在Python中，sklearn提供了plot_tree函数。以下是示例代码：

from sklearn.tree import DecisionTreeClassifier, plot_tree
from sklearn.datasets import load_iris
import matplotlib.pyplot as plt

# 加载数据
iris = load_iris()
X, y = iris.data, iris.target

# 训练模型
clf = DecisionTreeClassifier(max_depth=3)
clf.fit(X, y)

# 可视化
plt.figure(figsize=(15, 10))
plot_tree(clf, filled=True, feature_names=iris.feature_names, class_names=iris.target_names)
plt.show()

关键代码解释：

filled=True：用颜色填充节点，颜色深浅表示类别纯度。
feature_names：显示特征名称。
class_names：显示类别名称。

运行后，你会看到一个清晰的树状图，展示每个节点的特征、阈值和预测结果。

4.2.2 可视化结果解读

假设上图显示“花瓣长度 ≤ 2.45”是根节点，左分支全是“setosa”类，说明这个特征很好地区分了一个类别。

五、决策树在实际项目中的应用：以Titanic生存预测为例

5.1 引言

决策树是一种简单却强大的机器学习算法，广泛应用于分类和回归任务。本章节通过一个经典案例——Titanic生存预测，展示如何在实际项目中使用决策树解决问题。我们将涵盖数据预处理、模型训练、评估和可视化的全流程，并提供丰富的代码示例，帮助您将理论转化为实践。

5.2 案例研究：Titanic生存预测

5.2.1 数据集简介

Titanic数据集包含泰坦尼克号乘客的信息，如年龄、性别、船舱等级等。目标是预测乘客是否幸存（survived列：0表示未幸存，1表示幸存）。

5.2.2 获取数据集

我们使用seaborn库加载Titanic数据集：

import seaborn as sns
import pandas as pd

# 加载数据集
titanic = sns.load_dataset('titanic')
print(titanic.head())  # 查看前几行数据

5.3 数据预处理

数据预处理是机器学习的重要步骤，确保输入数据适合模型训练。

5.3.1 处理缺失值

Titanic数据集中age和embarked列存在缺失值。我们用中位数填充age，用众数填充embarked：

# 填充age的缺失值
titanic['age'].fillna(titanic['age'].median(), inplace=True)

# 填充embarked的缺失值
titanic['embarked'].fillna(titanic['embarked'].mode()[0], inplace=True)

# 检查缺失值是否处理完毕
print(titanic.isnull().sum())

5.3.2 编码分类变量

决策树要求特征为数值型，因此将sex和embarked转换为数值：

# 将sex转换为0和1
titanic['sex'] = titanic['sex'].map({'male': 0, 'female': 1})

# 将embarked转换为one-hot编码
titanic = pd.get_dummies(titanic, columns=['embarked'], drop_first=True)

# 查看处理后的数据
print(titanic[['sex', 'embarked_Q', 'embarked_S']].head())

5.3.3 选择特征和目标变量

我们选择以下特征进行建模：pclass、sex、age、sibsp、parch、fare、embarked_Q、embarked_S，目标变量为survived。

# 选择特征和目标变量
features = ['pclass', 'sex', 'age', 'sibsp', 'parch', 'fare', 'embarked_Q', 'embarked_S']
X = titanic[features]
y = titanic['survived']

# 查看特征数据
print(X.head())

5.4 模型训练

5.4.1 划分训练集和测试集

将数据集分为训练集（80%）和测试集（20%）：

from sklearn.model_selection import train_test_split

# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

print(f"训练集样本数: {X_train.shape[0]}")
print(f"测试集样本数: {X_test.shape[0]}")

5.4.2 训练决策树模型

使用sklearn的DecisionTreeClassifier训练模型，设置max_depth=3以控制模型复杂度：

from sklearn.tree import DecisionTreeClassifier

# 初始化并训练模型
clf = DecisionTreeClassifier(max_depth=3, random_state=42)
clf.fit(X_train, y_train)

print("模型训练完成！")

5.5 模型评估

5.5.1 计算准确率

使用测试集预测并计算准确率：

from sklearn.metrics import accuracy_score

# 预测
y_pred = clf.predict(X_test)

# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print(f"模型准确率: {accuracy:.2f}")

5.5.2 绘制混淆矩阵

混淆矩阵展示模型的分类性能：

from sklearn.metrics import confusion_matrix
import matplotlib.pyplot as plt
import seaborn as sns

# 计算混淆矩阵
cm = confusion_matrix(y_test, y_pred)

# 绘制混淆矩阵
plt.figure(figsize=(6, 6))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

5.6 可视化决策树

5.6.1 使用plot_tree可视化

可视化决策树结构：

from sklearn.tree import plot_tree

# 绘制决策树
plt.figure(figsize=(15, 10))
plot_tree(clf, filled=True, feature_names=features, class_names=['Not Survived', 'Survived'])
plt.show()

5.6.2 特征重要性

分析每个特征对预测的贡献：

# 获取特征重要性
importance = clf.feature_importances_
feature_importance = pd.Series(importance, index=features).sort_values(ascending=False)

# 绘制特征重要性条形图
plt.figure(figsize=(10, 6))
feature_importance.plot(kind='bar')
plt.title('Feature Importance')
plt.xlabel('Features')
plt.ylabel('Importance')
plt.show()

六、总结

决策树不仅是一个算法，更是一种思维方式——它教会我们如何从复杂问题中找到清晰的路径。无论是理论的深入剖析，还是Titanic案例的动手实践，这篇文章都旨在让你不仅“知其然”，还能“知其所以然”。

决策树基础：从树状结构到工作原理，揭开算法直观易懂的面纱。
构建过程：通过信息增益和基尼指数选择最佳特征，递归打造一棵高效的树。
优化技巧：预剪枝与后剪枝双管齐下，解决过拟合难题，提升模型泛化能力。
可视化展示：用Python绘制决策树和特征重要性，直观理解模型决策过程。
实战应用：以Titanic生存预测为例，完整演示数据预处理到模型评估的全流程。

Java 中的并发集合（Concurrent Collections）详解与使用指南超级小忍 Java java 开发语言
前言在多线程编程中，共享数据结构的线程安全是一个关键问题。传统的集合类（如HashMap、ArrayList）并不是线程安全的，如果在并发环境下直接使用，可能会导致数据不一致、死锁等问题。为了解决这个问题，Java提供了一套线程安全的并发集合类，它们都位于java.util.concurrent包中。本文将详细介绍Java中常见的并发集合类，包括它们的实现原理、使用场景以及性能对比，帮助你更好地选
STM32微控制器的按键短按与长按检测 AI_Guru人工智能 stm32 单片机嵌入式硬件
在嵌入式系统开发中，按键是最常见的输入设备之一。STM32微控制器广泛用于各种项目，包括需要按键输入的场合。本文将介绍如何在STM32微控制器上实现按键的短按和长按检测。引言按键检测是嵌入式系统中的基础功能，它允许用户通过物理按键与设备进行交互。STM32微控制器提供了丰富的GPIO（通用输入输出）引脚，可以方便地连接按键并进行检测。短按和长按是两种常见的按键操作模式，短按通常用于触发一个事件或命
python-程序编程-实例“温度转换”
实例：温度刻画的两种不同的体系。摄氏度、华氏度需求：将两种不同的摄氏度进行转换。问题分析：输入：输入一个华氏度的温度或者摄氏度的温度值处理：根据温度标志进行温度转换。输出：输出一个带华氏度或者摄氏度的温度值。(f代表华氏度，c代表是摄氏度)c=(f-32)/1.8f=c*1.8+32代码如下：temp=input("请输入有符号的温度值")iftemp[-1]in['f','F']:c=(eval
AI产品经理成长记《零号列车》第一集邂逅0XAI列车黑客思维者 AI产品经理养成人工智能 AI产品经理大模型智能体
《零号列车》绝非传统意义上的AI产品经理教程——它是我沉淀二十多年跨行业数字化转型与工业4.0实战经验后，首创的100集大型小说体培养指南。那些曾在千行百业验证过的知识与经验，不再是枯燥的文字堆砌，而是化作一场沉浸式的学习旅程。这里没有生硬的理论灌输，而是用跌宕起伏的故事情节，串联起AI技术的底层逻辑。你会跟着角色的脚步推进剧情，在不知不觉中吃透机器学习、大模型应用等专业概念；更有深入浅出的技术拆
Modbus协议开发应用挑战赛（一）
问题1：Modbus协议在主从通信模式设计中，为何严格规定“从站仅能响应主站请求而无法主动发送数据”？这种设计对工业控制场景的实时性保障与通信可靠性维护存在哪些具体影响？参考解析：设计原因：Modbus诞生于1979年，当时工业现场多采用RS-485等半双工总线，主从模式能避免多设备同时发送数据导致的总线冲突。通过集中控制（主站轮询），简化了通信仲裁机制，降低硬件实现复杂度。实时性影响：优势：主站
STM32 CAN 通信
STM32CAN通信文章目录STM32CAN通信前言一、硬件连接二、软件配置三、CAN通信流程四、错误处理与调试总结前言控制器局域网（ControllerAreaNetwork,CAN）是一种应用广泛的串行通信协议，特别适用于工业控制和汽车电子领域。STM32微控制器内置了CAN控制器，支持CAN协议2.0A和2.0B，能够实现高效可靠的分布式通信。本文档旨在STM32平台上实现CAN通信功能，内
人工智能时代下的数据新职业：新兴工作岗位版图研究司南锤 economics 人工智能
目录摘要第一章：AI驱动的数据价值链重构1.1从“沉睡金矿”到“流动的血液”：数据作为核心经济资产的激活1.2知识的新经济学：零边际成本革命1.3AI作为新的“操作系统”：重塑产业竞争格局第二章：基石层：数据准备与质量保障中的角色2.1数据标注与标签领导力：数据标注经理/主管2.2“地面真实”的守护者：AI数据质量专家第三章：技术核心层：构建AI与机器学习全生命周期的工程角色3.1AI生产线架构师
蓝桥杯单片机之通过实现同一个按键的短按与长按功能
实现按键的短按与长按的不同功能问题分析对于按键短按，通常是松开后实现其功能，而不会出现按下就进行后续的操作；而对于按键长按，则不太一样，按键长按可能分为两种情况，一是长按n秒后实现后续功能，比如按键按下1s后开灯，第二种情况是长按超过n秒以上实现功能，例如按键按下超过1s则不断增加某一个参数的数值；对于按键检测，通常有两种方式，一种是使用循环进行检测，另一种是使用中断进行检测，对于短按按键，两种方
JavaScript语言基础全解析：语法、面向对象与异步编程白仑色前端系列 javascript udp 开发语言
引言：JavaScript的三大核心支柱JavaScript作为一门跨平台、多范式的编程语言，已从最初的网页脚本发展为全栈开发的基石。其语言基础可概括为三大核心：语法基础（变量、数据类型、控制流等）、面向对象与原型系统（独特的原型继承机制）、异步编程模型（处理非阻塞操作的核心方案）。掌握这三部分，不仅能写出规范的代码，更能深入理解JavaScript的设计哲学。本文将系统讲解这三大模块，每个知识点
服务器与工控机的区别解析 D-海漠其他
服务器和工控机虽然都是计算机，但它们的设计目标、使用环境和核心特性有本质的区别，就像轿车和越野车虽然都是车，但用途和构造截然不同。以下是它们的主要区别：核心设计目标：服务器：数据处理、存储、网络服务和应用托管。核心目标是高性能、高吞吐量、高可靠性、可扩展性和高可用性（通常通过集群、冗余实现）。它需要处理海量并发请求（如网页服务、数据库查询、文件共享、虚拟化等）。工控机：工业环境中的过程控制、数据采
创客匠人：你做了那么多内容，为什么用户一来就走？老蒋新思维创始人IP 内容运营知识变现知识付费
上周看到一条新闻让我陷入沉思OpenAI联合微软和美国教师联盟，投资超过2亿美元，培训40万名老师如何使用AI做教学设计、内容评估、互动反馈。很多教育工作者因此实现了效率大幅提升，甚至可以在一周内设计出完整的教学路径。可你有没有发现，同样的“AI+内容”的浪潮，正在逼近我们这些做知识付费的人。你可能花了几个月时间搭建课程体系，录了几十个视频，也做了海报、社群、预热活动。你说：“我真的很努力了。”但
【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts) 视频教程 - 基于wordcloud库实现词云图
大家好，我是java1234_小锋老师，最近写了一套【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts)视频教程，持续更新中，计划月底更新完，感谢支持。今天讲解基于wordcloud库实现词云图视频在线地址：2026版【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts+爬虫)视频教程（火爆连载更新中..
单片机长短按简单实现柒壹漆经验分享单片机相关单片机嵌入式硬件按键长短按
单片机长短按简单实现目录单片机长短按简单实现1原理2示例代码2.1按键实现3测试log1原理按键检测和处理的步骤如下：1：定时扫描按键（使用定时器定时扫描，也可以用软件延时或者系统心跳之类的方式，总之能保证每次扫描间隔时间固定并且在一个较小的范围即可）。2：扫描到有按键按下（通常是检测GPIO的电平状态来判断按键是否按下，具体情况需要结合实际硬件电路来看）。3：开始计时，记录按键持续按下的时间。4
【STM32单片机】STM32单片机按键实现长按、短按处理森冰单片机 stm32 嵌入式硬件
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、为什么要实现一个按键多个功能？二、使用步骤1.开启EXTI中断及NVIC配置2.外部中断处理3.定时器中断处理4.按键处理5.长按处理6.短按处理总结前言如何使用按键完成长按、短按，在本文中使用单片机stm32f103c8t6完成。提示：以下是本篇文章正文内容，下面案例可供参考一、为什么要实现一个按键多个功能？在设计过
C++ 面向对象 _Chipen c++开发语言
C++面向对象编程一个类可以定义无数个对象，每一个对象都有自己的成员变量，但是他们共享一套成员方法。构造函数的初始化列表和直接在构造函数中构造的区别：初始化列表是用来初始化成员类的，用来调用成员的构造函数的一个是先调用默认构造后初始化，一个是调用构造函数初始化即：inta=10和inta;a=10的区别。对于普通类型区别不大。初始化列表的默认初始化顺序：成员函数的定义顺序。静态成员变量：类内声明，
DPDK（25.03）零基础配置笔记 _Chipen DPDK 计算机网络
DPDK零基础配置笔记DPDK（DataPlaneDevelopmentKit，数据面开发工具包）是一个高性能数据包处理库，主要用于绕过Linux内核网络协议栈，直接在用户空间对网卡收发的数据进行操作，以此实现极高的数据吞吐。DPDK的核心价值是：使用轮询+巨页内存+用户态驱动，提升网络收发性能。适用场景：高频交易、软件路由器、防火墙、负载均衡器等对网络性能要求极高的系统。基本数据简要解释igb_
Python领域制造业的Python应用 Python编程之道 Python编程之道 python 开发语言 ai
Python在制造业中的应用：从自动化到智能制造关键词：Python、制造业、工业自动化、数据分析、机器学习、物联网、智能制造摘要：本文深入探讨Python编程语言在制造业中的广泛应用。从基础的自动化脚本到复杂的智能制造系统，Python凭借其丰富的库生态系统和易用性，正在重塑现代制造业。我们将分析Python在制造业中的核心应用场景，包括设备监控、质量控制、预测性维护和供应链优化等，并通过实际案
【机器学习】探索未来科技的前沿：人工智能、机器学习与大模型 AIGC零基础入门小白 AI大模型大模型教程人工智能机器学习科技 AI大模型 AIGC AI教程大模型教程
文章目录引言一、人工智能：从概念到现实1.1人工智能的定义1.2人工智能的发展历史1.3人工智能的分类1.4人工智能的应用二、机器学习：人工智能的核心技术2.1机器学习的定义2.2机器学习的分类2.3机器学习的实现原理2.4机器学习的应用2.5机器学习的示例代码2.6解释代码三、大模型：推动AI前沿发展的关键技术3.1大模型的定义3.2大模型的发展历程3.3深度学习与神经网络3.4大模型的优势与挑
为了你想要的，你有多努力过 BOHE薄荷123
昨天看《精进》这本书里有一个段落写道，努力是一种才能。非常赞的观点，书里大概的意思是：努力不是使力，费力，不仅是一种信念，不只是一种意志力的较量，而是一种策略性的活动。这个策略性体现在，在努力的过程中要有明确的方向，要有有效的学习方法，也要有对个人资源合理利用的能力。努力的前提除了自我激励以外，更需要思考。到底为了自己的目标实现最眼前需要做哪些准备，怎样才最是有效率的，怎样让一件事做起来更容易，更
现代人工智能综合分类：大模型时代的架构、模态与生态系统司南锤 economics 人工智能分类数据挖掘
目录引言：人工智能的第四次浪潮与新分类的必要性第一节：大型模型范式的基础支柱1.1规模化假说：算力、数据与算法的三位一体1.2“涌现能力”之谜：当“更多”变为“不同”1.3自监督学习（SSL）革命第二节：大型模型的技术分类学2.1Transformer：现代人工智能的架构基石2.2架构分化：一种功能性分类2.3提升效率与规模：专家混合模型（MoE）2.4超越Transformer：下一代架构的探索
单片机检测按键的短按、长按、持续按
单片机检测按键的短按、长按、持续按文章目录单片机检测按键的短按、长按、持续按前言一、硬件连接二、软件实现1.实现步骤2.按键结构体定义3.状态机执行4.读取按键状态5.页面调用示例总结前言在单片机系统里，按键检测是很基础的功能。按键的工作原理是借助机械触点的闭合与断开来实现电路的接通和断开。不过，在实际的电路中，当按键按下或者释放时，机械触点会产生抖动现象，这可能会使单片机检测到多次按键动作。所以
28.【.NET8 实战--孢子记账--从单体到微服务--转向微服务】--单体转微服务--币种服务（二）喵叔哟 .NET 8 .net 微服务 java
仅有币种服务还不够，记账应用还需支持不同币种间的转换。要实现这一功能，首先需要获取币种之间的汇率。因此，本文将介绍如何实现汇率的同步。一、汇率数据从何而来？汇率数据无时无刻都在变动，因此需要一个可靠的来源来获取最新的汇率信息。通常可以通过以下几种方式获取：爬取数据：一些专业的金融数据服务商提供汇率数据，可以通过订阅获取。手动输入：对于小型应用，可以手动输入汇率数据，但这不适合大规模或实时更新的应用
Java网络编程基础（TCP/IP协议、Socket编程）扬子鳄008 Java 网络 java tcp/ip
Java网络编程是现代软件开发中的一个重要组成部分，尤其是在构建分布式系统和网络服务时。Java提供了丰富的网络编程API，使得开发者能够轻松地实现各种网络通信功能。本文将详细介绍Java网络编程的基础知识，包括TCP/IP协议和Socket编程的基本概念和实现方法。TCP/IP协议简介TCP/IP（传输控制协议/互联网协议）是一组用于网络通信的标准协议集。它由多个层次组成，每个层次负责不同的功能
子图同构算法-VF2（java实现） xitianxiaofeixue java 数据结构
子图同构算法-VF2（java实现）最近在项目中用到了子图同构算法VF2，自己查找的时候发现csdn上没有太详细的博客，所以在这里记录一下。内容主要来自一篇论文（A(Sub)GraphIsomorphismAlgorithmforMatchingLargeGraphs）一、什么是VF2算法 VF2算法是一种子图同构算法，而子图同构我们可以这样定义：假设有两个图H=(VH,EH)H=(VH,EH
Python条件语句(if-elif-else)的完整用法与嵌套技巧梦幻南瓜 python python 网络服务器
引言条件语句是编程中最基础也是最重要的控制结构之一，它使程序能够根据不同条件执行不同的代码路径。Python中的条件语句以if、elif和else关键字实现，语法简洁但功能强大。本文将全面介绍Python条件语句的各种用法，从基础语法到高级嵌套技巧，通过大量代码示例、对比表格和实际应用场景，帮助你掌握条件语句的精髓。1.条件语句基础1.1基本语法结构Python条件语句的基本结构如下：if条件1:
防范DDoS攻击，服务器稳定性崩溃的根源与高效防御对策上海云盾第一敬业销售 ddos 服务器运维
DDoS攻击（分布式拒绝服务攻击）已成为危害服务器稳定性和业务连续性的主要因素之一。本文将深入探讨为什么服务器一遇到DDoS攻击就崩溃，以及如何从根本上实现有效防御和应对这一威胁，帮助企业提升网络安全水平。具体内容如下：随着互联网业务的不断扩展，企业服务器面临的安全威胁日益严峻，DDoS攻击（分布式拒绝服务攻击）已成为危害服务器稳定性和业务连续性的主要因素之一。本文将深入探讨为什么服务器一遇到DD
Java List 集合详解：从基础到实战，掌握 Java 列表操作全貌大葱白菜 java合集 java 开发语言后端学习个人开发
作为一名Java开发工程师，你一定在项目中频繁使用过List集合。它是Java集合框架中最常用、最灵活的数据结构之一。无论是从数据库查询出的数据，还是前端传递的参数列表，List都是处理这些数据的首选结构。本文将带你全面掌握：List接口的核心方法与特性常见实现类（如ArrayList、LinkedList、Vector、CopyOnWriteArrayList）List的遍历、增删改查、排序、线
Java 递归方法详解：从基础语法到实战应用，彻底掌握递归编程思想大葱白菜 java合集 java 开发语言个人开发后端学习
作为一名Java开发工程师，你一定在开发中遇到过需要重复调用自身逻辑的问题，比如：树形结构处理、文件夹遍历、斐波那契数列、算法实现（如DFS、回溯、分治）等。这时候，递归方法（RecursiveMethod）就成为你不可或缺的工具。本文将带你全面掌握：什么是递归方法？递归的三要素（边界条件、递归公式、递归方向）递归与循环的对比常见递归问题与实现（阶乘、斐波那契、汉诺塔、树遍历等）递归在真实项目中的
Java 匿名内部类详解：简洁、灵活的内联类定义方式大葱白菜 java合集开发语言后端 java 学习个人开发
作为一名Java开发工程师，你一定在开发过程中遇到过这样的场景：需要实现一个接口或继承一个类，但这个类只使用一次想简化代码结构，避免创建过多无意义的“一次性”类在事件监听器、线程任务、函数式编程中需要快速定义行为逻辑这时候，匿名内部类（AnonymousInnerClass）就派上用场了！本文将带你全面理解：什么是匿名内部类？匿名内部类的语法结构与执行流程使用场景与实际案例解析匿名内部类与Lamb
2025前端面试题全攻略：高频考点解析与实战指南
助力金三银四跳槽季，覆盖90%大厂核心考点，技术进阶+面试技巧双提升一、HTML/CSS核心篇1.语义化与布局实战问题1：如何用HTML5语义化标签优化新闻详情页？答案要点：使用包裹主体内容，划分章节标记发布时间，+处理图文SEO优势：提升关键内容权重，增强可访问性问题2：实现等间距三栏布局（中间自适应）.container{display:flex;gap:20px;/*关键：替代margin方
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f