Trade Off

PRML第十四章读书笔记——Combining Models 贝叶斯模型平均、委员会bagging、提升方法/AdaBoost、决策树、条件混合模型/混合线性回归/混合逻辑回归/【层次】混合专家模型

（终于读到最后一章了，吼吼！激动呀。我总感觉combining models已经有点频率派方法的味道了。所以接下来要读ESL？）

14.1 Bayesian Model Averaging
14.2 Committees
14.3 Boosting
- - P659 最小化指数误差
  - P661 boosting的误差函数
14.4 Tree-based Models
14.5 Conditional Mixture Models
- - P667 线性回归模型的混合
  - P670 逻辑回归模型的混合
  - P672 混合专家 mixtures of experts
  - P673 层次混合专家 hierarchical mixture of experts (HME)
*后记

委员会committe：训 $L$ 个不同的模型，然后取平均做预测
提升方法boosting：committee的变种，串行学一堆模型，依据之前模型的表现调整误差函数
决策树decision tree：如何把决策树看作是组合模型？从一堆模型中选一个，做决策，而不是平均。即对不同的输入区域用不同的模型
条件混合模型conditional mixture models：决策树是一种很硬的、平行于坐标轴的区域划分，可以采用一种概率模型去进行组合。例如有 $K$ 个模型，形式化为

该混合概率分布的模型称为专家混合mixtures of experts. 该模型和5.6节的混合密度网络密切相关

14.1 Bayesian Model Averaging

贝叶斯模型平均和组合模型并不相同
组合模型如混合高斯，生成过程为

贝叶斯模型平均则是有几个不同的模型，索引为 $h=1,\dots,H$ ，并有概率 $p (h)$
（例如其中一个模型是混合高斯，一个模型是混合柯西分布等；再例如线性回归中参数先验分布，不同参数对应不同的模型）
数据集的生成过程为

贝叶斯模型平均实际上假设了只有一个模型用于生成整个数据， $h$ 上的概率仅仅是对于究竟是哪个模型在生成的不确定性。随着数据集规模增大，这个不确定性会减小，后验分布 $p(h|\bm X)$ 会集中到模型中的一个（例如线性回归的参数后验）
贝叶斯模型平均中，整个数据集由单一模型生成，相反，用组合模型时，数据集中的不同数据点可以由隐变量 $z$ 的不同值对应分量生成

上述是关于 $p(\bm X)$ 的讨论，但同样适用于 $p(\bm x|\bm X)$ ，以及 $p(\bm t|\bm x, \bm X, \bm T)$ 等

14.2 Committees

委员会committe：训 $L$ 个不同的模型，然后取平均做预测
该方法主要是用来降variance，例如图3.5中的模型平均

自助聚集bootstrap aggregation/bagging：对数据集的重采样构造

其动机是，如果真实回归函数是 $h(\bm x)$ ，模型输出则可以写成

平均平方和损失为

各个模型独立预测的平均误差为

式14.7的委员会方法预测的期望误差为

如果假定误差是0均值且不相关的，即

那么易得

不过有一个严重的问题，就是需要假设每个模型之间是不相关的，但是实际中，误差通常相关性很高。导致增益很小。不过可以证明， $E_{COM}\leqslant E_{AV}$ （习题14.3，14.4，好像需要误差函数关于预测值是凸的），也即委员会一定是比单个模型的平均误差有提升的

14.3 Boosting

提升方法boosting：是committee的变种，串行学一堆模型，依据之前模型的表现调整误差函数
相比于委员会，boosting希望能得到更多的提升。就算基分类器的性能仅仅稍好于随机猜测，即弱分类器，boosting也能有很好的表现

AdaBoost：adaptive boosting.

P659 最小化指数误差

提升方法起源于统计学习理论，得到泛化误差上界，不过这些上界非常宽松，没有实际价值
Friedman et al. (2000)给出了一种不同的boosting解释，说明adaboost是关于指数误差的序列最小化
考虑指数误差函数

其中

$t_n\in \{-1, 1\}$ 是label，目标是最小化 $\alpha,y$
假定 $y_1,\dots, y_{m-1},\alpha_1, \dots,\alpha_{m-1}$ 给定，只关于 $\alpha_m,y_m$ 最小化，误差函数可以写成

其中 $w_n^{(m)}=\exp \{-t_n f_{m-1}(\bm x_n)\}$ ，记 $\mathcal T_m$ 为 $y_m$ 分对的数据集合， $\mathcal M_m$ 是分错的数据集合，那么误差函数可以写为

上式关于 $y_m$ 的优化，第二项是常量，所以实际上就是在优化式14.15；关于 $\alpha_m$ 的优化，得到了式14.17. 这都是和AdaBoost的算法流程里一致的
接着考察 $w$ ，从式14.22注意到

使用代换

得到

其中 $\exp(-\alpha_m/2)$ 独立于 $n$ ，对所有项都一样，丢掉不影响结果，由此得到式14.18
最后做决策时， $f$ 中的系数 $1 / 2$ 也可以丢掉，而不影响符号

P661 boosting的误差函数

为了获得更多关于指数误差函数的直觉insight，考虑如下误差函数

由变分法求上式关于 $y$ 的最小化，易得

所以它是log-odd函数 $\ln(x/(1-x))$ 缩放一半，也即AdaBoost在基分类器的线性组合形成的函数空间中寻找log-odd函数的形式，同时受约束于序列优化策略
在交叉熵损失中，如果 $t\in \{-1, 1\}$ ，则一个数据点的误差函数可以写为 $\ln (1+\exp (-yt))$ ，（回顾7.1.2节）
不同loss function的比较如图所示

上图中，为了把所有loss都规约到 $(0, 1)$ 点，cross-entropy除以 $\ln2$

最小化cross-entropy，导出逻辑回归
最小化hinge-loss，导出SVM
序列最小化指数损失，导出AdaBoost

指数损失的缺点：

过度惩罚了 $ty(\bm x)$ 过小的情况，所以指数损失没有cross-entropy那样对离群点鲁棒
指数函数不能解释成某个定义很好的概率模型的对数似然（习题14.8）
难以扩展到多类情况（周志华-《集成方法》一书2.5节中给出了几种扩展）

把提升方法表示为指数误差下可加性模型的最优化，扩展出一大类相似算法——包括使用其他误差函数的多类推广和回归。在回归中，如果用平方和损失，那么序列最小化的新增模型就变成了拟合残差 $t_n - f_{m-1}(\bm x_n)$ ，也即梯度提升（Friedman 2001），可以参考《统计学习方法》

（《西瓜书》第8章阅读材料指出：AdaBoost不容易过拟合，但是理论上仍然很难解释。这个现象的的严格表述是“为什么AdaBoost在训练误差达到0之后，继续训练，仍能提高泛化性能”，如果一直训练下去，过拟合终将出现）

14.4 Tree-based Models

决策树Decision Tree：如何看作是组合模型？决策树可以认为是从一堆模型中选一个，做决策，而不是平均。即对不同的输入区域用不同的模型。总复杂度随着输入有关的选择复杂程度变化

CART classification and regression trees

决策树的构造其实算是一种贪心算法，也即先贪心出根节点，再贪心出下一层……整体来看，并不一定是最优划分

关于停止：常见的做法是先构建一棵较大的树，然后用叶子上样本点数量作为停止准则，再后剪枝。剪枝会在模型复杂度和误差之间平衡。例如，从树 $T_0$ 开始，通过剪枝得到 $T$ ，即 $T\subset T_0$ . 假定叶结点的索引为 $\tau=1,\dots,|T|$ ，其中 $∣ T ∣$ 表示叶子个数。对于具有 $N_\tau$ 个数据点的区域 $\mathcal R_{\tau}$ ，给出的最优预测为

对应平方和损失

剪枝准则为

其中 $\lambda$ 平衡了模型复杂度（由 $∣ T ∣$ 定义）与平方和损失，该值通过cross-validation选择
对于分类问题，常用的损失函数是交叉熵和基尼系数，这一块直接翻西瓜书。这两者比分类错误率要好，因为这两者对结点的概率更敏感（习题14.11），此外这两者是可微的。对于后剪枝，分类错误率则更常用
决策树的一个优点是，所学习的模型人能理解。但是实际中，训练集的微小改变有可能形成非常不同的划分
决策树的问题在于
- 沿着特征空间平行于坐标轴的方向划分，如果要斜着划分，往往要很多次分裂
- 回归中，预测是不连续的，不光滑

14.5 Conditional Mixture Models

决策树是一种很硬的、平行于坐标轴的区域划分，可以采用一种概率模型去进行组合

P667 线性回归模型的混合

考虑 $K$ 个线性回归模型，每一个都有参数 $\bm w_k$ ，共用一套噪声精确度 $\beta$ ，先考虑一维输出 $t$ ，尽管扩展到多维是容易的。记混合系数为 $\pi_k$ ，混合分布可以写为

其中 $\bm \theta$ 表示了所有参数，包括 $\bm W=\{\bm w_k\},\bm \pi=\{\pi_k\},\beta$
对数似然为

该式可用EM优化，其中隐变量 $z_{nk} \in \{0,1\}$ ，对于每个数据点 $n$ ，只有一个 $z_{nk}=1$ ，其他为 $0$

全数据对数似然为

EM中

E步，首先用 $\bm \theta^{old}$ ，得到后验分布

其中 $\gamma_{nk}$ 就是后验，或者叫“责任responsibility”
M步：根据式14.36，得到Q函数为

上式其实就是把期望套在式14.36的 $z_{nk}$ 上
算 $\bm \pi,\bm W,\beta$

该式和混合高斯式9.22一样，这也是符合直觉的
考虑关于 $\bm w_k$ 的优化，只关注有关项

这其实就是带权最小二乘weighted least squares，注意这 $K$ 个不同的部分其实是互不干扰的，所以关于 $\bm w_k$ 求导得到

写成矩阵形式

其中 $\Phi^T=(\bm\phi_1, \dots, \bm\phi_N)$ ， $\bm R_k=\text{diag}(\gamma_{nk}) \in \mathbb R^{N\times N}$
解得

观察这个式子，原先的线性回归解析解可以认为是 $\bm R_k=\bm I_N$ ，另外，这和逻辑回归的迭代重加权平方算法——式4.99一致（感觉是个梦幻联动，暂时没想清楚背后的联系）
最后，优化 $\beta$ ，只保留有关项

极值点为

拟合结果如图所示

预测结果如图所示

图14.8的后验是很好的的，从图14.9看用两个线性分量比用单个要得到更好的数据表示，似然也高了
不过这里 $\pi$ 和 $x$ 无关，所以如果从做预测的角度考虑，给定一个 $x$ ，也判断不出来该用哪个分量；也即还是拟合了很多没有数据的区域
一种修正的扩展是把混合系数 $\bm \pi$ 也表示成 $\bm x$ 的函数，得到类似5.6节的混合密度网络，或14.5.3节的层次混合专家模型
注意，如果要做点估计，根据1.5.5节决策论，均方误差损失最小的对应预测均值，也即 $\sum_{k=1}^K \pi_k \mathbb E[t|\hat \phi, \bm w_k, \beta]$ ，从图14.9看，这是个很差的结果，位于两条高概率的中间低概率区域（参考习题14.15）

P670 逻辑回归模型的混合

将 $K$ 个逻辑回归模型混合

其中 $\bm \phi$ 是特征向量， $y_k=\sigma(\bm w_k^T\bm \phi)$ 是第 $k$ 个分量的输出， $\bm \theta$ 包括 $\{\pi_k\}$ 和 $\{\bm w_k\}$
对应数据集似然函数形式为

全数据的概率分布为

其中 $z_{nk}$ 是一个二值变量。（可以把式14.47关于 $\bm Z$ 求和求掉，验证式14.46）
使用EM

E步：得到 $z$ 的后验分布

同线性回归， $\gamma$ 叫做“责任responsibility”
M步：全数据的Q函数为

需要优化 $\bm \pi, \bm W$
关于 $\bm \pi$ 的优化得到熟悉结果

关于 $\bm W$ 的优化，注意到不同分量不干扰，此外，没有解析解，所以采用4.3.3节的迭代重加权平方terative reweighted least squares (IRLS)算法（其实就是牛顿法）。关于 $\bm w_k$ 的梯度和Hessian矩阵分别为

这里无非是多加了个权，其他和4.3.3节结果一致

该算法的拟合结果如图所示

混合逻辑回归可以直接扩展到多分类问题（习题14.16）

P672 混合专家 mixtures of experts

和混合线性（逻辑）回归的区别在于，混合系数 $\pi$ 也变成输入的函数

其中混合系数 $\pi_k(\bm x)$ 称为门函数gating functions（总感觉有点attention那味了）， $p_k(\bm t|\bm x)$ 称为专家experts
其背后的思想是不同的专家在自己的区域进行预测，门函数确定哪个分量控制哪个区域
其中门函数必须满足混合系数通常的限制，即 $0\leqslant \pi_k(\bm x)\leqslant 1,\ \sum_k \pi_k(\bm x)=1$ ，所以可以通过softmax进行约束表示
如果专家也是线性（回归、分类）模型，那么整体模型可以用EM算法优化，M步中需要用IRLS算法

P673 层次混合专家 hierarchical mixture of experts (HME)

专家模型的限制在于门函数和专家函数都是线性的。更灵活的模型是用多层门函数，得到层次混合专家hierarchical mixture of experts (HME模型)，想象一个混合分布，其中每个部分都是混合分布。如果系数不是输入依赖的，那么这种层次和单层没区别，但是输入是线性依赖的，那么就有区别
参考习题14.17，这题的解答值得一看，如图

例如这种区域划分方式，用三类softmax就构造不出来，主要是 $\pi_1$ 不受 $\bm v_2^T$ 影响的大区域（也即右图的红色直线），softmax一定互相干扰

该模型可以看作是决策树的概率版本。（这感觉和神经网络也有点像，中间用softmax激活，输出是最终的混合系数，不过每一层都接收输入，可能不是隐层传递）
该模型可以用EM优化，其中M步要用IRLS
Bishop and Svensén(2003)提出了一种贝叶斯HME，并变分推断求解
HME和5.6节的混合密度网络有紧密联系
- HME的一个优点是可以用EM优化，M步关于混合分量和门函数是凸优化（虽然整体目标函数非凸）
- 混合密度网络的优点是分量和混合系数共享隐层单元，且对输入空间的划分更松，划分除了软、不限于坐标轴平行外，还可以是非线性的

参考文献：
[1] Christopher M. Bishop. Pattern Recognition and Machine Learning. 2006

*后记

至此，PRML读完了
2020年11月7日

《北京市加快推动“人工智能+医药健康“创新发展行动计划（2025-2027年）》深度解读
引言随着新一轮科技革命和产业变革的深入推进，人工智能技术与医药健康的深度融合已成为全球科技创新的重要方向。北京市于2025年7月正式发布《北京市加快推动"人工智能+医药健康"创新发展行动计划（2025-2027年）》，旨在充分发挥北京在人工智能技术策源、头部医疗资源汇聚、健康数据高度富集等方面的突出优势，构建形成"人工智能+医药健康"创新和应用并举的产业生态体系，打造具有国际影响力的创新策源地、应
李宏毅2025《机器学习》第四讲-Transformer架构的演进
Transformer架构的演进与替代方案：从RNN到Mamba的技术思辨Transformer作为当前AI领域的标准架构，其设计并非凭空而来，也并非没有缺点。本次讨论的核心便是：新兴的架构，如MAMA，是如何针对Transformer的弱点进行改进，并试图提供一个更优的解决方案的。要理解架构的演进，我们必须首先明确一个核心原则：每一种神经网络架构，都有其存在的技术理由。CNN（卷积神经网络）：为
条件概率：不确定性决策的基石大千AI助手人工智能 Python #OTHER 决策树算法机器学习人工智能条件概率概率论
条件概率是概率论中的核心概念，用于描述在已知某一事件发生的条件下，另一事件发生的概率。它量化了事件之间的关联性，是贝叶斯推理、统计建模和机器学习的基础。本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、定义与公式设(A)和(B)是两个随机事件，且(P(B)>0)：条件概率(P(A\midB))表示
「源力觉醒创作者计划」_文心大模型开源：开启 AI 新时代的大门小黄编程快乐屋人工智能
在人工智能的浩瀚星空中，大模型技术宛如一颗璀璨的巨星，照亮了无数行业前行的道路。自诞生以来，大模型凭借其强大的语言理解与生成能力，引发了全球范围内的技术变革与创新浪潮。百度宣布于6月30日开源文心大模型4.5系列，这一消息如同一颗重磅炸弹，在AI领域掀起了惊涛骇浪，其影响之深远，意义之重大，足以改写行业的发展轨迹。百度这次放大招，直接把文心大模型4.5开源了，这操作就像往国内AI圈子里空投了一个超
四种微调技术详解：SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
当谈到人工智能大语言模型的微调技术时，我们进入了一个令人兴奋的领域。这些大型预训练模型，如GPT-3、BERT和T5，拥有卓越的自然语言处理能力，但要使它们在特定任务上表现出色，就需要进行微调，以使其适应特定的数据和任务需求。在这篇文章中，我们将深入探讨四种不同的人工智能大语言模型微调技术：SFT监督微调、LoRA微调方法、P-tuningv2微调方法和Freeze监督微调方法。第一部分：SFT监
Python 数据分析与可视化 Day 14 - 建模复盘 + 多模型评估对比（逻辑回归 vs 决策树）蓝婷儿 python python 数据分析逻辑回归
✅今日目标回顾整个本周数据分析&建模流程学会训练第二种模型：决策树（DecisionTree）掌握多模型对比评估的方法与实践输出综合对比报告：准确率、精确率、召回率、F1等指标为后续模型调优与扩展打下基础一、本周流程快速回顾步骤内容第1天高级数据操作（索引、透视、变形）第2天缺失值和异常值处理第3天多表合并与连接第4天特征工程（编码、归一化、时间）第5天数据集拆分（训练集/测试集）第6天逻辑回归模
2023年搜索领域的技术认证与职业发展指南搜索引擎技术搜索引擎 ai
2023年搜索领域的技术认证与职业发展指南关键词搜索领域、技术认证、职业发展、搜索引擎技术、人工智能搜索摘要本指南旨在为搜索领域的从业者和有志于进入该领域的人士提供全面的技术认证与职业发展参考。首先介绍搜索领域的概念基础，包括其历史发展和关键问题。接着阐述相关理论框架，分析不同认证背后的原理。架构设计部分展示搜索系统的组成与交互。实现机制探讨算法复杂度和代码优化。实际应用部分给出实施和部署策略。高
探索AI人工智能医疗NLP实体识别系统的架构设计 AI学长带你学AI 人工智能自然语言处理 easyui ai
探索AI人工智能医疗NLP实体识别系统的架构设计关键词：人工智能、医疗NLP、实体识别、系统架构、深度学习、自然语言处理、医疗信息化摘要：本文将深入探讨医疗领域NLP实体识别系统的架构设计。我们将从基础概念出发，逐步解析医疗文本处理的特殊性，详细介绍实体识别技术的核心原理，并通过实际案例展示如何构建一个高效可靠的医疗实体识别系统。文章还将探讨当前技术面临的挑战和未来发展方向，为医疗AI领域的从业者
AI智能体原理及实践：从概念到落地的全链路解析 you的日常人工智能大语言模型人工智能机器学习深度学习神经网络自然语言处理
AI智能体正从实验室走向现实世界，成为连接人类与数字世界的桥梁。它代表了人工智能技术从"知"到"行"的质变，是能自主感知环境、制定决策、执行任务并持续学习的软件系统。在2025年，AI智能体已渗透到智能家居、企业服务、医疗健康、教育和内容创作等领域，展现出强大的生产力与创造力。然而，其发展也伴随着技术挑战、伦理困境和安全风险，需要从架构设计到落地应用的全链条思考与平衡。一、AI智能体的核心定义与技
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
《支持向量机（SVM）在医疗领域的变革性应用》 CodeJourney. 支持向量机算法机器学习
在医疗科技日新月异的今天，先进的数据分析与机器学习技术正逐渐成为提升诊疗水平、助力医学研究的关键力量。支持向量机（SVM），凭借其独特的优势，在医疗这片复杂且对精准度要求极高的领域崭露头角，带来诸多令人瞩目的应用成果。一、疾病诊断：癌症早期筛查的“火眼金睛”癌症，作为全球健康的“头号杀手”，早期诊断对提升患者生存率意义非凡。在乳腺癌筛查领域，SVM发挥着重要作用。医疗科研人员收集大量乳腺组织的影像
机器学习20-线性网络思考坐吃山猪机器学习机器学习人工智能线性网络
机器学习20-线性网络思考针对线性网络的基础问题，使用基础示例进行解释1-核心知识点1-线性模型家族的线性回归和逻辑回归分别是什么，线性模型家族还有没有其他的模型线性模型家族是一系列基于线性假设的统计模型，它们假设因变量和自变量之间存在线性关系。线性模型家族中的两个最常见模型是线性回归和逻辑回归。线性回归（LinearRegression）:线性回归是一种用于预测连续因变量的模型。它假设因变量yy
机器学习18-强化学习RLHF 坐吃山猪机器学习机器学习人工智能
机器学习18-强化学习RLHF1-什么是RLHFRLHF（ReinforcementLearningfromHumanFeedback）即基于人类反馈的强化学习算法，以下是详细介绍：基本原理RLHF是一种结合了强化学习和人类反馈的机器学习方法。传统的强化学习通常依赖于预定义的奖励函数来指导智能体的学习，而RLHF则通过引入人类的反馈来替代或补充传统的奖励函数。在训练过程中，人类会对智能体的行为或输
机器学习19-Transformer和AlexNet思考坐吃山猪机器学习机器学习 transformer 人工智能
Transformer和AlexNet思考关于Transformer和AlexNet发展的一些思考1-核心知识点Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？AlexNet的主要核心思路是什么，为什么表现那么好？现在有什么比AlexNet更优秀的算法2-思路整理1-Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？Word2Vec的作用Word2
机器学习21-线性网络思考坐吃山猪机器学习机器学习人工智能线性网络
机器学习21-线性网络思考针对线性网络的发展问题，进行补充学习1-核心知识点1-传统机器学习针对线性分类算法求解的方式有哪些？请详细列举不同的算法对应的损失函数和计算思路在传统机器学习中，线性分类算法是一种非常重要的方法，用于将数据划分为不同的类别。以下是几种常见的线性分类算法，包括它们的损失函数和计算思路：1.感知机（Perceptron）损失函数感知机的损失函数是基于误分类点的，其目标是最小化
Spring AI 第二讲之 Chat Model API 第八节ZhiPu AI Chat 疼死老夫了人工智能
SpringAI支持知普人工智能的各种人工智能语言模型。您可以与知普人工智能语言模型互动，并基于知普人工智能模型创建多语言对话助手。先决条件您需要与ZhiPuAI创建一个API，以访问ZhiPuAI语言模型。在ZhiPuAI注册页面创建账户，并在APIKeys页面生成令牌。SpringAI项目定义了一个名为spring.ai.zhipuai.api-key的配置属性，你应将其设置为从APIKeys
Spring AI 第二讲之 Chat Model API 第五节HuggingFace Chat
HuggingFaceInferenceEndpoints允许您在云中部署和提供机器学习模型，并通过API对其进行访问。开始使用有关HuggingFaceInferenceEndpoints的更多详细信息，请访问此处。前提条件添加spring-ai-huggingface依赖关系：org.springframework.aispring-ai-huggingface获取HuggingFaceAPI
Chat Model API 虾条_花吹雪 Spring AI java
聊天模型API为开发人员提供了将人工智能聊天完成功能集成到应用程序中的能力。它利用预训练的语言模型，如GPT（生成预训练转换器），以自然语言对用户输入生成类似人类的响应。API通常通过向人工智能模型发送提示或部分对话来工作，然后人工智能模型根据其训练数据和对自然语言模式的理解生成对话的完成或继续。然后将完成的响应返回给应用程序，应用程序可以将其呈现给用户或用于进一步处理。Spring人工智能聊天模
巅峰对决，超三十万奖金等你挑战！第十届信也科技杯全球AI算法大赛火热开赛！中杯可乐多加冰前沿资讯分享科技人工智能算法计算机视觉机器学习深度学习
信也科技今年跟IJCAI和CIKM这两大全球顶级AI会议合作，这场比赛被全球人工智能顶会CIKM收录为官方赛事单元，获奖选手有机会全球人工智能顶会创造更大的影响力。一、赛事概况随着深度伪造技术的高度发展，人工智能产业走深向实，生成合成技术开始呈现工具化和普及化趋势。在生成合成内容质量显著提升的当下，基于换脸攻击的身份冒用和欺诈事件在全球范围内激增，严重威胁个人隐私和公共数据安全。第十届信也科技杯全
Python设置国内镜像教程 wh3933 python 开发语言
####引言Python是一种广泛使用的高级编程语言，用于各种编程任务，从简单的脚本到复杂的机器学习算法。在安装Python包时，通常需要从Python包索引（PyPI）下载。由于网络原因，直接从PyPI下载可能速度较慢，因此，使用国内的镜像源可以显著提高下载速度。本文将详细介绍如何在Python中设置国内镜像。####文章目的本篇文章旨在指导用户如何将Python的包管理工具`pip`的默认源切
OPENAI中Assistants API的实现原理及示例代码python实现 dzend aigc python ai
OPENAI中AssistantsAPI的实现原理及示例代码前言OPENAI是一家人工智能公司，致力于研究和开发人工智能技术。其中，AssistantsAPI是OPENAI推出的一项人工智能服务，可以帮助开发者快速构建智能助手。本文将介绍AssistantsAPI的实现原理，并提供使用Python实现的示例代码。AssistantsAPI实现原理AssistantsAPI的实现原理主要包括以下几个
机器学习宝典——第6章爱看烟花的码农机器学习人工智能
第6章：聚类算法(Clustering)你好，同学！欢迎来到无监督学习的世界。与监督学习不同，这里的我们没有“标准答案”（标签），我们的目标是在数据中发现隐藏的、内在的结构。聚类算法就是实现这一目标的核心工具，它试图将数据集中的样本划分为若干个不相交的子集，我们称之为“簇”(cluster)。本章我们将深入探讨三种最具代表性的聚类算法：K-均值(K-Means)、层次聚类(Hierarchical
【深度学习】神经网络剪枝方法的分类烟锁池塘柳0 机器学习与深度学习深度学习神经网络剪枝
神经网络剪枝方法的分类摘要随着深度学习模型，特别是大语言模型（LLM）的参数量爆炸式增长，模型的部署和推理成本变得异常高昂。如何在保持模型性能的同时，降低其计算和存储需求，成为了工业界和学术界的核心议题。神经网络剪枝（Pruning）作为模型压缩的关键技术之一，应运而生。本文将解析剪枝技术的不同分类，深入探讨其原理、优缺点。文章目录神经网络剪枝方法的分类摘要1为什么我们需要剪枝？2分类方法一：剪什
结构型智能科技的关键可行性——信息型智能向结构型智能的转变（修改提纲）刘海东刘海东人工智能机器学习算法
结构型智能科技的关键可行性——信息型智能向结构型智能的转变1.信息型智能科技概述1.1传统计算机科技的信息型继承者1.2信息型智能环境1.3信息型智能主体1.4机器学习创造的智能1.5信息型智能科技的缺陷2.结构型智能科技概述2.1传统计算机科技向生命结构的发展2.2结构型智能科技的环境2.3结构型智能科技创造的机器生命2.4结构型智能科技的科学性3.结构型智能科技的关键可行性——信息型智能向结构
使用大模型预测胃穿孔的全流程系统技术方案大纲
目录一、项目概述二、项目背景三、建设目标四、建设内容（一）建设架构（二）核心功能（三）核心技术（四）预期成效（五）方案总结五、系统架构方案流程图六、实验验证证据七、健康教育与指导一、项目概述本项目旨在构建一套基于大模型的胃穿孔预测及全流程管理系统，通过整合术前、术中、术后各环节数据，利用先进的人工智能技术，实现对胃穿孔疾病的精准预测、手术方案优化、并发症风险预警以及术后护理指导等功能，为医疗决策提
表观遗传风暴：深圳AI-BioFab终极防御战全纪实
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站⚡《表观遗传风暴：深圳AI-BioFab终极防御战全纪实》副标题：抗癌疫苗灌装倒计时90秒惊现组蛋白叛乱，中国启动虫洞计算化解文明级生物危机2025年7月2日14:26光明科学城急电当第184支抗癌疫苗注入冷链罐的瞬间，B3层突爆刺眼蓝光！培养舱内数千细胞染色体疯狂解旋，量子钟在14:26:03
医疗影像诊断新范式：多模态AI在癌症早筛中的落地难题 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站医疗影像诊断新范式：多模态AI在癌症早筛中的落地难题——2025年临床转化瓶颈突破与多中心验证报告残酷现实：FDA2025Q1报告显示，87%的AI影像工具因临床转化失败止步于III期试验破局曙光：斯坦福-梅奥联合研究证实，多模态融合使肺结节良恶性判别AUC提升至0.98（单模态上限0.91）一
合成生物学奇点：AI驱动CRISPR超进化工厂2025投产纪实
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《合成生物学奇点：AI驱动CRISPR超进化工厂2025投产纪实》副标题：全球首座AI-BioFab落地深圳，蛋白质设计周期从3年压缩至11天，生物制造成本暴跌90%一、生物制造范式的历史性颠覆▶︎传统生物工程的三大世纪困局graphTDA[缓慢的试错循环]-->B[单基因改造耗时≥6个月]C[
Transformer已死？2025年十大替代架构实战评测
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站封面图建议：十大架构3D渲染图环绕碎裂的Transformer图标，背景为动态性能雷达图副标题：实测推理速度/显存占用/长文本能力，附迁移成本决策树一、争议源起：Transformer的时代性局限（2025版）graphLRA[Transformer痛点]-->B[显存黑洞：千亿模型推理需1.6
生物启发AI新突破：神经形态芯片+脉冲神经网络落地指南 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《生物启发AI新突破：神经形态芯片+脉冲神经网络落地指南》副标题：基于2025年英特尔Loihi3芯片的工业级部署实战（附能耗对比&代码库）封面建议：脉冲神经网络动态脉冲传导图覆盖在神经形态芯片显微结构上，标注「能效比：传统GPU的1/800」一、2025生物启发AI的临界点突破生物神经特性事件
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f