Zoro1996

周志华《机器学习》第二章：模型评估与选择（1）

文章目录

2.1 经验误差与过拟合
2.2 评估方法

2.2.1 留出法(hold-out)
2.2.2 交叉验证(cross-validation)
2.2.3 自助法(bootstrapping)
2.2.4 调参与最终模型

2.3 性能度量

2.3.1 错误率与精度
2.3.2 查准率、查全率与F1

表2.1 分类结果混淆矩阵

2.3.3 ROC与AUC
2.3.4 代价敏感错误率与代价曲线

表2.2 二分类代价矩阵

上一章主要介绍何为机器学习、机器学习相关基础概念、发展历程以及应用现状，力求使读者能够一窥机器学习全貌。本章主要研究应该如何评价学得模型，并加以选择。本章共分5个小节，2.1节先介绍了机器学习模型中的一些常见术语，并说明了"学得模型"不可避免的两个问题：欠拟合与过拟合，并引出如何做模型评估的问题；2.2节介绍了常用的评估方法；2.3节介绍了常见的性能度量指标；2.4节阐述了在有了评估方法与性能度量指标的情况下，应该怎么进行比较检验；2.5节介绍“偏差-方差”，用于解释模型的泛化能力。

2.1 经验误差与过拟合

首先定义几个常见的概念：

错误率=分类错误的样本数/样本总数， $E=\frac{a}{m}.$
精度=1-错误率.
误差：学习器的实际预测输出与样本的真是输出之间的误差叫做“误差”
（1）训练误差：学习器在训练集上的误差，training errer；
（2）泛化误差：学习器在测试集上的误差,generalization errer。

显而易见，泛化误差代表学习器对未知样本的预测能力，我们希望学习到泛化误差小的模型。但是我们并不能事先知道新样本的数据信息（否则不会叫做新样本），能够做的只有不断地优化模型、减小训练误差。但是，训练误差最小的学习器真的是最优解，会在新样本上同样取得最小的泛化误差吗？未必。学习器在训练集上学习到训练误差最小时，通常会把训练集本身的特征当作适用于所有样本的“潜在特征”而加以学习，从而导致学习器的泛化能力反而降低，即“过拟合”。与“过拟合”相对应的是“欠拟合”，即学习器没能充分学习训练集，从而生成能力强的模型
一般来说，“欠拟合”较容易克服，我们通常可以在神经网络中增加训练轮数、在决策树中增加分支来解决。但是“过拟合”更麻烦一些，它也是机器学习需要克服的关键障碍。再好的模型，都会多少有一点过拟合，这是无法避免的。但是我们可以通过种种手段来“缓解”过拟合。
书中在这里提到了“ $P=\not NP$ ”的问题，这是多项式复杂程度的非确定性问题,在这里提及只是为了证明过拟合无法避免而已。

$P$ 包含所有那些可以由一个确定型图灵机在多项式表达的时间内解决的问题， $N P$ 由所有其肯定解可以在给定正确信息的多项式时间内验证的决定问题组成。

用人话来说， $P$ 就是可以在多项式时间内解决的问题， $N P$ 就是可以在多项式时间内能够验证问题正确与否的问题，显然 $P=\not NP$ ,否则就会出现“验证问题=证明问题”的悖论。因此书中说，只要我们相信“ $P=\not NP$ ”，就必须相信机器学习学得模型的”过拟合“问题无法避免。
针对同一个现实任务，往往有多种算法可供我们选择，并且即使选择的算法相同，但是模型中参数配置不同，最后也会产生不同的结果。那么我们应该如何针对问题选出“最好”的学得模型呢？这就涉及“模型评估与选择”。（注意这里的最好是打引号的，因为我们在上一章中证明过，不考虑实际问题的话，所有的算法是无论优劣的，NFL定理）
那么该怎么选择模型呢？泛化误差我们说过，是得不到的；而训练误差又不可以直接作为评估模型的标准。我们需要研究评估方法，通过实验测试来选择“最好的“模型。

2.2 评估方法

我们应该怎样用实验的手段来“评估”学习器的泛化误差呢？使用“测试集”（testing set）来测试学习器对新样本的泛化能力，即用测试误差来近似泛化误差。在第一章中我们做过假设：样本空间中所有样本均服从同一分布 $\mathcal{D}$ ，在这里我们依然沿用这个假设，假设训练集和测试集的样本都是从样本真实分布中独立采样而来。这就好办了，我们可以将同一个数据集划分成训练集 $S$ 和测试集 $T$ ，二者必须互斥。具体划分方法有很多，书中列出以下方法。

2.2.1 留出法(hold-out)

直接将数据集 $D$ 分成对立的训练集 $S$ 和测试集 $T$ ，注意要尽可能保持数据分布的一致性，划分时要做到“分层采样”，按照比例从 $D$ 中每类数据中划分。
留出法有一弊端：即便S/T比例确定，每次划分也都是人为的，算出的测试误差并不可靠，需要多次随机划分，拿到多个测试误差，取其均值。除了这个弊端，留出法引出了一个矛盾：若令训练集包含大多数样本，虽然训练出的模型更接近用数据集 $D$ 训练的模型，但是由于测试集数据过少，不能用测试误差去近似泛化误差；相反，如果测试集包含相当数量的样本，又会导致用训练集学到的模型与用数据集 $D$ 训练的模型相差较大。

2.2.2 交叉验证(cross-validation)

交叉验证法对上述问题做了一些修正：令 $D=D_1\bigcup D_2\bigcup ...\bigcup D_k$ ，每个子集 $D_i$ 按照分层采样划分。用k-1个子集做训练集，剩下的一个子集做测试集，重复k次，确保每个子集都会充当一次测试集。将这k次实验的平均结果作为测试误差。又叫k-fold cross-validation.
留一法是一种特例，每次充当测试集的只有一个样本，相比于上述方法，这更准确，但是计算量大。另外，留一法的评估效果并不会一定比其他方法更准确，NFL定理同样适用。

2.2.3 自助法(bootstrapping)

我们希望评估的是用数据集 $D$ 训练的模型，但是上述方法都会从 $D$ 中抽出一部分样本作为测试集，这并不理想。自助法不仅可以减小训练规模不同而造成的影响，还可以较为高效的进行实验估计。
自助法是在非参数估计中的一种重要的估计统计方差，从而进行区间估计的统计方法。给定包含 $m$ 个样本的数据集 $D$ ,每次从中随机取出一个样本放入数据集 $D^{'}$ ，然后仍放回数据集 $D$ 中，重复 $m$ 次。显然，我们基于数据集 $D$ 生成了一个新的同样包含 $m$ 个样本的数据集 $D^{'}$ ，且在 $D$ 中有 $\lim_{m\rightarrow+\infty} (1-\frac{1}{m})^m\approx0.368$ 的样本不会出现在 $D^+$ 中。用 $D^{'}$ 做训练集， $D/D^{'}$ 做测试集得到的测试误差又叫“包外估计”。
自助法的优缺点都很明显，一方面，从 $D$ 中生成若干数据集 $D^{'}$ ，相当于扩增了原始数据量，比较适合原始数据量较少，难以有效划分S/T的情况；另一方面， $D^{'}$ 的分布规律势必与 $D$ 不同，会产生额外的估计误差。所以自助法适用于经验分布与原始分布估计一致的情况。

2.2.4 调参与最终模型

本章开头我们讨论了如何评估学习器的“泛化误差”，就是将数据集划分为S+T，用测试误差来近似泛化误差。2.2.1~2.2.3节我们讨论了三种划分S/T的方法：hold-out、k-fold cross-validation、bootstrapping。这里思考调参的问题。
用S训练模型，并没有利用全部的数据，所以应遵循下述步骤：

给定数据集 $D$ ，划分S/T；
利用S训练模型；
利用T测试模型；
调参；
用D再次训练；
提交模型

2.3 性能度量

对学习器的泛化性能进行评估，除了有效的评估方法，还要有衡量模型泛化能力的评价标准，即性能度量（performance measure）。在预测任务中，给定样例集 $D=\{(\vec{x_1},y_1),(\vec{x_2},y_2),...,(\vec{x_m},y_m)\}$ ，其中 $y_i$ 是示例 $\vec{x_i}$ 的真实标记。
在回归任务中，常见的性能度量是“均方误差”： $E(f;D)=\frac{1}{m}\displaystyle{\sum^{m}_{i=1}}(f(x_i)-y_i)^2$ ，更一般的：
$\ E(f;D)=\int_{x\in D} (f(x)-y)^2\cdot p(x){\rm d}x$
在分类任务中，常见指标如下：

2.3.1 错误率与精度

分类错误率 $E(f;D)=\frac{1}{m}\displaystyle{\sum^{m}_{i=1}}Ⅱ(f(x_i)=\not y_i)$ ，更一般的，设概率密度为 $p(\cdot)$ ： $\begin{aligned} \ E(f;D)=\int_{x\in D} Ⅱ(f(x)\not= y)\cdot p(x){\rm d}x \end{aligned}$
精度 $a c c = 1 - E (f; D)$

2.3.2 查准率、查全率与F1

对于二分类问题，可根据 $f(x_i)$ 与 $y_i$ 的关系将样例划分为：

表2.1 分类结果混淆矩阵

真实情况	预测结果
真实情况	正例	反例
正例	TP(真正例)	FN(假反例)
反例	FP(假正例)	TN(真反例)

查准率 $P=\frac{TP}{TP+FP}$
查全率 $R=\frac{TP}{TP+FN}$

查准率与查全率互相矛盾，这很好理解。有时我们需要根据学习器的预测结果对样例排序，根据排序结果来判断哪个样例“最有可能是正例”，以此顺序将样例逐个预测为“正例”，就能够计算出当前的查准率与查全率，从而得到“P-R”曲线。不同学习器的“P-R”曲线如下图所示：

若一个学习器的“P-R”曲线能够将另一个学习器完全包住，则可断言前者性能优于后者，否则不可轻易判断孰优孰劣，需要结合其他信息判断。很容易想到一个指标就是曲线包围面积，可这并不好求；另一个指标就是“平衡点”（Break Even Point，简称BEP）,BEP=P=R。第三个指标是P与R的调和平均数：
$\begin{aligned} \\& F1=\frac{2\times P\times R}{P+R}=\frac{2\times TP}{样例总数+TP-TN} \end{aligned}$
相比于几算术平均数和何平均数， $F 1$ 更注重小值。此外，在一般应用中，对查准率与查全率的关注程度是不同的，我们用 $\beta$ 表示查全率对查准率的重要程度，将上式改写成：
$\begin{aligned} \ F_\beta=\frac{(1+\beta^2)\times P\times R}{(\beta^2\times P)+R} \end{aligned}$
$\beta >1$ 时，查全率 $R$ 有更大影响； $\beta <1$ 时，查准率 $P$ 有更大影响。
考虑我们此时拥有多个二分类混淆矩阵，我们该如何考察查全率与查准率呢？一种做法就是在各个混淆矩阵上分别计算查全率与查准率，再计算平均值，得到“宏查全率”、“宏查准率”以及相应的“宏F1”：
$\begin{aligned} \\& macro\_R=\frac{1}{n}\displaystyle{\sum^{n}_{i=1}}R_i \\& macro\_P=\frac{1}{n}\displaystyle{\sum^{n}_{i=1}}P_i \\& macro\_F1=\frac{2\times macro\_P\times macro\_R}{macro\_P+macro\_R} \end{aligned}$
另外一种方法是先在每个二分类混淆矩阵上计算 $\overline{TP}、\overline{FP}、\overline{FN}、\overline{TN}$ ，再计算得到“微查全率”“微查准率”与“ $微 F 1$ ”：
$\begin{aligned} \\& micro\_R=\frac{\overline{TP}}{\overline{TP}+\overline{FP}} \\& micro\_P=\frac{\overline{TP}}{\overline{TP}+\overline{FN}} \\& micro\_F1=\frac{2\times micro\_P\times micro\_R}{micro\_P+micro\_R} \end{aligned}$

2.3.3 ROC与AUC

通常学习器预测的结果是一个在 $[0, 1]$ 区间的数值，我们可将预测数值排序，越接近1，表示当前样本越接近正例。在不同的任务中，我们往往根据需要设置不同的截断点：若要求较高的查全率，则截断点必须后移；若要求较高的查准率，截断点必须前移。因此，预测结果的排序质量，直接体现着学习器在不同任务下的“期望泛化性能”的好坏。换句话说，这体现着学习器在一般情况下的好坏。ROC曲线正是从这个角度对学习器进行评估。
ROC，即“Receiver Operating Characteristic”“受试者工作特征”，源于二战中对雷达信号的分析，后引入机器学习领域。我们将学习器做出的预测结果排序，逐个把样例预测为正例，每次计算出两个数值，并以这两个数值为坐标轴绘制ROC曲线。横轴为“假正例率”（FPR），纵轴为“真正例率”（TPR）：
$\begin{aligned} \\& FPR=\frac{FP}{FP+TN} \\& TPR=\frac{TP}{TP+FN} \end{aligned}$
考虑这样几个特例：
1.当预测结果全为反例时， $T P = F P = 0$ ，从而 $T P R = F P R = 0$ ，对应ROC曲线原点 $(0, 0)$
2.当预测结果全为正例时， $T N = F N = 0$ ，从而 $T P R = F P R = 1$ ,对应点 $(1, 1)$ 点
3.当预测结果中所有样例均预测正确，换句话说，所有真实标签为“正例”的示例均排在标签为“反例”的示例之前，则 $T P = 1, F P = 0$ ，从而 $T P R = 1, F P R = 0$ ，对应点 $(0, 1)$
4.当所有样例的真实标签与预测结果恰好全部相反时， $T N = T P = 0$ ，对应点 $(1, 0)$ .

现实任务中，样例是有限的，只能像上图右侧这样画成分段的曲线。（类似于计算机控制中的第一象限插补）设给定 $m^+$ 个正例， $m^+-$ 个反例，具体做法：

将分类阈值调整到最大，所有样例设为反例，计算 $(F P R, T P R)$ 作为曲线原点；
样例按照预测结果排序，依次以预测结果为分类阈值进行计算；
若当前为正例，则 $(x,y+\frac{1}{m^+})$ ；若当前为反例，则 $(x+\frac{1}{m^-},y)$ ；

类似“P-R”曲线，若一个学习器的ROC曲线能够“包住”另一个学习器的曲线，可断定前者性能优于后者。否则需另行判断：计算ROC曲线包围的面积AUC（Area Under ROC Curve）:
$AUC=\frac{1}{2}\displaystyle{\sum_{i=1}^{m-1}(x_{i+1}-x_i)(y_i+y_{i+1})}$

我们在开始的时候说过，ROC曲线体现的是预测结果的排序质量，所以AUC与排序误差密切相关。从这个角度去理解AUC，可得：
$AUC=\frac{1}{m_+m_-}\displaystyle{\sum_{x^+\in D^+}}\displaystyle{\sum_{x^-\in D^-}}Ⅱ(f(x^+)>f(x^-))$

从反方向定义排序“损失”：
$l_{rank}=\frac{1}{m_+m_-}\displaystyle{\sum_{x^+\in D^+}}\displaystyle{\sum_{x^-\in D^-}}(Ⅱ(f(x^+)lrank=m+m−1x+∈D+∑x−∈D−∑(Ⅱ(f(x+)<f(x−))+21Ⅱ(f(x+)=f(x−)))$

显然 $AUC=1-l_{rank}$ 。

2.3.4 代价敏感错误率与代价曲线

$R O C - A U C$ 体现的是学习器在一般情况下的好坏，我们在其计算过程中默认各种分类错误造成的后果是一样的，即所有类型的错误“均等代价”，但这有时不合常理，有些错误一定会比其它错误造成的后果更严重。我们可以用“非均等代价”来衡量这种不平等程度。以二分类为例：

表2.2 二分类代价矩阵

真实类别	预测类别
真实类别	第0类	第1类
第0类	0	cost_01
第1类	cost_10	0

代价“敏感”的错误率：
$\frac{1}{m}(\displaystyle{\sum_{x^+\in D^+}Ⅱ(f(x_i)\not= y_i)\times cost_{01}+\sum_{x^-\in D^-}Ⅱ(f(x_i)\not= y_i)\times cost_{10}})$
在“非均等代价”下，ROC曲线不再能够代表学习器的期望总体代价，我们采用“代价曲线”来实现这一任务。代价曲线的横轴是取值在 $[0, 1]$ 之间的正例概率代价，式中 $p$ 是样例为正的概率。
$P(+)cost=\frac{p\times cost_{01}}{p\times cost_{01}+(1-p)\times cost_{10}}$
纵轴是归一化代价：
$cost_{norm}=\frac{FNR\times p\times cost_{01}+FPR\times (1-p)\times cost_{10}}{p\times cost_{01}+(1-p)\times cost_{10}}$
$p = 0$ 对应 $(0, F P R)$ ， $p = 1$ 对应 $(1, F N R)$ ，且这条曲线肯定是直的，那么我们就能把它画出来。ROC曲线上一个点对应代价曲线上一条直线。横纵坐标都是概率，一条代价曲线下方的面积就代表“在一种条件下学习器的期望总体代价”。那么我们将对应于ROC曲线上每一个点的代价曲线都画出来，其下方面积的交集就是“在所有条件下学习器的期望总体代价”。如图所示：

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
致即将逝去的2020年斯丹钰
婚姻生活没有想象中那么完美…有时候特别痛恨小时候受的那些教育为什么要被灌输：结婚就好了结婚根本不是那么一件容易的事情…结婚是一种全新生活方式的开始是每一个人学习的新课程很讨厌传统思想中：女人的价值不就是为了生儿育女的吗！我觉得女人哪怕你不是想走所谓的事业型但是你一定要拥有一技之长无论你身在职场，还是想退隐江湖哪天再回来…至少你能在这个时代和这个社会生存下去那时候再来谈你的精神你要的所有其它的东西不
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
架构评审的自动化与人工智能: 如何提高效率光剑书架上的书架构自动化人工智能运维
1.背景介绍架构评审是软件开发过程中的一个关键环节，它旨在确保软件架构的质量、可维护性和可扩展性。传统的架构评审通常是由人工进行，需要大量的时间和精力。随着大数据技术和人工智能的发展，自动化和人工智能技术已经开始应用于架构评审，从而提高评审的效率和准确性。在本文中，我们将讨论如何通过自动化和人工智能技术来提高架构评审的效率。我们将从以下几个方面进行讨论：背景介绍核心概念与联系核心算法原理和具体操作
解锁企业潜能，Vatee万腾平台引领智能新纪元自媒体经济说其他
在数字化转型的浪潮中，企业正站在一个前所未有的十字路口，面对着前所未有的机遇与挑战。解锁企业内在潜能，实现跨越式发展，已成为众多企业的共同追求。而Vatee万腾平台，作为智能科技的先锋，正以其强大的智能赋能能力，引领企业步入一个全新的智能纪元。Vatee万腾平台，是一个集成了人工智能、大数据、云计算等前沿技术的综合性智能服务平台。它不仅仅是一个技术工具，更是企业转型升级的加速器，能够深入企业运营的
LiteBee Wing测评：走进中小学课堂，合适的编程无人机非常重要！ song_bcbd
“国务院在《新一代人工智能发展规划》中明确，要广泛开展人工智能科普活动，实施全民智能教育项目，要在中小学阶段设置人工智能相关课程，逐步推广编程教育，鼓励社会力量参与寓教于乐的编程教学软件、游戏的开发和推广，而且要进行人工智能竞赛。”作为从事创客教育多年的老师，感谢在这个大环境，让学生能够了解人工智能，接触到前沿科技，同时也鼓励更多学生学习编程，因为没有学编程，可能就会像现在的我们后悔以前没有学习好
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟