Unique13

李宏毅机器学习笔记(四)——分类问题

文章目录

一.二分类问题
- 1.贝叶斯分类器
- 2.Logistic回归
- 3.生成模型vs判别模型
二.多分类问题
- 1.选择预测函数
- - - (1).指数族分布
    - (2).广义线性模型假设
    - (3).softmax回归
- 2.计算损失值
- 3.优化

一.二分类问题

在二分类中，最终我们要的输出就是两个数值，代表着分到了第一类还是第二类。对比一下我们的回归问题，对于每个点输出的值是在整个实数范围内的，因此分类不能直接的用回归的思想去解决，要另辟蹊径。

1.贝叶斯分类器

最简单而直观的想法，当然就是转换成对于一个 $n$ 维向量输入，我们去计算它属于这两个类的概率，哪个概率大，就分到哪个类。
那对于这个 $n$ 维向量输入 $x$ 而言，设这两个类分别是 $C_1$ 和 $C_2$ ，那我们想要计算的，就是 $x$ 在类 $C_1$ 中的概率，即 $P(C_1|x)$ ，之后我们对其用贝叶斯公式展开，可以得到 $P(C_1|x)=\frac{P(C_1)P(x|C_1)}{P(C_1)P(x|C_1)+P(C_2)P(x|C_2)}$
那么我们就转换成了求某个类出现的概率和在某个类中 $x$ 的概率。前者非常简单，根据有标签的输入信息统计比例即可，而后者呢？
一般来说，属于某个类中的那些有标签的点，一般都是有内部规律，符和一种分布的(当然，如果全是纯随机，那谁都没办法分类)。因此，我们就要分两步：(1)假设这个类中的点符合某种分布。(2)在此基础上算出对应的这个分布的参数。一般来说，高斯(正态)分布是最普遍的分布，因此，这里我们就默认这些点符合高斯分布(没错这又是炼丹)。
我们假设 $x$ 是二维的，我们将属于类 $C_1$ 中的有标签的点可视化，得到下图。

多元高斯分布的公式如下图所示。

之后我们对每个类都可以继续使用极大似然估计来计算出对应的参数 $\mu$ 和 $\Sigma$ ，即计算 $\Large L(\mu,\Sigma,x_1,x_2,...,x_n)=\Pi_{i=1}^nf_{\mu,\Sigma}(x_i)$
取使得 $L$ 的值最大的参数即可，在这个例子中，我们可以得到 $\mu={75 \brack 71.3}$ $\Sigma = { 874 \quad 327\brack 327 \quad 929}$
通过算出的参数，我们就可以计算出 $P(x|C_1)$ 了，从而我们的公式终于可以得到结果了。
二维情况下的效果如下图所示，正确率甚至不足50%，与随机选差不多；在七维的情况也很一般，只有54%。

一般来说，由于这些本就是一个整体，所以很多时候，我们可以理解为所有类的 $\Sigma$ 是同一个值；因此我们可以简化模型，从计算多个 $\Sigma$ 改为计算一个 $\Sigma$ 即可。
计算的过程其实也是类似，只是改为将所有类合并到一起去用最大似然估计来进行计算，当然最后的结果比较直观： $\Sigma=\Sigma_{i=1}^nP(C_i)\Sigma_i$ 我们带到图里一看，发现恰好是线性的分界线。这不是巧合，我们可以去推所谓的分界线一定是一个超平面(仅仅在二维是一条直线)。

首先我们可以如下图所示，去将我们的条件概率进行化简，我们可以看出，这时的条件概率已经是一个sigmoid函数了，因此如果这个 $z$ 是关于 $x$ 的线性函数，那么最后的分界线(令这个的概率等于0.5)就一定是一条直线了。

下面就是对 $z$ 的处理，其实过程就是将ln拆解，再将条件概率展开等等，最后可以得到下图结果。前面虽然这个式子很长，但是我们仔细一看就可以看出，虽然内容复杂，但是结构极其简单，就是 $z=w^Tx+b$ 这种线性函数。
因此我们最后的分类的表达式如下: $\large P(C_1|x)=\frac{1}{1+e^{-w^Tx+b}}$

2.Logistic回归

在前面的问题中我们可以看出，对于这种线性分类的情况，其实我们就是为了找到最好的参数 $w$ 和 $b$ 而已。上面的方法我们是构建的整体的分布情况，我们完全可以简化方法，不去思考每个类的整体情况，仅仅是直接去计算我们想要的内容，去使用与普通回归类似的方式来学习参数 $w$ 和 $b$ 。
首先是预测 $\hat y$ ，有 $P(C_1|x)=f_{w,b}(x)=\sigma(wx+b)$ ， $\hat y=0$ 当且仅当 $f_{w,b}(x)<0.5$ ， $\hat y=1$ 同理。
然后下一步就是定义损失函数，我们还是使用最大似然估计。 $L(w,b,x_1,...,x_n)=\Pi_{\tiny x_i在C_1类中}f_{w,b}(x_i)\Pi_{\tiny x_i在C_2类中}(1-f_{w,b}(x_i))$ 我们想要这个函数尽量大，我们就相当于是找出让 $- l n L$ 尽量小的参数。仅仅是为了将两种情况合并起来变得好看，我们最后可以得到如下结果: $w^*,b^*=\arg\underset {w,b}{min}(-\Sigma_{i=1}^n(\hat y^ilnf(x^i)+(1-\hat y^i)(1-lnf(x^i)))$ 这也就是著名的交叉熵损失函数，可见在logistic回归中我们虽然也是使用了最大似然估计来得到损失函数，但因为其计算方式的不同(这里 $f (x) > 0.5$ 则 $\hat y=1$ )，因此得到的结果也不再是均方误差了。
最后还是使用梯度下降或者Adam等算法即可，还是求损失函数对参数 $w$ 和 $b$ 的导数。忽略掉推导的过程，最后的公式如下图所示。

我们惊奇的发现，这个更新方式竟然和线性回归的公式一模一样，调整的大小与预测值和真实值之间的差距成正比。这也从另一个角度看出了它们在各自问题的合理性。
而如果我们在这里偏要使用均方误差，即 $L(f)=\frac{1}{2}\Sigma_{i=1}^n(\hat y^i-f_{w,b}(x^i))^2$ 则 $\begin{aligned}\frac{\partial (\hat y-f_{w,b}(x))^2}{\partial w_i}&=2(\hat y-f_{w,b}(x))\frac{\partial f_{w,b}(x)}{\partial z}\frac{\partial z}{\partial w_i}\\&=2(\hat y-f_{w,b}(x))f_{w,b}(x)(1-f_{w,b}(x))x_i\end{aligned}$ 然而根据上式我们可以看到，如果 $f_{w,b}(x)$ 十分接近于1或者0，那么不论
$\hat y$ 是0还是1，得到的梯度都几乎是0，从而几乎无法进行学习(换句话说，这样无法区分完美正确和完全错误)；没有达到交叉熵的那种，每步移动的大小和到真实解的距离成正比。

3.生成模型vs判别模型

上面两种方法，前一种是生成模型，后一者是判别模型。
生成模型中，我们是假设了某种联合分布，之后我们再用这个联合分布来算出我们的条件分布；因此也就是说，我们多做了假设，经过更复杂的计算过程，我们也得到了更多的信息。
而判别模型中则没有这些，我们直接让机器去自己找条件分布的特征，来预测这个条件分布；从而我们简化了步骤，假设的内容也少了，但是只能得到条件分布的信息，得不到联合分布的信息。
至于这两种方法孰优孰劣，其实争议也比较大。其实这两大类中都有很多机器学习模型，因此他们显然都是实用的。总的来说，生成模型是否更精确取决于我们对这个联合分布的假设是否与数据契合，然而我们很多时候也不确定是否契合；如果真的很契合，那我们就是相当于多挖掘出了信息，那当然预测的更精确；但是如果数据集中某些类的数据不够多，则会存在着比较大的误差，从而我们的预测就可能比较不准确，从而影响后续的结果。但是，显然生成模型因为多了条件，他的“健壮性”更好，可以更好的免受错误数据和没有标签数据的影响，同时也可以减小后续操作的方差(因为有模型框架的约束)。

二.多分类问题

基于二分类的思想，我们可以扩展到多分类问题中。

1.选择预测函数

由于分类数量很多(假设分为m类)，我们无法再通过一个 $w$ 和 $b$ 来计算，将结果再映射；因此我们只能是，我们让 $z_i=w_ix+b_i$ ，然后取优化这几组参数，但是下一个问题就是如何去判断 $z_i$ 与 $y$ 之间的相近程度呢？这就出现了一个问题。
下面是一系列数学内容，高能警告！！

(1).指数族分布

如果参数为 $\eta$ ，关于 $y$ 的分布为如下图所示的式子，我们就称之为指数族分布。 $p(y;\eta)=b(y)exp(\eta^TT(y)-\alpha(\eta))$ 当然，这其实是一个比一些著名的分布更广泛的二元函数分布。很多有名的分布，例如指数分布，正态分布，伯努利分布，多项式分布等等等等，都属于指数族分布，这里的证明可见：我是传送门。

(2).广义线性模型假设

由于指数族分布涵盖了几乎所有的比较常见的分布模型，因此正常来说的线性分类问题，都可以用指数族分布的模型进行建模，通过里面函数的不同来确定模型。然而指数族分布中除了 $y$ 以外只有参数 $\eta$ ，而线性模型中则是 $\theta^Tx$ ，因此我们就可以合理的假设 $\theta^Tx$ 就是指数族分布的 $\eta$ 。

(3).softmax回归

对于k分类问题，首先我们要考虑如何表示各输出的概率，这样才可以转化成指数族分布模型。我们当然可以用k个参数 $\phi_1,\phi_2,...,\phi_k$ 来对应各输出值的概率，但是，我们完全可以只用k-1个来表示，然后最后一个就是用1去减去其他所有的就可以得到。因此我们有: $\phi(i)=p(y=i,\phi)(1\le i\le k-1)$ $\phi(k)=1-\Sigma_{i=1}^{k-1}\phi(i)$
之后我们要确定我们的输出如何表示。当然，值一定是有k个，即y=1,2,3,…,k，代表着y属于第几类；当然，为了进行建模，同时将其表示成线性无关的情况，我们就要建立函数 $T (y)$ 。当然，我们这里可以使用k维One-Hot表示法，但为了和上面的输出概率匹配，我们修改为k-1维的变种，即： $T(1)=[1,0,0,...,0,0]_{k-1}^T$ $T(2)=[0,1,0,...,0,0]_{k-1}^T$ $T(3)=[0,0,1,...,0,0]_{k-1}^T$ $T(k-1)=[0,0,0,...,0,1]_{k-1}^T$ $T(k)=[0,0,0,...,0,0]_{k-1}^T$
这样也保证了线性无关且有 $\Sigma_{i=1}^k T(i)=1$ 。
为了更好的进行转化，可以定义一个指示函数 $F$ ,有 $F\{statement\}=1$ 当且仅当 $s t a t e m e n t$ 为真；否则 $F\{statement\}=0$ 。因此就有如下式子： $T(y))_i=F\{y=i\}$
之后我们要通过 $\phi$ 来建立这个模型，我们只要要求不属于第 $i$ 类则为1，否则为 $\phi_i$ ，这样就可以保证不管属于哪类，都可以与模型相匹配了。从而 $\begin{aligned} p(y;\theta)&=\phi_1^{F\{y=1\}}\phi_2^{F\{y=2\}}...\phi_k^{F\{y=k\}} \\&=\phi_1^{F\{y=1\}}\phi_2^{F\{y=2\}}...\phi_k^{1-\Sigma_{i=1}^{k-1}F\{y=i\}} \\&=\phi_1^{(T(y))_1}\phi_1^{(T(y))_2}...\phi_k^{1-\Sigma_{i=1}^{k-1}(T(y))_k} \\&=exp((T(y))_1log(\phi_1/\phi_k)+(T(y))_2log(\phi_2/\phi_k)+...+(T(y))_{k-1}log(\phi_{k-1}/\phi_k)+log(\phi_k)) \\&=b(y)exp(\eta^TT(y)-\alpha(\eta))\end{aligned}$ 此时有 $\theta^Tx=\eta=[log(\phi_1/\phi_k),log(\phi_2/\phi_k),...log(\phi_{k-1}/\phi_k)]$ ,因此有 $\large \phi_i=\frac{e^{\eta_i}}{\Sigma_{j=1}^{k-1}e^{\eta_j}}$ 也就是我们的softmax函数。
最终的效果示例如下所示。也就是说softmax是一种有理有据的建模方式，虽然我们无法证明它是一定最完美的，但是它确实有它统计学的意义，以及现实中优良的效果。

2.计算损失值

根据上文的One-Hot表示法，对于损失函数我们可以继续采用MLE的思想来做。这里有一个假设，那就是如果分错了类，那么分错到哪类都是一样的，也就是说各个类之间完全独立——这也是合理的，因为One-Hot表示法也是建立在这个前提下的。
因此对于一个样本的输入，把其他错误的类看成是同一类，带入二分类的表达式中，损失值为 $-\Sigma_{i=1}^k\hat y_ilogy_i$ ,因此直接可以带入到多分类中。对于多个样本就是累加取平均即可。
有趣的是，这恰好也是信息熵的值，因此也侧面的互相说明了合理性。关于信息熵的概念和计算可以参考如下知乎问题的最高赞回答:https://www.zhihu.com/question/22178202

3.优化

我们关注损失函数，可以看到这个损失函数最终还是关于 $w$ 和 $b$ 的连续函数，因此可以直接使用梯度下降及其优化算法进行优化，得到损失值最小的解。

量子计算+AI：未来AI Agent的计算范式 AI天才研究院计算 ChatGPT DeepSeek RL 强化学习 agent agi 推理模型智能驾驶
量子计算+AI：未来AIAgent的计算范式关键词：量子计算，人工智能，AIAgent，量子算法，量子机器学习，量子优化，量子数据处理摘要：量子计算和人工智能（AI）的结合正在改变AIAgent的计算范式。通过量子计算的超强算力和独特性质，AIAgent在数据处理、算法优化和决策能力方面展现出巨大潜力。本文将详细探讨量子计算与AI结合的核心概念、算法原理、系统架构，并通过实际案例展示量子AIAge
AI人工智能深度学习算法：在量子计算中的应用 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着科技的不断发展，人工智能和量子计算成为了当今世界的热门话题。人工智能的深度学习算法在处理大规模数据和复杂任务方面取得了显著的成果，而量子计算则具有强大的并行计算能力和高效的信息处理能力。将人工智能与量子计算相结合，为解决一些具有挑战性的问题提供了新的思路和方法。本文将探讨人工智能深度学习算法在量子计算中的应用，包括其背景、意义和应用场景。2.核心概念与联系在人工智能中，深度学习是一
《量子门与AI神经元：计算世界的奇妙碰撞》程序猿阿伟人工智能量子计算
在当今科技飞速发展的时代，量子计算和人工智能作为前沿领域，正不断颠覆我们对计算和智能的认知。量子门操作和AI中的神经元计算过程，分别作为这两大领域的核心机制，看似处于不同维度，却有着千丝万缕的联系，它们之间的区别与关联，犹如一把钥匙，为我们打开了通往更高级计算与智能世界的大门。量子门操作是量子计算的基础，它利用量子力学的奇妙特性，如叠加和纠缠，对量子比特进行操控。量子比特，作为量子信息的基本单元，
自建智能算力中心 vs 第三方算力租赁：AI企业的算力博弈与最优解
人工智能的爆发式增长正在重塑全球产业格局。从ChatGPT到DeepSeek，从自动驾驶到智能医疗，AI模型的训练和推理需求呈现指数级增长。在这场技术革命中，算力已成为企业竞争的“命脉”。然而，面对动辄数亿元的硬件投入和复杂的运维挑战，AI企业正面临一个关键抉择：自建智能算力中心，还是选择第三方算力租赁？本文将从成本、效率、风险及适用场景等维度展开深度分析，为企业提供决策参考。一、成本对比：重资产
还在为找图发愁？图生生AI以图生图，一键生成专属风格！图生生人工智能 ai AI作画图生生
你是否也遇到过这样的烦恼：想为文章配图，却找不到风格合适的图片？设计海报时，灵感枯竭，不知从何下手？看到喜欢的图片风格，却无法应用到自己的作品中？别担心，图生生AI生图来帮你！只需上传一张图片，AI就能自动生成相似风格的图片，让你轻松拥有专属图库！图生生AI生图是一款基于人工智能技术的图片生成工具，它能够深度学习和理解图片的风格、色彩、构图等元素，并以此为基础生成全新的图片。无论你是设计师、自媒体
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据 java python javascript kotlin golang 架构人工智能
深度学习、模型架构、可拓展性、神经网络、机器学习1.背景介绍深度学习作为人工智能领域最前沿的技术之一，在图像识别、自然语言处理、语音识别等领域取得了突破性的进展。深度学习模型的成功离不开其强大的学习能力和可拓展性。本文将深入探讨深度学习算法的原理、模型架构设计以及可拓展性的关键要素，并通过代码实例和实际应用场景，帮助读者理解如何搭建可拓展的深度学习模型架构。2.核心概念与联系深度学习的核心概念是人
机器学习之向量化珠峰日记 AI理论与实践机器学习人工智能
文章目录向量化是什么为什么要向量化提升计算效率简化代码与增强可读性适配模型需求怎么做向量化数据预处理特征提取特征选择向量构建机器学习与深度学习中向量化的区别数据特征提取方式机器学习深度学习模型结构与复杂度机器学习深度学习计算资源需求机器学习深度学习数据规模适应性机器学习深度学习向量化是什么向量化是把数据转化为向量形式进行表示与处理的过程。在机器学习与深度学习的范畴内，现实中的各类数据，像文本、图像
Lec01-什么是安全？蛋蛋deべ忧桑安全
本文使用人工智能协助翻译，内容仅供参考，可能有错误或遗漏。如果你对内容或超链接有疑问，可以查看原文。参考资料地址：https://github.com/PKUFlyingPig/MIT6.16006.1600课程团队：HenryCorrigan-Gibbs,YaelKalai,BenKettle(TA),NickolaiZeldovich2022年秋季[!warning]免责声明本套笔记为正在进行
从零精通机器学习：线性回归入门吴师兄大模型 0基础实现机器学习入门到精通机器学习线性回归人工智能 python 算法回归开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
聊聊Python都能做些什么 ·零落· Python入门到掌握 python 开发语言
文章目录一、Python简介二、Python都能做些什么1.Web开发2.数据分析和人工智能3.自动化运维和测试4.网络爬虫5.金融科技三、Python开源库都有哪些1.Web开发2.数据分析和科学计算3.机器学习和深度学习4.网络爬虫5.自动化和测试6.其他常用库四、相关链接一、Python简介Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。它最初由GuidovanRossu
基于改进ISODATA算法的负荷场景曲线聚类（matlab代码）电力程序小学童聚类 matlab ISODATA算法风电光伏
目录1主要内容聚类中心选取步骤核方法2部分代码3程序结果4程序链接1主要内容程序复现文献《基于机器学习的短期电力负荷预测和负荷曲线聚类研究》第三章《基于改进ISODATA算法的负荷场景曲线聚类》模型，该方法不止适用于负荷聚类，同样适用于风光等可再生能源聚类，只需要改变聚类的数据即可，该方法的通用性和可创新性强。该代码实现一种基于改进ISODATA算法的负荷场景曲线聚类方法，代码中，主要做了四种聚类
《基于机器学习的负荷曲线聚类算法对比与改进：K-L-isodata的创新性研究》 TWHiwhjig 机器学习算法聚类
基于机器学习的负荷曲线聚类包括kmeansisodata和改进的L-isodata以及在其基础上再次进行改进的K-L-isodata(有创新性)，四者通过评价指标进行了对比精品代码可修改性极高有参考文献ID:93150688324967700自律的电气人基于机器学习的负荷曲线聚类是一种基于数据分析和模式识别的技术，它可以帮助我们对系统的负荷变化进行分类和理解。在负荷曲线聚类的研究中，K-means
机器学习Pandas_learn4 XW-ABAP 机器学习机器学习 pandas 人工智能
importpandasaspddefcalculate_goods_covariance():#定义商品销售数据字典goods_sales_data={"时期":["一期","二期","三期","四期"],"苹果":[15,16,3,2],"橘子":[12,14,16,18],"石榴":[11,8,7,1]}#将字典转换为DataFrame对象goods_dataframe=pd.DataFra
Browser Use开启AI辅助网页操作新时代 CodeJourney. python 人工智能算法数据库
在当今数字化时代，人们的工作和生活与互联网紧密相连。每天，我们都要花费大量时间在各类网站之间穿梭，进行诸如填写表单、查询信息、比价等重复性操作。这些工作不仅耗费精力，还容易因疲劳而出错，严重影响了工作效率。而现有的自动化工具，要么需要掌握专业的编程知识才能使用，要么在功能上存在局限性，让普通技术用户望而却步。不过，随着人工智能技术的飞速发展，一款名为BrowserUse的开源项目应运而生，为我们带
ChatGPT + Vue3：如何打造 AI 智能助手？ Js_x chatgpt 人工智能
引言人工智能（AI）正快速渗透到前端开发领域，越来越多的开发者希望将ChatGPT集成到自己的应用中，为用户提供智能对话、自动回复、辅助决策等功能。本文将介绍如何使用Vue3+OpenAIAPI搭建一个AI智能助手，让你的应用拥有强大的AI交互能力。1.项目准备1.1技术栈选择本项目将使用以下技术：Vue3-现代化的前端框架，响应式强，适合构建交互式应用。Vite-高效的Vue3项目构建工具，提升
用 AI 提高开发效率：自动生成代码、优化 SQL 查询、写测试用例 Js_x 人工智能 sql 测试用例
引言人工智能（AI）正在深刻改变软件开发行业。从代码自动补全到SQL查询优化，再到自动化测试，AI工具已经成为开发者提高生产力的重要助手。本文将介绍ChatGPT、GitHubCopilot、Tabnine等AI编程工具的实际应用，帮助开发者更高效地编写代码、优化数据库查询，并自动生成测试用例。1.AI代码生成：提升开发效率1.1ChatGPT代码生成ChatGPT具备强大的自然语言处理能力，可以
如何使用Python对Excel、CSV文件完成数据清洗与预处理？ Python 集中营 python数据分析应用 python excel 开发语言
在数据分析和机器学习项目中，数据清洗与预处理是不可或缺的重要环节。现实世界中的数据往往是不完整、不一致且含有噪声的，这些问题会严重影响数据分析的质量和机器学习模型的性能。Python作为一门强大的编程语言，提供了多种库和工具来帮助我们高效地完成数据清洗与预处理任务，其中最常用的库包括Pandas、NumPy、SciPy等。本文将详细介绍如何使用Python对Excel和CSV格式的数据文件进行清洗
理解深度学习1-简介 shangjg3 PyTorch深度学习实战深度学习人工智能
人工智能（AI）旨在打造模仿智能行为的系统。它覆盖了众多方法，涵盖了基于逻辑、搜索和概率推理的技术。机器学习是AI的一个分支，它通过对观测数据进行数学模型拟合来学习决策制定。这个领域近年来迅猛发展，现在几乎（虽不完全准确）与AI同义。深度神经网络是一类机器学习模型，将其应用到数据上的过程称为深度学习。目前，深度网络是最强大和最实用的机器学习模型之一，常见于日常生活中。我们常常用自然语言处理（Nat
人工智能专业毕业设计选题清单：热点课题推荐 HaiLang_IT 人工智能算法 python
目录前言毕设选题开题指导建议更多精选选题选题帮助最后前言大家好,这里是海浪学长毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了人工智能专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!对毕设有任何疑问都可以问学长哦!更多选题指导:最新最全计算机专业毕设选题精选推荐汇
RAG问答系统：检索增强生成框架 ZhangJiQun&MXP 2021 论文教学大模型语言模型
目录RAG（Retrieval-AugmentedGeneration）框架一、RAG框架的定义二、RAG框架的工作原理三、RAG框架的举例说明四、RAG框架的优势RAG问答系统二、工作流程三、优势四、应用场景RAG（Retrieval-AugmentedGeneration）框架即检索增强生成框架，是一种结合了信息检索技术与语言生成模型的人工智能技术。以下是对RAG框架的详细解释及举例说明：一、
【Java】已解决：`java.sql.SQLSyntaxErrorException: SQL` 屿小夏 java sql 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
AIGC带来数据革命：R语言如何成为数据科学家的秘密武器？程序边界 AIGC r语言开发语言
文章目录一、R语言的基础特性1.1R语言的起源与发展1.2R语言的核心优势二、R语言在AIGC中的应用场景2.1数据预处理与清洗2.2文本分析与生成2.3机器学习与模型构建2.4数据可视化与报告生成三、R语言在AIGC中的具体案例3.1金融数据分析与预测3.2医疗数据分析与建模3.3社交媒体数据分析与情感分析四、R语言在AIGC中的未来展望4.1与深度学习框架的集成4.2与云计算平台的集成4.3与
全网测评：2025年最值得中小企业入局的AI无人直播软件花落谁家？ V_13135861102 人工智能
全网测评：2025年最值得中小企业入局的AI无人直播软件花落谁家？在数字化时代，人工智能技术的快速发展为各行各业带来了深刻的变革。直播电商领域也迎来了前所未有的机遇，AI无人直播软件应运而生，逐步改变着传统电商和直播行业的运营模式。对于预算有限、希望实现高效营销的中小企业而言，选择一款合适的AI无人直播软件显得尤为重要。本文将测评几款热门的AI无人直播软件，帮助中小企业找到最适合自己的入局之选。一
大模型转型之路：必要性与未来前景，迎接智能时代的浪潮_转行大模型大模型入门学习人工智能语言模型 AI 大模型 AI大模型程序员转行
随着人工智能（AI）技术的迅猛发展，特别是大型语言模型（LLM,LargeLanguageModels）的崛起，各行各业正迎来一场前所未有的技术革命。对于普通程序员而言，转行进入大模型领域不仅是对个人职业发展的战略性投资，也是顺应时代潮流、把握未来机遇的重要选择。本文将探讨转行大模型的必然性和该领域的未来发展前景。一、转行大模型的必然性技术普及化与学习资源丰富互联网的发展极大地降低了知识获取的成本
7招教你掌握用DeepSeek辅助论文写作的提示词技巧学境思源AcademicIdeas 学境思源 AI写作 ChatGPT 人工智能
随着人工智能技术的快速发展，大模型（如DeepSeek、ChatGPT等）已经成为论文写作的重要辅助工具。合理运用提示词（Prompt），不仅能极大提高写作效率，还能辅助生成高质量的学术内容。今天的内容将分享如何利用DeepSeek的提示词技巧，助力论文写作。1.明确写作目标，让AI理解你的需求在使用大模型时，清晰的写作目标至关重要。一个好的提示词应当包括：写作主题、内容范围、格式要求、风格倾向等
首款折叠iPhone或定价2300美元；百川智能两位联合创始人被曝离职；Manus启用.cn域名 | 极客头条极客日报 iphone ios
「极客头条」——技术人员的新闻圈！CSDN的读者朋友们好，「极客头条」来啦，快来看今天都有哪些值得我们技术人关注的重要新闻吧。整理|郑丽媛出品|CSDN（ID：CSDNnews）一分钟速览新闻点！华为诺亚方舟实验室主任换帅，90后王云鹤接班姚骏百川智能两位联合创始人被曝离职，均开启AI领域创业蝴蝶效应公司正式备案manus.cn域名传刘强东现身香港科技大学参观人工智能，此前有消息称其重回业务一线A
李开复：AI 2.0 时代的价值 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据 java python javascript kotlin golang 架构人工智能
人工智能，AI2.0，价值创造，伦理挑战，未来趋势1.背景介绍人工智能（AI）技术近年来发展迅速，从语音识别、图像识别到自然语言处理，AI已经渗透到我们生活的方方面面。李开复，作为一位享誉全球的人工智能专家，在《AI2.0时代的价值》一文中，深刻地探讨了AI2.0时代带来的机遇与挑战，以及AI如何为人类创造价值。AI1.0时代主要集中在规则驱动的系统，例如围棋、象棋等游戏的AI。而AI2.0时代则
李开复：AI 2.0 时代的机遇 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
人工智能，深度学习，Transformer，大模型，通用人工智能，AI2.0，应用场景，未来趋势1.背景介绍人工智能（AI）技术近年来发展迅速，从语音识别、图像识别到自然语言处理等领域取得了突破性进展。其中，深度学习作为人工智能的核心技术之一，推动了AI技术的飞速发展。然而，深度学习模型的训练成本高、数据依赖性强、可解释性差等问题仍然制约着AI技术的进一步发展。李开复先生在《AI2.0时代的机遇》
DeepSeek重构产业生态：餐饮、金融与短视频的智能跃迁放逐者-保持本心，方可放逐其他重构金融
引言：智能时代的产业共振在数字技术浪潮席卷全球的当下，DeepSeek作为人工智能领域的重要参与者，正以其强大的算法能力和多模态交互特性，深度渗透至餐饮、金融、短视频等民生关键领域。从长江之畔的烟火气到陆家嘴的金融脉搏，从市井小店的智能排班到跨国银行的风险定价，从美食博主的AI替身到探店经济的虚实融合，DeepSeek不仅重塑了传统行业的运营逻辑，更在消费升级与技术创新的交汇处，催生出新的商业范式
2025 职业革命：AI 重构就业图谱的生存法则 RPAdaren 人工智能重构
一、技术迭代下的产业剧变2025年的春天，全球科技界正在见证人工智能的第三次浪潮。根据麦肯锡最新发布的《全球就业趋势报告》，大模型技术已渗透至83%的行业领域。以医疗行业为例，IBMWatson的诊断准确率已达98.7%，超越资深医师平均水平；金融领域，摩根大通的AI交易系统每日处理超2000万笔订单，效率提升400%。这些数据背后，是AI技术从单一功能向通用智能的跨越式发展。二、职业版图的重构逻
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D