ExcitingYi

无数据蒸馏方向文献_1

初认无数据知识蒸馏

Large-Scale Generative Data-Free Distillation
- Introduction & Related Work
- 具体实现
- - 知识蒸馏
  - 图像生成模型
  - - Inceptionism loss
    - Moment matching loss
    - 总损失函数
- 实验结果
- - CIFAR-10
  - CIFAR-100
  - ImageNet

Large-Scale Generative Data-Free Distillation

这篇文章是老师推荐的，也是看得第一篇无数据知识蒸馏方向的文章。初看这篇文章感觉很牛逼，感觉idea很牛逼，实验结果也很好。但是深入了解，看了其他几篇引文后，感觉含金量并不是特别足。
概括一下摘要：目前存在的知识蒸馏方法往往需要获得原始的训练数据，而一些无数据的知识蒸馏比较耗时，或是无法运用到大数据集上（Imagenet）。这篇文章利用经过训练的教师网络来训练生成网络（generator），并在 $C I F A R - 10$ 和 $C I F A R - 100$ 上取得了 $95.02\%$ 和 $77.02\%$ 的准确率。并且能够运用到 $I m a g e N e t$ 数据集上。在这篇文章之前，从来没有生成模型在无数据情况下跑Imagenet。

Introduction & Related Work

尽管有”解释性“方向的工作指出不同层的特征代表不同含义，但神经网络总体上还是个黑箱。知识蒸馏是一种鲁棒性较好的，将大网络”知识“转移到小网络的方法。但知识蒸馏又有自己的问题：

知识蒸馏在”蒸馏“环节仍然需要原始数据，而一些特殊的信息因为隐私和安全问题不能直接得到。
不能用于某些特定的框架中（如联邦学习，这里不懂）
对于无数据知识蒸馏，它往往很费时，而且难以扩展到大数据集。

这篇文章针对上问题，用”生成模型“生成有效数据，并探索了将生成器模型扩展到生成大图片上（imagenet）。设计的总体结构如下图：
的

对生成器来说有两个损失函数——交叉熵损失函数和 $\ Matching\ Loss$ ，抽象点说，前者是限制头和尾，后者是限制中间部分。让生成的网络不那么离谱。这两个损失函数在下文会详细介绍。
在相近工作中，作者主要介绍了两大方向：1. 生成模型。2. 知识蒸馏。对于生成模型，主流的是GAN网络，但是GAN网络在大规模的数据上表现得不是特别好；另一种方法是最近兴起的可逆网络（reversible networks）（个人理解：前者是训练网络参数，后者是训练输入图像。DeepDream应该就是可逆网络？我看的另外几篇无数据知识蒸馏的文章都是训练”输入数据“的，而非训练生成器的网络参数）。对于知识蒸馏，主要是数据依赖的和无数据的，文章提到之前的无数据知识蒸馏大多都是通过给定一个确定的类别，来训练输入的随机噪声，这就需要哪个噪声经过很多轮迭代才能收敛，很耗时；也有其他文章使用了其他方法，比“训练噪声”的方法效率更高，但无法扩展到大数据集上。
上面都是原文的说法，但其实有点问题：文章说训练网络参数的方法要比训练噪声（也就是输入图像）的方法要更高效。可能是训练n张图像——>需要n*epoch轮反向传播的过程。但如果是训练网络，训练好后只需要一次前馈就可以了。但问题在于如果数据较少，训练网络的过程真的更省时间吗？ 另外，文章对CIFAR-100和ImageNet这两个数据集，都用了多个生成器——多少类就多少生成器。虽然生成器的模型比较简单，但这还是有点恐怖的。

具体实现

知识蒸馏

对于一般的知识蒸馏，训练的损失函数公式如下：
$\mathcal{L}_{\mathrm{KD}}=\mathbb{E}_{\boldsymbol{x} \sim p_{\text {data }}(\boldsymbol{x})}\left[D_{\mathrm{KL}}(T(\boldsymbol{x}) \| S(\boldsymbol{x}))\right]$
知识蒸馏相关知识这篇博客整理的很好，我大概看了一下前面几节理解了个大概，对各种知识蒸馏的改进、变种没有深究。上式中S(x)是学生网络，其中的参数是可训的。这个损失函数训练的结果是让S(x)和T(x)尽量接近。设想T(x)是一个完美的网络，能百分百预测出标签，而且输出是one-hot的张亮，那上面那个KL三度的损失函数就变成了交叉熵损失函数。
但对于生成网络的训练，全过程和知识蒸馏没有一点关系（或者说和学生网络没关系），是先训完生成器，再知识蒸馏训学生网络。

图像生成模型

生成模型（Generator）是对我造成困扰最大的一个模块，看了好多遍看不懂，一方面是没有生成网络的先导知识，另一方面是作者居然一直点名用啥方法生成图像。我也不知道是reversible model还是类GAN生成图像，后来在逼站跟着李沐看了一遍GAN的论文解读，又看了几篇引文，结果在今天上午才突然发现这篇文章的附录里有说生成器的模型是啥…
生成器的模型会放在实验部分介绍，其实和我想象的差距还是很大的，本以为生成器也会像ResNet一样的这种奇形怪状的网络，但发现它的结构意外简单。
文章对生成器如何生成图片的介绍也很复杂，最后还是看GAN网络看懂的。实际上，就是训练一个生成器 $G\left(\boldsymbol{z} \mid \boldsymbol{y} ; \theta_{g}\right)$ ，这里的 $z$ 是随机生成的输入，本文中对CIFAR10和CIFAR100用1024维的正态分布张量，ImageNet用512维（为啥Imagenet反而更小一点呢？）。 $\theta_{g}$ 是可训练的权重。 $y$ 是输入的标签（想要生成的类别）。
下面介绍个人认为全篇文章最重要的几个损失函数。

Inceptionism loss

这是最基础的一个损失函数，在DAFL这篇较早的无数据知识蒸馏的文章就提出了。说是基于Inception的一个损失函数（但是Inception在我的印象里就是一个很胖的结构啊…不知道和这个有啥关系，但不知道也能看懂）
$\mathcal{L}_{\mathrm{Inc}}(x, \hat{y})=\mathcal{L}_{\mathrm{CE}}(x, \hat{y})+\mathcal{L}_{\mathrm{Reg}}(x)$
第一项是标准的交叉熵损失函数，其中 $\hat{y}$ 是预设的需要产生的类别。后面一项是惩罚项。 $\mathcal{L}_{\mathrm{Reg}}(x)=\lambda_{\mathrm{t}} \mathcal{L}_{\mathrm{t}}(x)+\lambda_{\ell_{2}} \mathcal{L}_{\ell_{2}}(x)$ ，其中 $\mathcal{L}_{\mathrm{t}}$ 为总体的方差， $\mathcal{L}_{\ell_{2}}$ 为 $l_2$ 范数。（搞不懂方差为啥也要惩罚啊…）
我是将他理解为，使产生的图像可以被教师网络“认识”，是属于，固定住教师网络的两头。

Moment matching loss

这个损失函数比较有趣，这篇文章中提到：之前有工作表明，神经网络中的不同层会提取不同类型的特征，如低层倾向于提取边缘棱角，深层会提取更抽象的特征。另一份工作指出，如果只用inceptionism这个方法来生成图像，可能会导致中间激活层的信息消失。这就要求我们需要在神经网络的中间层也加以约束。
在网络中的BN层就保留有该特征图的均值和方差的信息。我们可以利用这一信息，将随机生成图片经过网络后每一层特征图的均值方差都和保存在BN层的均值方差给匹配上。这样就能约束教师网络的中间层。
$\mathcal{L}_{\mathrm{M}}(x)=\lambda_{\mathrm{S}} \sum_{l}\left[\left\|\mu_{l}(x)-\hat{\mu}_{l}\right\|_{2}+\left\|\sigma_{l}^{2}(x)-\hat{\sigma}_{l}^{2}\right\|_{2}\right]$
这里的损失函数也很简洁。（这个Moment loss还有另外一种交叉熵的形式，本文没用这种，但在另外一篇文献中用到了）

总损失函数

最后总的损失函数就是 $\mathcal{L}_{\text {Image }}(x, y)=\mathcal{L}_{\text {Inc }}(x, y)+\mathcal{L}_{\mathrm{M}}(x)$ ，如果把x换成用生成模型G生成的形式，损失函数如下：
$\mathcal{L}_{\mathrm{G}}=\mathbb{E}_{\boldsymbol{z} \sim p_{z}(\boldsymbol{z}), \boldsymbol{y} \sim p_{y}(\boldsymbol{y})}\left[\mathcal{L}_{\text {Inc }}(G(\boldsymbol{z} \mid \boldsymbol{y}), \boldsymbol{y})+\mathcal{L}_{\mathrm{M}}(G(\boldsymbol{z} \mid \boldsymbol{y}))\right] .$

实验结果

这里主要讲一下最后的实验结果，实验的具体参数不做过多赘述。

CIFAR-10

CIFAR-10生成器的网络结构参数：
$\begin{gathered} \hline z \in \mathbb{R}^{1024} \sim \mathcal{N}(0, I) \\ \text { OneHot }(y) \in \mathbb{R}^{K} \\ \hline \text { Linear }(1024+K) \rightarrow 8 \times 8 \times 128 \\ \hline \text { Reshape, BN, LeakyReLU } \\ \hline \text { Upsample } \times 2 \\ \hline 3 \times 3 \text { Conv } 128 \rightarrow 64, \text { BN, LeakyReLU } \\ \hline 3 \times 3 \text { Conv } 64 \rightarrow 3, \text { Tanh } \\ \hline \text { Upsample } \times 2 \\ \hline \text { Conv } 128 \rightarrow 128, \text { BN, LeakyReLU } \\ \hline \end{gathered}$
其中对于CIFAR-10数据集，只用了一个生成器，所以上面的K=1。上面还是有一些没懂的地方，不知道Upsample是啥…后面花个十来分钟补一下就好了。
其中教师网络为ResNet-34，学生网络为ResNet-18最后得到的结果如下：
$\begin{array}{lllr} \hline \text { Model } & \text { Method } & & & \text { Accuracy } \\ \hline \text { ResNet-34 } & \text { Supervised Training } & & & 95.05 \%^{\dagger} \\ \text { ResNet-18 } & \text { Supervised Training } &&& 93.92 \%^{\ddagger} \\ \text { ResNet-18 } & \text { Knowledge Distillation [23] } &&& 94.34 \%^{\ddagger} \\ \hline \text { ResNet-18 } & \text { Gaussian Noise } &&& 11.43 \% \\ & \text { DAFL [5] } & & & 92.22 \% \\ & \text { DFAD [11] } & & & 93.3 \% \\ & \text { Adaptive DeepInversion [55] } &&& 93.26 \% \\ \hline \text { ResNet-18 } & \text { Ours } & \mathcal{L}_{\text {Inc }} & \mathcal{L}_{\mathrm{M}} & \\ & \text { •inceptionism } & \checkmark & & 77.31 \% \\ & \text { •moment matching } & & \checkmark & 94.61 \% \\ & \text { •both } & \checkmark & \checkmark & \mathbf{9 5 . 0 2 \%} \\ \hline \end{array}$
DAFL和Adaptive DeepInversion这两篇文章我有大概看过，感觉这两篇的含金量比较高。前者是19年的文章，比较早，和这篇文章的差别就在1. DAFL对生成器和学生模型迭代训练。2. DAFL的损失函数稍微落后一点，没用到Moment Loss这一项，而是用“特征图的点亮程度“来约束教师网络的中间过程。 ADI是和这篇文章同时期的文章，早了六个月，和这篇文章的区别在于：没有用生成器网络，而是用教师网络类似DeepDream的方法来生成图片，而其他的，像损失函数啥的都差不多。

CIFAR-100

CIFAR-100所用的生成器结构与CIFAR-10一样，但它的类别数比CIFAR-10更多，为了避免“模式崩溃”，这篇文章直接采用了100个生成器，每一个生成器生成一种类别。每个生成器Moment Loss的均值和方差都是不一样的，对应CIFAR-10每一个类别的均值方差。而教师网络有的只有整个数据集的均值方差，每一类的均值方差是无法得到的。这篇文章给出了一种~~扯淡的~~方法：1. 通过其他文献（训练输入噪声的）data-free的方法，每个类别都训一点；2. 拿上面的训出来图片的均值方差作为每个生成器的Moment Loss中的参数。
最后结果如下：
$\begin{array}{llr} \hline \text { Model } & \text { Method } & \text { Accuracy } \\ \hline \text { ResNet-34 } & \text { Supervised Training } & 77.26 \%^{\dagger} \\ \text { ResNet-18 } & \text { Supervised Training } & 76.53 \%^{\ddagger} \\ \text { ResNet-18 } & \text { Knowledge Distillation [23] } & 76.87 \%^{\ddagger} \\ \hline \text { ResNet-18 } & \text { Gaussian Noise } & 1.23 \% \\ & \text { DAFL [5] } & 74.47 \% \\ & \text { DFAD [11] } & 67.7 \% \\ \hline \text { ResNet-18 } & \text { Ours } & \\ & \bullet \text { single generator } & 76.42 \% \\ & \bullet \text { ensembles (meta-data) } & 77.16 \% \\ & \bullet \text { ensembles (data-free) } & 77.02 \% \\ \hline \end{array}$
可以看到提升还是很明显的，即使是单个生成器（不用流氓办法），效果也是不错的。

ImageNet

ImageNet所采用的生成器网络模型如下：
$\begin{gathered} \hline z \in \mathbb{R}^{512} \sim \mathcal{N}(0, I) \\ \hline \text { Linear }(512) \rightarrow 7 \times 7 \times 64 \\ \hline \text { Reshape, BN, LeakyReLU } \\ \hline \text { Upsample } \times 2 \\ \hline 3 \times 3 \text { Conv } 64 \rightarrow 64, \text { BN, LeakyReLU } \\ 3 \times 3 \text { Conv } 64 \rightarrow 3, \text { Tanh } \\ \hline \end{gathered}$
因为存储的关系，这里将输入数据从1024维降低到512维。最后一共有三个实验结果：

ResNet-50，与其他文献横向对比。
$\begin{array}{lrr} \hline \text { Method } & \text { Top-1 Acc. } & \Delta \text { Acc. } \\ \hline \text { Supervised Training } & 75.45 \%\left(77.26 \%^{\dagger}\right) & \text { N/A } \\ \hline \text { BigGAN [4] } & 64.0 \%^{\ddagger} & -13.26 \% \\ \text { DeepInversion [55] } & 68.0 \% & -9.26 \% \\ \hline \text { Ours } & 69.75 \% & -5.70 \% \end{array}$
ResNet-34为教师网络，ResNet-18为学生网络，不同生成器个数对应的准确率。
$\begin{array}{llr} \hline \text { Model } & \text { Method } & \text { Top-1 } \\ \hline \text { ResNet-34 } & \text { Supervised Training } & 59.68 \% \\ \hline \text { ResNet-18 } & \text { Supervised Training } & 54.99 \% \\ \hline\text { ResNet-18 } & \text { Ours } & \\ & \text { -generators }=1 & 15.85 \% \\ & \text { -generators }=100 & 29.40 \% \\ & \text { -generators }=1000 & 51.82 \% \\ \hline \end{array}$
ResNet-50为教师网络，不同学生网络的准确率。
$\begin{array}{lrrr} \hline \text { Student } & \text { Sup. Acc. } & \text { Distill. Acc. } & \Delta \text { Acc. } \\ \hline \text { ResNet-50 } & 75.45 \% & 69.75 \% & -5.70 \% \\ \text { ResNet-18 } & 68.45 \% & 54.66 \% & -13.79 \% \\ \text { MobileNetV2 [49] } & 70.01 \% & 43.15 \% & -26.86 \% \\ \hline \end{array}$

CentOS 7.x 快速搭建ARK服务器 Aorsion Linux ark server ark server centos 方舟服务器搭建Linux 方舟开服教程方舟多人联机
本人菜鸟一枚，最近喜欢上了ark，也找到了2个基友，但是在别的服玩的不是很开心（非人民币玩家，你们懂），刚好有台闲置的拯救者14笔记本，i7-4720HQ、16G内存、128G三星970pro，1T机械，索性拿来装个Centos7.6搭个服自己玩,就多点电费的事，下面把自己折腾一天的开服经历做个笔记留给和我一样的童鞋，喜欢开服工具的请绕道友情提醒：ARK需要大量内存，建议使用至少具有6GBRAM以
QKeras、Brevitas和QONNX量化工具对比 kanhao100 笔记深度学习边缘计算
QKeras、Brevitas和QONNX量化工具对比一、引言在深度学习模型部署领域，量化技术已成为提升模型执行效率的关键手段。通过将浮点权重转换为低精度表示，量化能显著减小模型体积、降低内存占用并加速推理过程。对于资源受限的设备（如移动设备、嵌入式系统和边缘计算设备），量化技术尤为重要。本文深入对比三款主流量化工具：QKeras、Brevitas和QONNX，从用户实际应用角度剖析它们的技术特点
Umi-OCR：解锁高效文字识别的新时代水熠芝Dark-Haired
Umi-OCR：解锁高效文字识别的新时代Umi-OCR一款强大而高效的文字识别工具项目地址:https://gitcode.com/Resource-Bundle-Collection/6adda项目介绍在数字化浪潮席卷全球的今天，文字识别技术已成为提升工作效率和生活质量的关键工具。Umi-OCR，作为一款基于深度学习技术的开源文字识别工具，凭借其强大的功能和高效的性能，迅速成为众多用户的首选。无
Umi-OCR：一款强大而高效的文字识别工具裘心国Trent
Umi-OCR：一款强大而高效的文字识别工具Umi-OCR一款强大而高效的文字识别工具项目地址:https://gitcode.com/Resource-Bundle-Collection/6adda介绍Umi-OCR是一款基于深度学习技术的开源文字识别工具，特别适合日常办公、学术研究及数据分析等场景。它能有效解决将图像中的文字快速转化为可编辑文本的需求，极大提升工作效率。此工具依托于先进的计算机
自动语音识别（ASR）：技术、应用与未来 ajie1117 语音识别人工智能
自动语音识别（ASR）：技术、应用与未来1.ASR简介自动语音识别（ASR，AutomaticSpeechRecognition）是一种将语音转换为文本的技术。它利用人工智能（AI）、深度学习和自然语言处理（NLP）技术来识别和理解人类的语言，使计算机能够与人类进行更自然的交互。2.ASR的工作原理ASR的核心流程通常包括以下几个步骤：语音信号采集：通过麦克风或其他设备获取音频数据。预处理：去除噪
docker-compose笔记 Re_Virtual docker docker 笔记容器
docker目前docker官网已经无法登录，但是还可以从清华镜像站（https://mirrors.tuna.tsinghua.edu.cn/docker-ce/）下载。使用方法可以参考早期文章《docker笔记》docker-compose可以从Github下载不同版本的二进制文件，例如docker-compose-linux-x86_64。下载完成后，将二进制文件复制入路径，例如/usr/l
机器学习是怎么一步一步由神经网络发展到今天的Transformer架构的？ yuanpan 机器学习神经网络 transformer
机器学习和神经网络的发展经历了一系列重要的架构和技术阶段。以下是更全面的总结，涵盖了从早期神经网络到卷积神经网络之前的架构演变：1.早期神经网络：感知机（Perceptron）时间：1950年代末至1960年代。背景：感知机由FrankRosenblatt提出，是第一个具有学习能力的神经网络模型。它由单层神经元组成，可以用于简单的二分类任务。特点：输入层和输出层之间直接连接，没有隐藏层。使用简单的
iOS接入微信支付（小白都能看懂的微信支付）马拉萨的春天功能模块一天一读基础知识点
因为近期项目中需要接入微信支付功能，自己也爬了很多的坑，所以做了一下这边文章供大家学习参考，远离爬坑，文章主要讲到以下五部分：一、填写商户平台所需资料二、具体Demo代码@Github下载地址本文为本人学习记录笔记，如需转载，请注明出处@iOS_lyon填写商户平台所需资料一、填写经营信息@查看截图指引下图选择不同的类目，所需要上传的资料也是有所不同的，下图拿其它为例子填写经营信息二、填写商户信息
30秒生成电子合同：B2B系统+AI引擎缩短80%交易周期|数商云数商云网络 B2B系统数字化电商平台人工智能大数据云计算数据库运维 java spring
引言在数字经济时代，B2B（Business-to-Business）电子商务正在以前所未有的速度改变着企业的运营模式。随着交易量的不断攀升，传统的合同生成和审核流程逐渐成为制约交易效率的瓶颈。然而，随着人工智能（AI）技术的飞速发展，结合B2B系统的智能化升级，我们正见证一场合同生成效率的革命。本文将深入探讨“30秒生成电子合同：B2B系统+AI引擎缩短80%交易周期”这一创新模式，解析其背后的
关于误差平面小记文弱_书生乱七八糟平面算法神经网络机器学习
四维曲面的二维切片：误差平面详解在深度学习优化过程中，我们通常研究损失函数（LossFunction）的变化，试图找到权重的最优配置。由于神经网络的参数空间通常是高维的，我们需要使用低维可视化的方法来理解优化过程和误差平面（ErrorSurface）。在这里，我们讨论一个四维曲面的二维切片，其中：三个维度是网络的权重（w1,w2,w3w_1,w_2,w_3w1,w2,w3）。第四个维度是误差（损失
关于神经网络中的激活函数文弱_书生乱七八糟神经网络人工智能深度学习
激活函数（ActivationFunction）详解理解首先煮波解释一下这四个字，“函数”相信大家都不陌生，能点进来看这篇文章说明你一定经历至少长达十年的数学的摧残，关于这个概念煮波就不巴巴了，煮波主要说一下“激活”，大家可能或多或少的看过类似于古装，玄幻，修仙等类型的小说或者电视剧。剧中的主角往往是天赋异禀或则什么神啊仙啊的转世，但是这一世他却被当成了普通人，指导某一时刻才会迸发出全部的能量（主
奇异值分解（SVD）文弱_书生乱七八糟神经网络人工智能
奇异值分解(SVD)介绍奇异值分解(SVD)，这是最强大的矩阵分解技术之一。SVD广泛应用于机器学习、数据科学和其他计算领域，用于降维、降噪和矩阵近似等应用。与仅适用于方阵的特征分解不同，SVD可以应用于任何矩阵，使其成为一种多功能工具。在这里煮啵将分解SVD背后的理论，通过手动计算示例进行分析，并展示如何在Python中实现SVD。在本节结束时，您将清楚地了解SVD的强大功能及其在机器学习中的应
常见经典目标检测算法 109702008 人工智能 #深度学习目标检测人工智能
ChatGPT目标检测（ObjectDetection）是计算机视觉领域的一个重要分支，其目的是识别数字图像中的不同对象，并给出它们的位置和类别。近年来，许多经典的目标检测算法被提出并广泛应用。以下是一些常见的经典目标检测算法：1.R-CNN（RegionswithCNNfeatures）:R-CNN通过使用区域提议方法（如选择性搜索）首先生成潜在的边界框，然后使用卷积神经网络(CNN)提取特征，
【北京迅为】iTOP-RK3568开发板OpenHarmony系统南向驱动开发UART接口运作机制迅为电子 RK3568开发板 RK3568开发板 OpenHarmony
瑞芯微RK3568芯片是一款定位中高端的通用型SOC，采用22nm制程工艺，搭载一颗四核Cortex-A55处理器和MaliG522EE图形处理器。RK3568支持4K解码和1080P编码，支持SATA/PCIE/USB3.0外围接口。RK3568内置独立NPU，可用于轻量级人工智能应用。RK3568支持安卓11和linux系统，主要面向物联网网关、NVR存储、工控平板、工业检测、工控盒、卡拉OK
关于神经网络中的正则化文弱_书生乱七八糟神经网络人工智能深度学习
神经网络训练中的正则化正则化（Regularization）是神经网络训练中的一个关键技术，主要用于防止模型过拟合（overfitting），提高泛化能力。1.为什么需要正则化？在神经网络训练过程中，模型的目标是找到能在训练数据上表现良好的参数，同时也能泛化到未见过的数据。如果一个模型过于复杂（如参数过多、层数过深），它可能会记住训练数据中的噪声，而不是学习数据的本质模式。这种情况称为过拟合（ov
MySQL性能优化实战笔记 - 通俗易懂版泥潭硬拔 mysql 性能优化笔记
1.存储引擎选择-到底选哪个？InnoDBvsMyISAM通俗对比想象你开了一家银行：InnoDB就像是有保险柜的银行支持事务：比如转账，要么都成功，要么都失败行级锁：小明在存钱时，小红还能同时取钱缺点：需要更多内存和CPUMyISAM就像是简易储物柜不支持事务：操作简单直接表级锁：一个人在用时，其他人要等待优点：读取速度快，占用资源少2.实战案例：常见性能问题及解决方案案例1：查询特别慢--糟糕
大学期间如何学习利用AI der丸子吱吱吱学习人工智能
一、引言人工智能（AI）是当今世界技术发展的重要方向，它已经渗透到医疗、金融、交通、娱乐等各个领域。随着AI技术的快速发展，它不仅改变了我们的生活，也带来了巨大的职业机会。然而，面对如此广阔的领域，作为大学生，如何在本科阶段有效地学习和利用AI，成了许多同学的困惑。本文将详细介绍大学生在本科阶段如何通过合理的学习路线、方法和工具，逐步掌握AI的核心技术，并为日后进入AI行业打下坚实的基础。通过这篇
全面掌握Python：从安装到基础再到进阶的系统学习之路（附代码，建议新手收藏） der丸子吱吱吱 python 学习开发语言新手入门代码
Python，作为一种现代化的高级编程语言，因其简洁易懂的语法和强大的功能，成为了数据科学、人工智能、Web开发等多个领域的首选语言。在这篇文章中，我们将从大学课本的结构来详细介绍Python，帮助大家从零基础开始，逐步深入掌握Python的各个方面。目录第一章：Python简介与安装1.1Python语言概述1.2安装Python1.3Python的开发环境1.4第一个Python程序第二章：基
rust学习笔记16-206.反转链表(递归) 水蜜桃one 学习笔记链表
rust函数递归在14中已经提到，接下来我们把206.反转链表，用递归法实现递归函数通常包含两个主要部分：基准条件（BaseCase）：递归终止的条件，避免无限递归。递归步骤（RecursiveStep）：将问题分解为更小的子问题，并调用自身来解决这些子问题。//Definitionforsingly-linkedlist.#[derive(PartialEq,Eq,Clone,Debug)]pu
yum install locate出现Error: Unable to find match: locate解决方案爱编程的喵喵 Linux解决方案 linux locate yum 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了yuminstalllocate出现
GraphCube、Spark和深度学习技术赋能快消行业关键运营环节 weixin_30777913 开发语言大数据深度学习人工智能 spark
在快消品（FMCG）行业，需求计划（DemandPlanning）、库存管理（InventoryManagement）和需求供应管理（DemandSupplyManagement）是影响企业整体效率和利润水平的关键运营环节。GraphCube图多维数据集技术、Spark大数据分析处理技术和深度学习技术的结合，为这些环节提供了智能化、动态化和实时化的解决方案，显著提升业务运营效率和企业利润。一、技术
【人工智能机器学习基础篇】——深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理猿享天开人工智能数学基础专讲人工智能机器学习无监督学习降维
深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理在当今数据驱动的世界中，数据维度的增多带来了计算复杂性和存储挑战，同时也可能导致模型性能下降，这一现象被称为“维度诅咒”（CurseofDimensionality）。降维作为一种重要的特征提取和数据预处理技术，旨在通过减少数据的维度，保留其主要信息，从而简化数据处理过程，并提升模型的性能。本文将深入探讨两种广泛应用于无监督学习中的降
模型上下文协议 (MCP)是什么？Model Context Protocol 需要你了解一下同学小张学习 AIGC AI-native agi gpt 开源协议
大家好，我是同学小张，+v:jasper_8017一起交流，持续学习AI大模型应用实战案例，持续分享，欢迎大家点赞+关注，订阅我的大模型专栏，共同学习和进步。在人工智能领域，ModelContextProtocol（MCP）正逐渐成为连接AI模型与各类数据源及工具的重要标准。MCP究竟为何物？它又将如何改变AI应用的开发与使用？文章目录0.概念1.MCP的总体架构2.为何使用MCP？3.我的理解4
生成式对抗网络在人工智能艺术创作中的应用与创新研究辛迎蕌人工智能
摘要本文深入探究生成式对抗网络（GAN）在人工智能艺术创作领域的应用与创新。通过剖析GAN核心原理，阐述其在图像、音乐、文学等艺术创作中的实践，分析面临的挑战与创新方向，呈现GAN对艺术创作模式的变革，为理解人工智能与艺术融合发展提供全面视角。一、引言在人工智能与艺术深度融合的时代浪潮中，生成式对抗网络（GAN）作为一项突破性技术，为艺术创作带来了全新的可能性。它打破传统创作边界，以独特的对抗学习
知识图谱在人工智能语义理解与推理中的关键作用及发展研究 @王威& 人工智能
摘要本文聚焦知识图谱，深入剖析其在人工智能语义理解与推理中的核心作用。阐述知识图谱的构建原理、表示方法，分析其在自然语言处理、智能问答系统、推荐系统等多领域助力语义理解与推理的应用，探讨面临的挑战并展望未来发展方向，全面呈现知识图谱对人工智能发展的重要价值与深远影响。一、引言在人工智能追求更精准理解和处理人类语言与知识的进程中，知识图谱成为关键技术。它以结构化形式组织海量知识，揭示实体间复杂关系，
Flink启动任务 swg321321 flink 大数据
Flink以本地运行作为解读例如：第一章Python机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Flink前言StreamExecutionEnvironmentLocalExecutorMiniClusterStreamGraph二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发
计算机专业毕业设计题目推荐（新颖选题）本科计算机人工智能专业相关毕业设计选题大全✅ 会写代码的羊毕设选题课程设计人工智能毕业设计毕设题目毕业设计题目 ai AI编程
文章目录前言最新毕设选题（建议收藏起来）本科计算机人工智能专业相关的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费功能
AI人工智能 Agent：在赋能传统行业中的应用 AI天才研究院计算 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能Agent：在赋能传统行业中的应用1.背景介绍1.1人工智能的发展历程1.1.1人工智能的起源与发展1.1.2人工智能的三次浪潮1.1.3人工智能的现状与挑战1.2传统行业面临的困境1.2.1效率低下1.2.2成本高企1.2.3决策滞后1.3人工智能赋能传统行业的必要性1.3.1提高效率1.3.2降低成本1.3.3优化决策2.核心概念与联系2.1人工智能Agent的定义2.1.1Age
嵌入式笔记 | 正点原子STM32F103ZET6 3 | 时钟系统 J鸟笔记 stm32 单片机嵌入式硬件
1.RCC（复位和时钟控制）RCC（ResetandClockControl）是STM32的时钟系统控制模块，负责管理整个芯片的时钟信号。在使用任何外设之前，必须先使能其时钟。2.时钟系统框图解析时钟源（5种）HSI（高速内部时钟）由内部RC振荡器产生，默认8MHz精度较低，适用于对时钟精度要求不高的应用可作为系统时钟源HSE（高速外部时钟）由外部晶振（石英/陶瓷谐振器或外部时钟）产生，频率范围4
25年申报工商年报前先看这篇笔记，帮你避坑，少走弯路！搬砖小杨聊资质笔记
又到工商年报申报的时候了（25年截止日期6月30日）,今年年报申报与去年有点区别，我特意整理出来与大家分享，帮助大家避坑。笔记不长，5分钟时间让你事半功倍，你就是老板眼中最靓的仔！！1、今年国家企业信用信息公示系统做了个更新，未完成年报填写或有多家公司需要申报的，一定要点击退出登录，不要直接关闭网页。否则当你想要继续填写年报或申报其他公司的，需要等待系统【自动退出登录】，时间2-3个小时，会大大影
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep