CarNong_Blog

【深度学习-图像分类】02 - AlexNet 论文学习与总结

论文地址：ImageNet Classification with Deep Convolutional
Neural Networks

论文学习

1. 摘要

本研究训练了一个大型深度卷积神经网络（CNN），用于对ImageNet LSVRC-2010比赛中的1.2百万高分辨率图像进行分类，这些图像分布在1000个不同的类别中。
在测试数据上，该网络实现了37.5%的top-1错误率和17.0%的top-5错误率，这显著优于之前的最佳成果。
神经网络包含6000万个参数和650,000个神经元，由五个卷积层组成，其中一些后接最大池化层，以及三个全连接层，最后是一个1000路softmax输出。
为了加快训练速度，研究者使用了非饱和神经元（ReLU）和高效的GPU实现卷积操作。
为了减少全连接层的过拟合，采用了一种名为“dropout”的新型正则化方法，证明非常有效。
研究者还在ILSVRC-2012比赛中使用了这个模型的变体，取得了15.3%的获胜top-5测试错误率，相比之下，第二名的成绩为26.2%。

2. 引言

论文开头指出，当前对象识别的方法主要依赖于机器学习技术。为了提高性能，可以通过收集更大的数据集、学习更强大的模型以及使用更好的过拟合防止技术来实现。（提高对象识别方法性能：1. 更大数据集 2.更强大的模型结构 3. 更好的防止过拟合的方法）
作者提到，尽管过去的标记图像数据集相对较小（例如，NORB、Caltech-101/256、CIFAR-10/100等），但对于简单的识别任务来说，这些数据集的规模已经足够。然而，由于现实环境中对象的多样性，识别这些对象需要更大规模的训练集。（现阶段需要更大规模的训练集）
论文强调了大型数据集的重要性，并提到了ImageNet数据集，它包含超过1500万个标记的高分辨率图像，覆盖了超过22000个类别。（ImageNet数据集）
为了从数百万图像中学习识别成千上万的对象，需要一个具有大学习能力的模型。但是，由于对象识别任务的复杂性，即使是像ImageNet这样大的数据集也无法完全指定问题，因此模型需要具有大量的先验知识来弥补数据的不足。（对象识别、图片分类任务的复杂性）
作者提到，卷积神经网络（CNNs）是一类具有这种能力的模型。通过调整其深度和宽度，可以控制CNN的容量。CNN对图像的性质（如统计的平稳性和像素依赖性的局部性）做出了强而正确的假设，因此相比于同等规模层的标准前馈神经网络，CNN有更少的连接和参数，更易于训练，同时理论上的最佳性能也只略有下降。（卷积神经网络CNN的优势）

3. 数据集

ImageNet数据集的概述
- 论文中提到的ImageNet是一个大规模的图像数据库，包含超过1500万个标记的高分辨率图像，这些图像分布在大约22000个类别中。
数据收集与标记
- ImageNet中的图像是从互联网上收集的，并通过使用亚马逊的Mechanical Turk众包工具由人工进行标记。
ImageNet Large-Scale Visual Recognition Challenge（ILSVRC）
- 自2010年起，作为Pascal Visual Object Challenge的一部分，每年举办一次名为ImageNet Large-Scale Visual Recognition Challenge（ILSVRC）的年度比赛。ILSVRC使用ImageNet的一个子集，其中大约包含1000个类别，每个类别大约有1000张图像。总计大约有120万张训练图像、5万张验证图像和15万张测试图像。
数据集的特点与挑战
- ImageNet数据集的特点在于其规模之大以及类别之多，提供了一个挑战性极高的平台，用于测试和改进各种视觉对象识别算法。
- ILSVRC-2010是唯一一个公开测试集标签的版本，因此成为了作者进行大部分实验的数据集。论文中也提到了在ILSVRC-2012版本上的实验结果。
数据集的处理
- 由于ImageNet包含的是变分分辨率的图像，而神经网络需要固定输入维度，因此研究者将图像下采样到固定的256x256分辨率。对于矩形图像，首先将较短的一边缩放到256像素，然后从缩放后的图像中裁剪出中心的256x256区域。除了从每个像素中减去训练集上的平均活动外，没有进行其他预处理。

4. 架构

网络架构概述
- 论文中描述的卷积神经网络包含8个带权重的层：前5层是卷积层，后3层是全连接层。网络的最后输出是一个1000路的softmax，用于生成1000个类别标签的分布。
卷积层的设计
- 网络的第一层使用96个大小为11x11x3的卷积核，步长为4个像素。
  第二层包含256个5x5x48的卷积核。
- 第三、四、五层的卷积核数量分别为384、384和256，核大小均为3x3，且这些层之间没有池化或归一化层。
全连接层的设计
- 网络的三个全连接层每层都有4096个神经元。
特殊的网络特性
- 论文中提到了一些网络的新颖或不寻常的特性，这些特性有助于提高性能和减少训练时间。例如，使用了ReLU（修正线性单元）作为激活函数，实现了局部响应归一化，采用了重叠的池化等。

ReLU（修正线性单元）作为激活函数
定义与优势：ReLU是一种非线性激活函数，定义为f(x) = max(0, x)。它的主要优势在于解决了梯度消失问题，这在深层网络中尤为重要。由于ReLU在正区间的梯度恒定，它允许更快的训练和更深的网络结构。
实现效率：ReLU的计算效率高于传统的Sigmoid和Tanh激活函数，因为它只涉及简单的阈值操作。

局部响应归一化
作用：局部响应归一化（Local Response Normalization, LRN）是一种在卷积神经网络中常用的正则化技术。它模仿生物神经系统中的“侧抑制”机制，通过对局部输入区域进行归一化，增强了模型的泛化能力。
实现方式：在实践中，LRN沿着通道维度对每个像素位置的活动进行归一化，使得响应较大的神经元抑制其邻近神经元，从而增强了模型对高频特征的敏感性。

重叠的池化
池化概念：池化层在卷积神经网络中用于降低特征维度和提取重要特征。传统的池化操作（如最大池化）通常在不重叠的区域上进行。
重叠池化：重叠池化意味着池化窗口的步长小于其大小，导致池化窗口之间存在重叠。例如，可以使用大小为3x3的池化窗口和步长2来进行操作。
优势：重叠池化有助于减少网络对特定池化窗口位置的敏感性，从而提高了特征的平移不变性。此外，它还可以在一定程度上减少过拟合。

GPU并行化
- 为了处理大型网络和大量数据，研究者将网络分布在两个GPU上进行训练。这种并行化策略不仅加快了训练过程，还通过在某些层中限制GPU间的通信来减少了计算负担。
防止过拟合的策略
- 为了防止过拟合，网络在全连接层中使用了Dropout技术。

Dropout 定义与原理：
定义：Dropout是一种在训练深度神经网络时使用的正则化技术。它通过在训练过程中随机“丢弃”（即暂时移除）网络中的一部分神经元来工作。
实现方式：在每次训练迭代中，每个神经元有一定概率（例如50%）被随机选择并临时从网络中移除，即其在这次前向和反向传播中不会被激活。这种随机性意味着网络不能依赖于任何一组特定的神经元激活模式。

Dropout的优势:
减少过拟合：Dropout减少了神经元之间复杂的共适应关系。由于网络的每个神经元不能依赖于其他神经元的激活，它们被迫学习更加健壮的特征，这有助于提高网络的泛化能力。
模型平均：Dropout可以被看作是一种廉价的集成学习。每次训练迭代中使用的是原始网络的一个“子网络”，在测试时，使用整个网络可以近似为所有子网络的平均。
在论文中的应用

应用层级：在论文中，dropout被应用于全连接层。这是因为全连接层通常包含大量的参数，更容易发生过拟合。
效果：使用dropout后，网络需要更多的训练迭代来收敛，但最终可以达到更好的泛化性能。

测试时的处理:
测试时的调整：在测试时，所有的神经元都被保留，但其输出需要乘以训练时dropout的保留概率（例如50%），以补偿训练时神经元被随机丢弃的影响。

5. 减少过拟合

过拟合的挑战：
- 论文中指出，由于神经网络架构拥有大量的参数（约6000万个），即使在拥有大约120万个训练样本的ImageNet数据集上，也面临着严重的过拟合问题。
数据增强：
- 图像翻译和水平翻转：作为减少过拟合的一种方法，论文中采用了图像翻译和水平翻转的数据增强技术。通过从256x256像素的图像中随机裁剪出224x224像素的区域，并进行水平翻转，从而人为地扩大了训练集。
- 改变RGB通道强度：另一种数据增强方法是改变训练图像中RGB通道的强度。这是通过在ImageNet训练集上对RGB像素值进行主成分分析（PCA），然后对每个训练图像的每个RGB像素值添加多个主成分，其中每个成分乘以一个随机变量。
Dropout技术：
- 定义与应用：Dropout是一种正则化技术，它在训练过程中随机地“丢弃”网络中的一部分神经元。在这篇论文中，dropout被应用于全连接层。
- 效果：使用dropout可以显著减少过拟合，尽管它会使得网络需要更多的训练迭代来收敛。
效果评估：
- 论文中提到，这些技术显著减少了过拟合，使得网络能够在大规模的ImageNet数据集上实现更好的泛化性能。

主要通过数据增强 + Dropout 来减少过拟合。

6. 学习细节

训练方法：
- 论文中使用的是随机梯度下降（Stochastic Gradient Descent, SGD）方法来训练深度卷积神经网络。
- 使用了动量（momentum）为0.9，这有助于加速训练过程并减少训练过程中的振荡。
权重衰减和正则化：
- 为了进一步减少过拟合，论文中采用了权重衰减（weight decay），即L2正则化，其系数设置为0.0005。
- 权重衰减不仅作为正则化使用，还有助于改善模型的训练误差。
权重和偏置的初始化：
- 网络中每层的权重初始化为均值为0，标准差为0.01的高斯分布。
- 第二、四和第五卷积层以及全连接隐藏层的偏置初始化为1，这有助于ReLU单元更早地开始学习。
- 其他层的偏置初始化为0。
学习率的调整：
- 论文中使用了相同的学习率对所有层进行训练，并在验证错误率不再改善时手动调整学习率。
- 初始学习率设置为0.01，并在训练过程中逐步减小。
训练时间和硬件：
- 训练网络大约需要90个周期（epoch）通过整个ImageNet训练集（大约120万图像），在两个NVIDIA GTX 580 3GB GPU上训练大约需要五到六天。
批处理大小：
- 训练时使用的批处理大小为128个样本。

7. 结果

ILSVRC-2010结果
- 论文中的网络在ILSVRC-2010测试集上取得了37.5%的top-1错误率和17.0%的top-5错误率，这显著优于之前的最佳成绩。此前的最佳成绩是使用六个稀疏编码模型的平均预测结果，top-1错误率为47.1%，top-5错误率为28.2%。
ILSVRC-2012结果
- 论文还报告了在ILSVRC-2012比赛中的结果。由于ILSVRC-2012的测试集标签不公开，因此主要报告了验证集上的错误率。
- 在ILSVRC-2012上，单个CNN模型的top-5验证错误率为18.2%。通过平均五个类似CNN模型的预测，错误率降至16.4%。
- 训练一个额外的CNN模型，该模型首先在整个ImageNet 2011 Fall release（大约1500万图像，22000类别）上进行预训练，然后在ILSVRC-2012上进行微调，其top-5验证错误率为16.6%。
- 将上述模型与另外五个CNN模型的预测结果平均，最终达到了15.3%的top-5测试错误率，而第二名的成绩为26.2%。
ImageNet 2009 Fall release结果
- 论文还在ImageNet 2009 Fall release数据集上测试了模型，该数据集包含10184个类别和890万图像。
- 在这个数据集上，使用增加了一个额外卷积层的网络模型，top-1和top-5错误率分别为67.4%和40.9%，这也优于之前的最佳成绩。
结果的意义
- 这些结果展示了深度卷积神经网络在大规模图像分类任务上的强大性能，特别是在处理非常大的数据集和类别数量时。
- 论文中的模型不仅在单个测试集上表现出色，而且在多个版本的ImageNet数据集上都显示了其优越的性能和泛化能力。

8. 定性评估

卷积层特征的可视化
- 论文中展示了第一卷积层学习到的96个卷积核（滤波器）。这些可视化的卷积核揭示了网络如何响应不同类型的图像特征，例如边缘、颜色和纹理等。
- 通过观察这些卷积核，可以看出网络在两个GPU上的学习是有所不同的，其中一个GPU倾向于学习颜色无关的特征，而另一个GPU倾向于学习颜色相关的特征。
高层特征的图像检索
- 论文还探讨了使用最后一个隐藏层（4096维特征向量）进行图像检索的效果。通过计算测试图像和训练集图像在该特征空间中的欧几里得距离，可以找到与测试图像最相似的训练图像。
- 这种方法展示了网络高层次如何捕捉图像内容的抽象和语义信息，即使这些图像在像素级别上可能看起来截然不同。
错误分析
- 论文中还包括了对网络错误分类的分析。例如，展示了一些网络错误分类的图像以及网络认为可能的前五个类别。
- 这种分析有助于理解网络在哪些类型的图像上表现良好，以及它在哪些方面还有改进的空间。
网络对图像的理解
- 通过这些定性评估，论文展示了网络不仅能够识别出图像中的主要对象，而且能够捕捉到更复杂的视觉模式和对象之间的关系。
- 这些评估结果表明，深度卷积神经网络能够学习到丰富的图像表示，这些表示在很大程度上与人类的视觉感知相似。

9. 讨论

模型性能的突破
- 论文总结指出，通过使用大型深度卷积神经网络，研究团队在ImageNet数据集上取得了前所未有的分类性能。这一成果标志着深度学习在图像分类任务中的重大突破。
网络深度的重要性
- 论文强调了网络深度对于实现高性能的重要性。实验表明，移除任何一个卷积层都会导致性能显著下降，证明了深层结构在处理复杂视觉任务中的关键作用。
未来的发展方向
- 论文提出，尽管已经取得了显著的进展，但与人类视觉系统相比，还有很大的发展空间。作者期望未来能够训练更大、更深的网络，并利用未标记的数据来进一步提升性能。
  作者还提到了将这种深度网络应用于视频数据和其他领域的可能性，以及利用时间信息来提高模型性能的潜力。
对深度学习领域的影响
- 论文总结了该研究对深度学习领域的影响，特别是在计算机视觉任务中的应用。这项工作不仅推动了深度神经网络在学术界的研究，也促进了它们在工业界的广泛应用。
开放问题和挑战
- 最后，论文提出了一些仍待解决的开放性问题和挑战，如如何有效地训练更大规模的网络，以及如何更好地理解和解释深度网络的内部工作机制。

这篇论文《ImageNet Classification with Deep Convolutional Neural Networks》的主要创新点以及找重要贡献如下：

大规模深度卷积神经网络的成功应用
- 论文中成功训练了一个非常大型的深度卷积神经网络（CNN），这在当时是前所未有的。这个网络有60百万个参数和650,000个神经元，包含五个卷积层和三个全连接层。
在ImageNet数据集上取得突破性成果
- 论文的模型在ImageNet LSVRC-2010和LSVRC-2012数据集上取得了当时最好的结果，显著降低了图像分类任务的错误率。
ReLU（修正线性单元）的有效应用
- 论文中采用ReLU作为激活函数，这是在大型神经网络中的首次应用。ReLU帮助解决了梯度消失问题，使得网络能够更快地训练。
Dropout技术减少过拟合
- 论文中使用了Dropout技术来有效地减少过拟合，这对于训练如此大规模的网络尤为重要。
数据增强方法
- 论文采用了多种数据增强技术，如图像翻译、水平翻转和改变RGB通道强度，这些方法显著提高了网络的泛化能力。
GPU的高效利用
- 论文中的网络利用了多个GPU进行并行训练，这在当时是对GPU计算能力的一种创新利用，为训练大型深度学习模型提供了一个可行的途径。
网络架构的创新设计
- 包括局部响应归一化和重叠池化等网络架构上的创新设计，这些设计有助于提高网络的性能和训练效率。

AlexNet

这幅流程图详细描述了AlexNet卷积神经网络（CNN）的架构，这是一种特别为图像识别任务设计的网络。从左侧的输入层到右侧的输出层，下面是该过程的详细分解：

输入：输入层接收一个227x227像素的图像，具有3个颜色通道（通常是RGB）。
第一卷积层（CONV）：这一层使用96个11x11大小的卷积核（或滤波器），步长为4，这意味着滤波器在输入图像上滑动时每次移动4个像素。这一层将图像的空间尺寸降低到55x55。
第一个最大池化层（Max POOL）：这一层使用3x3的池化窗口和2的步长进行操作，进一步降低空间尺寸到27x27。
第二卷积层：接着是一个256核的5x5卷积，步长为1，并且填充（padding）设置为2，以保持尺寸为27x27。
第二个最大池化层：再次应用3x3大小和2步长的最大池化操作，减少尺寸到13x13。
第三、四、五卷积层：接下来是三个卷积层，它们都使用384个3x3大小的卷积核，步长为1，最后一个卷积层后面没有池化层。
第三个最大池化层：然后是最后一个3x3大小、步长为2的最大池化层，将尺寸降低到6x6。
全连接层（FC）：卷积后的特征图被展平并通过两个全连接层，每个层有4096个神经元。
输出层（Softmax）：最终通过一个有1000个单元的全连接层，每个单元对应一个分类标签。输出层使用softmax激活函数，将网络的原始输出转换为分类概率。

整个网络通过这种结构来提取输入图像中的特征，并进行分类。这种架构中包含了一些重要的深度学习概念，如ReLU激活函数、最大池化、丢弃（dropout）和数据增强等，这些都有助于网络在图像分类任务中取得良好的性能。

代码实现：

import torch
import torchvision.models
from torch import nn
from torch.hub import load_state_dict_from_url

class AlexNet(nn.Module):
    def __init__(
            self,
            num_classes=1000, // 分类数
            dropout=0.5 // dropout率
    ):
        super().__init__()
        self.features = nn.Sequential(
            nn.Conv2d(3, 64, kernel_size=11, stride=4, padding=2),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=3, stride=2),

            nn.Conv2d(64, 192, kernel_size=5, padding=2),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=3, stride=2),

            nn.Conv2d(192, 384, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),

            nn.Conv2d(384, 256, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),

            nn.Conv2d(256, 256, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=3, stride=2),
        )
        self.avgpool = nn.AdaptiveAvgPool2d((6, 6))
        self.classifier = nn.Sequential(
            nn.Dropout(p=dropout),
            nn.Linear(256 * 6 * 6, 4096),
            nn.ReLU(inplace=True),
            nn.Dropout(p=dropout),
            nn.Linear(4096, 4096),
            nn.ReLU(inplace=True),
            nn.Linear(4096, num_classes),
        )
    def forward(self, x):
        x = self.features(x)
        x = self.avgpool(x)
        x = nn.Flatten(x)
        x = self.classifier(x)
        return x

def alexnet(num_classes=1000, pretrained=True):
    model = AlexNet()
    if pretrained:
        state_dict = load_state_dict_from_url(
            url="https://download.pytorch.org/models/alexnet-owt-7be5be79.pth",
            model_dir="./pretrained_model",
            progress=True
        )
        model.load_state_dict(state_dict=state_dict, strict=False)
    if num_classes != 1000:
        model.classifier[-1] = nn.Linear(in_features=4096, out_features=num_classes)

    return model

以上内容旨在记录自己的学习过程以及复习，如有错误，欢迎批评指正，谢谢阅读。

论文学习_SoK: An Essential Guide For Using Malware Sandboxes In Security Applications: Challenges, Pitfa kitsch0x97 学习
0.文章概述恶意软件沙箱尽管在安全应用程序中带来许多优势，但其复杂的选择、配置和使用过程常让新用户不知所措，甚至可能导致错误的部署，进而对安全分析结果产生负面影响。目前，缺乏系统化的指导来帮助用户正确选择和应用沙箱工具，这种知识空白阻碍了沙箱在不同研究领域中的有效应用。为了填补这一知识空白，研究团队系统分析了84篇关于x86/64恶意软件沙箱的学术论文，并提出了一种新颖的框架，以简化沙箱组件和操作
Prompt Engineering 指南教程班磊闯Andrea
PromptEngineering指南教程Prompt-Engineering-Guidedair-ai/Prompt-Engineering-Guide:是一个用于指导对话人工智能开发的文档。适合用于学习对话人工智能开发和自然语言处理。特点是提供了详细的指南和参考资料，涵盖了多种对话人工智能技术和算法，并且可以自定义学习路径和行为。项目地址:https://gitcode.com/gh_mirr
SoK: A Critical Evaluation of Efficient Website Fingerprinting Defenses
2023攻击和防御模型防御评估准确度、精确度和召回率：使用准确率来评估攻击模型在多类别封闭世界设置中的性能，但在二进制开放世界设置中使用精确率和召回率防御策略：（1）增加虚拟流量、（2）增加流量延迟、（3）将流量从一个流移到另一个流固定速率发送流量F，随机抽样以添加填充R，修改流量以产生与目标流量样本或模式的碰撞C，将流量分成多个流S，使用对抗性扰动来欺骗机器学习模型AF：（1）（2）BuFLO,
Prompt 精通之路（七）- 你的终极 AI 宝典：Prompt 精通之路系列汇总程序员阿超的博客 Prompt 精通之路：从零基础到 AI 高效玩家人工智能 prompt Prompt指南 AI学习资源速查手册 ChatGPT 系列总结
你的终极AI宝典：Prompt精通之路系列汇总标签：#Prompt指南#AI学习资源#速查手册#ChatGPT#系列总结Prompt精通之路：系列文章导航第一篇：AI时代的新语言：到底什么是Prompt？为什么它如此重要？第二篇：告别废话！掌握这4个黄金法则，让你的Prompt精准有效第三篇：像专业人士一样思考：Zero-Shot,Few-Shot和思维链（CoT）技巧详解第四篇：AI赋能：10个
JavaScript代码审计工具叶梓诺 javascript 开发语言 ecmascript 前端
我整理的一些关于【Java】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/bLN8S1如何实现一个JavaScript代码审计工具作为一名刚入行的小白，你可能对如何创建一个JavaScript代码审计工具感到困惑。在这篇文章中，我将引导你完成整个流程，并提供具体的代码示例和说明。我们将采取结构化的步骤来确保你能够理解每个阶段。流程概述创建JavaSc
电子词典开源项目源代码完全解析
本文还有配套的精品资源，点击获取简介：电子词典作为数字化学习工具，已由传统硬件发展为可定制的开源软件应用。本源代码提供深入理解其工作机制的机会，包括用户界面设计、词典数据库、查询引擎、翻译算法等。源代码通常由主流编程语言编写，涉及到数据结构与算法、UI设计、数据库管理、自然语言处理、本地化与多语言支持、版本控制、软件工程、API接口以及开源社区的协作和交流。1.电子词典工作原理和定制功能电子词典工
【iSAQB软件架构】原型和技术概念验证小马哥编程 ui 系统架构架构开发语言产品经理
在软件开发项目的过程中可能会出现许多不同类型的问题。要么利益相关者难以明确（尤其是完整地）阐述需求，要么系统用户和开发人员之间的合作无法正常进行。通常，合作在分析和设计阶段结束，因为开发人员随后会退出，只有在软件完成时才展示他们的工作成果。如果团队要相互学习，团队之间的协调非常重要。各种解决方案必须与客户进行测试和讨论，并且某些需求无法仅根据其理论描述得到保证（例如，实时需求）。因此，在定义阶段完
【ISAQB大纲解读】软件密集型系统的三大分类小马哥编程系统架构架构
软件密集型系统的类型划分为信息系统、嵌入式系统和移动系统，主要基于其应用场景、功能定位、硬件依赖程度及软件设计逻辑的显著差异。以下从三类系统的核心特征、典型场景及分类逻辑展开分析：一、软件密集型系统的定义与分类逻辑软件密集型系统指软件在系统功能实现中起决定性作用的系统，其分类本质上反映了不同场景下软件与硬件、业务需求的耦合方式。三类系统的划分依据包括：应用领域：商业办公、设备控制、移动交互等不同场
将h.264视频流封装成flv格式文件（二.开始动手） darkdragonking flv 264 flv h.264 rtmp c++windows
前面写了flv文件的解析，有h264裸流的话就开始封装吧。网上大多数都是用ffmeg库来做这个工作的，哎，学习资料少学不会，还是自己动手吧。封装前要先了解下h.264格式，只需要知道一点点就可以了，我看了h.264官方文档，我靠，3百多页，还全是中文，什么，是中文？既然是中文的我就勉强看下吧，我靠，看起来还很复杂的，果断不看了，不需要，也没时间，我又不做解码，这东西具体步骤资料又少，基本都是那一两
I2C子系统面试指南：基础原理、经典问答与答题技巧全解析嵌入式Jerry Linux+内核面试职场和发展 linux 服务器运维单片机 java
I2C子系统面试指南：基础原理、经典问答与答题技巧全解析关于本篇博文，B站视屏讲解链接，点击进入深度学习一、引言：为什么要深入掌握I2C子系统？在嵌入式、驱动开发、BSP移植、甚至AIoT行业，I2C几乎是绕不开的“基础功”。不管你是应聘Linux驱动开发、嵌入式软件工程师、SoC底层支持，还是BSP/系统调试，I2C的核心架构和调试经验都是面试高频关注点。掌握I2C子系统，关键不止是能写驱动，更
CLIP之后，多模态模型将如何进化？三大技术路径解析老周聊AI AI大模型人工智能 MCP 机器学习神经网络深度学习 AI大模型大模型训练框架
多模态学习的革命：CLIP技术深度解析关注老周不迷路本文较长，建议点赞收藏以免遗失。由于文章篇幅有限，更多涨薪知识点，也可在主页查看最新AI大模型应用开发学习资料免费领取引言：多模态学习的时代来临在人工智能领域，多模态学习正成为最具前景的研究方向之一。传统AI系统通常专注于单一模态（如纯文本或纯图像），而人类认知的本质却是多模态的——我们通过视觉、听觉、触觉等多种感官协同理解世界。OpenAI于2
Android系统LED控制的5层架构与GPIO扩展实现王元祺
本文还有配套的精品资源，点击获取简介：在Android系统中，实现LED灯控制需要理解应用程序层、框架层、本地接口层、硬件抽象层和驱动程序层之间的交互。此项目提供了一个多层源码结构示例，包含完整的从App到Drivers的实现，以及对GPIO的扩展支持，适用于2440开发板并可移植到其他板卡。开发者可以深入学习Android硬件控制的机制，以及如何通过不同层次编写代码来管理LED灯的状态。1.An
Vue Vue-route （2） JSON_L 前端 #Vue vue.js javascript 前端
Vue渐进式JavaScript框架基于Vue2的学习笔记-Vue-route重定向和声明式导航目录Vue-route路由重定向首页默认访问不存在匹配声明式导航路由原理使用示例自定义class类Tag设置版本4路由改变示例总结Vue-route路由重定向首页默认访问希望访问网站域名时，直接访问film组件。在router/index.js中配置根路径默认组件.示例如下：//配置表constrout
js代码08 翻滚吧键盘 vue javascript 开发语言 ecmascript
题目好的，我们正式进入JavaScript的另一个深水区，这也是面向对象编程的基石：this关键字。this是JavaScript中最强大、最灵活，也最容易引起困惑的概念之一。但别担心，它的行为遵循一套清晰的规则。一旦你理解了这些规则，就能完全驾驭它。练习08:this的指向-解开JS中最微妙的谜题核心法则:在学习this之前，请先记住这条黄金法则：this的值取决于函数被调用时的“执行上下文”（
开源 java android app 开发（十三）绘图定义控件、摇杆控件的制作 ajassi2000 linux C 到 Android App开发开源 java android linux python
文章的目的为了记录使用java进行androidapp开发学习的经历。本职为嵌入式软件开发，公司安排开发app，临时学习，完成app的开发。开发流程和要点有些记忆模糊，赶紧记录，防止忘记。相关链接：开源javaandroidapp开发（一）开发环境的搭建-CSDN博客开源javaandroidapp开发（二）工程文件结构-CSDN博客开源javaandroidapp开发（三）GUI界面布局和常用组
跟着论文代码学习编码第一天：main.py 程程不爱学习爱摸鱼 pytorch代码学习学习 pytorch
根据ESRT和LBNet的代码学习编码。首先看main.py。1.args模块B站小侯学府的args讲解需要三步，创建argparse.ArgumentParser解释器，添加add_argument参数，解析参数parse_args:#创建argparse.ArgumentParser解析器parser=argparse.ArgumentParser(description='LBNet')#添
Python爬取与可视化-豆瓣电影数据木子空间Pro 项目集锦 #课程设计 python 信息可视化开发语言
引言在数据科学的学习过程中，数据获取与数据可视化是两项重要的技能。本文将展示如何通过Python爬取豆瓣电影Top250的电影数据，并将这些数据存储到数据库中，随后进行数据分析和可视化展示。这个项目涵盖了从数据抓取、存储到数据可视化的整个过程，帮助大家理解数据科学项目的全流程。环境配置与准备工作在开始之前，我们需要确保安装了一些必要的库：urllib：用于发送HTTP请求和获取网页数据Beauti
KANN 是一个独立的轻量级 C 语言库，用于构建和训练中小型人工神经网络，例如多层感知器、卷积神经网络和递归神经网络（包括 LSTM 和 GRU）。它实现了基于图的逆模自动微分，并允许构建具有递归等
一、软件介绍文末提供程序和源码下载KANN是一个独立的轻量级C语言库，用于构建和训练中小型人工神经网络，例如多层感知器、卷积神经网络和递归神经网络（包括LSTM和GRU）。它实现了基于图的逆模自动微分，并允许构建具有递归、共享权重和多个输入/输出/成本的拓扑复杂神经网络。与TensorFlow等主流深度学习框架相比，KANN的可扩展性较低，但它的灵活性接近，代码库要小得多，并且仅依赖于标准C库。与
AI agent开发出办公AI小助手的学习方案和路线云博士的AI课堂大模型技术开发与实践大模型 AI Agent 人工智能自动化
一个从基础概念、关键技术栈到实际落地的AIAgent开发全流程学习路线和开发方法建议。此方案参考当前主流大模型（LLM）及相关工具链生态，总体目标是从零开始了解所需知识体系与技能，并能在实践中构建自动化的客服AI或者办公辅助类AI助手。学习与开发的总体思路明确目标场景与需求：在开始前，确定需要开发的AIAgent的功能点和使用场景。例如，客服AI需要具备回答客户常见问题、查询订单状态、转接人工客服
学习软件测试的第八天尹yaya 软件测试面试学习学习面试软件测试
三十六.JMeter中的处理器类型有哪些？1.什么是JMeter？JMeter是一个开源的性能测试工具。（压力测试）它就像一个“虚拟用户模拟器”，能帮助你测试网站、接口或者系统在多个用户同时访问时是否会“卡住”或者“崩掉”。简单理解就是：JMeter就像一批自动化的小机器人在不停访问你的网站，帮你发现性能瓶颈。2.JMeter中的“处理器”是干嘛的？在JMeter里，处理器就像“工具助手”，帮你在
Python知识点：如何使用Nvidia Jetson与Python进行边缘计算杰哥在此 Python系列 python 边缘计算开发语言面试编程
开篇，先说一个好消息，截止到2025年1月1日前，翻到文末找到我，赠送定制版的开题报告和任务书，先到先得！过期不候！如何使用NvidiaJetson与Python进行边缘计算NvidiaJetson平台是专为边缘计算设计的一系列AI计算机，它们能够处理和分析来自物联网(IoT)设备和边缘节点的数据。这些设备小巧、节能且功能强大，非常适合用于执行机器学习、计算机视觉和自然语言处理等任务。Python
MySQL数据库核心技术深度解析：SQL语句最佳实践与性能优化指南有趣的灵魂465 mysql
MySQL数据库大师之路：从语法精要到高阶优化全攻略一、开篇：构建系统化的MySQL知识体系在完成《MySQL数据库技术》课程学习后，我通过300+小时的实战演练和源码研究，形成了这套覆盖MySQL5.7/8.0核心技术的知识体系。本文不仅包含标准SQL语法，更将深入InnoDB存储引擎原理、索引实现机制和事务隔离级别的底层实现，帮助开发者跨越从"会写SQL"到"精通数据库"的鸿沟。二、数据库设计
CST微波工作室学习笔记2 主要特点 raininforest CST学习硬件工程
概要基于Windows98/Me、WindowsNT4、Windows2000和WindowsXP的图形用户界面快速并能有效使用内存的有限积分（FI）算法由于理想边界拟合技术和薄片技术的采用，性能更加卓越结构建模基于先进ACIS内核的参量化实体建模前端，并附带优异的结构可视化功能。内含多种建模技术，可快速进行结构变换。可通过SAT（如AutoCAD）、IGES、STEP、ProE、CATIA4、C
AI工作流平台对比分析 come11234 Ai 人工智能
以下是和「扣子工作流」（KoFlow）类似的AI工作流平台对比分析，涵盖主流工具的核心特点、使用方式、优缺点及区别：一、主流工作流平台分类平台类型核心定位代表用户扣子(KoFlow)低代码AI流程中文场景优化，深度集成大模型中文开发者/企业LangChain代码框架开发者灵活构建AI链Python开发者/AI工程师LlamaIndex数据增强框架企业级RAG（检索增强生成）数据工程师/知识库应用M
【开源分享】Conan：C/C++开发者的包管理神器智驾开源分享 c++Conan 包管理
文章目录一、现实中的依赖地狱二、Conan是什么？三、Conan的核心优势四、实际项目应用示例1.安装Conan2.创建项目结构3.编写conanfile.txt4.安装依赖5.CMake构建五、六大核心优势详解优势1：依赖隔离优势2：构建可重复性优势3：构建加速优势4：多编译器支持优势5：企业级私有仓库优势6：灵活的构建模式六、适用场景对比七、常见误区提醒八、企业级应用案例九、学习资源导航一、现
AttnRNN：参数更少，却断档碾压LSTM/GRU的新RNN wq舞s 人工智能 python 深度学习 deep learning ai 科技 pytorch
研究者与发布者为:CSDNwq舞s，知乎wqwsgithubwqws突破性进展！新型注意力RNN（AttnRNN）在长序列任务中全面超越传统RNN模型在深度学习领域，循环神经网络（RNN）及其变体GRU和LSTM长期以来一直是处理序列数据的首选架构。然而，它们在长序列任务中始终存在信息遗忘和梯度消失等问题。今天，我很高兴地宣布一种全新的RNN架构——AttnRNN，它在多个长序列基准测试中全面超越
kotlin入门之泛型易帜¤ kotlin android
【码上开学】Kotlin的泛型在学习kotlin泛型之前我们先来回顾一下关于Java的泛型基础吧。说道泛型，我们可能最常用的就是在三大集合中去使用。泛型将具体的类型泛化，编码的时候用符号来值代类型，在使用时再确定他的类型。因为泛型的存在，我们可以省去强制类型转化。泛型是跟类型相关的，那么是不是也能使用与类型的多态呢？场景一：//多态，因为Button是TextView的子类，向上转型TextVie
【学习】《算法图解》第十一章学习笔记：动态规划程序员
一、动态规划概述动态规划（DynamicProgramming，简称DP）是一种通过将复杂问题分解为更简单的子问题来解决问题的方法。它是一种强大的算法设计技术，特别适用于具有重叠子问题和最优子结构性质的问题。（一）算法适用场景动态规划主要适用于以下场景：最优化问题（求最大值、最小值）计数问题（求方案数）具有重叠子问题特性的问题具有最优子结构特性的问题（二）算法基本思想动态规划的核心思想是：将原问题
Kotlin学习5—泛型 SyubanLiu Kotlin Kotlin
前言什么是泛型？在我们一般的编程模式下，我们需要给任何一个变量指定一个具体的数据类型，而泛型允许我们不指定具体类型的情况下进行编程，这样会具有更好的扩展性泛型的基本用法泛型主要有两种定义方式：定义泛型类，及定义泛型方法，使用的语法结构都是，括号中的字母使用任何字母都可以的，T只是常规写法在Kotlin中，还拥有非常出色的类型推导机制，假设我们传入一个Int类型的参数，Kotlin能够自动推导出泛型
图论算法的大家庭——c++中的图论算法 imlarry0616 深度优先算法图论
图论算法是处理图结构问题的核心工具，广泛应用于路径规划、社交网络分析、计算机网络等领域。以下从基础概念、经典算法及其代码实现展开详细介绍，涵盖DFS、BFS、最短路径、最小生成树等核心内容，并附C++代码示例及注释。一、图的基础概念图的定义：由顶点（Vertex）集合V和边（Edge）集合E组成，记作G=(V,E)。分类：无向图：边无方向（如社交网络中的朋友关系）。有向图：边有方向（如网页链接关系
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc