韩三岁.

GoogLeNet-论文阅读及paddlepaddle复现

论文原文链接（百度云资源）： https://pan.baidu.com/s/1KPiQqBRLS6ZPufkJShWlBQ 密码：hans

该篇文章主要包括两部分内容：

一、论文中的小知识点

二、paddlepaddle复现GoogLeNet（该篇文章只复现了inception v1 模块，关于v2、v3、v4会在后面的文章陆续复现）

知识点：

1、背景知识：视觉皮层包含了一系列复杂的细胞，这些细胞中的每个细胞只是对一个视觉区域内的一小部分敏感（稀疏连接，sparse connect），而对其它部分则可以视而不见，被称为局部感受野（receptive field），而这些receptive field的叠加就构成了visual field，这一点很像inception module（融合不同的信息）。

2、inception module：从LeNet到AlexNet再到VGG，人们似乎习惯了这种卷积加pooling的方式，并且习以为常的通过增加这种操作的层数来增加模型深度和宽度，从而提高模型“质量”。但是，如果一味的通过这种方式来增加模型的深度（层数layer）和宽度（卷积核数），会使参数量迅速增长，消耗大量计算资源；网络计算复杂度大，无法部署推理；反向传播时易造成梯度消失，难以优化模型。于是问题便来了，怎样才能在增加模型深度和宽度的同时又能减少参数量从而解决这些问题呢？在论文introduction部分有这样一句话：One encouraging news is that most of this progress is not just the result of more powerful hardware, larger datasets and bigger models,but mainly a consequence of new ideas , algorithms and improved network architectures.作者在拥有这样的认识下便“构造出了”inception module，这样的一种结构（如下图：）。

图a是原始inception module（naive version）。图b是（with dimensionality reduction）版本，加入了1x1卷积进行降维。

所以inception module到底是怎么减少计算量的呢？（1x1卷积）如果没有加入1x1卷积的话，对于3x3卷积、5x5卷积的分支，它们会使输出越积越厚，concat的时候输出向量维度更深，随着网络的加深，inception模块的增加，会是的计算量爆炸。因此引入了1x1卷积来降维。

当然1x1卷积不仅仅有降维的作用；还能使信息跨通道交融；减少参数量；增加模型的深度，提高非线性表达能力。具体解释，见下图：

3、concat与add的区别：

concat是将向量进行叠加的操作，沿着一个（axis）方向进行，会使向量在这个方向上越来越厚；而add操作是将相同维度的向量相加，也就是加操作，不会改变向量的维度。通过paddlepaddle的concat、add两个api来实现。

5、GoogLeNet：

!unzip -q -o data/data68755/signs.zip

#该程序用于生成标签文件
#使用了十二生肖数据集

import os

data_root = "signs"
classes = ["rooster", "tiger", "dragon", "snake", "ratt", "ox", "monkey", "dog", "goat", "pig", "horse", "rabbit"]
k = 0
def generate_txt(mode):
    with open ("{}/{}.txt".format(data_root, mode), "w") as f:
        train_path = "{}/{}".format(data_root, mode)

        for classe in os.listdir(train_path):
            label = classes.index(classe)

            image_path = "{}/{}".format(train_path, classe)
            
            for image in os.listdir(image_path):
                image_file = "{}/{}".format(image_path, image)

                f.write("{}\t{}\n".format(image_file, label))
                global k
                k += 1
generate_txt('train')
m = k
print(m)
generate_txt("test")
n = k - m
print(n)
generate_txt("valid")
z = k - m - n
print(z)

7200
660
660

#将图片路径及标签放到一个列表中

data = []
with open("signs/{}.txt".format("train")) as f:
            for line in f.readlines():
                info = line.strip().split("\t")
                #print(info)
                data.append([info[0].strip(), info[1].strip()])
#测试：
image_file, label = data[1]
print(image_file)
print(label)

signs/train/goat/00000139.jpg
8

#加载数据集

import paddle
from paddle.io import Dataset
from paddle.vision import transforms as T
import numpy as np
from PIL import Image
from PIL import ImageFile
ImageFile.LOAD_TRUNCATED_IMAGES = True

class mydataset(Dataset):
    def __init__(self, mode):
        self.mode = mode
        self.data = []

        with open("signs/{}.txt".format(mode)) as f:
            for line in f.readlines():
                info = line.strip().split("\t")
                if (len(info) > 0):
                    self.data.append([info[0].strip(), info[1].strip()])
        if mode == "train":
            self.transforms = T.Compose([T.RandomHorizontalFlip(0.5),
                                        T.Resize((224, 224)), 
                                        T.ToTensor(),
                                        T.Normalize(mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225), data_format="CHW")])
        else:
            self.transforms = T.Compose([
                T.Resize((224, 224)),
                T.ToTensor()
            ])
    def __getitem__(self, index):
        image_file, label = self.data[index]
        
        image = Image.open(image_file)
        
        if image.mode != "RGB":
            image = image.convert("RGB")
        image = self.transforms(image)
        return image, np.array(label, dtype="int64")
    
    def __len__(self):
        return len(self.data)

train_dataset = mydataset("train")
test_dataset = mydataset("test")
valid_dataset = mydataset("valid")

from paddle.io import DataLoader

trainset = DataLoader(train_dataset, batch_size=64, shuffle=True)
testset = DataLoader(test_dataset, batch_size=64, shuffle=True)
validset =DataLoader(valid_dataset, batch_size=64, shuffle=True)

#GoogLeNet 
#inception v1
import paddle
from paddle.nn import Layer
import paddle.nn as nn

#inception v1 parameters:
inception_3a = {
     'in_channel':192, '_1filter':64, '_3filter':128, '_5filter':32, '_3reduce':96, '_5reduce':16, 'pool_proj':32}
inception_3b = {
     'in_channel':256, '_1filter':128, '_3filter':192, '_5filter':96, '_3reduce':128, '_5reduce':32, 'pool_proj':64}
inception_4a = {
     'in_channel':480, '_1filter':192, '_3filter':208, '_5filter':48, '_3reduce':96, '_5reduce':16, 'pool_proj':64}
inception_4b = {
     'in_channel':512, '_1filter':160, '_3filter':224, '_5filter':64, '_3reduce':112, '_5reduce':24, 'pool_proj':64}
inception_4c = {
     'in_channel':512, '_1filter':128, '_3filter':256, '_5filter':64, '_3reduce':128, '_5reduce':24, 'pool_proj':64}
inception_4d = {
     'in_channel':512, '_1filter':112, '_3filter':288, '_5filter':64, '_3reduce':144, '_5reduce':32, 'pool_proj':64}
inception_4e = {
     'in_channel':528, '_1filter':256, '_3filter':320, '_5filter':128, '_3reduce':160, '_5reduce':32, 'pool_proj':128}
inception_5a = {
     'in_channel':832, '_1filter':256, '_3filter':320, '_5filter':128, '_3reduce':160, '_5reduce':32, 'pool_proj':128}
inception_5b = {
     'in_channel':832, '_1filter':384, '_3filter':384, '_5filter':128, '_3reduce':192, '_5reduce':48, 'pool_proj':128}

#inception v1 moudle:这里将inception Moudle写成一个类，是为了，后边便于扩展到v2、v3、v4。
#不过这篇文章暂时只写了v1，后面可能会继续复现v2、v3、v4
class inception_v1(Layer):
    def __init__(self, input_activation, parameters={
     }):
        super(inception_v1, self).__init__()
        self.input_ = input_activation
        self.in_channel = parameters['in_channel']
        self.filter_1x1 = parameters['_1filter']
        self.filter_3x3 = parameters['_3filter']
        self.filter_5x5 = parameters['_5filter']
        self.reduce_3 = parameters['_3reduce']
        self.reduce_5 = parameters['_5reduce']
        self.proj = parameters['pool_proj']
        self.relu = nn.ReLU()

    def conv(self, in_channel, out_channel, kernel_size, stride, paddling, in_x):
        conv_ = nn.Conv2D(in_channel, out_channel, kernel_size, stride, paddling)
        x = conv_(in_x)
        return x

    def max_pool(self, kernel_size, stride, paddling, in_x):
        maxpool = nn.MaxPool2D(kernel_size, stride, paddling)
        x = maxpool(in_x)
        return x
    #max_pool branch:
    def max_pool_branch(self, input_data):
        x = self.max_pool(3, 1, 1, input_data)
        x = self.conv(self.in_channel, self.proj, 1, 1, 0, x)
        x = self.relu(x)
        return x
    #5x5_conv_branch:
    def conv_5x5_branch(self, input_data):
        x = self.conv(self.in_channel, self.reduce_5, 1, 1, 0, input_data)
        x = self.relu(x)
        x = self.conv(self.reduce_5, self.filter_5x5, 5, 1, 2, x)
        x = self.relu(x)
        return x
    #3x3_conv_brabch:
    def conv_3x3_branch(self, input_data):
        x = self.conv(self.in_channel, self.reduce_3, 1, 1, 0, input_data)
        x = self.relu(x)
        x = self.conv(self.reduce_3, self.filter_3x3, 3, 1, 1, x)
        x = self.relu(x)
        return x
    
    def forword_v1(self, input_):
        branch_pool = self.max_pool_branch(input_)
        branch_3 = self.conv_3x3_branch(input_)
        branch_5 = self.conv_5x5_branch(input_)
        branch_1 = self.conv(self.in_channel, self.filter_1x1, 1, 1, 0, input_)
        
        out = paddle.concat(x = [branch_pool, branch_3, branch_5, branch_1], axis=1)
        #x = branch_pool + branch_3 + branch_5 + branch_1
        #print(out)
        return out

#inception_v1_arch:
inception_v1_arch_list= [
                        inception_3a, 
                        inception_3b,
                        inception_4a,
                        inception_4b,
                        inception_4c,
                        inception_4d,
                        inception_4e,
                        inception_5a,
                        inception_5b
                        ]
 
#GoogleNet:
class GoogLeNet(Layer):
    def __init__(self, num_classes, inception_arch_list, inception):
        super(GoogLeNet,  self).__init__()
        self.inception = inception
        self.inception_arch_list = inception_arch_list
        self.num_classes = num_classes
        self.relu = nn.ReLU()
        self.dropout = nn.Dropout(0.4)
        self.conv1 = nn.Conv2D(in_channels=3, out_channels=64, kernel_size=7, stride=2, padding=3)
        self.conv2 = nn.Conv2D(in_channels=64, out_channels=192, kernel_size=3, stride=1, padding=1)
        self.max_pool = nn.MaxPool2D(kernel_size=3, stride=2, padding=1)
        self.avg_pool = nn.AvgPool2D(kernel_size=7, stride=1)
        self.flatten = nn.Flatten()
        self.linear = nn.Linear(in_features=1024, out_features=num_classes)
        self.softmax = nn.Softmax()

    def forward(self, input_data):

        x = self.conv1(input_data)
        x = self.relu(x)
        x = self.max_pool(x)
        x = self.conv2(x)
        x = self.relu(x)
        x = self.max_pool(x)

        if self.inception == 'v1':
            v1_3a = inception_v1(x, self.inception_arch_list[0])
            x = v1_3a.forword_v1(x)
            v1_3b = inception_v1(x, self.inception_arch_list[1])
            x = v1_3b.forword_v1(x)
            x = self.max_pool(x)
            v1_4a = inception_v1(x, self.inception_arch_list[2])
            x = v1_4a.forword_v1(x)
            v1_4b = inception_v1(x, self.inception_arch_list[3])
            x = v1_4b.forword_v1(x)
            v1_4c = inception_v1(x, self.inception_arch_list[4])
            x = v1_4c.forword_v1(x)
            v1_4d = inception_v1(x, self.inception_arch_list[5])
            x = v1_4d.forword_v1(x)
            v1_4e = inception_v1(x, self.inception_arch_list[6])
            x = v1_4e.forword_v1(x)
            x = self.max_pool(x)
            v1_5a = inception_v1(x, self.inception_arch_list[7])
            x = v1_5a.forword_v1(x)
            v1_5b = inception_v1(x, self.inception_arch_list[8])
            x = v1_5b.forword_v1(x)
        x = self.avg_pool(x)
        x = self.dropout(x)
        x = self.flatten(x)
        x = self.linear(x)
        x = self.softmax(x)

        return x

GoogLeNet_v1_model = paddle.Model(GoogLeNet(12, inception_v1_arch_list, 'v1'))
GoogLeNet_v1_model.summary((64, 3, 224, 224))

---------------------------------------------------------------------------
 Layer (type)       Input Shape          Output Shape         Param #    
===========================================================================
   Conv2D-1     [[64, 3, 224, 224]]   [64, 64, 112, 112]       9,472     
    ReLU-1      [[64, 192, 56, 56]]   [64, 192, 56, 56]          0       
  MaxPool2D-1   [[64, 832, 14, 14]]    [64, 832, 7, 7]           0       
   Conv2D-2      [[64, 64, 56, 56]]   [64, 192, 56, 56]       110,784    
  AvgPool2D-1    [[64, 1024, 7, 7]]    [64, 1024, 1, 1]          0       
   Dropout-1     [[64, 1024, 1, 1]]    [64, 1024, 1, 1]          0       
   Flatten-1     [[64, 1024, 1, 1]]       [64, 1024]             0       
   Linear-1         [[64, 1024]]           [64, 12]           12,300     
   Softmax-1         [[64, 12]]            [64, 12]              0       
===========================================================================
Total params: 132,556
Trainable params: 132,556
Non-trainable params: 0
---------------------------------------------------------------------------
Input size (MB): 36.75
Forward/backward pass size (MB): 1001.42
Params size (MB): 0.51
Estimated Total Size (MB): 1038.67
---------------------------------------------------------------------------






{'total_params': 132556, 'trainable_params': 132556}

#模型的训练：
rate = 0.01
epochs = 90
Batchsize = 16
GoogLeNet_v1_model.prepare(optimizer=paddle.optimizer.Adam(learning_rate=rate, parameters=GoogLeNet_v1_model.parameters()),
             loss=paddle.nn.CrossEntropyLoss(),
             metrics=paddle.metric.Accuracy())
             loss=paddle.nn.CrossEntropyLoss(),
             metrics=paddle.metric.Accuracy())
GoogLeNet_v1_model.fit(trainset, epochs=epochs, batch_size=Batchsize, verbose=1)

The loss value printed in the log is the current step, and the metric is the average value of previous step.
Epoch 1/90
step  10/113 [=>............................] - loss: 2.5875 - acc: 0.0797 - ETA: 2:34 - 2s/step

【人工智能】AI现状分析 || 神经网络的数学基础 || 人工智能交叉领域的发展和技术应用 || 附：小白入门人工智能学习步骤追光者♂ Python从入门到人工智能百题千解计划(项目实战案例）人工智能交叉领域神经网络的数学基础 AI现状分析
声明：仅学习使用~资料整理分析不易，点个赞吧！目录1.AI现状分析（人工智能基础入门概念）1.1人工智能基础概念1.2人工智能的技术发展路线1.3产业发展的驱动因素1.4人工智能薪资岗位介绍2.神经网络的数学基础2.1神经网络的生物表示2.2神经网络的数学表示2.3神经网络必备的一些数学基础2.3.1Sigmoid函数2.3.2偏置2.4总结3.人工智能交叉领域的发展和技术应用3.1人工智能应用交
conda更换环境版本（比如torch版本）挨打且不服66 python python
找到想要的torch版本pytorch官网torch过往的版本创建新环境condacreate--namemyenvpython=3.8condaactivatemyenvconda虚拟环境中安装CUDA和CUDNN深度学习用显卡训练的时候，需要安装与显卡对应的cuda和cudnn。但不同的项目所支持的pytorch版本是不一样的，而pytorch版本和cuda版本之间又是互相依赖的，所以如果可以
一文读懂！深度学习 + PyTorch 的超实用学习路线 a小胡哦深度学习 python pytorch
深度学习作为人工智能领域的核心技术，正深刻改变着诸多行业。PyTorch则是深度学习实践中备受青睐的框架，它简单易用且功能强大。下面就为大家详细规划深度学习结合PyTorch的学习路线。一、基础知识储备数学基础数学是很重要的！！！线性代数、概率论与数理统计、微积分是深度学习的数学基石。熟悉矩阵运算、概率分布、梯度计算等概念，能帮助理解深度学习模型的原理。例如，在神经网络中，矩阵乘法用于神经元之间的
随机梯度下降一定会收敛么？ AndrewHZ 人工智能深度学习算法
1.什么是随机梯度下降？随机梯度下降（StochasticGradientDescent，SGD）是一种用于最小化目标函数的迭代优化算法，在机器学习和深度学习领域应用广泛。2.随机梯度下降算法的基本原理1.基于梯度的优化基础该算法是基于梯度的优化算法，用于寻找函数的最优解，通常是最小化损失函数。在机器学习和深度学习中，模型通过调整参数来最小化损失函数，以达到最佳的预测性能。2.迭代更新参数从初始的
大规模GPU集群的进阶之路卢旗人工智能
大家好，我是卢旗。今天来聊聊GPU。GPU，全称GraphicProcessingUnit，即图形处理器。它的并行处理能力非常强大，能够同时处理多个任务和数据，因此被广泛用于图形渲染、视频处理、深度学习、科学计算等领域。研发团队在负责制定硬件选型策略并设计优化下一代大规模GPU集群的软硬件架构时，我们需要关注GPU技术的最新进展、重点研究问题以及潜在的技术突破。一、GPU在重点研究的问题算力提升与
PyTorch `.pth` 转 ONNX：从模型训练到跨平台部署 MO__YE 人工智能
PyTorch.pth转ONNX：从模型训练到跨平台部署在深度学习里，模型的格式决定了它的可用性。如果你是PyTorch用户，你可能熟悉.pth文件，它用于存储训练好的模型。但当你想在不同的环境（如TensorRT、OpenVINO、ONNXRuntime）部署模型时，.pth可能并不适用。这时，ONNX（OpenNeuralNetworkExchange）就必不可少。本文目录：什么是.pth文件
什么是Scaling Laws（缩放定律）；DeepSeek的Scaling Laws ZhangJiQun&MXP 教学 2024大模型以及算力 2021 论文人工智能自然语言处理神经网络语言模型深度学习
什么是ScalingLaws（缩放定律）ScalingLaws（缩放定律）在人工智能尤其是深度学习领域具有重要意义，以下是相关介绍及示例：定义与内涵ScalingLaws主要描述了深度学习模型在规模（如模型参数数量、训练数据量、计算资源等）不断扩大时，模型性能与这些规模因素之间的定量关系。它表明，在一定条件下，模型的性能会随着模型规模的增加而以某种可预测的方式提升，通常表现为模型的损失函数值随模型
PyTorch `.pth` 转 ONNX：从模型训练到跨平台部署 MO__YE pytorch 人工智能 python
PyTorch.pth转ONNX：从模型训练到跨平台部署在深度学习里，模型的格式决定了它的可用性。如果你是PyTorch用户，你可能熟悉.pth文件，它用于存储训练好的模型。但当你想在不同的环境（如TensorRT、OpenVINO、ONNXRuntime）部署模型时，.pth可能并不适用。这时，ONNX（OpenNeuralNetworkExchange）就必不可少。本文目录：什么是.pth文件
【生物AI】AI在生物医药研发中的应用：基于深度学习的疾病诊断标志物发现 Anitalin00 生物AI 人工智能深度学习
摘要生物医药研发一直是推动人类健康进步的关键领域，然而传统研发方式在疾病诊断标志物发现方面存在效率低、准确性不足等问题。人工智能（AI），特别是深度学习技术，凭借其强大的数据处理和特征挖掘能力，为疾病诊断标志物的发现带来了新的契机。本文深入探讨AI在这一领域的具体应用，涵盖详细的实现流程、代码示例、运行结果分析，以及实际使用场景和应用效果评估。一、引言疾病诊断标志物是能够反映疾病发生、发展过程的生
商汤绝影端到端自动驾驶的迭代优化 AGI大模型与大数据研究院计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
自动驾驶,端到端,迭代优化,深度学习,感知,规划,控制,模型训练,数据增强,模型微调1.背景介绍随着人工智能和计算机视觉技术的飞速发展，自动驾驶汽车从科幻走进了现实。商汤科技推出的绝影端到端自动驾驶系统，就是其中的佼佼者。本文将深入剖析商汤绝影端到端自动驾驶系统的迭代优化过程，帮助读者理解其背后的技术原理和架构设计。2.核心概念与联系商汤绝影端到端自动驾驶系统的核心架构如下：graphLRA[感知
DeepSeek的无限可能：探索前沿AI技术在多领域的应用编码追梦人 AI人工智能人工智能
引言2023年，全球人工智能产业规模突破万亿美元大关，一场以深度学习为核心的技术革命正以前所未有的速度重构人类社会的运行逻辑。在这场变革的浪潮中，中国AI企业深度求索（DeepSeek）以其独特的“问题驱动型”技术路径，悄然构建起覆盖科研、医疗、金融、教育等领域的智能生态系统。第一章技术底座：重构AI核心范式1.1MoE架构的颠覆性创新传统Transformer模型面临参数爆炸与能耗困境，Deep
什么是神经网络 jerryjee 神经网络与深度学习神经网络深度学习机器学习人工智能 python
概述简而言之，神经网络就是函数：输入数据，输出结果。函数我们以MNIST手写数字图像识别为例，来定义一下对应的函数形式：任务类型：图像分类输入：一张图像包含28x28=784个像素，每个像素用一个实数表示输出：0-9任务描述：从图像张识别出唯一的数字函数定义y=f(x1,x2,...,x784)y=f(x_1,x_2,...,x_{784})y=f(x1,x2,...,x784)xi∈R,i=1,
DeepSeek-R1驱动下一代AIGC安全：全面解析智能内容合规审查技术体系与实战案例 Coderabo DeepSeek R1模型企业级应用 AIGC 安全
DeepSeek-R1赋能AIGC内容合规审查：技术实践与案例解析一、AIGC内容合规审查技术架构（此处展开约1500字的技术原理说明，涵盖深度学习模型、规则引擎、多模态检测等核心组件）二、核心实施步骤与代码实现1.文本内容预处理模块importrefromdeepseek_nlpimportTextCleanerdeftext_preprocessing(text):#特殊字符过滤cleaner
Decoder-Only、Encoder-Only、Encoder-Decoder 区别会喘气的粽子丶 nlp 人工智能
Decoder-Only、Encoder-Only和Encoder-Decoder是三种常见的神经网络架构，主要用于自然语言处理（NLP）任务。它们在结构和应用上有显著的区别。1.Decoder-Only架构描述：仅包含解码器部分，没有编码器。应用：通常用于生成任务，如语言模型和对话系统。代表模型：GPT（GenerativePre-trainedTransformer）特点：自回归生成：模型通过
新书速览|细说PyTorch深度学习：理论、算法、模型与编程实现全栈开发圈深度学习 pytorch 算法
超详细的PyTorch深度学习入门书，100余个编程示例+6大热点案例，大咖带路，边学边实践。本书特点：1.专家编撰：由资深专家精心编撰，通俗易懂，娓娓道来2．范例丰富：100余个编程教学示例，帮你深入理解，边学习、边操练。3.实战应用：6大典型应用，原理与实操并重，快速掌握提升实战能力。4技术先进：视觉transformer模型详解，紧跟大模型核心技术。5易于上手：Pytorch详解并使用Pyt
【YOLO模型】（1）--YOLO是什么方世恩 YOLO YOLO 人工智能目标检测
一、什么是YOLOYOLO（YouOnlyLookOnce）是一种基于深度学习的目标检测算法，由JosephRedmon等人于2016年提出。1.核心思想它的核心思想是将目标检测问题转化为一个回归问题，通过一个神经网络直接预测目标的类别和位置。2.原理YOLO算法将输入图像分成SxS个网格，每个网格负责预测该网格内是否存在目标以及目标的类别和位置信息。此外，YOLO算法还采用了多尺度特征融合的技术
神经网络常见激活函数 10-GELU函数亲持红叶神经网络常见激活函数神经网络 neo4j 人工智能
GELU高斯误差线性单元（Gaussianerrorlinearunit）函数+导函数GELU函数的公式(近似表达式)GELU(x)=x∗P(X<=x)=x∗Φ(x)\rmGELU(x)=x*P(X<=x)=x*\Phi(x)GELU(x)=x∗P(X<=x)=x∗Φ(x)其中Φ(x)\Phi(x)Φ(x)指的是x的高斯正太分布的累积分布函数(CDF),进一步地，可得该函数的具体表达为x∗P(X<
ocr智能票据识别系统|自动化票据识别集成方案 OCR_API 接口 ocr 自动化运维
在企业日常运营中，对大量票据实现数字化管理是一项耗时且容易出错的任务。随着技术的进步，OCR（光学字符识别）智能票据识别系统的出现为企业提供了一个高效、准确的解决方案，不仅简化了财务流程，还大幅提升了工作效率。一、什么是OCR智能票据识别系统？OCR智能票据识别系统是一种基于先进图像处理和深度学习算法的技术，能够自动从各类票据中提取关键信息，并将其转换为结构化数据。翔云发票识别系统可以应用于增值税
在linux 中搭建deepseek 做微调，硬件配置要求说明慧香一格学习 AI linux 服务器 deepseek
搭建可参考使用deepseek-CSDN博客官方网站：DeepSeekDeepSeek是一个基于深度学习的开源项目，旨在通过深度学习技术来提升搜索引擎的准确性和效率。如果你想在Linux系统上搭建DeepSeek，你可以遵循以下步骤。这里我将提供一个基本的指导，帮助你从零开始搭建一个基础的DeepSeek环境。1.安装依赖首先，确保你的Linux系统上安装了Python和pip。DeepSeek主
深度学习与图像识别：机器学习基础之回归 Shenrn_ 机器学习回归深度学习
1.线性回归1.1一元线性回归1.2多元线性回归2.逻辑回归与线性回归的不同在于其将最终预测值y固定在一个范围之中2.1Sigmoid函数sigmoid函数表达式：p为预测出来的概率，范围在0-1之间，一般用于处理二分类问题，因为这个式子的一个显著特征在于：当z=0,p=0.5当z>0,p>0.5当z<0,p<0.5所以当对z进行多元线性回归表示的时候，以p的值来反映y_pre是一个不错的选择，此
深度学习下的图像分割人工智能大讲堂深度学习人工智能
在之前写的文章[图像分割演进之路]中，讲述了图像分割的发展历程，从传统图像分割算法到人工智能，分割算法百花齐放，但最终的佼佼者当属人工智能，但即使是人工智能领域，图像分割也五花八门，今天就让我们看几种基于学习的图像分割方法。基于学习的图像分割算法主要依赖于深度神经网络，经典的深度神经网络分为如下几种：2.1卷积神经网络CNN：卷积神经网络是图像处理领域应用最为广泛的网络，其权值共享，局部连接等特性
深入剖析模型推理：原理、技术与挑战 ♢.＊人工智能模型推理
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！引言在当今人工智能飞速发展的时代，模型
AI 编程工具崛起，程序员的未来是否岌岌可危？
一、AI编程工具的现状AI编程工具的出现与迅猛发展是技术进步的必然结果。这一趋势首先得益于开源社区和代码托管平台提供的丰富代码样本，它们为AI模型的学习提供了充足的素材。其次，编程语言本身的严格语法和结构化特点，使得AI能够高效、精确地理解和生成代码。再者，深度学习技术的突破，尤其是大语言模型在代码理解与生成方面的显著进展，为AI编程提供了坚实的技术基础。最后，随着软件开发需求的不断增加，传统开发
LSTM-SVM故障诊断 | 基于长短期记忆神经网络-支持向量机多特征分类预测/故障诊断Matlab代码实现机器学习之心分类预测神经网络 lstm 支持向量机 LSTM-SVM 故障诊断
LSTM-SVM故障诊断|基于长短期记忆神经网络-支持向量机多特征分类预测/故障诊断Matlab代码实现完整代码私信回复LSTM-SVM故障诊断|基于长短期记忆神经网络-支持向量机多特征分类预测/故障诊断Matlab代码实现一、引言1.1、研究背景和意义在现代工业生产中，机械设备的高效稳定运行对保障生产安全和提高生产效率至关重要。因此，故障诊断技术作为预防和维护设备性能的关键手段，受到了广泛关注和
线性代数导引：张量与张量空间 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
线性代数，张量，张量空间，深度学习，机器学习，人工智能1.背景介绍在现代人工智能领域，深度学习和机器学习算法的蓬勃发展，使得对数据的高效处理和表示能力提出了更高的要求。线性代数作为数学基础，为理解和构建这些算法提供了坚实的基础。而张量，作为一种高维数组的表示形式，成为了深度学习和机器学习的核心数据结构。本篇文章将从线性代数的角度出发，深入探讨张量与张量空间的概念，并阐述其在深度学习和机器学习中的重
每天五分钟深度学习框架pytorch：搭建谷歌的Inception网络模块每天五分钟玩转人工智能深度学习框架pytorch 深度学习 pytorch 网络人工智能机器学习 Inception
本文重点前面我们学习了VGG，从现在开始我们将学习谷歌公司推出的GoogLeNet。当年ImageNet竞赛的第二名是VGG，而第一名就是GoogLeNet,它的模型设计拥有很多的技巧，这个model证明了一件事：用更多的卷积，更深的层次可以得到更好的结构GoogLeNet的网络结构如图所示就是GoogLeNet的网络结构，在这个网络结构中我们可以看到红色框起来的地方，他就是Inception块，
使用opencv实现深度学习的图片与视频的超分辨率人工智能研究所人工智能之计算机视觉 opencv 深度学习视频超分辨率图片超分辨率
图片超分辨率什么是视频与图片的超分辨率，总结一下便是给一张分辨率比较低的图片，进行超分辨率的处理后，生成比较清晰的高分辨率的图片，上图图片完美解释了超分辨率的过程，由于不同的算法不同，处理的结果也不相同，本期我们介绍一下如何进行图片的超分辨率的处理。·EDSR模型图像超分辨率EDSR：EnhancedDeepResidualNetworksforSingleImageSuper-Resolutio
OpenCV机器学习（1）人工神经网络 - 多层感知器类cv::ml::ANN_MLP 村北头的码农 OpenCV opencv 机器学习人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::ml::ANN_MLP是OpenCV库中的一部分，用于实现人工神经网络-多层感知器（ArtificialNeuralNetwork-Multi-LayerPerceptron,ANN-MLP）。它提供了一种方式来创建和训练多层感知器模型，以解决分类、回归等
Pytorch实现mnist手写数字识别 Zn要学习 python
>-**本文为[365天深度学习训练营]中的学习记录博客**>-**原作者：[K同学啊]**我的环境：语言环境：Python3.8编译器：JupyterLab深度学习环境：torch==1.12.1+cu113torchvision==0.13.1+cu113一、前期准备1.设置GPU如果设备上支持GPU就使用GPU,否则使用CPUimporttorchimporttorch.nnasnnimpo
本地部署DeepSeek模型技术指南 Evaporator Core apache Doris 人工智能 deepseek
DeepSeek模型是一种先进的深度学习模型，广泛应用于自然语言处理、计算机视觉等领域。为了充分利用DeepSeek模型的强大功能，许多开发者和研究人员选择在本地环境中部署该模型。本文将详细介绍如何在本地环境中部署DeepSeek模型，包括环境准备、模型下载、配置、优化以及代码实现等内容。通过本文的指导，您将能够在本地成功部署并运行DeepSeek模型。1.环境准备在部署DeepSeek模型之前，
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持

GoogLeNet-论文阅读及paddlepaddle复现

你可能感兴趣的:(深度学习,神经网络,paddlepaddle)