梦在黎明破晓时啊

Xception 算法详解

本次重点（模型轻量化）：
● Inception设计理念
● 点卷积
● 深度可分离卷积
● Bottleneck结构
注：Xception算法整体结构是其次，主要是了解以上四个结构。

今天详解Xception算法，由于Xception模型在极大的减少了网络参数量和计算复杂度的同时，可以保持卓越的性能表现。因此，Xception模型已经被广泛地应用与图像分类、目标检测等任务中。

一、理论基础

1.前言

在计算机视觉领域，卷积神经网络（CNN）已经成为最主流的方法，比如GoogLenet，VGG-16，Incepetion等模型。CNN史上的一个里程碑事件是ResNet模型的出现，ResNet可以训练出更深的CNN模型，从而实现更高的准确度。ResNet模型的核心是通过建立前面层与后面层之间的“短路连接”，进而训练出更深的CNN网络。

随着图像分类的准确率不断提高，网络的深度越来越深，图像分类的错误率也越来越低，从2012的AlexNet，2013年的ZFNet，2014年的GoogLeNet，再到后面2015年的ResNet，准确率已经超过了人类的水平，所以单纯从准确率方面考虑的话已经很难提升了；因此人们就开始从其他方面考虑，比如参数量和计算量，软硬件协同等。

今天我们要介绍的是Xception模型，Xception是Google继Inception后提出的对Inception V3的另一种改进，主要是采用深度可分离卷积（Depthwise Separable Convolution）来替换原来Inception V3中的卷积操作。

论文原文：Xception.pdf

2.设计理念

前面说了，由于CNN模型的精度已经很难进一步提升，所以研究者们就把注意力放到了减少模型参数量和计算量上，因此Xception应运而生。而Xception就是研究者们在Inception V3模型上的进一步改进，通过用深度可分离卷积替换Inception V3中的多尺寸卷积核特征响应操作，最终达到了精度的略微提升和参数量的减少。在讲解Xception之前，我们先对它的前身Inception进行一番了解，然后再一步步往Xception方面讲述。

2.1多尺度卷积核
Inception 最初提出的版本，其核心思想就是使用多尺寸卷积核去观察输入数据。

举个例子，我们看某个景象由于远近不同，同一个物体的大小也会有所不同，那么不同尺度的卷积核观察的特征就会有这样的结果。于是就有了如下的网络结构图：

于是我们的网络就变胖了，增加了网络的宽度，同时也提高了对于不同尺度的适应程度。

2.2 点卷积（Pointwise Conv）
但是我们的网络变胖了的同时，计算量也变大了，所以我们就要想办法减少参数量来减少计算量，于是在Inception v1 中的最终版本加上了1x1 卷积核。

使用 1x1 卷积核对输入的特征图进行降维处理，这样就会极大得减少参数量，从而减少计算。

举例，输入数据的维度是256维，经过1x1 卷积之后，我们输出的维度是64维，参数量是原来的 $\frac{1}{4}$ 。

这就是 Pointwise Convolution，俗称叫做 1x1 卷积，简写为 PW，主要用于数据降维，减少参数量。

2.3 卷积核替换

就算有了 PW ，由于 5x5 和 7x7 卷积核直接计算参数量还是非常大，训练时间还是比较长，我们还要再优化。

人类的智慧是无穷的，于是就想出了使用多个小卷积核替代大卷积核的方法，这就是 Inception v3，如图3所示：

使用两个 3x3 卷积核来代替 5x5 卷积，效果上差不多，但参数量减少很多，达到了优化的目的。不仅参数量少，层数也多了，深度也变深了。

除了规整的的正方形，我们还有分解版本的 3x3 = 3x1 + 1x3，这个效果在深度较深的情况下比规整的卷积核更好。

我们假设输入 256 维，输出 512 维，计算一下参数量：

● 5x5 卷积核： $256\times5\times5\times512=3276800$
● 两个 3x3 卷积核： $256\times3\times3\times256+256\times3\times3\times512=589824+1179648=1769472$

结果对比： $\frac{1769472}{3276800}=0.54$
我们可以看到参数量对比，两个 3x3 的卷积核的参数量是 5x5 一半，可以大大加快训练速度。

2.4 Bottleneck

我们发现就算用了上面的结构和方法，我们的参数量还是很大，于是乎我们结合上面的方法创造出了 Bottleneck 的结构降低参数量。

Bottleneck 三步走是先 PW卷积对数据进行降维，再进行常规卷积核的卷积，最后 PW 卷积对数据进行升维。我们举个例子，方便我们了解：

根据上图，我们来做个对比计算，假设输入 feature map 的维度为 256 维，要求输出维度也是 256 维。有以下两种操作：
● 直接使用 3x3 的卷积核。256 维的输入直接经过一个 3×3×256 的卷积层，输出一个 256 维的 feature map ，那么参数量为：256×3×3×256 = 589,824 。
● 先经过 1x1 的卷积核，再经过 3x3 卷积核，最后经过一个 1x1 卷积核。 256 维的输入先经过一个 1×1×64 的卷积层，再经过一个 3x3x64 的卷积层，最后经过 1x1x256 的卷积层，则总参数量为：256×1×1×64 + 64×3×3×64 + 64×1×1×256 = 69,632 。
经过两种方式的对比，我们可以很明显的看到后者的参数量远小于前者的。

2.5 深度可分离卷积（Depthwise Separable Convolutions）

深度可分离卷积（Depthwise Separable Convolutions）不同之处在于，其不仅仅涉及空间维度，还涉及深度维度（即 channel 维度）相较于常规卷积操作，其参数数量和运算成本比较低。通常输入图像会具有3个channel：R、G、B。在经过一系列卷积操作后，输入特征图就会变为多个channel。对于每个channel而言，我们可以将其想成对该图像某种特定特征的解释说明。例如输入图像中，“红色” channel 解释描述了图像中的“红色”特征，“绿色” channel 解释描述了图像中的“绿色”特征，“蓝色” channel 解释描述了图像中的“蓝色”特征。又例如 channel 数量为64的输出特征图，就相当于对原始输入图像的64种不同的特征进行了解释说明。

类似空间可分离卷积，深度可分离卷积也是将卷积核分成两个单独的小卷积核，分别进行2种卷积运算：深度卷积运算和逐点卷积运算。首先，让我们看看正常的卷积是如何工作的。

1）标准卷积
假设我们有一个 $12\times12\times3$ 的输入图像，即图像尺寸为 $12\times12$ ，通道数为 $3$ ，对图像进行 $5\times5$ 卷积，没有填充（padding）且步长为1。如果我们只考虑图像的宽度和高度，使用 $5\times5$ 卷积来处理 $12\times12$ 大小的输入图像，最终可以得到一个 $8\times8$ 的输出特征图。至于如何计算的就涉及到卷积运算了，这里给出一个动图1解释如下：

图1 单通道卷积运算

然而，由于图像有3个通道，我们的卷积核也需要有3个通道。这就意味着，卷积核在每个位置进行计算时，实际上会执行 $5\times5\times3=75$ 次乘法。如图2所示，我们使用一个 $5\times5\times3$ 的卷积核进行运算，最终可以得到 $8\times8\times1$ 的输出特征图。

单个三通道特征图卷积计算过程也可以用一张动图3解释如下：

图3 单个三通道特征图卷积运算

如果我们想增加输出的 channel 数量让网络学习更多种特征呢？这时我们可以创建多个卷积核，比如256个卷积核来学习256个不同类别的特征。此时，256个卷积核会分别进行运算，得到256个 $8\times8\times1$ 的输出特征图。如图4 所示。

图4 输出通道为256的标准卷积

2）深度卷积运算
我们第二个已经讲解过了DW卷积，而深度可分离卷积就运用到了DW卷积。首先，我们对输入图像进行深度卷积运算，这里的深度卷积运算其实就是逐通道进行卷积运算。对于一副 $12\times12\times3$ 的输入图像而言，我们使用大小为 $5\times5$ 的卷积核进行逐通道计算，计算方式如图5所示：

图5 深度卷积运算

这里其实就是使用3个 $5\times5\times1$ 的卷积核分别提取输入图像中3个 channel 的特征，每个卷积核计算完成后，会得到3个 $8\times8\times1$ 的输出特征图，将这些特征图堆叠在一起就可以得到大小为 $8\times8\times3$ 的最终输出特征图。这里我们可以发现深度卷积运算的一个缺点，即深度卷积运算缺少通道间的特征融合，并且运算前后通道数无法改变。

因此，接下来就需要连接一个逐点卷积来弥补它的缺点。

3）逐点卷积运算

前面我们使用深度卷积运算完成了从一幅 $12\times12\times3$ 的输入图像中得到 $8\times8\times3$ 的输出特征图，并且发现仅使用深度卷积无法实现不同通道间的特征融合，而且也无法得到与标准卷积运算一致的 $8\times8\times256$ 的特征图。那么，接下来就让我们看一下如何使用逐点卷积实现这两个任务。逐点卷积其实就是 $1\times1$ 卷积，因为其会遍历每个点，所以我们称之为逐点卷积。 $1\times1$ 卷积在前面的内容中已经详细介绍了，这里我们还是结合上边的例子看一下它的具体作用。

我们使用一个3通道的 $1\times1$ 卷积对上文中得到的 $8\times8\times3$ 的特征图进行运算，可以得到一个 $8\times8\times1$ 的输出特征图。如图6 所示。此时，我们就使用逐点卷积实现了融合3个通道间特征的功能。

此外，我们可以创建256个3通道的 $1\times1$ 卷积对上文中得到的 $8\times8\times3$ 的特征图进行运算，这样，就可以实现得到与标准卷积运算一致的 $8\times8\times256$ 的特征图的功能。如图7 所示。

图7 输出通道为256的逐点卷积

4）深度可分离卷积的意义
上文中，我们给出了深度可分离卷积的具体计算方式，那么使用深度可分离卷积代替标准卷积有什么意义呢？

这里我们看一下上文例子中标准卷积的乘法运算个数，我们创建了256个 $5\times5\times3$ 的卷积核进行卷积运算，每个卷积核会在输入图片上移动 $8\times8$ 次，因此总的乘法运算个数为：

$256\times3\times5\times5\times8\times8=1228800$

而换成深度可分离卷积后，在深度卷积运算时，我们使用3个 $5\times5\times1$ 的卷积核在输入图片上移动 $8\times8$ 次，此时乘法运算个数为：

$3\times5\times5\times8\times8=4800

在逐点卷积运算时，我们使用256个 $1\times1\times3$ 的卷积在输入特征图上移动 $8\times8$ 次，此时乘法运算个数为：

$256\times1\times1\times3\times8\times8=49152$

将这两步运算相加，即可得到，使用深度可分离卷积后，总的乘法运算个数变为：53952。可以看到，深度可分离卷积的运算量相较标准卷积而言，计算量少了很多。

3.网络结构

Xception的具体网络结构如图11所示：

图11 Xception网络结构

Xception包含三个部分：输入部分（Entry flow），中间部分（Middle flow）和结尾部分（Exit flow）；其中所有卷积层和可分离卷积层后面都使用Batch Normalization处理，所有的可分离卷积层使用一个深度乘数1（深度方向并不进行扩充）。

对于Entry flow，首先使用了两个3x3卷积（conv1，conv2）降低特征图尺寸，同时增加了特征图个数；接着是3个含跳连的深度可分离卷积堆叠模块。

对于Middle flow，包含了8个一模一样的含跳连的深度可分离卷积堆叠模块。

对于Exit flow，首先是一个含跳连的深度可分离卷积堆叠模块，接着是一些深度可分离卷积层以及全局平均池化层，最后用全连接层输出分类结果。

二、搭建网络模型

我的环境：
● 语言环境：Python3.8
● 编译器：Jupyter Lab
● 深度学习环境：Pytorch
○ torch1.12.1+cu113
○ torchvision0.13.1+cu113

1. SeparableConv模块定义
结构图中的SeparableConv组件就是depthwise separable convolution（深度可分离卷积），它是由depthwise conv（dw）和pointwise conv（pw）组成。根据原论文描述，dw与pw的先后顺序对最终效果并无影响，其结构定义如下

class SeparableConv(nn.Module):
    def __init__(self, in_channels, out_channels, kernel_size, stride=1, padding=0):
        super(SeparableConv, self).__init__()
        self.depthwise = nn.Conv2d(in_channels, in_channels, kernel_size, stride, padding, groups=in_channels)
        self.pointwise = nn.Conv2d(in_channels, out_channels, kernel_size=1)
        
    def forward(self, x):
        x = self.depthwise(x)
        x = self.pointwise(x)
        return x

2. XceptionBlock_1定义
根据结构图，Entry flow由两个卷积层和三个相同的子模块构成，我们将这个子模块命名为XceptionBlock_1，其结构如上图。可以看出，XceptionBlock_1的两个分支以残差的的形式进行连接，其中主分支需要经过两个SeparableConv层和一个最大池化层，残差分支则经过步距为2的1*1卷积层。XceptionBlock_1模块的定义如下

class XceptionBlock_1(nn.Module):
    def __init__(self, in_channels, out_channels):
        super(XceptionBlock_1, self).__init__()
        self.relu = nn.ReLU()
        self.sepconv1 = SeparableConv(in_channels, out_channels, kernel_size=3, padding=

【离散数学】关系闭包运算的性质彭彭不吃虫子机器学习人工智能
关系闭包运算是关系代数中的一个重要概念，它用于通过一系列运算来生成一个关系的闭包，即包含原关系的所有可能的“扩展”形式。关系闭包主要有三种类型：传递闭包、对称闭包和自反闭包。每种闭包运算都有一些性质，我们将逐个分析这些性质，并通过详细的例子和图形来加以说明。1.传递闭包（TransitiveClosure）定义：传递闭包是给定一个关系RR和一集合AA，通过不断加入能通过已有关系到达的元素来构建最小
基于Python机器学习、深度学习技术提升气象、海洋、水文领域实践应用 KY_chenzhao python 机器学习深度学习气象
1.背景与目标ENSO（ElNiño-SouthernOscillation）是全球气候系统中最显著的年际变率现象之一，对全球气候、农业、渔业等有着深远的影响。准确预测ENSO事件的发生和发展对于减灾防灾具有重要意义。近年来，深度学习技术在气象领域得到了广泛应用，其中长短期记忆网络（LSTM）因其在处理时间序列数据方面的优势，被广泛用于ENSO预测。2.数据准备数据来源包括NOAA（美国国家海洋和
基于R语言的DICE模型实践技术应用；评估气候变化对经济的影响以及不同减排政策的经济成本和效益 KY_chenzhao DICE模型 R语言气候变化
DICE模型是一个动态综合气候经济模型，由诺贝尔经济学奖得主WilliamNordhaus开发，用于评估气候变化对经济的影响以及不同减排政策的经济成本和效益。以下是一个关于DICE模型在气候变化影响评估中的实际应用案例，结合R语言代码进行讲解。实际案例：评估全球碳税政策的影响假设我们要评估一项全球碳税政策对经济增长、碳排放和气候变化的影响。我们将使用DICE模型的基本框架来进行分析。模型构建经济部
对超短脉冲的色散效应的研究 Bonnie1985119 hololens 人工智能 matlab python 算法
在现代光学系统中，超快现象经常被应用于各种各样的场合。由于这种短脉冲的光谱带宽很大，色散效应在这些系统的设计和分析中起着重要作用。因此，为了确保准确和合适的建模，系统中的所有色散效应都必须得到充分考虑。为了强调快速物理光学软件VirtualLabFusion在这个特定光学领域的能力，我们展示了两个例子。在第一个例子中，我们研究了一个脉冲在不同材料中传播时的行为，并说明了相应的色散相关效应。我们还用
构建一个查询分析系统 AWsggdrg 数据库 python
技术背景介绍在构建一个查询分析系统时，需要能够加载文档、使用聊天模型、生成嵌入、创建向量存储并执行检索。这些过程的目标是将用户输入的查询优化，以实现更为精准的检索结果。本文将通过一个端到端的示例展示如何使用查询分析提升检索结果的相关性。我们将着眼于如何对LangChain的YouTube视频进行检索，并通过查询分析解决原始用户问题直接传递给搜索引擎时可能出现的失败模式。核心原理解析查询分析的核心在
MDX语言的编程范式 BinaryBardC 包罗万象 golang 开发语言后端
MDX语言的编程范式引言MDX（MultidimensionalExpressions）是一种查询语言，主要用于在多维数据集中检索数据。这种语言广泛应用于商业智能（BI）领域，尤其是在与分析服务（如MicrosoftAnalysisServices）相关的上下文中。MDX语言提供了一个强大的语法，使得开发者能够以灵活的方式操作多维数据模型。本文将深入探讨MDX的编程范式，从基本语法、查询结构到高级
MDX语言的数据类型 BinaryBardC 包罗万象 golang 开发语言后端
MDX语言的数据类型详解引言MDX（多维表达式）是一种用于查询和操作多维数据集的查询语言，广泛用于数据分析和商业智能领域。MDX语言的设计旨在帮助用户高效地从多维数据库（如MicrosoftSQLServerAnalysisServices）中提取和分析数据。随着数据量的不断增加和数据结构的日益复杂，MDX提供了一种强大的方式来处理和分析这些多维数据。在MDX中，数据类型是理解和使用该语言的基础，
R语言的软件工程 BinaryBardC 包罗万象 golang 开发语言后端
R语言的软件工程1.引言随着数据科学的快速发展，R语言作为一种统计计算和图形绘制的编程语言，其在数据分析、可视化以及机器学习等领域的应用日益广泛。尽管R语言在数据处理上有其独特的优势，但要将其运用于大型项目和商业应用中，就需要遵循软件工程的原则。本篇文章将探讨R语言在软件工程中的应用，主要涵盖软件开发生命周期、代码规范、版本控制、测试和文档等方面。2.软件开发生命周期软件开发生命周期（SDLC）是
AI 2025：技术飞跃与应用鸿沟——AI代码生成器引领未来？前端
2024年，人工智能技术经历了前所未有的飞跃。大型语言模型（LLM）的能力显著提升，成本大幅下降，多模态应用成为主流。然而，令人担忧的是，技术进步与实际应用普及之间存在着巨大的鸿沟。“智能体”等概念被热炒，但实际应用却远未达到预期。本文将探讨这种技术进步与应用普及之间的矛盾，并分析弥合鸿沟的关键所在。技术的突飞猛进2024年，AI技术在多个方面取得了突破性进展。首先，模型能力得到了显著提升。GPT
StarRocks Awards 2024 年度贡献人物开源
在过去一年，StarRocks在Lakehouse与AI等关键领域取得了显著进步，其卓越的产品功能极大地简化和提升了数据分析的效率，使得"OneData，AllAnalytics"的愿景变得更加触手可及。虽然实现这一目标的道路充满挑战且漫长，但我们并不孤单，因为有一群社区伙伴与我们并肩作战。每一位贡献者的代码提交和每一次的布道，都在推动着StarRocks社区向前发展。为了表达对这些贡献者的深深感
华为OD机试E卷 --数大雁--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python js c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码题目描述一群大雁往南飞，给定一个字符串记录地面上的游客听到的大雁叫声，请给出叫声最少由几只大雁发出。具体：1.大雁发出的完整叫声为”quack“，因为有多只大雁同一时间嘎嘎作响，所以字符串中可能会混合多个”quack”2.大雁会依次完整发出”quack”，即字符串中’q，u,a，c，k这5个字母按
简单谈谈日志审计系统和堡垒机的区别服务器安全
日志审计系统和堡垒机有什么区别呢？日志审计系统和堡垒机是两种常见的安全工具，用于加强企业信息系统的安全性。尽管两者都有助于提高安全性，但它们在功能和应用方面有着显著的区别。日志审计系统和堡垒机有什么区别？1.什么是日志审计系统日志审计系统是一种集中管理和分析日志数据的工具。它能够自动收集来自不同设备和应用程序的日志信息，并对其进行存储和分析。通过日志审计系统，管理员能够实时监控系统的活动，并识别潜
RC和RR隔离级别下SELECT操作的读取机制及差异机械猿-- sql 数据库 mysql mybatis
RC（读已提交）和RR（可重复读）隔离级别下不同的查询语句行为不同，读取到的数据可能不同，以下是详细分析：RC（读已提交）隔离级别1.select*fromtablewhereid=1forupdate：读取类型：不管是否在事务中执行forupdate，这都是一种当前读，能确保读取的数据是最新的，因为forupdate会对符合条件的记录加排他锁。因为RC级别下是每次执行forupdate都会新生成
处理 SQL Server 中的表锁问题梓芮. SQL Server 数据库 sql sqlserver mssql 数据库开发微软数据库 sql 数据库
在SQLServer中，表锁是一个常见的问题，尤其是在并发访问和数据更新频繁的环境中。表锁会导致查询性能下降，甚至导致死锁和系统停滞。本文将详细介绍如何识别、分析和解决SQLServer中的表锁问题。什么是表锁？表锁是SQLServer用来管理并发访问的一种机制，确保多个事务在访问同一数据时不会互相干扰。表锁分为共享锁、排他锁和更新锁等类型。虽然锁机制可以保证数据的一致性，不当的锁策略可能会导致性
USB3.1 GEN2 信号完整性考虑芯片电源完整性与信号完整性设计
USB组织推出了一种通用的type-C连接器，可以在任何方向插入，与此相关的是分配给主机、设备和电缆组件的有限损耗预算，如图所示。按规格，电缆组件的允许损耗预算为USB3.1Gen2.0（SuperSpeed10Gbps）为6.0dB，其余分配的功耗预算在主机和设备之间平均分配，如上图所示。在实际进行测试时，信号通过主机和设备上的插座/插头连接器，从主机到分析仪的电缆，从分析仪到设备的电缆传播。对
Python mysql数据库连接池戴** Python
最近在写一个Python的文本分析,需要大量的读取数据库(千万级别mysql)并进行更新操作,运行着程序发现一个问题,过了一会儿程序就报错说链接已经满了,或者是端口不可重复使用,因此我在网上找到了一个连接池的代码用于解决这个问题,在此处贴出代码本身是有配置文件的,因为我觉得在我的项目中不必要所以就删除了#!/usr/bin/envpython#-*-coding:utf-8-*-importpym
SpringBoot Configuration Annotation Processor not configured 解决方案和详细问题分析以及作用 P7进阶路面试学习路线阿里巴巴 spring boot 后端 java
目录1、问题出现：2、解决方案：?2.1方式一?简单粗暴的禁止提示2.2方式二引入jar包3、问题深入探究写在前：笔者出现这个问题的时候，大概猜到是什么问题，在网上也是很快找到了解决方案，但是很多帖子，并没有深究，只是单纯的解决了问题。1、问题出现：当我们写配置类时就会出现如下的提示，虽然不影响运行，但看着实在碍眼，笔者这个是刚解决了的，为了记录，所以后面才截图，如果是一开始即对应的是后面截图的图
基于Python爬虫的豆瓣电影影评数据可视化分析 wp_tao Python副业接单实战项目 python 爬虫信息可视化
文章目录前言一、数据抓取二、数据可视化1.绘制词云图2.读入数据总结前言本文以电影《你好，李焕英》在豆瓣上的影评数据为爬取和分析的目标，利用python爬虫技术对影评数据进行了爬取，使用pandas库进行了数据清洗，使用jieba库进行分词，使用collections库进行词频统计，使用wordcloud库绘制词云图，使用matplotlib库绘制了评论人所在城市占比饼状图，并使用matplotl
程序设计思考：归零思想 hookby 程序设计
“归零思想”是一种在程序设计中常用的思考方法，主要指的是通过将某些值或状态归零，来简化问题或解决复杂度。这个思想在许多领域中都可以找到应用，尤其是在处理问题时需要清理和重置状态，避免累积错误或多余的计算。下面是几个典型的应用场景：1.状态重置在某些算法中，特别是动态规划、回溯、递归等问题中，我们可能需要在每个阶段重置某些变量或状态，防止它们影响后续的计算。例如，在递归算法中，递归结束后可以通过将某
BP神经网络及其Python和MATLAB实现预测陈辰学长神经网络 python matlab
BP神经网络及其Python和MATLAB实现预测引言BP神经网络（BackPropagationNeuralNetwork），即反向传播神经网络，是一种通过反向传播算法进行监督学习的多层前馈网络。这种网络能够通过不断地调整和改变神经元的连接权重，达到对特定任务的学习和优化。由于其高度的灵活性和适应性，BP神经网络在模式识别、函数逼近、优化问题等多个领域有着广泛的应用。本文将详细介绍BP神经网络的
TikTok跨境电商应该怎么做？几大关键策略在这菠萝派爱跨境网络物联网大数据服务器
根据最新数据显示，TikTok的用户数量在全球范围内迅速增长，尤其是在欧美、东南亚等地区，平台的用户粘性非常高，这使得TikTok成为了品牌、商家甚至独立卖家进行跨境电商业务的理想平台。然而，如何利用TikTok实现跨境电商的成功并非易事。本文将从市场分析、平台策略、运营方法等多方面分析，帮助商家做好TikTok跨境。一、TikTok跨境电商的市场潜力分析1.TikTok全球用户增长TikTok在
使用Anthropic API的入门指南 dqw41111d microsoft python
使用AnthropicAPI的入门指南在现代AI应用中，API提供了一种强大的方式来访问复杂的AI服务。Anthropic提供了一组强大的API来执行各种AI任务。本文将带您深入了解如何使用AnthropicAPI进行AI应用开发。技术背景介绍AnthropicAPI允许开发者以简单的HTTP请求模式与AI模型进行交互，返回的结果可以被用于多种场景，如文本生成、情感分析等。通过API，开发者可以避
保护你的会话令牌博文视点信息安全技术 ESAPI OWASP Top10 web Web WEB 会话安全
保护你的会话令牌通常我们会采取以下的措施来保护会话。1．采用强算法生成SessionID正如我们前面用WebScrab分析的那样，会话ID必须具有随机性和不可预测性。一般来说，会话ID的长度至少为128位。下面我们就拿常见的应用服务器Tomcat来说明如何配置会话ID的长度和生成算法。首先我们找到{TOMCAT_HOME}\conf\context.xml，然后加入下面一段设置➊定义会话ID的长度
C# 解析 HTML 实战指南 code_shenbing C#c#html 开发语言
在网页开发和数据处理的场景中，经常需要从HTML文档里提取有用的信息。C#作为一门强大的编程语言，提供了丰富的工具和库来实现HTML的解析。这篇博客就带你深入了解如何使用C#高效地解析HTML。一、为什么要在C#中解析HTML在实际项目中，无论是进行网页数据采集、网页内容分析，还是开发网页爬虫，都离不开对HTML的解析。例如，电商平台可能需要从竞品网站上采集商品价格和库存信息；新闻聚合应用可能需要
【Python】selenium结合js模拟鼠标点击、拦截弹窗、鼠标悬停方法汇总（使用 execute_script 执行点击的方法）翠花上酸菜 selenium 网络爬虫 python selenium javascript
我们在写selenium获取网络信息的时候，有时候我们会受到对方浏览器的监控，对方通过分析用户行为模式，如点击、滚动、停留时间等，网站可以识别出异常行为，进而对Selenium爬虫进行限制。这里我们可以加入JavaScript的使用。Selenium可以执行JavaScript，通过使用execute_script方法，来执行点击操作。它可以绕过一些Selenium直接操作元素时可能遇到的问题，比
探索前沿AI技术：什么是LLM框架?什么是Agent应用?什么是Workflow架构?一篇文章带你全部搞懂大模型学习路线大模型人工智能架构 llm agent ai 大模型 agi
探索前沿AI技术：什么是LLM框架?什么是Agent应用?什么是Workflow架构?前排提示，文末有大模型AGI-CSDN独家资料包哦！文章目录探索前沿AI技术：什么是LLM框架?什么是Agent应用?什么是Workflow架构?摘要引言正文LLM框架：定义与重要性什么是LLM框架?详细的知识点讲解和分析详细的代码案例详细的操作命令Agent应用：智能与自动化什么是Agent应用?知识点讲解代码
gaussdb大表查询性能慢的解决思路 _Evelyn 大数据 gaussdb
一、引言1.背景介绍数字化和智能化转型是经济发展的新动力。而面对国外对中国数据库市场的长期垄断，人们对于中国自研数据库的需求越来越普遍，高斯数据库成为许多企业的选择之一。在经营分析5G智慧加油站项目项目中，我接触到高斯数据库，并使用它来进行数据的存储和查询。高斯数据库是以PostgreSQL为内核进行开发的一款数据库产品，其具备了PostgreSQL的高并发特性，又具有很强的通用性，支持行和列两种
基于深度学习的极端天气预测全解析与实战指南：基于MetNet 模型 AI_DL_CODE 深度学习人工智能 MetNet 天气预测 python
摘要：本文全面解析了基于深度学习的极端天气预测，重点介绍了MetNet模型。首先，文章阐述了极端天气预测的重要性和传统天气预报的局限性。接着，详细介绍了MetNet模型的基本架构、特点以及与其他气象预测模型的对比。然后，通过实战案例展示了MetNet模型在极端降雨天气预测中的应用，包括数据准备、模型搭建与训练、模型评估与预测。最后，文章总结了MetNet模型的优势与挑战，并展望了深度学习在气象领域
深度解析：Python与TensorFlow在日平均气温预测中的应用——LSTM神经网络实战 AI_DL_CODE python 神经网络 tensorflow LSTM 气温预测 RNN
文章目录1.引言1.1研究背景与意义1.2研究目标与问题定义2.概念解析2.1Python语言简介2.2TensorFlow框架概述2.3LSTM神经网络原理3.原理详解3.1时间序列分析基础3.1.1时间序列的组成3.1.2时间序列分析方法3.2LSTM在时间序列分析中的应用3.2.1LSTM的优势3.2.2LSTM的结构3.3日平均气温预测的数学模型3.3.1ARIMA模型3.3.2LSTM模
国自然青年项目｜基于多模态影像组学的乳腺癌分子分型预测研究｜基金申请·25-01-20 罗小罗同学基金申请医学人工智能人工智能国自然
小罗碎碎念今天和大家分享一份国自然青年项目，项目执行期为2021-2023年，直接费用为24万。项目聚焦乳腺癌分子分型预测，综合运用多模态组学数据、影像组学技术和深度学习技术。研究内容包括跨模态医学图像分割、多模态特征提取与融合、模型设计与系统研发。通过提出一系列创新算法，如基于类别中心原型对齐器的图像分割算法、基于自注意力机制与生成对抗网络的聚类算法等，实现了对乳腺癌分子分型的高精度预测，并开发
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在

Xception 算法详解

一、理论基础

1.前言

2.设计理念

二、搭建网络模型

你可能感兴趣的:(深度学习经典文章理论及分析,算法,深度学习)