云从天上来

实例分割模型 YOLACT 和 YOLACT++

Paper：CVPR 2019 YOLACT: Real-time Instance Segmentation，CVPR 2020 YOLACT++: Better Real-time Instance Segmentation

1. YOLACT

1.1 相关工作/模型比较

1.1.1 Mask-R-CNN

1.1.2 FCIS

1.2 YOLACT

1.2.1 模型整体解析

1.2.2 backbone 和 neck

1.2.3 Protonet 定义与结构

1.2.4 Prediction head + Mask 定义与结构

1.2.5. Mask Assembly

1.2.6 Fast NMS

1.2.7 Loss

1.2.8 实验

2. 核心优势/特色以及缺陷

2. YOLACT++

2.1 改进1 Predition head

2.2 改进2 在Backbone中有间隔的引入DCN（Deformable Conv，可变形卷积）

2.3 改进3 引入新的小分支，优化mask的预测质量

2.4 YOLACT++的小总结

1. YOLACT

先要明确的知道，YOLACT是一个一阶段（one stage）、全卷积（FCN）、实例分割（instance segmentation）、！！anchor base！！模型。核心关注点在实时性上，该模型在单个Titan Xp上以33 fps在MS COCO上实现了29.8 mAP。

论文目的在于实现一个实时实例分割的任务，建立一个快速的单级实例分割模型。

1.1 相关工作/模型比较

1.1.1 Mask-R-CNN

two-stage 实例分割模型的集大成者，在检测框的基础上进行像素级的语义分割，简化了实例分割的难度，是 '先检测再分割’ 这一范式上的极致代表。我们知道在Faster-R-CNN中有两个主要的输出，对于每一个ROI（也称candidate object）输出分类结果以及预测anchor的坐标偏置（offset），为了完成实例分割任务，Mask-R-CNN在此基础之上添加了第三个输出：object mask，也就说对每个ROI都输出一个mask，就像下图1所示，两个conv完成了预测anchor的mask预测。

1.1.2 FCIS

FCN 最终输出的是类别的概率图，只有类别输出，没有单个实例输出，InstanceFCN输出3*3的位置信息图，只有单个实例输出，没有类别信息，需要单独的downstream网络完成类别信息。FCIS通过计算position-sensitive inside/outside score maps，同时输出 instance mask 和类别信息。

尽管从概念上讲比两阶段方法要快，但它们仍然需要repooling或其他特殊的计算（例如，mask voting）。这严重限制了它们的速度。

1.1.3 上述模型的一些总结

目前最好的two-stage实例分割方法，在预测mask的时候非常依赖于特征定位准确与否，也就是在一些b-box / Rois 区域要对特征进行“repooling”（RoI pooling/align），之后将新的定位特征送入mask预测分支中，这个过程是内在有序的（顺序执行），故很难加速。

1.2 YOLACT

1.2.1 模型整体解析

YOLACT的目的是将mask分支添加到现在的one stage目标检测模型中，为此，本文将实例分割这一复杂任务分解为两个更简单的并行任务，任务结果可以组合并形成最终的mask。

第一个任务分支（Protonet），该分支使用全卷积网络（FCN）来生成一组与原图像尺寸一样（存疑，在1.2.3的结构图中不是一样的）的 “原型掩码”（prototype masks），该掩码不依赖于任何一个特定的实例，是共用的。

第二个任务分支（mask coefficients），该分支向目标检测分支（预测 anchor ）添加额外的 head 为每一个实例 / anchor 预测一系列 “掩模系数”（mask coefficients）。

然后对经过NMS后的预测anchor（也可以说是实例，因为预测了掩模系数，相当于预测了类别），我们通过线性组合（Assembly）两个分支的结果来计算该 anchor或实例的 mask 。

再说一遍：YOLACT将实例分割问题分解为两个并行的部分，分别产生 “prototype masks” 和 “mask coefficients”。

1.2.2 backbone 和 neck

还是由上图可知，backbone还是熟悉的味道 ResNet残差结构 + FPN结构，论文中使用了 ResNet101，在后期公开的源代码中作者还实现了 ResNet50 和 DarkNet53。

neck部分可以看到，组合C3, C4, C5层的feature map构成FPN（特征金字塔网络P3, P4, P5, P6, P7），使用FPN的用意很简单，深层网络的feature map拥有更高的感受野、更抽象的特征能够更好的表达图像全局信息（比如是什么），浅层网络的feature map尺寸更大，拥有更多细节信息，能够更好的检测小目标。

接下来就是两个并行的分支：Protonet 和 mask coefficients。P3作为 Protonet 的输入，P3~P7作为Prediction Head的输入。

1.2.3 Protonet 定义与结构

原论文图3将的就是YOLACT核心分支之一：Protonet。该分支可以看作是一个FCN网络。

Protonet 部分对于每张输入图像预测k个prototype masks。对于coco数据集，作者尝试了k取8，16，32，64，128，256，发现32效果最好。因此最终这部分输出的 mask 维度是 138*138*32，即 32 个 prototype mask，每个大小是 138*138。

注意：你会发现mask的数量 k 不依赖于类别数量，也就是类别可能比模板数量多。论文中说的是，YOLACT学习到的是一种分布式的表示，其中每个实例都由多个 prototype masks（模板原型）组合分割，这些模板在不同类别之间共享。

这种分布式使得不同的prototype mask模板域出现了一些情况：一些mask在空间上划分开了图像，一些定位实例，一些检测实例的轮廓，一些编码对位置敏感的方向图谱，可能同时也会划分图像，看看原文图5的实验。

给你们翻译一下：图5展示了六种不同的prototype mask对不同图像特征的响应，反映了不同 prototype mask 的效果。

1，4，5 可以清晰检测出目标的轮廓（尤其是图b，d，e，f，尤为明显）；2 突出左下方向的特征； 3 区分前景和背景（图e，f比较明显）；6 能够识别出背景。

接下来，我们来简单的看下Protonet 的网络结构。其是一个全卷积网络，P3是该部分的输入。

class ProtoNet(nn.Module):
    def __init__(self, in_channels):
        super().__init__()
        # 每一个都是same卷积，尺寸不变
        self.proto_net = torch.nn.Sequential(torch.nn.Conv2d(in_channels, 256, kernel_size=3, padding=1),
                                             torch.nn.Conv2d(256, 256, kernel_size=3, padding=1),
                                             torch.nn.Conv2d(256, 256, kernel_size=3, padding=1),
                                             )
        # 线性插值，上采样
        self.inter_polate = torch.nn.functional.interpolate
        self.proto_net2 = torch.nn.Sequential(torch.nn.Conv2d(256, 256, kernel_size=3, padding=1),
                                              torch.nn.Conv2d(256, 32, kernel_size=1),
                                              )
        self.activation = torch.nn.ReLU(inplace=True)
 
    def forward(self, x):
        proto_out = self.proto_net(x)
        proto_out = self.inter_polate(proto_out, scale_factor=2, mode='bilinear', align_corners=False)
        proto_out = self.proto_net2(proto_out)
        proto_out = self.activation(proto_out)
        proto_out = proto_out.permute(0, 2, 3, 1).contiguous()
        return proto_out

1.2.4 Prediction head + Mask 定义与结构

如上图所示，本文predition head 改自于Retina Net，同时采取共享卷积网络的trick，从而可以提高速度，达到实时分割的目的。

该分支的输入是 P3～P7 ，共计五个特征图，Prediction Head 也有五个共享参数的预测层与之一一对应。每个特征图先生成anchor，每个像素点生成3个anchor，比例是 1:1、1:2 和 2:1。五个特征图的anchor基本边长分别是24、48、96、192和384。

看代码，输入特征图 x，先经过一个upfeature，其结果作为三个并行分支（bbox_layer，conf_layer，mask_layer）的输入，每个像素点预测 3 个anchor ，最终为每个anchor预测（4 + c + k）个值，其实4：anchor坐标偏移，c：每个anchor一共有c个类，k：k个prototype mask的系数。对应上文 prototype mask ，k = 32时，模型效果最好。

class PredictionModule(nn.Module):
    def __init__(self, in_channels, out_channels=1024, aspect_ratios=[[1]], scales=[1], parent=None, index=0):
        super().__init__()
 
        self.num_classes = cfg.num_classes
        self.mask_dim = cfg.mask_dim  # Defined by Yolact
        self.num_priors = sum(len(x) * len(scales) for x in aspect_ratios)
        self.parent = [parent]  # Don't include this in the state dict
        self.index = index
        self.num_heads = cfg.num_heads  # Defined by Yolact
 
        if parent is None:
            self.upfeature = nn.Sequential(nn.Conv2d(in_channels, 256, 3, padding=1),
                                           nn.ReLU(inplace=True))
            out_channels = 256
 
            self.bbox_layer = nn.Conv2d(out_channels, self.num_priors * 4, kernel_size=3, padding=1)
            self.conf_layer = nn.Conv2d(out_channels, self.num_priors * self.num_classes, kernel_size=3, padding=1)
            self.mask_layer = nn.Conv2d(out_channels, self.num_priors * self.mask_dim, kernel_size=3, padding=1)
 
        self.aspect_ratios = aspect_ratios
        self.scales = scales
 
        self.priors = None
        self.last_conv_size = None
        self.last_img_size = None
 
    def forward(self, x):
        src = self if self.parent[0] is None else self.parent[0]
        conv_h = x.size(2)
        conv_w = x.size(3)
 
        x = src.upfeature(x)
 
        bbox_x = x
        conf_x = x
        mask_x = x
 
        bbox = src.bbox_layer(bbox_x).permute(0, 2, 3, 1).contiguous().view(x.size(0), -1, 4)
        conf = src.conf_layer(conf_x).permute(0, 2, 3, 1).contiguous().view(x.size(0), -1, self.num_classes)
        mask = src.mask_layer(mask_x).permute(0, 2, 3, 1).contiguous().view(x.size(0), -1, self.mask_dim)
 
        mask = torch.tanh(mask)
 
        priors = self.make_priors(conv_h, conv_w, x.device)
 
        preds = {'loc': bbox, 'conf': conf, 'mask': mask, 'priors': priors}
 
        return preds

1.2.5. Mask Assembly

依然是参照这个图：

将 mask coefficient 和 prototype mask 做一个线性组合就得到了每个实例 / anchor 的分割图像。具体做法是采用如下的矩阵乘法： $M = \sigma (PC^{T})$

其中 P：h×w×k的 prototype mask；C：n×k的mask系数矩阵；n：通过NMS和阈值过滤的实例 / anchor，每个实例对应有 k 个mask 系数。

看公式很容易知道，每一个实例最终预测的mask，由 k 个 prototype mask（所以实例共享）分别乘以 prototype mask 对应的mask系数（为每一个实例预测k个mask系数，并且该系数与其他实例独立），最终将k个结果线性组合而来。

！！！需要注意的是，为了能够通过线性组合多个 prototype mask 来得到最终想要的mask，能够从最终的mask中减去原型mask是很重要的。换言之就是，mask系数必须有正有负。所以，在mask系数预测时使用了tanh函数进行非线性激活，因为tanh函数的值域是(-1,1)。

（1）对prototype mask P 和 mask系数矩阵C，做矩阵乘法。

（2）组合之后得到每一个目标实例的mask，对该mask进行crop操作，即将实例框之外的位置置零。训练时采用的是ground truth的检测框，测试时使用目标检测部分得到的检测框。

（3）最后以 threshold = 0.5 作为阈值，对输出的mask做二值化操作，将mask中值的范围限制在[0,1]之间。

1.2.6 Fast NMS

在得到位置偏移后，可以通过预设anchor 的位置加上位置偏移得到 RoI 位置。然后通过NMS 算法筛出重叠ROI。但是因为NMS计算速度较慢，本文提出了一种NMS的简化版的 Fast NMS。

Fast NMS步骤：

（1）对于每个类别的前n个得分（Roi中目标是当前类的概率）最高的结果进行降序排列，然后计算它们两两之间的IoU得到一个C×n×n（其中C是类别总数）的矩阵 N，其中的每个n×n矩阵都为对角阵。

（2）同样针对某一类，剔除掉与得分更高结果重合的检测框Roi。

具体操作：删除矩阵N对角线以及下三角元素；然后取每一列的最大值，每一列的最大值大于阈值 t 的则被筛除，剩下的便是经过nms之后的检测结果。

下面的例子来自于博客：图像分割之YOLACT & YOLACT++

对于Person类，假设有 5 个RoI，按照置信度由高到低分别是 b1、b2、b3、b4 和 b5。接下来通过矩阵运算得出它们彼此之间的 IoU，假设结果如下图：

接下来将这个矩阵的下三角和对角线元素删去，得到如下图结果：

这其中的每一个元素都满足行号小于列号。接下来对每一列取最大值，得到 [-, 0.8, 0.6, 0.6, 0.4]。假设阈值为 0.5，即 IoU 超过 0.5 的两个 RoI 需要舍弃掉置信度低的那一个。根据最大值，b2、b3 和 b4 对应的列都超出了阈值，所以这三个 RoI 会在这一步舍去。

这样做的原因是，由于每一个元素都是行号小于列号，而序号又是按照置信度从高到低降序排列的，因此任一元素大于阈值，代表着这一列对应的 RoI 与一个比它置信度高的 RoI 过于重叠了，需要将它筛除。

这里需要注意的是，b3 虽然和 b2 过于重叠（IoU 为 0.6），但 b3 与 b1 的 IoU 只有 0.1，而 b2 与 b1 的 IoU 为 0.8。按照传统 NMS 算法，b2 会在第一轮循环中被舍去，这样 b3 将会被保留。

这也是 Fast NMS 与 NMS 不同的地方，即原文所述：..., we simply allow already-removed detections to suppress other detections, which is not possible in traditional NMS.

1.2.7 Loss

YOLACT在损失函数这一方面主要由三类别构成（但是还引入了其他的loss）：

1. Roi分类损失，使用 Smooth L1；

2. Roi坐标偏置回归损失，使用 Smooth L1（这一块和之前所有的论文方法基本上都一致，比如yolo、faster、mask）；

3. 目标mask损失，这里用的是二分类交叉熵loss。其中mask loss在计算时，因为mask的大小是138*138（mask结果是来自于prototype mask 和 mask系数矩阵，其中prototype mask的尺度是138 * 138 * k），因此需要先将原图的mask数据通过双线性插值缩小到这一尺寸。

1.2.8 实验

一般来说这一块是不想说的，但是这个模型满足了实时的条件下实现了实例分割，还是有必要比较一下它和传统two-stage实力分割模型在性能上的差异。

我们核心来看一下红框部分，对比two-stage实例分割模型Mask-R-CNN，MS R-CNN，YOLACT的FPS是它们的4 倍；相对的，观察AP指标，大概和最好的MS R-CNN相比有10个点的差距；我们着重观察小目标分割，大概在AP上有8个点的差距，说实话在AP这方面差距还是挺大的。现在形如自动驾驶这方面确实需要实时的语义分割or实例分割，但是这一类任务对准确率和实时性的要求都很高，所以还是比较期待作者的进一步改进。

2. 核心优势/特色以及缺陷

总结一下 YOLACT 三个显著的优势：

1）速度快：one-stage模、最终mask的预测是一个矩阵操作（可以利用现有的库）、FastNMS在略微牺牲性能的前提下基于矩阵操作完成Roi的筛选；

2）mask质量高，信息利用充分：不包含repooling类操作（主要体现在 protoNet）、残差网络+FPN的结构使得模型获得了充分的语义特征；

3）普适性强：这种生成原型mask和mask系数的思路可以应用在目前很多流行的检测器上。

缺陷：

在2020年这个时间点，大多数任务都需要实时性和准确率兼并，YOLACT性能低于目前最好的实例分割方法（AP上10个点不少了！），那么这里面一定有原因！作者实验发现，错误大多数都是由检测器（predition head）引起的，比如检测错误，分类错误和边界框的位移等。这一部分详细可以去看看原论文中的 discussion 部分。

下面说明两个由YOLACT的mask生成方法造成的典型错误：

（1）定位误差（Localization Failure）

当在图像某个位置存在多个重叠的目标时（或者说prototype mask上某一个点存在的目标太多），网络可能无法通过自身学习到的 prototype mask 对每一个目标进行定位。在这种情况下，会输出更接近前景mask的内容，而不是某些目标的分割。

如下图所示，红色飞机下面的两辆卡车没有被正确分开（就是蓝色 truck：0.91）。

（2）泄露（Leakage）这一块我不是很懂？？？？？？？你们比较明白的，评论区给小弟我解释一下可好

泄露：噪声渗入实例掩码中，在某一个Roi中将另一个目标的部分误识别为当前目标的mask，如下图最右绿色滑雪者的anchor的左下角，你会发现预测出来的绿色 Roi 明显过大了，因为左下角包含了不属于绿色滑雪者的部分。

YOLACT 最终 mask 是在经过线性组合后crop（裁剪）得到的，该操作在 predition head 生成Roi后，所以没有抑制 Roi 外部噪声的功能。如果预测的Roi（也可以称为检测框）定位不准，那么就会导致mask泄露现象。

另外，当多个同类实例相隔较远但大小又很大的时候，也可能发生这种现象。因为网络可能认为（这个是学习到的特性）这几个实例已经离得很远了，自身不需要去分开定位它们，裁剪分支会负责处理这种情况。如下图所示，就属于这种情况。

！！论文最后，作者认为该问题可以通过mask error down-weighting 机制得到缓解，如MS R-CNN（Mask Scoring R-CNN）中那样，其中显示这些错误的mask可以被忽略。

（3）论文实验解释 AP 差异的来源，Understanding the AP Gap

这部分不细说，作者对比mask-r-cnn经过相关实验说明了，AP的差异来自于预测anchor的准确率。

2. YOLACT++

作为YOLACT的改进，YOLACT++模型大体继承YOLACT，在保证实时性(大于或等于30fps)的前提下，对原版的 YOLACT 主要做出了三点改进，大幅度提升了mAP：

2.1 改进1 Predition head

上文章节1中最后总结了作者对YOLACT的分析中说道，YOLACT与MASK-R-CNN等实例分割模型存在10AP左右的性能差异，其主要原因在于预测出来的anchor也就是Roi不准确，因此在++中，作者使用了更好的 anchor 尺度和长宽比提高了大目标的Recall。

作者在这里做了两组实验（1）固定anchor的尺寸（面积），调整长宽比例，比例从变为，这种方案就相当于增加了 $\frac{5}{3}$ 的anchor数目；（2）固定长宽比例，改变anchor的尺寸，，其中x是原来的尺寸（有3种），所以这种方案相当于把原来每一个anchor尺寸扩展了3倍（总体也是扩展了3倍，现在有9种尺度的anchor）。总之这两种方案都是牺牲速度，给与anchor更多的选择，个人认为有性能提升是正常的，但是这个长宽比例和anchor尺寸的调整系数我不是很理解是怎么计算来的？？？？（经验吗？）下面放一下性能图：

2.2 改进2 在Backbone中有间隔的引入DCN（Deformable Conv，可变形卷积）

需要注意的是：引入DCN其实是比正常的卷积耗时的（性能提升的代价），因此作者在论文中尝试了不同的替换方案（将ResNet中的conv替换成DCN），不同方案有不同的FPS和AP，这一个部分感兴趣可以去看看原文。

简单的解释下DCN，就是这种卷积突破了传统矩形卷积的限制，认为卷积核应该是可以变化的，卷积核应该更加关注那些核心的或者感兴趣的信息，这样得到的特征更具有代表性。

具体实现，我们以3 * 3 的卷积核为例，论文原图如下：其实就是在不同的卷积层后面加入一个卷积层来学习输入特征图中每个像素点的位置偏移，然后将学到的X轴和Y轴上的位置偏移加入到输入特征图中，在进行后续的卷积。（细节的话可以去看看专门讲这一块的博客或者原文或者等我出一个。。。）

可形变卷积和一般卷积的区别，更直观的体现可以看下图：可以发现可形变卷积在卷积操作时候采样的点更符合目标本身的形状和尺寸，反观标准卷积卷积操作时候采样的点是固定的。

2.3 改进3 引入新的小分支，优化mask的预测质量

YOLACT++ 受 Mask Scoring R-CNN 的启发，预测anchor中目标分类的置信度（概率）和预测结果mask的好坏之间关联并不大（比如分类结果正确，但mask质量不一定好），高质量的mask并不一定就对应着高的分类置信度，因此在模型后面添加Mask R-Scoring Network分支，该分支用来预测mask和Ground Truth之间的IOU（回归），最终将预测的IOU与分类置信度相乘作为最后的得分。

Mask Re-Scoring Network：

注意：（1）输入上的区别：该分支的输入是 YOLACT 经过crop后的（未经过 [0, 1] 阈值处理） mask （按理说这个输入就是YOLACT论文中Crop部分的输出！）；而 MS R-CNN 对应分支使用 ROI Align 后的特定尺寸特征拼接 mask预测分支的结果作为输入；

（2）结构上的区别：应该也是为了实时性，YOLACT++的 Mask Re-Scoring 分支仅使用6个具有非线性ReLU激活函数的卷积层以及1个全局池化层组成，该分支没有特征的拼接、融合，没有FC，据悉耗时仅增加了1.2 ms，提升了1.5左右的mAP，这种代价还是比较合适的；但是MS R-CNN就有FC层，耗时28ms。

2.4 YOLACT++的小总结

总的来说，通过2.1 ~ 2.3 的这三个优化，使得模型与MS R-CNN这一类二阶段实例分割模型大约10AP左右的差距变成了现在的4AP；与YOLACT相比提升了5AP左右，FPS下降了10左右，不过1秒27帧的处理速度还是挺快的。

大模型时代的知识焦虑机载软件与适航机器学习-建模算法-代理模型人工智能大数据
引言：浪潮之巅，焦虑暗涌大模型时代已经浩荡而来，如同奔腾的浪潮，以令人惊叹的速度重塑着世界的面貌。从智能客服的温声细语，到AI绘画的妙笔生花，再到自动驾驶的日趋成熟，大型语言模型、图像模型等人工智能技术以前所未有的姿态，渗透进我们生活的方方面面。信息获取前所未有的便捷，知识创造空前高效，人机交互焕然一新，一个充满无限可能的智能化未来似乎触手可及。然而，在这令人眼花缭乱的技术盛景之下，一股无形的焦虑
RAG 企业级应用落地框架细节差异对比一顿码架构人工智能 python 数据挖掘知识图谱语言模型
—1—什么是RAG？RAG检索增强生成本质上来讲，就三件事情：第一、Indexing索引。即如何更有效地存储知识。第二、Retrieval检索。即在庞大的知识库中，如何筛选出少量的有益知识，供大模型参考。第三、Generation生成。即如何将用户的提问与检索到的知识相结合，使得大模型能够生成有价值的回答。这三个步骤表面上看似乎并不复杂，然而在RAG从构建到实际部署的整个流程中，包含了众多精细且复
“轻松一键生成 AI 图像：Stable Diffusion Online 带来革命性视觉创意体验！“ ai小精灵人工智能 stable diffusion 文心一言 AI作画 chatgpt
StableDiffusionOnline正在为AI图像生成领域树立新标准，将复杂的功能与便捷直观的用户体验相结合。历史上，StableDiffusion的部署步骤带来了重大挑战，特别是对于技术新手而言。然而，StableDiffusionOnline消除了这些障碍，提供了一个既适合新手也适合资深专业人士的酷炫界面。什么是StableDiffusionOnline？StableDiffusionO
近期计算机领域的热点技术 0dayNu1L 云计算量子计算人工智能
随着科技的飞速发展，计算机领域的新技术、新趋势层出不穷。本文将探讨近期计算机领域的几个热点技术趋势，并对它们进行简要的分析和展望。一、人工智能与机器学习人工智能（AI）和机器学习（ML）是近年来计算机领域最为热门的话题之一。AI和ML技术已经广泛应用于图像识别、自然语言处理、智能推荐等领域，并取得了显著的成果。随着技术的不断进步，AI和ML将更深入地渗透到各个行业，为人类社会带来更多便利和效益。在
精准测试：软件开发中的高效质量保障利器霍格沃兹软件测试开发精准化测试测试用例安全性测试测试覆盖率模块测试 selenium 测试工具压力测试
全面解析软件测试开发：人工智能测试、自动化测试、性能测试、测试左移、测试右移到DevOps如何驱动持续交付在现代软件开发中，测试效率与测试质量直接影响产品竞争力。精准测试作为一项兼具效率与精度的创新测试方法，已经成为众多企业提升软件质量的重要手段。本篇文章围绕精准测试的落地实施、对质量指标的提升、数据统计与效果评估方法以及如何提高投入产出比进行全面解读，帮助企业掌握精准测试的价值与实践路径。精准测
CSS3背景与渐变天涯学馆大前端&移动端全栈架构 css3 前端 css
背景与渐变background-sizebackground-size属性用于设置背景图像的尺寸。您可以指定绝对或相对单位，或者使用关键词来控制背景图像在元素背景区域中的大小。.element{background-size:[length|percentage|cover|contain]|[length|percentage][length|percentage]|auto|inherit;}
Moodle + Websoft9：创新教育的强大组合，助力教学与学习开源软件
Moodle+Websoft9：构建未来课堂的技术基石一、Moodle：开源生态的深度解析•模块化设计：支持超800个官方插件，如H5P交互内容创作、BigBlueButton虚拟课堂，满足个性化教学需求。•学习分析引擎：内置LearningAnalyticsAPI，可集成Python/R语言进行深度学习，预测学生学业风险。•移动优先战略：MoodleApp支持离线学习、扫码签到，2023年新增A
新浪财经App喜娜AI助手通过大模型登记，已上线AI摘要和个股公告AI解读量子位
3月14日，官方发布的信息显示，新浪财经App喜娜AI助手近日已通过北京市生成式人工智能服务登记。目前，喜娜AI助手已上线两项创新功能：喜娜AI摘要和个股公告AI解读。这两项功能旨在通过先进的人工智能技术，提升用户对财经资讯和上市公司公告的理解与分析效率，这标志着AI技术在信息服务领域的又一重大突破。喜娜AI摘要：快速提炼财经资讯核心要点AI时代，资讯信息迎来爆炸性增长，用户每天都要面对海量资讯，
书籍-《动手学深度学习（英文版）》
书籍：DiveintoDeepLearning作者：AstonZhang，ZacharyC.Lipton，MuLi，AlexanderJ.Smola出版：CambridgeUniversityPress编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《动手学深度学习（英文版）》01书籍介绍深度学习已经彻底改变了模式识别，为计算机视觉、自然语言处理和自动语音识别等领域提供了强大的工具。应用深度学
模型微调：让AI更懂你的魔法棒带上一无所知的我 pytorch 人工智能 python
模型微调：让AI更懂你的魔法棒✨在人工智能的世界里，模型微调（Fine-tuning）就像是一位魔法师用魔法棒对预训练模型进行“个性化改造”，让它更适应特定的任务。今天，我们就来深入探讨模型微调的技术细节，让你也能像魔法师一样，轻松驾驭AI模型！什么是模型微调？模型微调是指在预训练模型的基础上，通过少量的特定任务数据进行训练，使模型更好地适应新任务的技术。预训练模型通常是基于大规模数据集（如Ima
根据论文复现大模型方法以及出错处理技巧 Ai玩家hly 从0倒1 论文复现大模型复现 Ai大模型复现
复现一篇论文中的大模型搭建涉及以下几个关键步骤：理解论文的模型架构、数据集处理、超参数设置以及实验环境的搭建。这里给出一个基本的实现方法示例，假设我们选择复现一个图像分类任务中的经典模型，例如ResNet。实现步骤示例1.理解论文和模型架构选择一篇关于ResNet的论文作为示例，例如《DeepResidualLearningforImageRecognition》（Heetal.,2015）。2.
书籍-《优化基础：理论、工具及应用（论文版）》机器学习人工智能
书籍：OptimizationEssentials:Theory,Tools,andApplications作者：FaizHamid出版：Springer编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《优化基础：理论、工具及应用（论文版）》01书籍介绍本书探讨了运筹学和数学优化领域的最新发展和令人兴奋的挑战。它以统一且精心编排的方式呈现了以下内容：(a)现实生活中出现的新颖优化问题，并突出每
工厂方法模式、简单工厂模式与抽象工厂模式的对比智想天开工厂方法模式简单工厂模式抽象工厂模式
原文地址:工厂方法模式、简单工厂模式与抽象工厂模式的对比更多内容请关注：深入思考与解读设计模式引言在面向对象设计中，工厂模式是一种常用的创建型设计模式，帮助我们在不直接暴露对象创建逻辑的情况下，生成对象。你是否曾经在开发过程中遇到过对象创建的需求？你是否觉得对象的创建过程可能随着系统的复杂性增加而变得越来越繁琐？如果我们有一种方法能够简化和统一对象创建的过程，是否能提高代码的灵活性和可维护性？工厂
java毕业设计，在线水果商城系统爱编程的小哥 java毕设 java 课程设计 spring boot vue
天天生鲜在线商城系统技术解密|SpringBoot+Vue3企业级实战（附高并发场景解决方案）一、系统全景解读该系统是生鲜电商全流程解决方案，采用SpringBoot3+Vue3+ElementPlus技术栈，覆盖商品管理、智能分类、订单处理、用户画像等核心场景，通过RBAC权限控制+OSS图片存储+高并发库存管理三大技术亮点，日均支撑5000+商品、10万+订单的电商需求。系统以蓝白清新界面+实
Matlab基于BP神经网络与NSGA-II的多目标工艺参数优化方法天天酷科研工艺参数优化 matlab 神经网络工艺参数优化
Matlab基于BP神经网络与NSGA-II的多目标工艺参数优化方法一、方法原理与框架BP神经网络的作用BP神经网络通过建立工艺参数与目标性能（如翘曲变形、收缩率、硬度等）之间的非线性映射关系，作为代理模型替代复杂的物理仿真或实验。其优势在于：能够处理多输入-多输出的复杂非线性关系，例如激光功率、扫描速度与熔覆层性能的关联。在注塑成型中，预测体积收缩率和翘曲变形的相对误差可控制在5%以内。通过正交
使用 TensorFlow 进行图像处理：深度解析卷积神经网络（CNN）一碗黄焖鸡三碗米饭人工智能前沿与实践 tensorflow 图像处理 cnn 人工智能机器学习 python ai
目录使用TensorFlow进行图像处理：深度解析卷积神经网络（CNN）1.什么是卷积神经网络（CNN）？CNN的基本结构为什么CNN适合图像处理？2.使用TensorFlow构建CNN2.1环境准备2.2加载并预处理MNIST数据集2.3构建CNN模型2.4编译和训练模型2.5评估模型3.CNN的优化与改进3.1使用数据增强3.2调整网络结构4.CNN在其他图像处理任务中的应用5.总结参考文献在
HAl库开发中断方式接收Can报文的详细流程逆旅可好单片机 stm32 嵌入式硬件
下面给出一个基于HAL库的中断方式接收CAN报文的详细流程说明，描述每一步的硬件配置、软件调用和中断处理机制，而不涉及具体代码细节，只讲解整体原理和步骤：在使用HAL库时，不需要手动清除中断标志位。原因如下：当你在中断回调函数（例如HAL_CAN_RxFifo0MsgPendingCallback）中调用HAL_CAN_GetRxMessage()读取报文时，HAL库会自动清除相应的中断标志，使得
图像分割技术的应用不要不开心了计算机视觉 dash python
今天的内容为：图像分割技术与应用，以下是内容总结1.图像分割概述图像分割是指预测目标的轮廓，将不同的像素划分到不同的类别，属于非常细粒度的分类任务。其应用场景广泛，包括人像抠图、医学组织提取、遥感图像分析、自动驾驶、材料图像分析等。2.图像分割的前景与背景-物体（Things）：可数的前景目标，如行人、车辆等。-事物（Stuff）：不可数的背景，如天空、草地、路面等。3.图像分割的三层境界-语义分
Can通信流程逆旅可好单片机 stm32 嵌入式硬件
下面给出一个更详细的CAN发送报文的程序流程说明，结合HAL库的使用及代码示例，帮助你了解每一步的具体操作和内部原理。一、系统与外设初始化1.1HAL库初始化在main()函数开头，首先调用HAL库初始化函数：HAL_Init();作用：重置外设、初始化系统定时器，并设置NVIC分组等。细节：这一步保证后续调用HAL库函数时，各个全局变量和中断配置已就绪。1.2系统时钟配置调用时钟配置函数（通常由
blender渲染有波纹光圈怎么解决 Renderbus瑞云渲染农场渲染知识瑞云新闻 blender 渲染农场动画云渲染云渲染效果图云渲染 3d云渲染农场
在使用Blender进行三维渲染作业时，偶尔会遇到渲染图像中出现波纹光圈的问题，这种情况的出现会影响渲染效果的质量，导致最终产品效果图无法达到理想的状态，那么此类危机出现时，该如何解决呢？一起来简单看看吧。出现波纹光圈原因常见的诱因包括光照设置不当、色彩位深不足、抗锯齿问题以及渲染分辨率设置不当。针对这些问题，逐一排查并进行针对性的优化调整是根本的解决方案。接下来，我们将探索一些有效的修正策略，帮
【OpenCV C++】如何快速高效的计算出图像中大于值的像素个数？遍历比较吗？ No，效率太低！那么如何更高效？ R-G-B OpenCV C++opencv c++计算机视觉
文章目录1问题2分析3代码实现（两种方法实现）方法1:使用cv::compare方法2:使用cv::threshold3.2compare和threshold看起来都有二值化效果？那么二者效率？4compare函数解释4.1参数解释4.2底层行为规则4.3应用示例4.4典型应用场景1问题一幅图像的目标区域ROI尺寸为60*35的灰度图，快速计算出大于backVal的像素个数，其中backVal=2
【开题报告+论文+源码】基于SpringBoot+Vue的社区团购配送系统编程毕设 spring boot 后端 java
项目背景与意义随着社会的进步和收入的提高，消费者对购物体验有了更高的要求。他们希望获得更多样化的商品选择，更加便捷的购物方式，以及更加优质的售后服务。同时，越来越多的老年人开始关注健康饮食和食品质量。他们不再满足于传统的购物方式，而是希望通过更加方便的方式来获取更加安全和健康的食品。社区团购配送系统在满足用户日常生活需求的同时，也带来了许多便利和机遇。项目介绍本课程演示的是一款基于SpringBo
在线视频创作平台（Vidnami） deepdata_cn 视频生成视频剪辑视频创作
Vidnami是一款功能强大的在线视频创作平台，前身为ContentSamurai，于2015年推出，2020年更名为Vidnami。它运用人工智能技术，能够分析输入的文本，自动从大量素材中选取合适的图像和视频片段，将文字快速转化为具有专业外观的视频，无需用户具备视频编辑经验。该平台提供多种视频模板、全主题定制功能以及内置的免版权媒体库，包括3000万张图片和3万首音乐，还支持自动配音，用户可以录
基于图像比对的跨平台UI一致性校验工具开发全流程指南——Android/iOS/Web三端自动化测试实战追寻向上 ui android ios
一、需求背景与方案概述1.1为什么需要跨平台UI校验？在移动互联网时代，同一产品需覆盖Android、iOS和Web三端。由于不同平台的开发框架（如Android的MaterialDesign与iOS的Cupertino风格）及渲染引擎差异，UI界面易出现以下问题：布局错位：按钮位置偏移、文本换行不一致视觉差异：颜色色差、字体粗细不同交互逻辑冲突：滑动方向、弹窗动画不一致传统人工测试效率低且易遗漏
OpenCV第1课OpenCV 介绍及其树莓派下环境的搭建嵌入式老牛树莓派之OpenCV opencv 人工智能计算机视觉
1.机器是如何“看”的我们人类可以通过眼睛看到五颜六色的世界，是因为人眼的视觉细胞中存在分别对红、绿、蓝敏感的3种细胞。其中的光感色素根据光线的不同进行不同比例的分解，从而让我们识别到各种颜色。对人工智能而言，学会“看”也是非常关键的一步。那么机器人是如何看到这个世界的呢？这就涉及到人工智能方向重要的分支--机器视觉。机器视觉即用机器人代替人眼来做测量和判断，通过机器视觉产品（即图像摄取装置，分C
Opencv计算机视觉编程攻略-第一节图像读取与基本处理 weixin_44242403 深度学习 opencv 计算机视觉
1.图像读取导入依赖项的h文件#include#include#include#include项目Valuecore.hpp基础数据结构和操作（图像存储、矩阵运算、文件I/O）highgui.hpp图像显示、窗口管理、用户交互（图像/视频显示、用户输入处理、结果保存）imgproc.hpp图像处理算法（图像滤波、几何变换、边缘检测、形态学操作）二读取图片Matimage;//图像矩阵std::co
神经网络之参数初始化硬水果糖人工智能神经网络人工智能深度学习
引言：参数初始化是训练深度神经网络的一个关键步骤，目的是给网络中权重（weights）和偏置（biases）赋予初始值。合适的参数初始化方法有助于提高训练速度、避免梯度消失/爆炸问题，并且加速网络的收敛。一、参数初始化目的避免梯度消失和梯度爆炸：在深度神经网络中，参数初始化对梯度流动非常重要。如果初始权重值太大或太小，可能导致梯度爆炸或梯度消失，从而增加网络的训练难度。加速收敛：良好的初始化可以帮
神经网络基础之正则化硬水果糖人工智能神经网络人工智能机器学习
引言：正则化（Regularization）是机器学习中一种用于防止模型过拟合技术。核心思想是通过在模型损失函数中添加一个惩罚项（PenaltyTerm），对模型的复杂度进行约束，从而提升模型在新数据上的泛化能力。一、正则化目的防止过拟合：当模型过于复杂（例如神经网络层数过多、参数过多）时，容易在训练数据上“记忆”噪声或细节，导致在测试数据上表现差。简化模型：正则化通过限制模型参数的大小或数量，迫
DeepSeek智能政务大脑：城市服务知识库构建全指南——从RAG架构到民生场景落地实践 Coderabo DeepSeek R1模型企业级应用政务架构
DeepSeek赋能城市智慧升级：基于RAG架构的市民服务智能知识库构建全解一、需求分析与技术选型1.1市民服务场景需求市民服务智能知识库需要解决政务咨询效率低下、专业术语难理解、多轮对话能力弱等核心问题。系统需具备：自然语言理解能力（NLU）异构知识整合能力政策法规精准解读能力多轮对话上下文管理应急服务联动机制1.2DeepSeek技术栈选择基于DeepSeek-Large语言模型构建核心系统，
[0482]基于JAVA的养老服务监控智慧管理系统的设计与实现阿鑫学长【毕设工场】 java 人工智能大数据毕业设计课程设计
毕业设计（论文）开题报告表姓名学院专业班级题目基于JAVA的养老服务监控智慧管理系统的设计与实现指导老师（一）选题的背景和意义选题背景与意义：随着全球社会老龄化的不断加剧，养老服务的信息化、智能化转型已成为必然趋势。我国作为世界上老年人口最多的国家，面临着巨大的养老压力和挑战，如何高效、科学地管理和优化养老服务资源，保障老年群体的生活质量及健康安全，是当前社会亟待解决的重要课题。基于此现实背景，设
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl

实例分割模型 YOLACT 和 YOLACT++

1. YOLACT

1.1 相关工作/模型比较

1.1.1 Mask-R-CNN

1.1.2 FCIS

1.2 YOLACT

1.2.1 模型整体解析

1.2.2 backbone 和 neck

1.2.3 Protonet 定义与结构

1.2.4 Prediction head + Mask 定义与结构

1.2.5. Mask Assembly

1.2.6 Fast NMS

1.2.7 Loss

1.2.8 实验

2. 核心优势/特色 以及 缺陷

2. YOLACT++

2.1 改进1 Predition head

2.2 改进2 在Backbone中有间隔的引入DCN（Deformable Conv，可变形卷积）

2.3 改进3 引入新的小分支，优化mask的预测质量

2.4 YOLACT++的小总结

你可能感兴趣的:(深度学习图像论文细节解读,深度学习细节研讨,神经网络,计算机视觉)

2. 核心优势/特色以及缺陷