JYZhang_sh

MICCAI2019论文分享 PART①

刚刚结束的 MICCAI2019 会议的论文集分为6个部分，这段时间刷了一遍 Part I，在这儿和大家做一个简单的分享交流

由于本人主要专注于分割领域和半监督弱监督等学习策略，下面给出的综述可能多涉及该方向。
选出的文章主要突出其中的闪光点，如果感兴趣还望各位移步 MICCAI 官网获取原文。
如有代码，我也会附在下文中。

文章目录

@[toc]

1. Dual Encoding U-Net for Retinal Vessel Segmentation

# 闪光点：

2. A Deep Learning Design for Improving Topology Coherence in Blood Vessel Segmentation

# [code is available](https://github.com/rjtaraujo/dvae-refiner)

# 闪光点

# 总结

3. Boundary and Entropy-Driven Adversarial Learning for Fundus Image Segmentation

# [code is available](https://github.com/EmmaW8/BEAL)

# 闪光点

# 总结

4. Unsupervised Ensemble Strategy for Retinal Vessel Segmentation

# 闪光点

5. Multi-scale Microaneurysms Segmentation Using Embedding Triplet Loss

# 闪光点

6. Uncertainty Guided Semi-supervised Segmentation of Retinal Layers in OCT Images

# 闪光点

# 总结

7. Triple ANet: Adaptive Abnormal-aware Attention Network for WCE Image Classification

# [code is available](https://github.com/Guo-Xiaoqing/Triple-ANet)

# 闪光点

# 总结

8. Multi-view Learning with Feature Level Fusion for Cervical Dysplasia Diagnosis

# 闪光点

# 总结

9. Improving Nuclei/Gland Instance Segmentation in Histopathology Images by Full Resolution Neural Network and Spatial Constrained Loss

# [code is available](https://github.com/huiqu18/FullNet-varCE)

# 闪光点

# 总结

10. ET-Net: A Generic Edge-aTtention Guidance Network for Medical Image Segmentation

# [Code is avaliable](https://github.com/ZzzJzzZ/ETNet.)

# 闪光点

# 总结

11. Pancreatic Cancer Detection in Whole Slide Images Using Noisy Label Annotations

# 闪光点

# 总结

12. Local and Global Consistency Regularized Mean Teacher for Semi-supervised Nuclei Classification

# 闪光点

# 总结

13. Precise Separation of Adjacent Nuclei Using a Siamese Neural Network

# 闪光点

# 总结

14. Evidence Localization for Pathology Images Using Weakly Supervised Learning

# 闪光点

# 总结

15. IRNet: Instance Relation Network for Overlapping Cervical Cell Segmentation

# 闪光点

# 总结

16. Multiclass Deep Active Learning for Detecting Red Blood Cell Subtypes in Brightfield Microscopy

# 闪光点

# 总结

17. Nuclei Segmentation in Histopathological Images Using Two-Stage Learning

# 闪光点

# 总结

18. ACE-Net: Biomedical Image Segmentation with Augmented Contracting and Expansive Paths

# 闪光点

# 总结

19. CS-Net: Channel and Spatial Attention Network for Curvilinear Structure Segmentation

# 闪光点

# 总结

20. Multi-task Neural Networks with Spatial Activation for Retinal Vessel Segmentation and Artery/Vein Classification

# 闪光点

#总结

MICCAI2019 PART① 总结

1. Dual Encoding U-Net for Retinal Vessel Segmentation

# 闪光点：

在 spatial path 中使用大的卷积核来保持空间信息，在 context path 中使用 multi-scale 特征来获得更多语义信息。
在 skip connection 中使用 channel attention，即上图中的 ASM 模块。

2. A Deep Learning Design for Improving Topology Coherence in Blood Vessel Segmentation

# code is available

# 闪光点

最近两年出了一些关于如何在深度学习框架中引入形状约束，即本文提到的拓扑一致性约束的策略。而不同的是这个工作采用的是一种端对端的框架，同时采用变分自编码器来隐式地编码拓扑约束。其具体来说，是采用粗分割-细分割两步走的策略，首先用传统的分割框架得到粗分割结果，然后用 variational auto-encoder 来从粗分割重建出金标准，其学习得到的隐空间能够避免 topological incoherence。框架如下：

# 总结

其实这个方法被常常用于 noise reduction 工作中，即中间结果是不能获得的无噪声的结果，而网络的监督是有噪声的结果，然后通过这种类似自编码的方法来模拟一种潜在的噪声过程。但是用在这儿本人持保守态度，因为本身血管分割就是属于 fine-grained 工作，这样的自编码器操作并不能得到很好的空间保持性，是否会影响最后的分割精度呢？

3. Boundary and Entropy-Driven Adversarial Learning for Fundus Image Segmentation

# code is available

# 闪光点

为了解决不同数据库中分割的 domain shift 问题，提出了 boundary and entropy-driven 的无监督域适应方法。其采用对抗学习的方法使边界预测和分割不确定性在 target domain 中保持和 source domain 接近，从而得到准确地边缘和分割结果。

Boundary-Driven adversarial learning
采用判别网络 $D_b$ 区分边缘预测结果是来源于 source domain 还是 target domain。因此对于 $D_b$ 的训练目标定义为 $\mathcal{L}_{D_{b}}=\frac{1}{N} \sum_{x_{s} \in \mathcal{T}_{S}} \mathcal{L}_{D}\left(p_{x_{s}}^{b}, 1\right)+\frac{1}{M} \sum_{x_{t} \in \mathcal{I}_{T}} \mathcal{L}_{D}\left(p_{x_{t}}^{b}, 0\right)$ ，同时对应的对抗目标定义为 $\mathcal{L}_{a d v}^{b}=\frac{1}{M} \sum_{x_{t} \in \mathcal{I}_{T}} \mathcal{L}_{D}\left(p_{x_{t}}^{b}, 1\right)$ 。
Entropy-Driven Adversarial Learning
和上面提到的边缘对抗差不多，只不过这边需要对抗的输入不是概率图，而是熵值图 $E(x)=p_{x}^{m} \cdot \log \left(p_{x}^{m}\right)$ 。
训练策略
采用交替训练的方式训练分割网络和判别器。为了训练边缘判别器 $D_b$ 和 $D_e$ ，我们优化 $\mathcal{L}_{D_{b}}$ 和 $\mathcal{L}_{D_{e}}$ ；然后优化分割网络，我们优化来自 target domain 图像对应的边界回归 loss $\mathcal{L}_{b}=\frac{1}{N} \sum_{x_{s} \in \mathcal{I}_{S}}\left(y_{x_{s}}^{b}-p_{x_{s}}^{b}\right)^{2}$ 和分割的 loss $\mathcal{L}_{m}=-\frac{1}{N} \sum_{x_{s} \in \mathcal{I}_{S}}\left[y_{x_{s}}^{m} \cdot \log \left(p_{x_{s}}^{m}\right)+\left(1-y_{x_{s}}^{m}\right) \cdot \log \left(1-p_{x_{s}}^{m}\right)\right]$ ；以及对抗 loss $\mathcal{L}_{a d v}^{b}$ 和 $\mathcal{L}_{a d v}^{e}$ ，为了欺骗对应的判别器。

# 总结

属于 solid work，文章写得很棒从 motivation 开始阐述了 target domain 和 source domain 的联系，从而铺垫了为什么要采用对抗学习的方式来实现无监督 domain adaptation 的问题。

4. Unsupervised Ensemble Strategy for Retinal Vessel Segmentation

# 闪光点

文章考虑了一个新的问题，如何更好的进行模型 ensemble。即采用一种能够 no-reference 的网络自动判断分割质量，然后根据分割质量就可以得到对应分割方法的权重，进而完成无监督的模型 ensemble。

5. Multi-scale Microaneurysms Segmentation Using Embedding Triplet Loss

# 闪光点

多尺度的输入 (multi-scale patch-wise) 送入分割网络中然后通过分类模型进行精修。为了提高分类模型的性能，这个工作联合 triplet embedding loss 和 选择性采样方法。

Hypothesis Generation Network (HGN)
为了更好的处理不同尺度的血管，采用两个分辨率的输入图像，然后采用 dice loss 和 BCE 进行训练。
Patch-Wise Refinement Network (PRN)
这个网络是一个分类网络，输入是图像块，输出是图像块中心点的分类结果。HGN 的分割结果作为 PRN 的 ROI 区域，潜在的优势在于这样级联的方式显著的增大了感受野。训练 PRN 除了采用常用的 BCE loss 之外，还采用了在 Image retrieval 中常用的 triplet loss，使得 $d$ -维空间中具有相同标签的像素更加接近，而不同标签的像素更远：
$\mathcal{L}_{\text {triplet}}=\sum_{i}^{N}\left[d\left(f\left(x_{i}^{a}\right), f\left(x_{i}^{p}\right)\right)-d\left(f\left(x_{i}^{a}\right), f\left(x_{i}^{n}\right)\right)+a\right]_{+}$ 。

6. Uncertainty Guided Semi-supervised Segmentation of Retinal Layers in OCT Images

# 闪光点

采用 student-teacher 框架利用有限的有标注的样本和未标注的样本来训练分割模型 (不确定性引导的半监督学习)。一般而言，student-teacher 模型通常先用有标注的样本训练 teacher 模型，为剩余未标记的样本生成对应的 soft-label (可以理解为伪标签) 和不确定度量；接着基于上述 teacher 模型输出的 soft-label 和不确定度量来更新 student 模型。更新 student 模型的时候也考虑类别之间的不均衡性设计损失函数。整个算法框架如下：

# 总结

个人觉得这篇文章的创新性还是比较弱的，不如所提到的 semi-supervised learning 采用的 teacher-student 模型也就是很久之前用的比较多的 distillation 方法，而且 uncertainty guided 训练方式也是比较传统的处理未标记数据的方法。

7. Triple ANet: Adaptive Abnormal-aware Attention Network for WCE Image Classification

# code is available

# 闪光点

这个工作属于改进框架式的工作，关键在于 adaptive dense block 和 abnormal-aware attention module。

Adaptive dense block (ADB) 对于每个 dense connection 设置 attention score，从而反映不同特征图的重要性。
Abnormal-aware attention module (AAM) 能够对于不正常的区域调整感受野，从而有效地结合局部上下文信息有助于网络关注在不正常区域。具体来说这个模块分成两个 deformable conv 和一个 1*1 卷积构成的分支，其中得到的 $\beta$ 可以理解成类似于 self-attention 得到的 similarity map，然后本质上这个模块就是为了得到 feature map 的权重。
Angular contrastive (AC) loss 来减小类内方差同时增大类间差异。

# 总结

这边的 attention module 和 adaptive dense 操作还是值得使用的，包括 (1) 加权的 identify operation 和 (2) 如何使用 self-attention —— two-streams conv -> sequence -> softmax 得到 correlation map -> 乘到原来的 feature map 上完成加权过程即 attention 过程。

8. Multi-view Learning with Feature Level Fusion for Cervical Dysplasia Diagnosis

# 闪光点

考虑多角度学习中的特征融合问题，即如何高效地利用不同视角之间的相关性 —— 提出了新的特征层面的融合方法，捕获两个角度之间的关系。具体来说，方法主要基于 attention 机制，使得一个角度去辅助另外一个角度的学习；或者两个角度相互促进以更好的学习。下图展示了传统的 multi-view 融合方法和这个工作所提出方法的区别：

其中融合的方法为下图的 assistant module：首先通过 1*1 的卷积进行降维，再通过一系列的卷积核进行语义提炼 (采用 bottleneck 结构和大卷积核) 增大感受野而且能够更好的利用已经学习到的特征信息；接着再升维到原来的维度经过 sigmod 操作变换到 0-1 之间 (尺度等于 $2^{nd}$ 角度的特征图)；最后再逐像素乘到特征图上去，进行加权 attention 操作。

# 总结

感觉上面的 assistant module 的 attention 操作也是值得学习：-> conv -> conv -> conv -> sigmod 得到加权值 -> 加权到特征图上完成 attention 操作。

9. Improving Nuclei/Gland Instance Segmentation in Histopathology Images by Full Resolution Neural Network and Spatial Constrained Loss

# code is available

# 闪光点

采用 dilated convolution 操作，使得不用 max-pooling 的同时保证感受野的快速增大，而且兼顾特征图的分辨率不降低。
考虑细胞空间性质的损失函数 —— 除了传统的交叉熵 $\mathcal{L}_{\text {triplet}}=\sum_{i}^{N}\left[d\left(f\left(x_{i}^{a}\right), f\left(x_{i}^{p}\right)\right)-d\left(f\left(x_{i}^{a}\right), f\left(x_{i}^{n}\right)\right)+a\right]_{+}$ ，还有一个考虑像素的空间关系的损失函数 $\mathcal{L}_{v a r}(y, t)=\frac{1}{C} \sum_{c=1}^{C} \frac{1}{\left|S_{c}\right|} \sum_{i=1}^{\left|S_{c}\right|}\left(\mu_{c}-\hat{y}_{i}\right)^{2}$ 。注意这个损失函数直接对属于同一个 instance 的像素给出了局部空间约束。然后最后的整体损失函数是 $\mathcal{L}_{v a r C E}=\mathcal{L}_{C E}+\alpha \mathcal{L}_{v a r}$ 。

# 总结

其实对于第一个 contribution，我还是持怀疑态度的。原因有两点：首先，仅仅采用 dilated convolution 的操作会导致 feature map 不会有任何的分辨率损失但是也使得 feature map 的数量大大降低了。如此低的 channel number 难道也能确保高语音信息能够有效提取吗？其次，文中所谓的 full resolution neural network 其实在很久之前就已经被发表在 TPAMI 的一篇交互式分割的文章中了，这个思路也是完全一致。
第二个 contribution 还是挺有意思的，感觉在 instance segmentation 中会有比较大的帮助。

10. ET-Net: A Generic Edge-aTtention Guidance Network for Medical Image Segmentation

# Code is avaliable

# 闪光点

工作考虑的重点在如何使分割工作能够对于边缘有很好的关注性。因此有了 edge-attention 的说法，用 edge-attention 来引导分割过程。整个算法框架如下：

Edge guidance module (EGM) 来进行 edge-attention 的表示，而且在浅层保持住局部的边缘特征。这个模块有两个特性：(1) 提供关注边缘的特征表示引导 decoder 中的分割过程；(2) 采用 edge detection loss (具有更好的 class imbalanced 鲁棒性) 来监督浅层网络 $\mathcal{L}=\frac{1}{C} \sum_{c \in C} \overline{\Delta_{J_{c}}}(m(c)), \quad \text { and } \quad m_{i}(c)=\left\{\begin{array}{cl}{1-p_{i}(c)} & {\text { if } c=y_{i}(c)} \\ {p_{i}(c)} & {\text { otherwise }}\end{array}\right.$
Weighted aggregation module (WAM) 整合不同尺度上的 decoder 的输出，而且将 edge attention 的表示转移到高语义层进而实现对于边缘的很好响应。注意不同尺度的 decoder 的输出其实是经过 weighted block 这样一个 channel attention 模块：
整个网络的损失函数也是由浅层的 edge detection loss 和最后的 segmentation loss 构成：
$\mathcal{L}_{\text {total}}=\alpha \cdot \mathcal{L}_{s e g}+(1-\alpha) \cdot \mathcal{L}_{e d g e}$

# 总结

本质上从方法论角度来说这篇文章最大的亮点 edge attention 其实并没有很深的创新性，也就是引入了类似 deep supervision 的思路，只不过这里监督的是 edge 而并不是 segmentation/classification。另外在分割结果融合部分也是考虑了 channel attention，即 conv -> global pooling -> conv -> conv -> sigmoid 得到权重 -> 相乘完成 attention 过程。

11. Pancreatic Cancer Detection in Whole Slide Images Using Noisy Label Annotations

# 闪光点

虽然题目中说是 using noisy label annotations，但是文章解决的确是 a small set of clean training samples + a large set of noisy training samples。解决问题的思路也就是用 noisy label classification 然后 online 的方式给具有噪声标签的样本不同的权重。

其中采用 ensemble 的方法融合 noisy label classification 和没有任何 anti-noise 的 baseline-noisy，原因在于观察到的一个现象 —— NLC 在 cancer 区域效果比较好，baseline noisy 模型在 non-cancer 区域效果比较好。

# 总结

其实这篇文章的核心点在于很好的 motivation 和 observation，包括对于 noisy labels 区域的定义和为什么要采用 ensemble 方式。但是这样也会导致这样的方法并不是一个很通用的策略，在别的部位或者病变上效果并不好。

12. Local and Global Consistency Regularized Mean Teacher for Semi-supervised Nuclei Classification

# 闪光点

目标依然是半监督任务。

Mean-teacher 方法。给定标注的样本集 $\mathcal{X}_{l}=\left\{x_{1}, x_{2}, \cdots, x_{n}\right\} \subset \mathbb{R}^{m}$ 和未标注的样本集 $\mathcal{X}_{u}=\left\{x_{n+1}, x_{n+2}, \cdots, x_{N}\right\} \subset \mathbb{R}^{m}$ 。 mean-teacher 方法还是依赖于两个模型，即 student model 和 teacher model，并且 teacher model 的模型的参数是 student model 的滑动平均得到 ： $\theta_{\tau}^{\prime}=\alpha \theta_{\tau-1}^{\prime}+(1-\alpha) \theta_{\tau}$ ，其中 $\alpha$ 是滑动平均系数， $\theta^{\prime}$ 是 teacher model 参数而 $\theta$ 是 student model 参数。所采用的的损失函数不仅仅需要考虑传统损失比如 BCE loss，而且需要考虑相同数据在不同扰动下在 teacher model 和 student model 上的预测结果的一致性： $\text {Loss }_{m t}=\frac{1}{n} \sum_{i}^{n}\left(-y_{i} \log f_{\theta}\left(x_{i}\right)\right)+w(\tau) \lambda_{E M A} \mathbb{E}_{x, \eta, \eta^{\prime}}\left[\left\|f_{\theta^{\prime}}\left(x_{j}, \eta^{\prime}\right)-f_{\theta}\left(x_{j}, \eta\right)\right\|\right]$ 。尤其需要注意第二项，强化了 student model 和 teacher model 的预测一致性，而且这样的一致性是在所有数据而不仅仅是在部分标注数据上进行。
Mean-teacher with Label Propagation。 上述的 mean-teacher 方法没有考虑数据之间的结构，如 local consistency 和 global consistency 。为了解决这个问题这个工作采用了在 teacher model 上标签传递的策略，因为 teacher model 作为一个 ensemble 模型具有更好的 embedding 过程，即可以构建更好的一个具有标记的样本的 graph 空间，再次基础上进行 label propagation。对于得到的标签计算 student model 上的 contrastive Siamese loss 使得具有相同类的样本更加接近而不同类的样本更远： $L_{s}=\left\{\begin{array}{ll}{\left\|z_{i}-z_{j}\right\|^{2},} & {\text { if } A_{i j}=1} \\ {\max \left(0, m-\left\|z_{i}-z_{j}\right\|^{2}\right),} & {\text { if } A_{i j}=0}\end{array}\right.$
最后整体的损失函数是 $L_{t o t a l}=L o s s_{m t}+w(\tau)\left(\lambda_{g 1} \sum_{x_{i}, x_{j} \in \mathcal{X}_{l}} L_{s 1}+\lambda_{g 2} \sum_{x_{i} \in \mathcal{X}_{l}, x_{j} \in \mathcal{X}_{u}} L_{s 2}\right)$ 。

# 总结

要理解清楚 mean-teacher 和上面提到第 6 篇文章所用的 teacher-student model 的区别，注意 mean-teacher 实际上就是 model ensemble 的过程。这里使用的 label propagation 也就是完成对于 student model 的细化而已。

13. Precise Separation of Adjacent Nuclei Using a Siamese Neural Network

# 闪光点

给定细胞的语义分割结果，这个工作提出了一种 post-processing 方法来分离相邻的细胞。不同于端对端的分割网络，在语义分割的基础上生成个体标记，然后不断的融合可能为同一个个体的部分为一体。步骤如下：

生成过分割 (第二列) 和欠分割结果 (第三列)，然后生成 instance marker。
用孪生网络判断两个 instance marker 是否属于同一个细胞个体。具体来说是，孪生网络的每个分支输入原图 + concat 的单个 instance marker，用来判断生成的 feature map 是否属于同一个细胞个体。值得注意的是，采用逐通道的矩阵乘法来确保两个 stream 之间的信息共享；而且 encoder 之后得到的 feature map 通过额外的卷积层和全连接层来判断同一个体的概率。该概率也乘上 dice score 来优化 decoder 得到的分割结果。

# 总结

这样的思路个人觉得还是蛮新颖的，即采用孪生网络来提取潜在不同 instance 的特征，最后类似于在一个 multi-task 框架下完成语义分割和判断是否是同一个个体的分类问题。

14. Evidence Localization for Pathology Images Using Weakly Supervised Learning

# 闪光点

用弱监督的方法来定位病灶 (即给出诊断结果 (image-level)，然后在图像中找出对应诊断结果的图像区域 (pixel-level))。整体框架如下，训练时候目标得到一张图片的得癌症的分数，在测试阶段除了也预测得癌症的概率而且也能定位到对应最显著的区域。

病灶分类网络。其中每个残差块中增加了 attention module (CBAM)，首先得到 channel attention 的 feature map $F_{sq}$ ，然后以级联的方式得到 spatial attention ** $A_{s}=\sigma\left(\sum_{k^{\prime}} f^{k^{\prime} \times k^{\prime}}\left(F_{s q}\right)\right)$ ， $k^{\prime} \in\{3,5,7\}$ 表示了有三个尺度的 spatial attention 参与计算**。最后 A_{s} 和 $F_{sq}$ 进行逐像素相乘完成 attention 操作。
Cancer activation map (CAM) 和 cancer saliency map (CSM) 分别通过反向传播到不同层来得到，这部分也是传统的 weakly-supervised 的操作。
观察到 CAM (coarse) 和 CSM (fine-grained) 的不同特性，提出了一种融合框架。首先 CAM2 和 CAM3 通过 trade-off 的方式融合成 CAM，然后再融合 CSM 通过逐像素乘和 trade-off 的方式得到 CELM。

# 总结

感觉这个工作和传统 weakly-supervised 并没有比较大的区别，只不过分类网络采用了更好的结构 (channel + spatial attention)，然后也用了更加丰富的融合方法来融合不同尺度的 activation map。

15. IRNet: Instance Relation Network for Overlapping Cervical Cell Segmentation

# 闪光点

提出 Instance Relation Network (IRNet) 来建模个体之间的关系。结构框图如下，输入图像首先经过 RPN 网络，然后对应的 feature map 进过 ROIAlign 层之后分别输入 detection 和 segmentation 分支，其中 detection 分支包含 Duplicate Removal Module (DRM) 而 segmentation 分支包含 Instance Relation Module (IRM)。

Instance Relation Module (IRM)。简而言之 IRM 考虑到不同 instance 之间的关联，使用每个 Instance 的 embedded feature 来计算 instance association matrix，在根据其中的关系传递信息。注意其中的 self-attention 机制用来刻画相关性，重新组织 feature map 的维度来考虑以 cell instance 为单位的 self-attention。得到 self-attention map 也就是 relation interaction 之后，按照对应关系加权原来的 feature map，同时加入 identify connection，得到 $A_{p}^{\prime}=\gamma \sum_{q=1}^{n} w_{p q} A_{q}+A_{p}$ $A_{p}^{\prime}=\gamma \sum_{q=1}^{n} w_{p q} A_{q}+A_{p}$ 。通过这样的 relation 之后，得到的特征综合考虑来自其他细胞个体的上下文信息，从而增强语义一致性。
Sparsity Regularized Duplicate Removal Module。DRM 可以认为是 NMS (非极大值抑制) 的提升版，考虑的还是 cell 之间的联系性。在这儿观察到 cell 的稀疏性因此考虑引入稀疏约束在其中，比如排序取其中最大的 $k$ 个 candidate。

# 总结

感觉这篇文章的质量比较高，而且类似的计算 relationship 的策略可以学习 —— re-arrange 之后得到对应不同 instance 的 feature map，然后再通过 self-attention 的操作得到相关性矩阵也就是目标的 relation matrix。

16. Multiclass Deep Active Learning for Detecting Red Blood Cell Subtypes in Brightfield Microscopy

# 闪光点

文中申明是第一个做 multi-class detection 问题中的 active learning —— 从 unlabeled sampels 中寻找最相关的样本并将其提交给专家进行标注。其选择策略为 (1) detection 的置信度；和 (2) 在当前图中的稀有性。

expert-in-loop 过程，即 active learning 在 detection 任务中。
selection measures，考虑分类和检测的不确定性；以及数据中的稀有性。不确定性在 active learning 中没什么好说的，这里还使用了所谓的 rareness —— 以解决 class unbalance，对于稀有类的检测是临床上比较感兴趣但是由于数量少而且具有比较大的 appearance variation导致其效果较差。因此对较为稀有的数据给比较大的优先级在选择查询样本时。

# 总结

其实当我看到这篇文章的时候，内心还是很疑惑的 —— 所谓第一个做 multi-class detection 中的 active learning 问题，加这么限定词之后的 first work 也能算是创新性？而且通读下来给我的感觉就是使用一下 active learning 并没有一些实质性的改进，甚至连对于 selection measure 的 ablation experiment 都没有做，实在是让我难以信服所谓的 rareness 到底有没有效果。

17. Nuclei Segmentation in Histopathological Images Using Two-Stage Learning

# 闪光点

提出了所谓的 two-stage learning 策略 —— 具体来说就是将原来的用于 cell instance segmentation 的类似 DCAN 方法，拆开成两个阶段：(1) 3-classes segmentation 关注细胞内外以及 boundary -> (2) 2-classes segmentation 能够更好的分离 overlapping 的细胞。思路上来说非常简单，但是文中给的解释很有意思，说这个类似于 curriculum learning 即从易到难的学习有利于更好的完成分割任务。比如第一阶段的粗略的边界分割有助于辅助第二阶段中对于粘连细胞的分离。

# 总结

分割框架也不是自己提出的，整体上感觉有点 UNet++ 的味道，然后 two-stage 的训练框架也是形同鸡肋，食之无味弃之可惜 —— 将原来的工作流拆成两个效果的提升能有多少，问题还是没有给出试验验证 —— 你最起码给一个 instance segmentation 的实验结果吧，但是文中比较的全是 semantic segmentation 的结果。这个实验结果实在是让我难以信服所提出的 contribution 的合理性和有效性。

18. ACE-Net: Biomedical Image Segmentation with Augmented Contracting and Expansive Paths

# 闪光点

另外一篇在 U-net 上提升性能的文章 —— ACE-net 用各种新提出的模块包括 ASPP，Dense connection 和 Deep supervision 等策略提升 U-net 中的 contracting 和 expansive path，能够更好的提升特征表示能力也可以更好的利用 multi-scale 和 multi-reception fields 的信息。

Augmented Contrasting Block (ACB)。除了传统2个的 $3\times3$ 卷积之外，intensive context modeling (ICM) 用来进行特征增强，其中包括首先的 $1\times1$ 卷积进行特征进一步提取，然后 concat + $1\times1$ 卷积进行特征维度正则化；接着 ASPP 模块用来建模不同感受野层面的 context information ，再进过 $1\times1$ 卷积之后送入 expansive block 进行 skip connection；除此之外，并行于 ASPP 模块也有 1*1 卷积用来进行 deep supervision。
Augmented Expansive Block (AEB)。其中包含 multi-source aggregation 模块，融合4种 feature map 作为输入：来自第一个 (或者前一个) AEB 的输出，对应 ACB 中 ASPP 分支的输出，原始图像和前面所有AEB模块输出的 dense connection。这样丰富的不同来源的具有不同尺度不同感受野的特征 concat 在一起有助于解决分割语义歧义问题，而且有助于提高边缘分割精度。

# 总结

感觉这篇文章的亮点在于如何在 U-Net 这样的一个 backbone 基础上融合 ASPP 等多种策略 —— ASPP 放在 contracting block 部分用来将其引导后续 expansive block 这点还是可以学习一下；包括后续在 expansive block 部分如何利用不同来源的 feature map 进行 concat 也是值得思考的。

19. CS-Net: Channel and Spatial Attention Network for Curvilinear Structure Segmentation

# 闪光点

还是在 U-net 基础上的改进，提出了 channel 和 spatial attention 模块，这两个模块放置在 encoder 的最后面 (decoder 的最前面)。

空间注意力模块来编码局部特征中的上下文信息，来提高其表示能力。具体的注意力生成方式是通过 $1\times3$ 和 $3\times1$ 的两种卷积捕获不同方向的树状结构的边缘信息，然后将其 re-arrange 成列向量 (或者行向量)，再进行点乘和 sigmoid 操作得到 attention map (空间相关性 map)： $\mathcal{S}_{(x, y)}=\frac{\exp \left(K_{(x)} \cdot Q_{(y)}^{\mathrm{T}}\right)}{\sum_{x=1}^{N} \exp \left(K_{(x)} \cdot Q^{\mathrm{T}}(y)\right)}$ ，然后将其逐像素乘到经过 $1\times1$ 卷积的特征上，最后再和原始的特征求和。这样的空间注意力知己有助于获得全局上下文联系，并且能够选择性的考虑最有意义的区域。
通道注意力模块。本质上类似于上面的空间注意力模块，在此不再具体说了。

# 总结

这里的空间注意力机制还是依赖于 self-attention 策略，通过不同方向的卷积如 $1\times3$ 和 $3\times1$ 捕获针对不同方向的 feature map，然后还是类似于计算 relation 的方式得到每个像素和其余所有像素之间的关系。最后再将其进行 sigmoid 得到 attention map 进而加权原始 feature map，注意这里还有一个 identify connection。

20. Multi-task Neural Networks with Spatial Activation for Retinal Vessel Segmentation and Artery/Vein Classification

# 闪光点

提出 multi-task 框架，能够分割出所有的血管并且能够区分出其中的动静脉。其中关键点如下，(1 ) 使用血管分割 —— 这一相对简单的任务来提高动静脉的分类效果。(2) 对于 encoder 的浅层使用 deep supervision 来提高浅层特征的语义性。

多输入模块。输入不仅仅是原始 RGB 图，还有 Gabor filtering 和 Iine detector 得到的结果，这样集合在一起输入网络有助于解决 RGB图容易受到不均一光照影响的缺陷。
带空间注意力机制的网络构架。设计了多任务输出模块来进行所有的血管分割和动静脉分类。但是本质上**分割和分类其实对于语义层的要求不太一样 —— 对动静脉分类需要对于动静脉更加具有判别性的特征，但是这样就不利于对所有血管的分割，因此需要网络同时能够学习动静脉之间共有的特征。**所以在多任务输出模块中设计了两个并行的分支，一个分支用来提取动静脉之间共有的特征，进而得到血管分割结果；另外一个分支用来得到动静脉之间具有判别性的特征。另外需要注意的是如何利用相对简单的分割任务对动静脉分类任务有一个显式地促进，尤其是对于毛细血管部分？所以设计了 activation block，通过增强毛细血管部分的权重，来加强对于毛细血管动静脉分类能力： $m(x)=\sigma\left(e^{-(x-0.5)^{2}}-e^{-\frac{1}{4}}\right)+1$
Deep supervision 模块根据不同的层有不同的卷积层数量设置，能够更好的确保浅层的语义信息。

#总结

这篇文章对于动静脉分类与血管分割，这两个任务之间关系的阐述很到位，并且有很好的 motivation 去设计这样的两个独立的分支在 multi-task output block 中。
另外这里的 attention 操作也不是传统意义上的 self-attention 操作，可以理解成就是给毛细血管部分一个比较大的权重以提升对这部分的分类效果。

MICCAI2019 PART① 总结

对于传统分割框架的改进很多是基于 U-Net，然后结合一些比较常用的比如 self-attention 操作，ASPP，deep supervision 等操作，尤其是 attention 操作还是非常值得理解清楚的。
其次就是关于各种 semi-supervised，weakly-supervised 等学习策略的研究，整个医学图像处理这边还是处于比较初级的阶段。这边给出的大部分方法笔者都有在之前的 machine learning 等领域有看到。
最后就是感觉很多文章的实验部分并没有很好的证明自己的 contribution 的真正有效性，很多都是直接给出了整个框架的效果，但是是否真正有效就很存疑了。

你可能感兴趣的:(机器学习,医学图像处理,深度学习)

Python爬虫【四十五章】爬虫攻防战：异步并发+AI反爬识别的技术解密程序员_CLUB Python入门到进阶 python 爬虫人工智能
目录引言：当爬虫工程师遇上AI反爬官一、异步并发基础设施层1.1混合调度框架设计1.2智能连接池管理二、机器学习反爬识别层2.1特征工程体系2.2轻量级在线推理三、智能决策系统3.1动态策略引擎3.2实时对抗案例四、性能优化实战4.1全链路压测数据4.2典型故障处理案例五、总结：构建智能化的爬虫生态系统Python爬虫相关文章（推荐）引言：当爬虫工程师遇上AI反爬官在大数据采集领域，我们正经历着技
AI人工智能领域知识图谱在文本分类中的应用技巧 AI天才研究院 AI大模型企业级应用开发实战人工智能知识图谱分类 ai
AI人工智能领域知识图谱在文本分类中的应用技巧关键词：知识图谱、文本分类、图神经网络、实体关系抽取、深度学习、自然语言处理、特征融合摘要：本文深入探讨了知识图谱在文本分类任务中的应用技巧。我们将从知识图谱的基本概念出发，详细分析如何将结构化知识融入传统文本分类流程，介绍最新的图神经网络方法，并通过实际案例展示知识增强型文本分类系统的构建过程。文章特别关注知识表示学习与文本特征的融合策略，以及在不同
解读一个大学专业——信号与图像处理
专业定义与核心内容维度内容定义研究如何采集、处理、分析和理解一维信号（语音、雷达、脑电）和二维/三维图像（医学、遥感、工业视觉）。关键词数字信号处理（DSP）、图像处理、计算机视觉、模式识别、压缩感知、深度学习、GPU加速、嵌入式系统。技术栈MATLAB/Python+OpenCV/PyTorch+DSP/FPGA+GPU（CUDA）第五届先进算法与信号、图像处理国际学术会议（AASIP2025）
Pad Token技术原理与实现指南 Takoony AI
目录概述理论基础：第一性原理分析技术实现机制工程最佳实践性能优化策略常见问题与解决方案技术发展趋势附录1.概述1.1文档目的本文档旨在深入阐述深度学习中PadToken的技术原理、实现机制及工程应用，为算法工程师提供全面的理论指导和实践参考。1.2适用范围自然语言处理模型开发序列数据批处理优化深度学习系统架构设计高性能计算资源管理1.3核心问题研究问题:为什么深度学习模型需要将变长序列统一到固定长
深度学习分布式训练：并行策略与通信机制的系统性分析 Takoony 深度学习分布式人工智能
1.引言随着深度学习模型规模的指数级增长，单一计算设备已无法满足训练需求。以GPT-3为例，其1750亿参数在FP16精度下需要约350GB存储空间（每个参数2字节），远超当前主流GPU的显存容量（如NVIDIAA100的80GB）。根据OpenAI的技术报告[1]，即使使用最先进的硬件，单卡训练GPT-3需要355年。这一计算瓶颈催生了分布式训练技术的快速发展。本文将从理论基础出发，系统性地分析
万字长文，解读大模型技术原理（非常详细）零基础入门到精通，收藏这一篇就够了
大模型是指具有大规模参数和复杂计算结构的机器学习模型。本文从大模型的发展历程出发，对大模型领域的各个技术细节进行详细解读，供大家在了解大模型基本知识的过程中起到一定参考作用。一、大模型的定义大语言模型作为一个被验证可行的方向，其“大”体现在训练数据集广，模型参数和层数大，计算量大，其价值体现在通用性上，并且有更好的泛化能力。这些模型通常由深度神经网络构建而成，拥有数十亿甚至数千亿个参数。大模型的设
TensorFlow为AI人工智能航空航天领域带来变革 AI原生应用开发人工智能 tensorflow python ai
TensorFlow为AI人工智能航空航天领域带来变革关键词：TensorFlow、人工智能、航空航天、机器学习、深度学习、神经网络、自主系统摘要：本文探讨了TensorFlow这一强大的机器学习框架如何推动航空航天领域的创新。我们将从基础概念入手，逐步深入分析TensorFlow在航天器导航、卫星图像处理、飞行器自主决策等关键应用场景中的实现原理。通过实际代码示例和架构图解，展示TensorFl
多语言文本分类在AI应用中的实践 AI原生应用开发人工智能分类数据挖掘 ai
多语言文本分类在AI应用中的实践关键词：多语言文本分类、自然语言处理、机器学习、深度学习、BERT、迁移学习、跨语言模型摘要：本文深入探讨多语言文本分类在AI领域的应用实践。我们将从基础概念出发，逐步讲解其核心原理、技术架构和实现方法，并通过实际案例展示如何构建一个高效的多语言文本分类系统。文章将涵盖从传统机器学习方法到最先进的深度学习技术，特别关注跨语言迁移学习在实际业务场景中的应用。背景介绍目
从零开始构建AI原生应用的认知架构 AI原生应用开发 AI-native 架构 ai
从零开始构建AI原生应用的认知架构关键词：AI原生应用、认知架构、机器学习、知识图谱、神经网络、智能决策、系统设计摘要：本文深入探讨如何从零开始构建AI原生应用的认知架构。我们将从基本概念出发，逐步解析认知架构的核心组件，包括知识表示、推理机制和学习能力等。通过生动的比喻和实际代码示例，帮助读者理解如何设计一个能够模拟人类认知过程的AI系统。文章还将介绍当前最先进的认知架构模型，并展望未来发展趋势
Orange3实战教程：图像分析---图像嵌入 err2008 Orange3 实战教程数据挖掘神经网络自然语言处理机器学习计算机视觉深度学习 orange3中文版
图像嵌入通过深度神经网络实现图像嵌入。输入图像：图像列表。输出嵌入向量：用数字向量表示的图像。跳过的图像：未计算嵌入向量的图像列表。图像嵌入功能读取图像并将其上传至远程服务器或本地计算。深度学习模型用于为每张图像计算特征向量。该功能返回一个增强的数据表，包含额外的列（图像描述符）。图像可以通过导入图像小部件导入，也可以通过电子表格中的图像路径导入。在这种情况下，包含图像路径的列需要一个三行表头，第
Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring 论文阅读钟屿论文阅读计算机视觉人工智能
用于动态场景去模糊的深度多尺度卷积神经网络摘要针对一般动态场景的非均匀盲去模糊是一个具有挑战性的计算机视觉问题，因为模糊不仅来源于多个物体运动，还来源于相机抖动和场景深度变化。为了去除这些复杂的运动模糊，传统的基于能量优化的方法依赖于简单的假设，例如模糊核是部分均匀或局部线性的。此外，最近的基于机器学习的方法也依赖于在这些假设下生成的合成模糊数据集。这使得传统的去模糊方法在模糊核难以近似或参数化的
基于Paillier同态加密算法的金融数据安全共享机制研究【附数据】
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
吴恩达机器学习cs229-学习笔记-更新中是娜个二叉树！机器学习学习笔记
吴恩达机器学习cs22901基础概念语言：Matlab/python监督学习定义：获取一组数据集拟合数据从X到Y的映射回归问题：预测的Y是连续的，Y是实数分类问题：分类指的是Y取离散值，输出是离散的两组，正示例和负示例，把所有样本推到这条直线上，用0，1，标识逻辑回归算法，拟合直线区分正，负示例处理相对大量特征的回归算法或者分类算法支持向量机算法：它使用的不是1,2,3,10个输入特征，而是使用无
YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测
在深度学习领域，手写数字识别是一个经典问题，也是入门计算机视觉的重要案例。本文将介绍一个基于YOLOv8和MNIST数据集的手写数字识别系统，该系统不仅能识别静态图像中的数字，还能通过摄像头实时检测手写数字。个人博客：YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测-iDing's博客项目概述这个项目结合了传统的MNIST数据集和现代的目标检测算法YOLOv8，实现了以下功能：将MN
「日拱一码」033 机器学习——严格划分胖达不服输「日拱一码」机器学习人工智能严格划分组划分
目录简单随机划分（train_test_split）分组划分（GroupSplitting）简单分组划分(GroupSplitting)分层分组划分(StratifiedGroupSplitting)交叉验证法（Cross-Validation）分组K折交叉验证（GroupKFold）留一组法（LeaveOneGroupOut）简单随机划分（train_test_split）简单随机分组通过随机分
基于深度学习的手写数字和符号识别系统：YOLOv5/v6/v7/v8/v10模型实现与UI界面集成 YOLO实战营深度学习 YOLO ui 人工智能目标检测计算机视觉
1.引言随着人工智能和深度学习技术的发展，手写数字和符号识别已经成为计算机视觉领域的重要研究方向。手写识别在很多实际应用中扮演着关键角色，例如邮政编码识别、表单自动处理和智能教育系统等。传统的手写识别方法通常依赖于复杂的特征工程，而深度学习则能够自动从数据中学习到特征，极大地提高了识别精度和速度。本文将介绍如何构建一个基于YOLO系列模型（YOLOv5、YOLOv6、YOLOv7、YOLOv8、Y
从零开始：搭建你的人工智能开发环境人工智能教程人工智能 YOLO 机器学习 transformer 线性回归动态规划排序算法
前言在人工智能和机器学习的旅程中，一个稳定且高效的开发环境是成功的关键第一步。无论是初学者还是经验丰富的开发者，一个配置良好的开发环境都能大大提高工作效率，减少遇到的问题。本文将从零开始，逐步指导你如何搭建一个完整的人工智能开发环境，包括操作系统选择、Python安装、常用库的配置以及开发工具的选择。一、选择合适的操作系统（一）主流操作系统介绍在搭建人工智能开发环境时，首先需要选择一个合适的操作系
AI作画：AI人工智能激发艺术创作灵感 AGI大模型与大数据研究院 AI作画人工智能 ai
AI作画：AI人工智能激发艺术创作灵感关键词：AI作画、生成艺术、深度学习、神经网络、艺术创作、人工智能、创意工具摘要：本文深入探讨AI作画技术如何激发艺术创作灵感。我们将从基础概念出发，解释AI如何"学习"艺术风格并生成新作品，分析核心技术原理，提供实际应用案例，并展望这一领域的未来发展趋势。通过通俗易懂的讲解和实际代码示例，帮助读者理解这项融合科技与艺术的创新技术。背景介绍目的和范围本文旨在向
基于机器学习的加密货币资金费率预测与套利策略云梦量化科技 python
一、资金费率机制解析永续合约的资金费率是加密货币衍生品市场独有的机制，旨在使永续合约价格锚定现货价格。资金费率每8小时结算一次，结算时多空双方互相支付资金费用：费率为正时，多头支付给空头；费率为负时，空头支付给多头。此机制既促使永续合约价格回归现货价格，也反映市场多空情绪。某安永续合约资金费率计算公式通常为：资金费率 F = 平均溢价指数 P + Clamp(综合利率 I − 溢价指数 P, +0
Jetson平台编译Tengine space01 AIoT Jetson 人工智能深度学习计算机视觉
1.Tengine简介Tengine于2017年在GitHub（https://github.com/OAID/Tengine）开源，是OPENAILAB（开放智能）推出的自主知识产权的边缘AI计算框架，致力于解决AIoT产业链碎片化问题，加速AI产业化落地。Tengine兼容多种操作系统和深度学习算法框架，简化和加速面向场景的AI算法在嵌入式边缘设备上快速迁移，以及实际应用部署落地，可以十倍提升
机器人-组成结构-感知 - 决策 - 执行具身智能-查布嘎具身智能机器人人工智能
目录一、感知系统内部传感器：外部传感器：二、智能决策系统机器学习家族1.1机器学习2.1深度学习2.2深度学习模型(主要属于监督/强化学习范畴，但结构通用)：3.1监督学习3.2监督学习模型4.1半监督学习4.2无/半监督学习模型：5.1无监督学习5.2生成模型(可属于监督/无监督)：6.1强化学习7.1其他学习三、控制系统（运控）①对应小脑和脊柱一、感知系统①对应人体的五官。由具有不同功能的各种
深度学习篇---矩阵 Atticus-Orion 嵌入式知识篇上位机知识篇嵌入式硬件篇深度学习矩阵人工智能
在机械臂解算、深度学习网络等硬件和软件领域中，矩阵运算作为核心数学工具，承担着数据表示、变换、映射和优化的关键作用。以下从具体领域出发，详细总结涉及的矩阵运算及对应的核心知识：一、机械臂解算领域机械臂解算（运动学、动力学分析）的核心是描述“关节空间”与“操作空间”的映射关系，矩阵运算用于精准刻画坐标系转换、运动传递和力/力矩分析。1.运动学解算（正/逆运动学）核心目标：通过矩阵描述关节角度与末端执
机器学习入门（五）：线性回归—从模型函数到目标函数米饭超人
从数据反推公式假设我们获得了这样一张表格，上面列举了美国纽约若干程序员职位的年薪：enterimagedescriptionhere大家可以看到，表格中列举了职位、经验、技能、国家和城市几项特征。除了经验一项，其他都是一样的。不同的经验（工作年限），薪水不同。而且看起来，工作年头越多，工资也就越高。那么我们把Experience与Salary抽取出来，用x和y来分别指代它们。enterimaged
Python深度学习实践：LSTM与GRU在序列数据预测中的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：LSTM与GRU在序列数据预测中的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来序列数据预测是机器学习领域的一个重要研究方向，涉及时间序列分析、自然语言处理、语音识别等多个领域。序列数据具有时间依赖性，即序列中每个元素都受到前面元素的影响。传统的机器学习算法难以捕捉这种时间依赖性，而深度学习
一个例子带你入门机器学习
目录1.为建模选择数据2.选择预测目标3.选择“特征”4.构建您的模型（这篇文章将使用经典墨尔本房价数据集作为例子，引导机器学习的流程，数据集为melb_data.csv，请在csdn的下载区自行下载，运行代码时需要将数据集下载在同个目录下）1.为建模选择数据数据集有太多的变量，多到难以理解，甚至无法很好地打印出来。如何将这海量的数据削减为能够理解的内容？我们将首先凭借直觉选择几个变量。后续将介绍
初探机器学习与力学研究的交叉领域 faderbic 机器学习人工智能深度学习
目录关于如何踏入机器学习领域机器学习与力学研究的交叉方向1.使用机器学习加速有限元求解2.结合有限元计算和机器学习预测复杂材料结构与力学性能的关系3.结构健康检测4.疲劳寿命预测总结关于如何踏入机器学习领域因为我本科的专业是力学，所以当我开始关注机器学习领域时，首先考虑的是机器学习和力学的交叉领域。对于很多对人工智能感兴趣的朋友，想加入人工智能的潮流却不知道从何学起，我提供一个思路，我认为将自己学
[NIPST AI]对抗性机器学习攻击和缓解的分类和术语 Anooyman 人工智能网络安全人工智能大语言模型网络安全安全
原文link：https://nvlpubs.nist.gov/nistpubs/ai/NIST.AI.100-2e2025.pdfIntroduction人工智能（AI）系统在过去几年中持续全球扩展。这些系统正在被众多国家开发并广泛部署于各自的经济体系中，人们在生活的许多领域都获得了更多使用AI系统的机会。本报告区分了两大类AI系统：预测型AI（PredictiveAI，PredAI）和生成型A
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现打架检测（C#代码，UI界面版）格林威工业相机机器视觉数码相机 YOLO 深度学习计算机视觉人工智能
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现打架检测（C#代码，UI界面版）工业相机使用YoloV8模型实现打架检测工业相机通过YoloV8模型实现打架检测的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入YoloV8模型重要核心代码代码实现
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现人脸识别检测（C#代码，UI界面版）格林威机器视觉工业相机数码相机 YOLO 深度学习人工智能视觉检测 c#
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现人脸识别检测（C#代码，UI界面版）工业相机使用YoloV8模型实现人脸的检测工业相机通过YoloV8模型实现人脸识别检测的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入YoloV8模型重要核心代
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现人物识别（C#代码，UI界面版）格林威工业相机机器视觉数码相机 YOLO c#人工智能计算机视觉开发语言
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现人物识别（C#代码，UI界面版）工业相机使用YoloV8模型实现人物识别工业相机实现YoloV8模型实现人物识别的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入YoloV8模型重要核心代码代码实现
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23