麻花地

糖尿病视网膜病变研究的基准：分割、分级和可转移性笔记

A Benchmark for Studying Diabetic Retinopathy: Segmentation, Grading, and Transferability

Abstract

糖尿病患者有患糖尿病视网膜病变（DR）的风险。当高血糖水平导致视网膜血管受损时，就会发生这种疾病。由于深度学习的巨大成功，计算机辅助DR诊断已成为DR早期诊断和严重程度分级的一个有前途的工具。然而，由于缺乏具有一致性和细粒度注释的训练数据，大多数当前的DR诊断系统并没有为眼科医生实现令人满意的性能或可解释性。为了解决这个问题，我们构建了一个包含2842幅图像的细粒度注释DR数据集（FGADR）。具体来说，该数据集有1842张图像，带有像素级DR相关病变注释，1000张图像带有图像级标签，由六名委员会认证眼科医生进行分级，评分员内部一致。提议的数据集将支持对DR诊断的广泛研究。此外，我们建立了三个评估基准任务：1。DR病灶分割；2.通过联合分类和分割进行DR分级；3.转移学习用于眼部多疾病识别。此外，在第三个任务中引入了一种新的归纳迁移学习方法。在我们的FGADR数据集上使用不同最先进的方法进行了广泛的实验，这些数据集可以作为未来研究的基线。我们的数据集将发布在https://csyizhou.github.io/FGADR/.

**关键词：**糖尿病视网膜病变、病变分割、分级和转移学习

I. INTRODUCTION

糖尿病性视网膜病变（DR）是一种由高血糖和高血压引起的眼病，可损害眼底血管（视网膜）并导致失明。三分之一的糖尿病患者患有某种程度的糖尿病视网膜病变，每个糖尿病患者都有患糖尿病的风险。对眼科医生来说，准确地对糖尿病视网膜病变进行分级是一项耗时的工作，对眼科初学者来说也是一项重大挑战。因此，开发糖尿病视网膜病变的自动诊断系统具有显著的潜在益处。

根据国际协议[1]，[2]，DR的严重程度可分为五个阶段（0-4）：无视网膜病变（0）、轻度非增殖性DR（NPDR）（1）、中度NPDR（2）、重度NPDR（3）和增殖性DR（4）。分级通常取决于不同相关病变表现和并发症的数量和大小。图1提供了两个例子，比较了一个正常视网膜病变和一个包含多个病变的糖尿病视网膜病变。例如，微动脉瘤（MAs）是DR最早的临床可见证据。这些局部毛细血管扩张表现为红色小点。中度NPDR除了微动脉瘤外，还包括“斑点”或“斑点”状出血（HEs）。**硬渗出物（Ex）**是一种明显的黄白色视网膜内沉积物，可以是小斑点，也可以是较大的斑块。它们主要在黄斑区观察到，因为脂质结合并延伸到中央凹。软性渗出物（SE），有时也称为“棉絮斑”（CWS），是神经纤维层的灰白色斑点，或毛细血管前闭塞。它们通常出现在严重的DR阶段。此外，视网膜内微血管异常（IRMA）是毛细血管扩张和新的视网膜内血管形成的区域。一旦出现大量的IRMA，就可以预测增殖前DR阶段。新生血管（NV）是DR增殖的一个重要因素。随着视网膜变得更加缺血，新的血管可能会从视盘或视网膜周围出现。因此，识别这些相关区域有助于DR分级。

在过去的十年里，计算机视觉和基于深度学习的算法在很大程度上得到了探索，为医学成像研究界做出了贡献。随着深度卷积神经网络（CNN）的成功发展，图像分类[3]、目标检测[4]、语义分割[5]和图像合成[6]框架都已被用于分析医学图像，以解决不同的任务。为了研究糖尿病视网膜病变[7]，以前的大多数研究大致可分为三个重要分支。首先，最有价值的任务是预测糖尿病视网膜病变的进展（即分级[1]，[8]–[12]）。Gulshan等人[1]采用Inception-v3架构来训练DR分级模型，其目的是直接学习局部特征，而不是明确检测病变。在[11]中，一个自动图像级DR分级系统建立在多个训练有素的深度学习模型的集合。其中一些深层模型还与AdaBoost结合，以减少每个模型的偏差。其次，还对基于病变的糖尿病视网膜病变检测[13]–[22]进行了研究。杨耀安。等人[13]提出通过设计两级深卷积神经网络来整合病变检测和分级。具体来说，首先训练一个局部网络，将斑块分为不同的病变，然后第二个网络预测DR的严重程度等级。在[14]中，提出了一个放大网络来学习突出异常区域的注意图，然后以全局和局部方式提供DR的分级等级。第三，已经提出了几种用于合成视网膜图像的图像生成方法[23]–[26]。该技术可用于数据扩充，以解决DR训练数据中的不平衡问题。Niu等人[24]提出在给定病理描述符和血管分割模板的情况下合成眼底图像。DRGAN在[23]中提出，试图通过操纵任意分级和病变信息来生成具有不同分级的高分辨率视网膜图像。

目前，DR计算机辅助诊断系统发展的两大障碍是有限的训练数据和不一致的注释。虽然有一些公共DR数据库，如[27]–[30]，但大多数数据库只包含图像级别的标签，注释通常不准确。构建具有高质量和细粒度注释的大型数据集将对DR诊断的研究做出重大贡献。例如，DR相关病变的像素级注释对于开发基于病变的分割模型以及为眼科医生培训更可解释的分级模型非常有益。此外，如果提供了大量病变的细粒度注释，这些丰富的信息可以用来提高表征学习的能力，以及使模型能够在没有注释的情况下转移到其他眼部疾病识别任务中。因此，在本文中，我们提出了一个研究糖尿病视网膜病变诊断系统的新基准。介绍了一个大像素级带注释的DR数据集，并设置了三个任务来评估不同的方法。本基准工作的主要贡献如下：

1.我们构建了一个带有细粒度注释的DR数据集，名为FGADR，包含1842张眼底图像，包括像素级病变注释和图像级分级标签，以及1000张仅带有分级标签的图像。基于该数据集，可以广泛探索语义分割、图像分类、转移学习、监督和半监督学习等算法，以推进DR，甚至更广泛的医学成像领域的研究。

2.建立了三个任务来评估我们新提出的数据集上的不同方法。进行了大量的实验和分析。首先，研究了基于像素级病变标注的医学图像分割方法。其次，研究了联合分类和分割框架，通过利用更多可解释的病变分割结果来提高DR分级性能。此外，还利用我们的数据集研究了转移学习在其他眼部多疾病识别中的应用。

3.为了评估第三个任务，我们还提出了一个新的归纳迁移学习方法提高了眼部多疾病识别的性能。设计了多尺度传输连接和特定领域的对抗适应模块，以在源域和目标域之间架起任务学习的桥梁。实验在我们的FGADR数据集和ODIR-5K数据集上进行[31]。

II. DATASETS

大多数现有的DR数据集只有图像级别的分级标签，很少提供基于像素级别病变的注释。表一总结了一些与DR相关的常用数据集。在这些数据集上训练的模型只能用于预测严重程度，而不能为眼科医生解释为什么眼底图像被分级为某一级别。因此，我们基准测试的主要目标之一是引入一个大的细粒度注释数据集，以便对DR进行更可解释的诊断。现有数据集和我们提出的数据集的详细信息如下。

**A.现有DR分级数据集 **

1） Kaggle EyePACS[27]：它由35126张训练图像和53576张仅包含分级标签的测试图像组成。这些图像是从不同的光源收集的，光源条件不同，注释质量差。每张图像中是否存在DR的评分范围为0到4。在此数据集中，一些图像包含瑕疵、失焦、曝光不足或曝光过度。

2） Kaggle-APTOS2019[32]：它由3662张训练图像和1928张测试图像组成，也只有分级标签。该数据集还存在图像和标签中的噪声。

3） ODIR-5K[31]：这是一个包含5000名患者的结构化眼科数据集。提供了八种眼科疾病类别的多标签图像级注释，包括糖尿病、青光眼、白内障、年龄相关性黄斑变性（AMD）、高血压、近视、正常和其他疾病。每个患者可能包含一个或多个疾病标签。在上一个任务中，我们采用这个数据集来探索从DR到眼部多疾病识别的转移学习。

4） Messidor[28]：这包含1200张眼底图像，但其DR分级标准与之前的数据集不同，只有四个级别（0到3）。除了DR分级外，还为每个分级标签为0到2的图像提供了黄斑水肿的风险。

B. Existing DR Lesion Segmentation Datasets

1） IDRiD[29]：该数据集提供了典型糖尿病视网膜病变和正常视网膜结构的专家注释。全套图像包含516张图像，但其中只有81张用像素级二值病变遮罩标记。提供了与DR相关的异常情况，如微动脉瘤、出血、软渗出物和硬渗出物。

2） DRIVE[30]：该数据集用于评估视网膜图像中血管的分割，包含像素级的二值血管遮罩。这40幅图像分为一个训练集和一个测试集，每个测试集包含20幅图像。

C. Our FGADR Dataset

我们收集了一个细粒度的带注释的糖尿病视网膜病变（FGADR）数据集，该数据集由两组组成。第一组名为Seg -set，包含1842张图像，包括像素级病变注释和图像级分级标签。病变包括微动脉瘤（MA）、出血（HE）、硬渗出物（EX）、软渗出物（SE）、视网膜内微血管异常（IRMA）和新生血管（NV）。分级标签由三名眼科医生标注。第二组名为Grade-set，是一组1000张图像，带有分级标签，由六名眼科医生标注。这中设置是有高度的可信度，专门设计用于评估评分性能。

除了在Seg集合中注释的六个像素级病变外，我们还注释了激光标记（LM）和增殖膜（PM）病变。激光标记和增殖膜是通常出现在重度DR级别（即3级和4级）的重要病变。然而，它们看起来像是全球性的特征，这使得它们很难以像素方式进行注释。因此，仅提供这两个病变的图像级标签，指示图像是否存在病变。图3显示了这两种病变的一些例子，以及通过弱监督方法提取的类别激活图[33]。

1）Dataset Construction and Labeling: 眼底图像数据主要来自我们当地的合作医院。为了保护患者隐私，我们在构建数据集时对个人信息进行了匿名化。在数据预清理期间，我们只为每个患者ID选择了质量最好的图像。因此，数据集中没有两张图像在血管或视盘方面具有相同的视网膜结构。这种过滤可确保FGADR中病变的多样性。此外，由于我们的主要目标是建立一个用于注释像素级DR病变的数据集，因此我们倾向于选择包含更多病变的高DR严重程度眼底图像。因此，我们基于Kaggle EyePACS数据集[27]训练了一个DR分级模型，然后将其应用于我们从医院收集的数据。我们选择了一组高质量的图像进行注释，模型的DR级别为2、3和4，其中可能还包含错误分类的0级和1级图像。三名眼科医生（两名住院医生和一名主治医生）被邀请对该Seg集进行注释。住院眼科医生进行了初步注释，主管医师负责最终验证。图2中提供了一些注释示例。除病变注释外，Seg集的图像级分级注释也由三名眼科医生以投票方式进行。

另一个集Grade-set也仅提供了分阶段标签。该集合的作用是评估DR分级模型的性能。为了确保分级注释的准确性，我们邀请了六名眼科医生（三名住院医师和三名主管医师）进行注释，并再次对最终标签进行投票。

2）Annotation Criteria（注释标准）: 我们采用了严格的注释标准，FGADR的Seg集的整个注释过程耗时超过10个月。我们要求三名眼科医生通过质量控制流程严格保证注释的准确性。细节：MAs在彩色照片中显示为小红点，血管造影上有染色。如果没有血管造影，如果分级员认为病变是MA，彩色照片上的红点被分级为MA。红点状病变通常被分级为视网膜HEs，而不是MAs。EXs是具有锐边的白色或黄白色小沉积物。通常，它们看起来蜡质、有光泽或闪闪发光。呈白点状且管腔内未见血管的MAs被视为EXs。浅白色、淡黄白色或灰白色区域，边缘呈羽毛状，经常显示平行于神经纤维层的条纹。椎间盘的NVs的特征是在视神经或视网膜前发育可变口径的血管。IRMA的口径稍大，排列更广，通常位于视网膜内各层。此外，DR分级标准严格遵循国际协议[2]。

3）Dataset Statistics:（a） Seg集合中的大多数图像包含一种或多种带注释的病变。病变计数的分布如图4（a）所示。我们观察到，微动脉瘤、出血和硬渗出物是DR图像中最常见的三种病变，而视网膜内微血管异常、新生血管、激光标记和增殖膜很少出现。

（b）Seg集合和等级集合的等级分布如图4（b）所示。由于Segset中的所有样本都是通过预先训练的分级模型粗略选择的，因此0级和1级的比率较低。更具体地说，Seg集合有1842个图像（[‘grade’：图像的数量]‘0’：101，‘1’：212，‘2’：595，‘3’：647，‘4’：287），而grade集合有1000个图像（‘0’：143，‘1’：125，‘2’：566，‘3’：105，‘4’：61）。

（c）我们还说明了与图4（c）中的五个分级水平相关的各种病变分布，并进行了归一化处理。如图所示，微动脉瘤是首次出现的DR病变，通常始于早期（0级或1级）。此外，所有病变的数量通常随着DR分级的增加而增加。尽管仅根据病变分布很难区分3期和4期，但我们观察到新生血管、激光标记和增殖膜是进一步区分的良好因素。

III.DR病变分割、分级和转移学习的基准设置

利用建议的FGADR数据集，我们可以探索与糖尿病视网膜病变相关的各种问题，例如像素级病变分割和图像级DR严重程度分级。我们设置了三个任务来评估数据集上的不同方法。在任务1中，医学成像的经典分割模型适用于多个DR病变。在任务2中，我们通过联合分类和病变分割来研究DR分级，我们认为这是一个具有挑战性和有趣的研究课题。此外，由于我们在眼底图像上有大量的细粒度注释，在任务3中还提出了一种转移学习方法，以探索我们的数据集是否有助于其他眼部疾病的诊断。

A. Task 1: DR Lesion Segmentation

任务1旨在评估DR病变分割模型，其中提供了大量像素级注释。此任务仅基于FGADR的Seg集。它包含六个子任务，包括微动脉瘤、软渗出物、硬渗出物、出血、视网膜内微血管异常和新生血管的分割。对于每个子任务，我们进行两次交叉验证实验，使用50%的图像进行训练，50%进行测试。

B. Task 2: Grading by Joint Classification and Segmentation

由于DR诊断的主要目标之一是对严重程度从0到4进行评级，因此我们还想在包含1000张测试图像的等级集上评估分级模型的性能。分级任务作为一个普通的分类问题来实现。我们的目标是将分类任务与病变分割结合起来，共同为最终诊断DR做出贡献。Kaggle EyePACS[27]中的图像级分级标签和我们的FGADR数据集的Seg集结合起来训练分类模型，而Seg集的像素级标签用于训练分割模型。本任务的总体框架是利用Seg集数据来训练DR相关病变分割模块，并在KaggleEyePACS和FGADR等级集的数据上提取DR相关病变特征，以便联合学习和评估分级模型。为了学习分级模型，分割分支（使用像素级DR相关病变注释进行训练）提取的特征与分级分支（仅使用图像级DR分级标签进行训练）获得的特征相结合，以改进结果。

已经提出了一些关于联合分类和分割模型的工作。例如，[15]引入了一个病变检测模型，首先提取病变信息，然后使用基于注意的网络融合原始图像和病变特征来识别医生。在[16]中引入了一个协作学习框架，以端到端的方式优化病变分割模型和疾病分级模型。然后，提出了一个病灶注意分类模块来提高严重程度分级的准确性，并提出了一个病灶注意模块来改进从未注释数据中提取的病灶图，以进行半监督分割。此外，在[34]中，分割和分类是并行进行的。将分割模型预测的病变概率图和弱监督分类模型的类别激活图结合起来进行联合诊断。在本任务中，我们采用上述三种方法作为基线来评估DR分级性能，并探索分级模型如何从病变的学习中受益根据我们的数据训练分割模型。此外，还使用imagelevel激光标记和增殖膜损伤标签来共同训练分类模型。

C. Task 3: Inductive Transfer Learning for Ocular Multi-Disease Identification

除了诊断糖尿病视网膜病变，我们还想探索我们的细粒度注释数据集是否有助于学习其他眼病识别任务。首先，一些眼科疾病的病变表现与DR.相似。例如，AMD是一种后天性视网膜变性，具有新生血管紊乱和出血等异常。高血压性视网膜病变通常包括渗出物和出血。这些共享病变可以用来帮助训练相应的疾病识别模型，而无需像素级注释。其次，我们的数据集中丰富的注释还可以增强模型在眼底图像表示学习方面的泛化能力，因为各种纹理和颜色都被很好地描绘出来。因此，我们提出了一种转移学习方法，以提高使用我们的数据集进行多疾病识别的性能。评估是在ODIR-5K[31]数据集上进行的。

迁移学习涉及使用从任务中学习到的知识，对于这些任务，在标记数据有限的情况下，有大量标记数据可用。根据不同的情况，它可以大致分为三个分支。首先，无论源域和目标域是否相似，如果任务不同，则使用归纳迁移学习[35]。相比之下，如果源域和目标域不同，但任务相同，则首选跨导迁移学习[36]。此外，如果两个领域和任务都不同，则需要考虑无监督迁移学习[37]。在我们的例子中，需要一种归纳迁移学习方法，因为源域和目标域都是眼底图像，但源域和目标域任务分别是DR病变分割和多疾病分类。归纳迁移学习算法试图利用源域的归纳偏差来帮助改进目标任务。根据源域是否包含标记数据，该策略可进一步分为两个子类，分别类似于多任务学习和自学学习。

我们提出的归纳迁移学习方法由三个模块组成，如图5所示。首先，源域任务是学习与DR相关的病变分割模块。其次，目标域任务是学习用于识别各种眼病的多标签分类模块。基本上，提出了一种多尺度传递连接（MTC）方法，将从源域数据学习到的强大特征提取能力扩展到目标域数据。因此，目标域数据的组合特征表示得到了增强，尤其是对FGADR数据集中包含的病变外观进行编码。此外，还提出了一种特定领域的对抗性适应（DSAA）模块，通过添加特定领域的鉴别器来适应目标和源领域数据的表示分布，同时保持疾病差异。我们介绍DSAA，因为我们的目标是调整两个域的表示，以便在源域数据上训练的分割模块能够更好地拟合目标域数据，并提取更有效的多尺度转移特征。换言之，DSAA的提出是为了提高MTC的有效性。

Details of the proposed algorithm:

让 $D_S$ 表示源域数据， $Y_S$ 表示相应的标签。 $L_S$ 是学习源域任务的损失。此外，让 $L_T$ 表示目标域数据， $Y_T$ 表示相应的标签。这是学习目标领域任务的损失。然后，还提出了一种额外的自适应损失 $L_A$ ，以对抗式学习的方式自适应两个域分布。我们将总损失函数概括为：

式中λ和γ平衡不同损耗部分的重量。

对于病变分割模块，我们简单地采用[38]中介绍的密集U网结构作为源域主干，没有太多的钟声和哨声。详细信息如图5所示。在每个致密块体后采用过渡层[38]。由于我们的输入大小是[38]的两倍，我们在编码器中最后一个密集块之后再添加一个过渡层，以适当增加接收场。为了优化源域数据的分割模块，提供了一对输入图像和相应的病变遮罩。 $L_S$ 采用加权二进制cross-entropy loss 和Dice loss，如任务1所示。

在目标域中，采用相似的DenseNet主干来学习多标签分类模块。我们提出了多尺度传输连接来集成从分割模块中学习到的特征。如图5所示，给定目标域图像，其多尺度特征由分割模块的编码器提取。然后，将这些特征与分类模块中相应的比例特征连接起来。因此，从分割模块中学习到的描述性表示可以仅在图像级标签的监督下转移到分类模块。此外，它采用加权二元交叉熵损失。

由于源域和目标域（由不同的数据源引入）之间存在特征分布差异，我们的目标是调整两个域数据的表示，以便在源域数据上训练的分割模块能够拟合目标域数据，并提取更好的多尺度传递特征。这种在两个领域之间共享的疾病模式的知识转移可以改善目标领域任务的结果。此外，由于目标域引入的疾病差异，我们的方法也考虑了特定域的属性。因此，提出了一种DSAA方法来解决域自适应问题。首先，我们从源域的分割模块中提取瓶颈特征向量，从目标域的分类模块中提取相同的特征向量。然后，提出了一种特定于域的鉴别器，该鉴别器将两个卷积（Conv）层堆叠起来，以区分特征是来自源域还是目标域。

在以前的一些工作中，主网络中采用了特定于域的批量归一化（DSBN）[39]，因为主网络的所有卷积层参数在源域和目标域之间共享，以学习域不变特征。之所以能够做到这一点，是因为使用不同的数据源只会引起域数据结构的分布变化，而这两个域的任务是相同的。然而，在我们的任务中，我们不仅面临着数据分布的变化，而且还面临着两个领域之间的疾病差异。因此，我们不共享主要网络参数，而是采用单独的分支来学习两个域的不同任务。因此，在这种情况下，在主网络中使用DSBN来寻址域转移是不合适的。取而代之的是，我们在鉴别器中的每个Conv层之后采用DSBN来代替标准批量归一化（BN）。鉴别器分离BN层的分支，每个域使用一个，同时跨域共享所有其他Conv参数。我们之所以采用DSBN，是因为我们希望通过在对抗性学习过程中利用从给定领域捕获的统计数据和学习参数，有效地去除鉴别器中特定于领域的疾病信息，并**增加鉴别器训练的难度[**40]。因此，对抗性适应可以约束两个域的编码器学习域不变特征，同时保持疾病差异。特定领域的适应模块与两个任务学习模块同时优化。

D. Evaluation Metrics

为了评估任务1中的分割性能，我们使用了四个广泛采用的指标，即骰子相似系数、接收器工作特性曲线下面积（AUC-ROC）、精确回忆曲线下面积（AUC-PR）和平均绝对误差（MAE）。在我们的评估中，我们选择sigmoid函数作为最终预测 $S_p$ .因此，我们测量最终预测图和像素级分割背景真相G之间的相似性/相异性，其定义如下：

1)Dice Similarity Coefficient (Dice):这是评估医学图像分割的经典指标。这是一种基于区域的评估区域重叠的方法。我们将其表述为：

2）AUC-ROC:它比较了敏感性和（1-特异性），换句话说，比较了真阳性率和假阳性率。AUC-ROC越大，真阳性和真阴性之间的区别就越大。

3）AUC-PR:精确回忆曲线根据真阳性率绘制阳性预测值。精确性和回忆性都集中在积极类（少数类），而与真正的消极类（多数类）无关。因此，当数据不平衡时，PR比ROC更合适。

4）Mean Absolute Error (MAE):这会测量Sp和G之间的像素误差，其定义如下：

对于任务2，DR分级性能作为五级分类问题进行评估。除了分类混淆矩阵和精度外，还采用了二次加权kappa度量。

5）Quadratic Weighted Kappa (Q.W.Kappa): 当权重设置为“二次”时，二次kappa度量与Cohen’skappa度量相同[41]。其计算如下。首先，在预测和基本真相评级之间创建多类混淆O，然后是权重矩阵w，该矩阵计算基本真相和预测评级之间的权重。然后，计算预测和基本事实中每个评级的值计数，并计算两个值计数向量的外积为E。最后，E和O被归一化，并用于计算加权kappa。

为了评估任务3中的多疾病分类表现，使用Cohen’skappa、F-1评分和AUC-ROC。

6）Cohen’s Kappa:这项提议是为了两名评分员达成一致。公式如下：

式中， $p_o$ 和 $p_e$ 表示评分员之间观察到的相对一致性和偶然一致性的假设概率。

7）F-1 Score:这是基于精度和召回率计算的，由以下公式给出：

F-1分数在精确性和回忆性之间保持平衡。如果类别分布不均匀，我们使用这个比较指标，因为精确性和召回率可能会给出误导性的结果。

IV. EXPERIMENTS AND RESULTS

A. Baselines

1）分割：为了评估DR病变分割任务，采用了几种经典的语义分割方法。它们可以粗略地分为非U-Net框架和U-Net框架。

非U-Net框架：FCN-8s[42]采用完全卷积网络，以编码器-解码器的方式堆叠多个卷积层。解码器使用转置卷积对图像进行上采样，以预测分段输出。我们使用8s的设置来熔断输出。DeepLabV3+[43]也采用编码器-解码器体系结构，但引入了Atrus空间金字塔池、Atrus可分离卷积和修改的对齐异常，以提高性能。测试s=8和s=16的设置。

**U-Net框架：**U-Net[44]被提出用于生物医学图像分割。其最成功的修改是在上采样部分设计大量具有跳过连接的特征通道，使模型能够更好地将上下文信息传播到分辨率更高的层。多类U-Net是一个扩展，它将二进制输出更改为多类输出。Attention U-Net[45]引入了端到端可训练的注意门，以分离定位和后续分段步骤。这种设计可以提高模型对前景像素的灵敏度和准确性。Gated UNet[46]提出了一种新的注意门，用于抑制不相关区域并聚焦显著区域特征。此外，Dense U-Net[38]将一个紧密连接的卷积网络集成到U-Net框架中，从而加强了特征的使用，提高了分割性能。UNet++[47]在三个方面不同于原始的U-Net，它在跳跃路径上有卷积层，在跳跃路径上有密集的跳跃连接，并使用深度监控，从而实现模型修剪。对于所有的基线方法，除了六个病灶共用主干的多类U网络外，每个病灶都训练单个分割网络。

2）分级：任务2是对DR严重程度从0到4进行分级，这是一个五级分类问题。我们提供三种评估基准。第一类基线采用了一个基本的仅分类模型，具有不同的经典主干，包括VGG-16[48]、ResNet-50[49]、Inception v3[50]和DenseNet-121[51]。第二类基线是Kaggle竞赛[27]，[32]中顶级解决方案提出的集合模型。对各种模型的结果进行平均以给出最终预测，这通常会在准确性方面产生实质性的改进。我们采用了两条基线，在表IV中分别表示为模型集合1和模型集合2。模型集合1是[27]的第一位解决方案，它结合了三个模型——两个使用分数最大池的卷积网络[52]和一个稍加修改的VGG网络。模型集成2是[32]中排名第一的解决方案，它由八个模型组成，包括Inception、ResNet和SEResNeXt[53]变体。最后但并非最不重要的是，第三种基线采用了结合病变识别和分级模型的想法。我们评估了三种方法：第一种[15]学习病变特征使用没有像素级训练的视觉注意模型，而后两个[16]，[34]利用分割模型预测的病变遮罩来帮助分级。[16]、[34]的主干都改为DenseNet-121进行比较。

3） **多标签分类：**为了评估我们提出的诱导转移学习方法对眼部多疾病识别的有效性，我们进行了两项消融研究。首先，与仅采用基于目标域数据训练的基本分类模块的基线相比，第一项消融研究探索了多尺度传输连接（基线+MTC）的有效性。从源域任务中学习到的多尺度特征被转移到目标域任务中。此外，第二项消融研究验证了对抗性领域特定适应模块（基线+MTC+DSAA）可以提高目标领域任务的性能。

我们的最终基线+MTC+DSAA的训练计划包括两个阶段。在第一步中，使用源域数据对分割模块进行预训练。采用ADAM优化器，基本学习率为0.01，动量为0.5。我们对分段模块进行了预训练，批量大小为32，用于100个时代。在第二步中，这两个域任务连同多尺度传输连接和特定于域的对抗适应模块一起优化。在整个实验过程中，超参数λ和γ被选择为1和0.5，这将产生最好的效果。基本学习率设置为0.001，批量大小设置为64。基于目标域数据长度，在300个历元后完成训练。

B. Results of Task: DR Lesion Segmentation

在我们的病变分割实验中，训练和测试数据的比例被分割为1:1，用于基线比较。在除多类U网络外的每种基线方法中，针对不同的病变类型训练不同的分割网络。表二提供了不同方法的结果，我们可以从中得出以下观察结果。首先，DenseU-Net和U-Net++是所有病变的两个最佳模型，但用于分割硬渗出物（EX）病变的模型除外，因为硬渗出物（EX）病变相对容易分割，因此没有哪种方法在这方面取得优势。其次，与标准U-Net相比，Multi-class U-Net显示PR的AUC略有增加，因为所有病变共享相同的模型参数，以便更好地学习表征。它还显著降低了计算成本。第三，U-Net框架始终比非U-Net框架获得更好的结果，这表明了UNet的上采样和跳过连接在允许网络将上下文信息传播到更高分辨率层方面的优势。第四，与基本U-Net相比，注意U-Net和门控U-Net中提出的注意模块都能显著提高分割性能。最后但并非最不重要的一点是，对于微动脉瘤（MA）、视网膜内微血管异常（IRMA）和新生血管（NV），目前没有一种基线模型取得令人满意的结果。MAs通常非常小，容易被漏检或错误地归类为出血（HE）。IRMA和NV的训练数据仍然有限。因此，在未来的研究中，更好的分割算法有望克服这些挑战。

除了可用于所有病变检测任务的深度分割框架外，还提出了一些传统的分类方法来处理与DR相关的一个或两个特定病变[20]，介绍了一种视网膜出血检测方法。提出了一种提取splat特征的方法，用于基于splat的出血检测。特征提取模块包括基于像素的响应聚合的splat特征和基于splat的特征。该算法采用了过滤器和包装器的方法来选择特征并降低维数。使用K-最近邻（KNN）搜索学习分类器并获得出血图。此外，为了检测微小病变，传统的像素分类方法也可以有效地工作，因为MAs可以在低层特征上编码。我们评估[21]，它使用多尺度贝叶斯相关滤波器。在这种方法中，来自高斯滤波器组的响应被用于构建对象及其周围环境的概率模型。当相关滤波的响应大于某个阈值时，检测到的位置被视为候选微动脉瘤位置。所有比较结果见表三。（通过手工构建特征进行学习）

C. Results of Task 2: DR Grading

我们评估了EyePACS测试集（EyePACS测试）和FGADR评分集（FGADR评分集）的评分结果，如表IV所示，以进行综合比较。首先，在四种型号中，DenseNet-121主干网的性能最好。模型集成进一步略微增加了结果。此外，尽管Lin[15]认为学习病变注意有助于分级，但注意图是以弱监督的方式学习的，无需像素级监督。因此，其改进是有限的。然而，借助于完全监督分割模型预测的病变掩模，取得了显著的改进。周[16]在EyePACS测试集和FGADR等级集上，Q.W.Kappa分别增加了4.97%和8.04%。吴[34]在这两盘中的Q.W.Kappa分别提高了4.23%和7.47%。关于更多细节，我们还提供了使用图7中的病变分割预测前后混淆矩阵的比较。可以观察到，一级和三级分类的准确率分别大幅提高了12.8%和15.25%。从2级到0级的错误分类率降低了6.89%. 此外，当提供病变mask时，4级DR图像均未被错误地评为0级或1级。因此，这些改进使DR诊断系统更加健壮，对眼科医生来说更容易理解，因为从高严重程度的DR水平到正常或早期DR水平的错误分类是没有意义的。

D. Results of Task 3: Ocular Multi-Disease Identification

为了评估眼部多疾病识别，使用ODIR-5K【31】数据集中的7000幅图像进行训练和验证。进行了五次交叉验证实验。表五显示了不同方法的结果。我们首先评估各个模型，VGG-16、Inception v3和我们的DenseNet架构，作为基准，DenseNet在这些模型中实现了最佳性能。然后，在源域任务学习的帮助下，多尺度转移连接（MTC）将Kappa提高了2.87%。此外，领域特异性对抗适应（DSAA）模块可以进一步提高模型性能，Kappa提高5.05%。两种设计的有效性都得到了验证。与两个域采用相同BN层的正常对抗性适应（AA）相比，域特异性鉴别器的单独BN层使Kappa增加了1.96%。关于更多细节，每种疾病的分类准确度如表六所示。我们观察到，从细粒度注释的DR域数据进行转移学习，可以持续改善任务域中所有眼部疾病的识别结果。尤其是对于糖尿病、AMD和高血压，改善是显著的，而对于青光眼、白内障和近视则略有改善。为了更好地解释从源域到目标域的迁移学习的有效性，我们可视化了被我们的迁移学习方法正确分类但被基线模型错误分类的样本的最终logit图。如图8所示，我们观察到基线+MTC+DSAA提取的logit映射可以包含更精确的病变区域与疾病相关，因为从源域网络学习到的病变分割能力被集成到目标域网络中。

V. CONCLUSION

为了促进医学图像分割、分类和转移学习的研究，特别是对糖尿病视网膜病变诊断社区的研究，在本文中，我们提出了一个大型细粒度注释DR数据集FGADR。此外，我们还进行了大量的实验来比较不同的最先进的分割模型，并探索病变分割任务。联合分类和分割方法在DR分级任务中表现出更好的性能。我们还开发了一种归纳迁移学习方法DSAA，利用我们的DR数据集来改进眼部多疾病识别。

你可能感兴趣的:(深度学习,深度学习框架,经典论文阅读,人工智能,深度学习,计算机视觉)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
2019-01-19 王小康KK
姓名:王康公司:扬州市方圆建筑工程有限公司2018年3月16日～3月18日上海361期《六项精进》感谢二组学员【日精进打卡第307天】【知～学习】《六项精进》大纲3遍共862遍《大学》通篇3遍共860遍《六项精进》全书40页【经典名句】思想决定行为，行为决定习惯，习惯决定性格，性格决定命运。【行～实践】一、修身：（对自己个人）1、践行六项精进的理念。二、齐家：（对家庭和家人）1、和女朋友视频聊天。
现代汉语粗糙版文学史与经典学习搬运工
第十六章文学史与经典文学史的兴起在西方,虽然从亚里士多德开始,在人类的著述中已经可以找到文学史概念与写作方式的萌芽,但是,人们一般认为17世纪后期到18世纪是现代文学史写作真正开始的时期。长达百年波及整个欧洲的“古今之争”孕育出文学研究的历史意识,现代意义上的文学史观念在这场影响深远的论争中初见端倪。从18世纪晚期到19世纪初,由于席勒、弗·施莱格尔和赫尔德等人的介入,文学史研究逐渐变得复杂和成熟
语文主题教学学习笔记之87 东哥杂谈
“语文主题教学”学习笔记之八十七（0125）今天继续学习小学语文主题教学的实践样态。板块三：教学中体现“书艺”味道。作为四大名著之一的《水浒传》，堪称我国文学宝库之经典。对从《水浒传》中摘选的单元，教师就要了解其原生态，即评书体特点。这也要求教师要了解一些常用的评书行话术语，然后在教学时适时地加入一些，让学生体味其文本中原有的特色。学生也要尽可能地通过朗读的方式，而不单是分析讲解的方式进行学习。细
2019-03-24 李飞720
姓名：李飞企业名称：临沂鑫道食品有限公司组别373期利他1组日精进打卡第338天】【知~学习】1、阿米巴经营一段2、活用人才1段3、活法、一段【行~实践】一、修身：读书、抽烟减量、俯卧撑个跑步3公里二、齐家、劝说老爸与姑姑和好三、建功、业务洽谈【经典名句分享】1、依据原理原则追求事物的本质，以“作为人，何谓正确”进行判断2、经营者必须为员工物质和精神两方面的幸福殚精竭虑，倾尽全力，必须超脱私心，让
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
2019-04-10 shuaigefeng
姓名：王林锋企业名称：三亚蔚蓝时代实业有限公司组别：420期努力6组【日精进打卡251天】【知~学习、诵读】《六项精进》2遍，累计256遍《大学》2遍，累计220遍【经典分享】1、想过成功、想过失败、也想过放弃。【行~实践】一、修身：（对自己个人）1.拍打腿部两侧50下，舌顶上颚50下。2.坚持诵读、阅读。3.坚持锻炼、按时睡觉起床。4.控制健康饮食，饭后走动30分钟。5.每天反省自己的思想和行为
妖孽宫廷（四）安好是佳
1.“纸糊三阁老，泥塑六尚书”与商辂堂堂文官言官，数年苦读儒家经典，应该是皇帝的智囊团，但是在这个时期的明朝政坛下居然是这样的评价，成为皇帝的后腿子团，成为国家发展的智障团，可见其背后有很强的推动力，让言官们躲避刚正不阿，做出祸国殃民的举措。我想，这个推动力应该是首先保住性命，而后同流而强取豪夺他人财物。在监派出头的环境下，尤其在监派强大的特务机构和惩罚机构，让那些发现问题的言官们不敢言。这可是脑
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
Python实现关联规则推荐这孩子谁懂哈 Python Machine Learning python 关联规则机器学习
1.什么关联规则关联规则（AssociationRules）是反映一个事物与其他事物之间的相互依存性和关联性，如果两个或多个事物之间存在一定的关联关系，那么，其中一个事物就能通过其他事物预测到。关联规则是数据挖掘的一个重要技术，用于从大量数据中挖掘出有价值的数据项之间的相关关系。关联规则挖掘的最经典的例子就是沃尔玛的啤酒与尿布的故事，通过对超市购物篮数据进行分析，即顾客放入购物篮中不同商品之间的关
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【新教育-教师随笔】读《做最好的英语老师》有感 164c5aca7b79
伊川县直中学王素平《做最好的英语老师》这本书是作者这些年在他教学中得与失的总结。里面给我们提供了听力，单词，句子，阅读，作文等模块的教学方法，让我受益匪浅，现总结如下：一.语文教学给了我们什么启示？（1）：现有的英语教材内容简单，枯燥，与学生的心智发展水平严重脱节。我们要给学生补中一些贴近学生生活，能感动和影响他们的经典作品。让学生学习知识的同时，有所感悟和思考，同时享受审美的乐趣！如AWiseO
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
内经简介（上）骆长珊
哈喽大家好我是骆长珊今天是2017年1月9日，今天是我每天一篇文章的第四十八篇。最近在重温《黄帝内经》，我在不断记颂原文的过程也不断的找相关资料来看。最终目的，以教为学，写出自己知道的，提神自己的觉悟。黄帝内经》是我国传统医学四大经典著作之一（《黄帝内经》、《伤寒论》、《金匮要略》、《温病条辨》），也是第一部冠以中华民族先祖“黄帝”之名的传世巨著，是我国医学宝库中现存成书最早的一部医学典籍。在理论
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
【品读国学经典】大学：第一章冰清九月
【原文】大学之道，在明明德，在亲民，在止于至善。知止而后有定，定而后能静，静而后能安，安而后能虑，虑而后能得。物有本末，事有终始。知所先后，则近道矣。古之欲明明德于天下者，先治其国;欲治其国者，先齐其家;欲齐其家者，先修其身;欲修其身者，先正其心;欲正其心者，先诚其意;欲诚其意者，先致其知;致知在格物。物格而后知至，知至而后意诚，意诚而后心正，心正而后身修，身修而后家齐，家齐而后国治，国治而后天下
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
学习| 积极心理学—习得性无助 benignHu
习得性无助——不知不觉，你居然习得了可怕的无助，从此，它将长久伴随着你，轻易不肯离去。“习得性无助”是积极心理学之父塞利格曼的研究成果，其概念由其提出。也正是因为“习得性无助”的发现，才有后来的积极心理学，所以今天我们来好好聊聊何谓习得性无助，如何走出习得性无助。01、习得性无助一、习得性无助的由来习得性无助源于经典心理学实验：美国著名心理学家、教育心理学的创始人爱德华·李·桑代克是一个科学心理学
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文