机器学习笔记 - 学习图像生成模型在医疗行业用例的思路

一、概述

        合成图像生成是使用算法或模拟来替换真实世界数据创建新图像的过程。

        与数据隐私、有限的数据可用性、数据标签、无效的数据治理、高成本以及对大量数据的需求相关的挑战正在推动使用合成数据来满足各行各业对人工智能解决方案的高需求。

        人们对使用深度学习的医疗诊断系统越来越感兴趣。然而,由于专有和隐私原因,对公众的数据访问非常有限,从而导致公众在这一研究领域的贡献有限。同样,在没有专家注释和准确元数据的情况下访问医学图像数据会使数据存在但毫无用处。这导致了对生成合成数据的更大兴趣,因为它可用于深度学习模型训练和验证,同时大大降低了数据收集和标记的成本。

        本文这个合成图像生成示例是针对医疗行业的一个用例,是英特尔与埃森哲合作的用于合成图像生成人工智能参考套件,可帮助您生成可用于深度学习的图像,我们这里不是要推荐这个套件工具,主要的目的主要是学习其实现思路,以便我们应用于其它场景。

        这里的示例是通过使用视网膜图像的合成数据生成来进行血管提取。视网膜脉管系统的详细解释和研究依赖于精确的血管分割,这是一项费力且耗时的任务。此外,视网膜图像的公共数据源受到限制,并受严格的隐私条款的约束。图像的合成数据生成有助于提供更大的数据源,以帮助从现有和有限的数据源开发模型。

二、参考解决方案

        当数据集有限时,支持 AI 的图像生成器辅助工具有助于生成新的准确图像和图像分割数据集。

        在这个参考工具包中,使用了一个两阶段的管道,用于使用生成对抗网络生成视网膜眼底的合成医学图像

你可能感兴趣的:(机器学习,人工智能,UNet,图像合成,GAN,深度学习)