医学数据集及机器学习项目

机器学习的医学数据 原文链接: http://edu.cda.cn/article/32

这是一个机器学习医疗数据的策划清单。
此列表仅供参考,请确保您尊重此处列出的任何数据的任何和所有使用限制。

1.医学影像数据

医学图书馆向
13,000名患者注释提供了53,000张医学图像的MedPix®数据库。需要注册。
信息:https : //medpix.nlm.nih.gov/home


ABIDE:自闭症脑成像数据交换:对自闭症内在大脑结构的大规模评估。
539名患有ASD和573名典型对照的个体的功能MRI图像。这些1112数据集由结构和静息状态功能MRI数据以及广泛的表型信息组成。需要注册。
论文:http//www.ncbi.nlm.nih.gov/pubmed/23774715

信息:http : //fcon_1000.projects.nitrc.org/indi/abide/
预处理版本:http:// preprocessed-connectomes-project。组织/遵守/


阿尔茨海默病神经成像倡议(ADNI)
MRI数据库阿尔茨海默病患者和健康对照。还有临床,基因组和生物制造商的数据。需要注册。
论文:http : //www.neurology.org/content/74/3/201.short
访问:http : //adni.loni.usc.edu/data-samples/access-data/


用于血管提取的数字视网膜图像(DRIVE)
DRIVE数据库用于比较研究视网膜图像中血管的分割。它由40张照片组成,其中7张显示出轻度早期糖尿病视网膜病变迹象。
论文:http : //www.isi.uu.nl/Research/Publications/publicationview/id=855.html
访问:http : //www.isi.uu.nl/Research/Databases/DRIVE/download.php


AMRG心脏地图集 AMRG心脏MRI地图集是奥克兰MRI研究组西门子Avanto扫描仪采集的正常患者心脏的完整标记的MRI图像集。该地图集旨在为大学和学校的学生,MR技术人员,临床医生提供...

先天性心脏病(CHD)地图集 先天性心脏病(CHD)地图集代表成年人和患有各种先天性心脏病的儿童的MRI数据集,生理临床数据和计算机模型。这些数据来自几个临床中心,包括Rady ...

通过磁共振成像评估确定除颤器降低风险,是一项前瞻性,多中心,随机临床试验,用于冠心病和轻中度左心室功能不全患者。主要目标......

MESA 多种族动脉粥样硬化研究是一项在美国的六个中心进行的大规模心血管人群研究(> 6,500名参与者)。它的目的是调查亚临床到临床心血管疾病的表现之前......


OASIS 开放获取系列影像研究(OASIS)是一项旨在使科学界免费提供大脑核磁共振数据集的项目。两个数据集可用:横截面和纵向集。

  • 年轻,中老年,非痴呆和痴呆老年人的横断面MRI数据:该组由416名年龄在18岁至96岁的受试者组成的横截面数据库组成。对于每位受试者,单独获得3或4个单独的T1加权MRI扫描包括扫描会话。受试者都是右撇子,包括男性和女性。100名60岁以上的受试者已经临床诊断为轻度至中度阿尔茨海默病(AD)。此外,还包括一个可靠性数据集,其中包含20个未删除的主题,在其初次会议后90天内的后续访问中成像。
  • 非痴呆和痴呆老年人的纵向磁共振成像数据:该集合包括150名年龄在60至96岁的受试者的纵向集合。每位受试者在两次或多次访视中进行扫描,间隔至少一年,总共进行373次成像。对于每个受试者,包括在单次扫描期间获得的3或4次单独的T1加权MRI扫描。受试者都是右撇子,包括男性和女性。在整个研究中,72名受试者被描述为未被证实。包括的受试者中有64人在初次就诊时表现为痴呆症,并在随后的扫描中仍然如此,其中包括51名轻度至中度阿尔茨海默病患者。另外14名受试者在初次就诊时表现为未衰退,随后在随后的访视中表现为痴呆症。

访问:http : //www.oasis-brains.org/


SCMR共识数据 SCMR共识数据集是从不同的MR机(4个GE,5个西门子,6个Philips)获得的混合病理学(5个健康,6个心肌梗塞,2个心力衰竭和2个肥大)的15个心脏MRI研究)。主要目标......

Sunnybrook心脏数据 Sunnybrook心脏数据(SCD)也被称为2009年心脏MR左心室分割挑战数据,由45个病人和病理混合的电影-MRI图像组成:健康,肥大,伴有梗塞和心脏的心力衰竭。 ..

访问:http : //www.cardiacatlas.org/studies/


肺图像数据库联盟(LIDC)

初步的临床研究表明,螺旋CT扫描肺部可以提高高危人群的肺癌早期发现率。图像处理算法有可能有助于螺旋CT研究中的病变检测,并评估连续CT研究中病变大小的稳定性或变化。这种计算机辅助算法的使用可以显着提高螺旋CT肺部筛查的灵敏度和特异性,并且通过减少解释所需的医师时间来降低成本。

肺成像数据库联盟(LIDC)倡议的目的是支持一个机构联盟制定螺旋CT肺部影像资源的共识指南,并建立螺旋CT肺部影像数据库。根据这项计划资助的研究人员为数据库的使用创建了一套指导方针和指标,并为开发数据库作为实验台和展示这些方法的指南和指标。该数据库通过互联网向研究人员和用户提供,作为研究,教学和培训资源具有广泛的用途。

具体而言,LIDC倡议的目标是提供:

  • 用于图像处理或CAD算法的相对评估的参考数据库
  • 一个灵活的查询系统,将为研究人员提供评估各种技术参数的机会,并取消确定该数据库中的临床信息,这对研究应用很重要。

该资源将刺激进一步的数据库开发,用于包括癌症筛查,诊断,图像引导干预和治疗在内的应用的图像处理和CAD评估。因此,NCI鼓励研究者发起的拨款申请,在他们的研究中利用数据库。NCI还鼓励研究者发起的赠款申请,这些申请提供了可以改进或补充LIDC使命的工具或方法。

访问:http : //imaging.cancer.gov/programsandresources/informationsystems/lidc


TCIA集合

跨各种癌症类型(例如癌,肺癌,骨髓瘤)和各种成像模式的癌症成像数据集。“癌症成像档案”(TCIA)中的图像数据被组织成特定目标的主题集合。受试者通常具有癌症类型和/或解剖部位(肺,脑等)。下表中的每个链接都包含有关集合的科学价值的信息,关于如何获取任何可用的支持非图像数据的信息以及查看或下载成像数据的链接。为了支持科学研究的可重复性,TCIA支持数字对象标识符(DOI),允许用户共享研究手稿中引用的TCIA数据的子集。

访问:http : //www.cancerimagingarchive.net/


白俄罗斯结核病门户

结核病(TB)是白俄罗斯公共卫生的一个主要问题。最近的情况与MDR / XDR结核病和HIV / TB需要长期治疗的出现和发展相关。许多和最严重的病例通常在全国各地传播到不同的结核病药房。通过使用包含患者放射影像,实验室工作和临床数据的共同数据库,领先白俄罗斯结核病专家关注这些患者的能力将大大提高。这也将显着改善对治疗方案的依从性,并且更好地记录治疗结果。纳入门诊患者入选临床病例的标准 - 入住肺结核和肺结核的RDSC耐多药结核病部门,诊断或怀疑患有耐多药结核病,

访问:http : //tuberculosis.by/


DDSM:用于筛选乳腺摄影的数字数据库

乳腺摄影数字化数据库(DDSM)是乳腺摄影图像分析研究社区使用的资源。该项目的主要支持来自美国陆军医学研究和装备司令部的乳腺癌研究计划。DDSM项目是由马萨诸塞州综合医院(D. Kopans,R. Moore),南佛罗里达大学(K. Bowyer)和桑迪亚国家实验室(P. Kegelmeyer)共同参与的合作项目。华盛顿大学医学院的其他病例由放射学和内科医学助理教授Peter E. Shile博士提供。其他合作机构包括威克森林大学医学院(医学工程和放射学系),圣心医院和ISMD,Incorporated。数据库的主要目的是促进计算机算法开发方面的良好研究,以帮助筛选。数据库的次要目的可能包括开发算法以帮助诊断和开发教学或培训辅助工具。该数据库包含约2,500项研究。每项研究包括每个乳房的两幅图像,以及一些相关的患者信息(研究时间,ACR乳房密度评分,异常微妙评级,异常ACR关键字描述)和图像信息(扫描仪,空间分辨率... )。包含可疑区域的图像具有关于可疑区域的位置和类型的像素级“地面真实”信息。

访问:http : //marathon.csee.usf.edu/Mammography/Database.html


前列腺

据报道,前列腺癌(CaP)在全球范围内是第二大最频繁诊断的男性癌症,占13.6%(Ferlay等(2010))。据统计,2008年,新诊断病例的数量估计为899,000,其中不少于258,100例死亡(Ferlay等(2010))。

磁共振成像(MRI)提供成像技术,可以诊断和定位CaP。I2CVB提供多参数MRI数据集以帮助开发计算机辅助检测和诊断(CAD)系统。访问:http : //i2cvb.github.io/


访问:http : //www.medinfo.cs.ucy.ac.cy/index.php/downloads/datasets

  • 多发性硬化症数据库中的MRI病灶分割

  • 紧急远程骨科X射线数字图书馆

  • IMT分割

  • 针EMG MUAP时域特征



DICOM图像样本集 这些数据集专门用于研究和教学。您无权重新发布或出售它们,或将其用于商业目的。

所有这些DICOM文件都使用JPEG2000传输语法进行压缩。

访问:http : //www.osirix-viewer.com/resources/dicom-image-library/


SCR数据库:胸部X光片的分割

胸部X光片中解剖结构的自动分割对于这些图像中的计算机辅助诊断非常重要。SCR数据库的建立是为了便于比较研究肺野,心脏和锁骨在标准的后胸前X线片上的分割。

本着合作科学进步的精神,我们可以自由共享SCR数据库,并致力于在这些分割任务上维护各种算法结果的公共存储库。在这些页面上,可以在下载数据库和上载结果时找到说明,并且可以检查各种方法的基准结果。

访问:http : //www.isi.uu.nl/Research/Databases/SCR/


医学影像数据库和图书馆

访问:http : //www.omnimedicalsearch.com/image_databases.html

一般类别

  • e-Anatomy.org - 交互式解剖学图谱 - 电子解剖学是解剖学在线学习网站。为了覆盖人体的整个断面解剖结构,选择了来自正常CT和MR检查的超过1500个切片。图像使用Terminologia Anatomica标记。用户友好的界面允许通过结合交互式文本信息,3D模型和解剖图绘制的多切片图像系列进行摄影。

  • 医学图片和定义 - 欢迎访问互联网上最大的医学图片和定义数据库。有许多网站提供医疗信息,但很少提供医疗照片。就我们所知,我们是唯一一家提供医学图片数据库的关于每个术语的基本信息的图片。编者按:好的网站可免费访问,无需注册1200多种健康和医疗相关图像,并带有定义。

  • 核医学艺术 - 医学插图,医学艺术。包括3D动画。“Nucleus Medical Art,Inc.是美国和海外的出版,法律,医疗,娱乐,制药,医疗设备,学术界和其他市场的医疗插图,医疗动画和交互式多媒体的领先创造者和分销商。注意:伟大的网站。

  • 互联网上的医学图像数据库(UTHSCSA Library) - 指向具有主题特定医疗相关图像的网站的链接目录。

  • 手术视频 - 国家医学图书馆MedlinePlus收集100和100s不同外科手术的链接。您必须在电脑上安装RealPlayer媒体播放器才能观看这些免费的视频。

  • 带插图的ADAM医学百科全书。也许今天互联网上最好的插图医学着作之一,ADAM医学百科全书收录了4000多篇有关疾病,测试,症状,受伤和手术的文章。它还包含一个广泛的医学照片和插图库,用于备份这4,000篇文章。这些插图和文章免费向公众开放。

  • 哈丁医学博士 - 医学和疾病图片,是一个由爱荷华大学提供的相当一段时间的免费和已建立的资源。主页处于目录风格,用户将不得不深入查找他们正在查找的图像,其中许多图像不在现场。尽管如此,哈丁医学博士是一个很好的门户,可以查看数千种详细的医疗照片和插图。

  • 健康教育资产图书馆(HEAL) - 网络健康基金会媒体库总部位于瑞士的(HON)是一个国际机构,旨在鼓励在线健康信息的道德提供。“HONmedia(图像库)是一个超过6,800个医学图像和视频的独特库,涉及1,700个主题和主题。这个无与伦比的数据库由HON手动创建,新图像链接不断从全球范围添加HON鼓励用户通过提交图片链接制作自己的图片链接。“ 图书馆包括解剖图像,疾病和条件以及程序的视觉影响。

  • 公共卫生图像库(PHIL)由疾病控制和预防中心(CDC)的工作组创建,PHIL为CDC的图片提供了一个有组织的通用电子网关。我们欢迎公共卫生专业人员,媒体,实验室科学家,教育工作者,学生和全球公众使用这些材料作为参考,教学,演示和公共卫生信息。内容被组织成人物,地点和科学等级分类,并以单幅图像,图像集和多媒体文件形式呈现。

  • 医学史图片 - 该系统提供了美国国家医学图书馆(NLM)医学史分部(HMD)的印刷品和图片集中近6万幅图片的访问权限。该系列包括各种媒体的肖像,机构图片,漫画,流派场景和平面艺术,展示了医学的社会和历史方面。

  • Pozemedicale.org - 以西班牙语,意大利语,葡萄牙语和意大利语收集医学图像。

  • 旧医学图片:从19世纪末和20世纪初,数百个迷人而有趣的旧,但高品质的照片和图像。


学科专业图像库和集合

  • 亨利·格雷的人体解剖 - 格雷的人体解剖学Bartleby.com版以经典的1918年出版物中的1,247幅鲜艳的雕刻 - 许多颜色为特征。

  • Crookston系列 - 由John H. Crookston博士拍摄的医学幻灯片集合,已经数字化,可供公众和医生使用。

  • DAVE项目 - 涵盖广谱内窥镜成像的胃肠内窥镜视频剪辑的可搜索库。

  • Dermnet - 可收集超过8000种高品质皮肤科图像。

  • 交互式皮肤科Atlas - 常见和罕见皮肤问题的图像参考资源。

  • 多维人类胚胎是由国家儿童健康与人类发育研究所(NICHD)资助的一项合作,旨在通过互联网制作并提供基于磁共振成像的人类胚胎的三维图像参考。

  • GastroLab内窥镜档案于1996年发起,目标是保持内窥镜图库免费供所有感兴趣的医护人员使用。

  • MedPix是放射学和医学图片数据库资源工具。主页界面很混乱,整个网站设计不友好,并且在20世纪90年代中期给它留下了印象。但是,如果你有时间(耐心),它可能被证明是一些重要的资源。

  • OBGYN.net图像库 - 本网站致力于提供对女性健康感兴趣的图像。除了为您提供访问OBGYN.net图像外,我们还指出了互联网上其他女性健康相关的图像。由于材料的图形性质,有些人可能不喜欢看这些图像。它们仅用于教育目的。



威盛集团公共数据库

记录图像数据库对于定量图像分析工具的开发至关重要,特别是对于计算机辅助诊断(CAD)的任务。与I-ELCAP小组合作,我们建立了两个公共图像数据库,其中包含DICOM格式的肺部CT图像以及放射科医师的异常记录。请访问下面的链接了解更多详情:

访问:http//www.via.cornell.edu/databases/


CVonline:图像数据库 访问:http : //homepages.inf.ed.ac.uk/rbf/CVonline/Imagedbase.htm


USC-SIPI图像数据库 USC-SIPI图像数据库是数字化图像的集合。它主要用于支持图像处理,图像分析和机器视觉方面的研究。USC-SIPI图像数据库的第一版于1977年发布,并且自那时以来增加了许多新图像。

数据库根据图片的基本特征分为多个卷。每个卷中的图像具有各种尺寸,例如256x256像素,512x512像素或1024x1024像素。所有图像的黑白图像均为8位/像素,彩色图像为24位/像素。目前提供以下卷:

Textures         Brodatz textures, texture mosaics, etc.Aerials         High altitude aerial imagesMiscellaneous         Lena, the mandrill, and other favoritesSequences         Moving head, fly-overs, moving vehicles

访问:http : //sipi.usc.edu/database/


2.挑战/比赛数据

放射学中的视觉概念提取挑战 手动注释来自几种不同成像模式(例如CT和MR)的几种解剖结构(例如肾,肺,膀胱等)的放射学数据。他们还提供了一个云计算实例,任何人都可以使用它来根据基准开发和评估模型。

访问:http//www.visceral.eu/


生物医学图像分析中的重大挑战

通过标准化评估标准,为了便于在新解决方案和现有解决方案之间进行更好的比较,收集生物医学成像挑战。您也可以创建自己的挑战。截至撰写本文时,有92个挑战提供可下载的数据集。

访问:http : //www.grand-challenge.org/


梦想的挑战

梦想的挑战提出了关于系统生物学和转化医学的基本问题。我们的挑战由来自各种组织的研究人员社区设计和运行,邀请参与者提出解决方案 - 促进协作并在此过程中建立社区。Sage Bionetworks提供专业技术和制度支持,以及通过Synapse平台应对挑战的基础设施。我们共同拥有一个愿景,允许个人和团体公开合作,使“人群中的智慧”对科学和人类健康产生最大的影响。

  • 数字乳腺摄影梦想挑战。
  • ICGC-TCGA DREAM体细胞突变称为RNA挑战(SMC-RNA)
  • 梦想的挑战
  • 这些是在增加时面临的积极挑战,还有更多过去的挑战和即将到来的挑战!

访问:http : //dreamchallenges.org/

你可能感兴趣的:(医学数据集及机器学习项目)