Github :哈佛 beamandrew机器学习和医学影像研究者-贡献的数据集
Academic torrents
Github :医学成像数据集
ISBI(生物医学成像国际研讨会)
光学相干断层扫描(OCT)和年龄相关性黄斑变性(AMD)
光学相干断层扫描(OCT)和糖尿病性黄斑水肿(DME)
年龄相关性黄斑变性(AMD)和糖尿病性黄斑水肿
dataset:https://data.mendeley.com/datasets/rscbjbr9sj/2
paper:https://www.cell.com/cell/fulltext/S0092-8674(18)30154-5#secsectitle0015
kaggle 2017 ,视网膜光学相干断层扫描(OCT)是一种成像技术,用于捕获活体患者视网膜的高分辨率横截面。
pytorch : https://www.kaggle.com/carloalbertobarbano/vgg16-transfer-learning-pytorch
http://www.adcis.net/en/third-party/messidor/
Messidor数据库包含数百个眼底图像,自2008年以来一直公开发布。它是由Messidor项目创建的,目的是评估自动病变分割和糖尿病视网膜病变分级方法。
图片格式:tif
TIF格式是一种压缩最小的图片处理格式,基本不损失图象信息,但其缺陷就是文件体积太大。
DRIVE数据库用于对视网膜图像中的血管分割进行比较研究。它由40张照片组成,其中7张显示轻度早期糖尿病视网膜病变的迹象。
论文:https://ieeexplore.ieee.org/document/1282003
访问:http://www.isi.uu.nl/Research/Databases/DRIVE/download.php
https://drive.grand-challenge.org/DRIVE/
高分辨率视网膜图像,由临床医生按0-4严重等级注释,用于检测糖尿病视网膜病变。该数据集是完成的Kaggle竞赛 4 years ago 的一部分,该竞赛通常是公开数据集的重要来源。
https://www.kaggle.com/c/diabetic-retinopathy-detection
视网膜水肿是一种常见的眼部病理改变,会导致不同程度的视力下降,从而影响正常的生活。尽早的发现水肿症状,能够对疾病的诊断和治疗起到重要的作用。如今临床上使用OCT(光学相干断层成像)辅助医生对视网膜水肿进行判断。我们提供了眼部OCT样本的图像数据集,由专业眼科医生分别对三种类型的水肿进行标注,数据量达到100个OCT体数据,每个体数据128张图片。
MRNet-v1.0
数据集在邮箱里
CAMMA(医学活动的计算分析和建模)
https://endovis.grand-challenge.org/endoscopic_vision_challenge/
HealthData.gov:来自美国联邦政府的数据集,旨在改善美国人口的健康状况。
大城市健康清单数据平台:来自26个城市的健康数据,包括34个健康指标,涵盖6个人口指标。
慢性病数据:美国各地慢性病指标数据。
人类死亡率数据库:超过35个国家的死亡率和人口数据。
MHealth(移动健康)数据集:在进行体育活动时,为10名不同形象的志愿者提供身体动作和生命体征记录。
医疗保险提供者使用和支付数据:医生和其他医疗保健专业人员向Medicare受益人提供的服务和程序数据。
生命科学数据库档案:日本生命科学家在长期稳定的国家公共产品中产生的数据集。存档使许多人可以更轻松地按统一格式按元数据搜索数据集,并使用明确的使用条款访问和下载数据集。
OASIS:开放获取系列成像研究(OASIS)是一个旨在使科学界免费获得大脑神经成像数据集的项目。他们编译并自由分发神经影像数据集,希望有助于未来在基础和临床神经科学方面的发现。
OpenfMRI:磁共振成像(MRI)数据集可供研究界公开使用。
ADNI:阿尔茨海默病神经影像学倡议(ADNI)研究人员从志愿者研究参与者那里收集了几种类型的数据。数据可免费提供给授权的调查员,但需要申请并事先批准。
GEO数据集:该数据库存储策划的基因表达数据集,以及基因表达综合(GEO)存储库中的原始系列和平台记录。
1000基因组计划:1000基因组项目是一项国际合作,已经建立了最详细的人类遗传变异目录。该项目的最后阶段对来自全球26个不同人群的2,500多人进行了测序。
瓶中基因组:数据集包括几个参考基因组,以便将整个人类基因组测序翻译成临床实践。
Medicare医院质量:医疗保险和医疗补助服务中心提供的Medicare.gov 医院比较网站上使用的官方数据集。这些数据使您可以比较全国4,000多家Medicare认证医院的护理质量。
医疗成本和利用项目(HCUP):数据集包含美国医院中不耐烦住院,急诊就诊和门诊手术的遭遇级信息。
MIMIC重症监护数据库:MIMIC是由麻省理工学院计算生理学实验室开发的一个公开可用的数据集,包括与大约40,000名重症监护患者相关的未识别健康数据。数据集包括人口统计学,生命体征,实验室测试,药物等。
SEER癌症发病率:由美国政府提供的有关癌症发病率的数据,按年龄,种族和性别等人口统计群体划分。
BROAD Institute癌症项目数据集:按脑癌,白血病,黑色素瘤等项目分类的数据。