数据下载链接:http://academictorrents.com/details/80ecfefcabede760cdbdf63e38986501f7becd49
数据介绍:包含82个病例的胰腺数据集。
数据下载链接:http://medicaldecathlon.com/
数据介绍:282个训练病例,139个测试病例,同时分割胰腺和肿瘤,测试集label是hidden的。
数据下载链接:https://medpix.nlm.nih.gov/home
数据介绍:MedPix®是一个免费的开放式在线访问数据库,其中包含医学图像,教学案例和临床主题,集成了图像和文本元数据,包括12,000多个患者案例,9,000个主题和近59,000个图像。我们的主要目标受众包括医师和护士,专职医疗人员,医学生,护理生以及其他对医学知识感兴趣的人。内容材料按疾病位置(器官系统)组织;病理类别患者资料;以及通过图像分类和图像标题。该集合可按患者症状和体征,诊断,器官系统,图像形式和图像描述,关键字,特约作者和许多其他搜索选项进行搜索。
数据下载链接:http://adni.loni.usc.edu/data-samples/access-data/
数据介绍:阿尔茨海默氏病患者和健康对照的MRI数据库。 还具有临床,基因组和生物制造商数据。
数据下载链接:https://wiki.cancerimagingarchive.net/display/Public/CT+COLONOGRAPHY#dc149b9170f54aa29e88f1119e25ba3e
数据介绍:CT扫描诊断结肠癌。 包括没有息肉,6-9mm息肉和大于10mm息肉的患者的数据。 该系列中有825例带有XLS片的病例,提供了息肉描述及其在结肠段中的位置。
数据下载链接:https://www.isi.uu.nl/Research/Databases/DRIVE/download.php
数据介绍:用于视网膜图像中血管分割的比较研究,它由40张照片组成,其中7张显示出轻度早期糖尿病性视网膜病变的迹象。
数据下载链接:http://www.cardiacatlas.org/studies/amrg-cardiac-atlas/
数据介绍:奥克兰MRI研究小组的Siemens Avanto扫描仪采集的正常患者心脏的完整带标签MRI图像集。
数据下载链接:https://data.gov.uk/dataset/f13fbd0e-fc8a-4d42-82ef-d40f930e4b70/congenital-heart-disease-chd
数据介绍:先天性心脏病(CHD)图集代表来自患有各种先天性心脏病的成年人和儿童的MRI数据集,生理临床数据和计算机模型。
数据下载链接:http://www.oasis-brains.org/
数据介绍:OASIS影像研究开放获取系列(OASIS)是一个旨在向科学界免费提供大脑的MRI数据集的项目。有两个数据集:横截面和纵向集。年轻,中年,非痴呆和痴呆老年人的横断面MRI数据:此集合包括416名18至96岁的受试者的横断面集合。非痴呆和痴呆老年人的纵向MRI数据:该组纵向收集了150名年龄在60至96岁之间的受试者。两次或两次以上就诊时对每个受试者进行了扫描,相隔至少一年,共进行373次成像。
数据下载链接:https://github.com/GalAvineri/ISIC-Archive-Downloader
数据介绍:该档案库包含分类皮肤损伤的23k图像。 它包含了恶性和良性的例子。每个示例均包含病变的图像,有关病变的元数据(包括分类和分割)以及有关患者的元数据。
数据下载链接:http://www.cardiacatlas.org/studies/
数据介绍:Sunnybrook心脏数据(SCD)也称为2009心脏MR左心室分割挑战数据,由来自以下患者和病理混合的45幅cine-MRI图像组成:健康,肥大,伴有梗塞和心脏的心力衰竭。
数据下载链接:https://wiki.cancerimagingarchive.net/display/Public/LIDC-IDRI#
数据介绍:肺图像数据库联合会图像收集(LIDC-IDRI)包括诊断性和肺癌筛查性胸部X线断层扫描(CT)扫描,并标明带注释的病变。 它是可通过网络访问的国际资源,用于开发,培训和评估用于肺癌检测和诊断的计算机辅助诊断(CAD)方法。 由美国国立癌症研究所(NCI)发起,并由美国国立卫生研究院(FNIH)基金会进一步推动,并在食品药品监督管理局(FDA)的积极参与下,这种公私合作伙伴关系证明了一项成功的研究成果。
数据库下载链接:http://medicalresearch.inescporto.pt/breastresearch/index.php/Get_INbreast_Database
数据库介绍:INbreast数据库是一个乳腺摄影数据库,其中的图像是从位于大学医院(葡萄牙波尔图的乳腺癌中心,圣若昂医院)的乳腺癌中心获取的。 INbreast共有115例(410幅图像),其中90例来自双乳女性(每例4幅图像),而25例来自乳房切除术患者(每例2幅图像)。 包括几种类型的病变(肿块,钙化,不对称和变形)。 专家还以XML格式提供了精确的轮廓。
数据下载链接:http://www.ehealthlab.cs.ucy.ac.cy/index.php/facilities/32-software/218-datasets
数据介绍:
1、图像格式:关于数据集的某些技术方面,T2-W MRI,DCE MRI和DWI MRI,ADC将以DICOM格式交付。
2、关于MRSI数据将以RDA(西门子)或DICOM(GE)格式提供。
3、以DICOM格式提供每种形式的所有地面真实图像。
Ground Truth:
对于每种方式,都提供了一组Ground Truth。GT由四个不同类别组成:(i)前列腺,(ii)边缘区(PZ),(iii)中央腺体(CG),(iv)CaP。
数据下载链接:http://www.isi.uu.nl/Research/Databases/SCR/
数据介绍:所有胸部X光片均取自JSRT数据库,这是一个公开可用的数据库,其中包含247张PA胸片。在每幅图像中,都对肺野,心脏和锁骨进行了手动分割,以提供参考标准
CSDN数据库介绍:http://blog.csdn.net/dcxhun3/article/details/54289598
数据库网址:https://wiki.cancerimagingarchive.net/display/Public/LIDC-IDRI
数据库介绍(DDSM SQL Data Base):http://deckard.mc.duke.edu/ddsm_sql/book1.html
图片格式为LJPEG需要使用对应的压缩方法对其进行解压,目前找到了xMedcon,但是不太会用,打不开相应的文件,也可能是不是使用这个软件压缩的。不过这个软件可以用来转换大部分的医学图像。matlab社区上有how to open lossless jpeg file,但是其中有一些答案提供的网址不能打开,可能是没有科学上网??
数据库网址:http://figment.csee.usf.edu/Mammography/Database.html
MIAS MiniMammographic Database(来自researchgate的一个问答):322例,尺寸:1024*1024pixel,图像数据是PGM格式,找到一个介绍和读取的博客代码使用的c,matlab问答相关
数据库(点击即下载):http://peipa.essex.ac.uk/pix/mias/all-mias.tar.gz
这也是一个乳腺的图像数据库,但是现在还没有搞清楚下载、格式之类的:https://www.repository.cam.ac.uk/handle/1810/250394?show=full
网址:http://www.dclunie.com/medical-image-faq/html/index.html
Cardiac MRI Dataset: http://www.cse.yorku.ca/~mridataset/
右心室MRI数据RVSC
右心室分割挑战赛(2012):http://pagesperso.litislab.fr/cpetitjean/mr-images-and-contour-data/
CT Medical Image Analysis Turorial这个比赛好像是分析CT纹理与患者年龄的关系。
肺癌分类比赛:https://www.kaggle.com/c/data-science-bowl-2017/data
分割肺癌(Kaggle):https://www.kaggle.com/kmader/finding-lungs-in-ct-data
DICOM文件打开使用Sante DICOM Free,paraview也可以打开,Mango网站:https://idoimaging.com/programs/124;anteDicom官方下载网址:http://www.santesoft.com/win/sante-dicom-viewer-free/download.html
http://www.cancerimagingarchive.net/
http://www.osirix-viewer.com/resources/dicom-image-library/
Github :哈佛 beamandrew机器学习和医学影像研究者-贡献的数据集
Academic torrents
Github :医学成像数据集
ISBI(生物医学成像国际研讨会)
眼底图像数据集整理(糖尿病视网膜病变/青光眼…)
【医学影像系列三】青光眼诊断眼底图像数据集|代码|论文总结|结果汇总|名词解析|评价指标
光学相干断层扫描(OCT)和年龄相关性黄斑变性(AMD)
光学相干断层扫描(OCT)和糖尿病性黄斑水肿(DME)
年龄相关性黄斑变性(AMD)和糖尿病性黄斑水肿
dataset:https://data.mendeley.com/datasets/rscbjbr9sj/2
paper:https://www.cell.com/cell/fulltext/S0092-8674(18)30154-5#secsectitle0015
kaggle 2017 ,视网膜光学相干断层扫描(OCT)是一种成像技术,用于捕获活体患者视网膜的高分辨率横截面。
pytorch : https://www.kaggle.com/carloalbertobarbano/vgg16-transfer-learning-pytorch
http://www.adcis.net/en/third-party/messidor/
Messidor数据库包含数百个眼底图像,自2008年以来一直公开发布。它是由Messidor项目创建的,目的是评估自动病变分割和糖尿病视网膜病变分级方法。
图片格式:tif
TIF格式是一种压缩最小的图片处理格式,基本不损失图象信息,但其缺陷就是文件体积太大。
好多朋友问我这个,不知道为什么你们下不了 = =,这里下好了在下面
https://download.csdn.net/download/qq_31622015/13078201
https://download.csdn.net/download/qq_31622015/13078237
https://download.csdn.net/download/qq_31622015/13078210
DRIVE数据库用于对视网膜图像中的血管分割进行比较研究。它由40张照片组成,其中7张显示轻度早期糖尿病视网膜病变的迹象。
论文:https://ieeexplore.ieee.org/document/1282003
访问:http://www.isi.uu.nl/Research/Databases/DRIVE/download.php
https://drive.grand-challenge.org/DRIVE/
高分辨率视网膜图像,由临床医生按0-4严重等级注释,用于检测糖尿病视网膜病变。该数据集是完成的Kaggle竞赛 4 years ago 的一部分,该竞赛通常是公开数据集的重要来源。
https://www.kaggle.com/c/diabetic-retinopathy-detection
视网膜水肿是一种常见的眼部病理改变,会导致不同程度的视力下降,从而影响正常的生活。尽早的发现水肿症状,能够对疾病的诊断和治疗起到重要的作用。如今临床上使用OCT(光学相干断层成像)辅助医生对视网膜水肿进行判断。我们提供了眼部OCT样本的图像数据集,由专业眼科医生分别对三种类型的水肿进行标注,数据量达到100个OCT体数据,每个体数据128张图片。
MRNet-v1.0
google搜素MRNet申请,数据集会发到邮箱里
CAMMA(医学活动的计算分析和建模)
https://endovis.grand-challenge.org/endoscopic_vision_challenge/
HealthData.gov:来自美国联邦政府的数据集,旨在改善美国人口的健康状况。
大城市健康清单数据平台:来自26个城市的健康数据,包括34个健康指标,涵盖6个人口指标。
慢性病数据:美国各地慢性病指标数据。
人类死亡率数据库:超过35个国家的死亡率和人口数据。
MHealth(移动健康)数据集:在进行体育活动时,为10名不同形象的志愿者提供身体动作和生命体征记录。
医疗保险提供者使用和支付数据:医生和其他医疗保健专业人员向Medicare受益人提供的服务和程序数据。
生命科学数据库档案:日本生命科学家在长期稳定的国家公共产品中产生的数据集。存档使许多人可以更轻松地按统一格式按元数据搜索数据集,并使用明确的使用条款访问和下载数据集。
OASIS:开放获取系列成像研究(OASIS)是一个旨在使科学界免费获得大脑神经成像数据集的项目。他们编译并自由分发神经影像数据集,希望有助于未来在基础和临床神经科学方面的发现。
OpenfMRI:磁共振成像(MRI)数据集可供研究界公开使用。
ADNI:阿尔茨海默病神经影像学倡议(ADNI)研究人员从志愿者研究参与者那里收集了几种类型的数据。数据可免费提供给授权的调查员,但需要申请并事先批准。
GEO数据集:该数据库存储策划的基因表达数据集,以及基因表达综合(GEO)存储库中的原始系列和平台记录。
1000基因组计划:1000基因组项目是一项国际合作,已经建立了最详细的人类遗传变异目录。该项目的最后阶段对来自全球26个不同人群的2,500多人进行了测序。
瓶中基因组:数据集包括几个参考基因组,以便将整个人类基因组测序翻译成临床实践。
Medicare医院质量:医疗保险和医疗补助服务中心提供的Medicare.gov 医院比较网站上使用的官方数据集。这些数据使您可以比较全国4,000多家Medicare认证医院的护理质量。
医疗成本和利用项目(HCUP):数据集包含美国医院中不耐烦住院,急诊就诊和门诊手术的遭遇级信息。
MIMIC重症监护数据库:MIMIC是由麻省理工学院计算生理学实验室开发的一个公开可用的数据集,包括与大约40,000名重症监护患者相关的未识别健康数据。数据集包括人口统计学,生命体征,实验室测试,药物等。
SEER癌症发病率:由美国政府提供的有关癌症发病率的数据,按年龄,种族和性别等人口统计群体划分。
BROAD Institute癌症项目数据集:按脑癌,白血病,黑色素瘤等项目分类的数据。
今天上海交大的研究学者发文 MedMNIST Classification Decathlon: A Lightweight AutoML Benchmark for Medical Image Analysis ,公布了其收集整理的10个医学领域的图像数据集MedMNIST,旨在促进AutoML(自动机器学习)在医学领域的技术研究。
项目主页:
https://medmnist.github.io/
论文地址:
https://arxiv.org/abs/2010.14925
Demo代码地址:
https://github.com/MedMNIST/MedMNIST