Camelyon16数据集踩坑记录

Camelyon16与Camelyon17的数据页面已经整合在一起(https://camelyon17.grand-challenge.org/Data/)。

首先,下载Camelyon16数据集,经过md5sum确认文件无损伤。

安装主办方提供的tiff图像查看软件ASAP,该软件提供了必要的python接口。ASAP软件可由源码编译,也有.deb或.exe文件可直接使用(https://github.com/computationalpathologygroup/ASAP/releases)。先后在Windows和Linux下安装该软件。

Linux版本的.deb软件的1.9、1.8、1.7版本都无法正常打开Camelyon16的train和test的tif文件,软件左下角显示‘Invalid Image type’;配置好的Python接口也无法读取图像文件。而Camelyon17的图像却可以正常打开,Python接口也可以正常访问(另外测试了bigtiff的官方测试图像,也是可以正常打开的)。猜测可能是16年和17年的数据集格式略有不同,而Linux版本的软件维护不周。

Windows版本的.exe 1.9可以解决上述问题,软件及Python接口可以正常访问16年数据集的图像。这也证实了应该是linux软件的问题,而不是图像的问题。Windows下的python需要注意路径字符串使用r表明是原始字符串,不然路径中的\train或\test造成歧义,无法正常读取文件,表现与上述linux相同。

结论:Camelyon16数据集的处理,若需要使用ASAP的Python接口访问,需在Windows下进行。

 

 

 

你可能感兴趣的:(科研记录)