PhysioNet生理信号处理(一)--PhysioBank

PhysioNet是一个由美国国家通用医学科学院(NIGMS)和国家生物医学成像和生物工程院(NIBIB)共同支持的面向科研人员免费提供生理信号库和其处理工具的一个资源网站或者项目。目前项目内容主要分为两个:PhysioBank和PhysioToolkit,也就是生理信号库和处理工具箱。

网站:https://physionet.org/

PhysioBank

PhysioBank是一个日益增长的生理信号数据库。目前的数据库分为以下两大类和数个子类:

-临床数据库(Clinical Databases):临床护理临床设置的数据可能包括人口统计数据,在床边进行的生命体征测量,实验室测试结果,程序,药物,护理人员注释,图像和影像报告以及死亡率(医院内外);

-波形数据库(Waveform Databases):高分辨率连续记录生理信号。波形数据库根据其信号和注释类型有以下子类:

          -多参数数据库(Multi-Parameter Databases)

         -心电图数据库(ECG Databases)

         -心率间隔数据库(Interbeat (RR) Interval Databases.)

         -其他心血管数据库(Other Cardiovascular Databases)

        -步态和平衡数据库(Gait and Balance Databases)

        -神经电和肌电数据库(Neuroelectric and Myoelectric Databases.)

        -图像数据库(Image Databases)

        -合成数据(Synthetic Data)

        -其他数据(Other Data)

       -计算心脏病学挑战数据集(Computing in Cardiology Challenge Datasets)

在每个大类或者子类中还有许多专业细分化的小类,详细可以进入https://physionet.org/查看。每个小类根据以下规则进行了归类:

第Ⅰ级 - 完整的参考数据库,一般有PhysioNet官方提供;

第Ⅱ类 - 支持已发表研究的原始数据的副本,由作者或期刊提供;

第Ⅲ类 - 其他数据收集,包括正在进行的工作。

小结:PhysioBank中有许多数据库,是为了满足不同需求的科研人员,一般我们只会用到其中一两个。比如,我要研究HRV,只需用到ECG数据库而已。


如何获取数据

如果你只是想先看看每个具体数据,不进行处理或者少量数据处理,那恭喜你,超级简单。PhysioNet提供了网页版的查看工具:

LightWAVE PhysioBank ATM允许你在Web浏览器中查看PhysioBank中的任何记录和注释。

与LightWAVE相比,ATM提供了一个用于数据探索和导出的工具箱,但波形显示的时候相对较慢(它在PhysioNet服务器上生成光栅图像,甚至可以在非常老的浏览器上查看)。LightWAVE则基于Javascript和SVG在任何现代浏览器上都可以使用并快速获取高质量的矢量图形。

如果您只需要少量数据用于学习,PhysioBank ATM允许您以文本格式获得多达100,000个您选择的数字化信号样本(至少花费一分钟,通常更多),并且它可以将任何数量的注释转换为文本格式。您可以使用Web浏览器查看和保存任何类型的文本输出。

使用PhysioBank ATM允许您仅使用Web浏览器探索PhysioBank,但在需要大量数据的项目的时候,您应该选择适当的PhysioToolkit软件。许多此软件可以直接访问PhysioNet和其他Web服务器,使您可以利用PhysioBank的资源,而无需事先下载和存储大量数据。

LightWAVE工具网站链接:https://physionet.org/lightwave/

PhysioBank ATM工具网站连接:https://physionet.org/cgi-bin/atm/ATM

如果你想利用命令或者在代码中下载或者临时使用部分需要的信号,PhysioNetY也提供了基于各种平台的强大工具箱,这部分将在PhysioToolkit中详细介绍。



数据简介

在大多数情况下,记录至少由三个文件组成,这些文件使用记录名称加上不同的后缀(扩展名)来指定其内容。例如,MIT-BIH心律失常数据库文件名为100的记录包含三个文件:100.atr,100.dat和100.hea,他们一起构成名为100的记录。几乎所有记录包含二进制信号文件.dat,其包含一个或多个信号的数字化样本,这些文件可能非常大。.hea(标题文件)是一个简短的文本文件,用于描述信号(包括信号文件的名称或URL,存储格式,信号的数量和类型,采样频率,校准数据,数字化仪特性,记录持续时间和开始时间)。大多数记录包括一个或多个二进制注释文件(在本示例中,.atr表示注释文件,有时也会有.qrs/.ecg等格式),注释文件包含一组标签(注释),每个标签描述记录中指定时间的一个或多个信号的特征;例如,100.atr包含记录中每个QRS波群(心脏跳动)的注释,标记了其位置(发生时间)和类型(正常,心室异位等)。在其他数据库中,注释标记了信号的其他特征。

利用PhysioToolkit的工具软件一般需要数据是PhysioNet的标准格式。如果我们在实验室自己采集了数据,但是又想用这些工具怎么办?Toolkit中也有相应的软件工具将这些数据转换成标准的PhysioNet格式数据,很方便的处理。

反过来,如果我只是想利用PhysioBank中的数据,自己开发工具代码处理怎么办?一样的,利用Toolkit中的工具可以很方便将标准PhysioBank的数据转换成.txt格式文件。



结束

这期内容到此结束,下期将重点介绍PhysioToolkit。希望小伙伴们继续关注哦!

你可能感兴趣的:(PhysioNet生理信号处理(一)--PhysioBank)