DICOM 协议学习 (4)数据字典 Data Dictionary

在本节将讲一下Dicom中非常重要也最常用到的一个概念:Data Dictionary. 对这个词如果你还不是很熟悉的话,那换一个词你一定是知道的: Tag. Tag可以说充斥了Dicom的方方面面,因为从程序的角度来说,算法与数据结构就是应用程序,而在医学影像软件开发中,Data Dictionary就是Dicom中最重要、最基本的一种数据结构。Dicom协议的PS3.6节中包括了一个用来编码标准Dicom属性的、完整的Dicom Data Dictionary,这一部分俗称共有Tag, 而作为医疗影像的硬件厂商,也可以遵循Dicom规则扩展属于自己公司内部的Data Dictionary, 俗称私有tag。

标准Dicom Data Dictionary

Dicom Data Dictionary 本质上是对所有标准医疗数字数据的一种注册,或者说是标记,在字典中的每一条数据都属于上一节所讲的27中VR(Value Representation.)类型之一。作为这么多年的发展累积,Dicom Data Dictionary 中索要表示的数据条目多达2000多个,那么为了能够更加有效地管理这么多的Item, Dicom对其进行了分组(Group),而数据条目Item作为一个element存在,这样通过group 号和element号就可以确定一个item具体是哪一个内容了,通常表示为(group, element), 如 (0008, 0080), 就是我们常说的tag号, 也被称之为"attributes"或 “Data elements”. 需要注意的是,所有的Dicom设备和软件中,都是通过tag来识别属性的,tag类似于id,软件中靠tag来找值,而不是属性名称来找值,属性名称只是方便人来读取和理解的。
所有的group id和element id都是通过十六进制进行编码的, Tag号与属性名一一对应。如下图即为数据字典的一部分,其中第一列为tag号,通过它可以找到属性名,VR表示了该属性的数据类型,VM表示这个属性可以有几个值,一般情况下一个属性有一个值就可以了,但是有些情况是不行的,比如(0010, 1001)这个属性,表示患者别名,有的患者可能有多个别名,这时候就需要该属性有多个值。另外,当属性具有多个值的时候,如果数据类型为二进制类型,那么只需要将其简单的拼接起来就可以,按照数据长度即可区分,而如果数据类型为文本类型,那么多个值就需要通过反斜杠进行连接,所以在Dicom当中,应该十分谨慎的使用反斜杠

image.png

在前面的图片中,通过斜体表示的属性为早期版本的DICOM数据,在将来可能不再支持。这些属性不会再被重新定义,也有可能被其他字段替代,但作为一个好的dicom应用,应该考虑到向前兼容性,对斜体部分属性作出适当的兼容。

私有DICOM Data Dictionary

正如前面所说, Dicom除了标准的Dicom属性,厂商还可以自己扩展属于自己的私有属性,一般的,Dicom中偶数group号表示标准的Dicom属性, 奇数的表示自定义私有的属性(tag)。所以虽然我们自己定义的tag号在标准中不会描述,但是其他厂商通过group号可以轻松地判断这个属性是我们自己扩展出来的。私有tag另一个问题就是,不同厂家可能用同一个tag定义了不同的属性,导致在读取其他家数据的时候回曲解tag的意思,虽然dicom协议作出了很大的努力避免这种问题,但并未完全排除这种问题,而笔者目前的开发经验来看,比较实用的方法还是先判断数据来源,再对私有tag进行读取,可以避免误读。

标准Dicom Command Dictionary

前边所讲的内容嗾使关于数据属性的, 那么你可能会问,像打印、存储、移动这种指令是怎么进行编码的呢?其实也很简单,Dicom 在Group 号为0000中对命令进行编码,该组中只包含DIcom指令,如 (0000, 0100)表示指令类型,(0000, 0110)表示指令消息ID。这里需要注意的是,Dicom中并不提供扩展私有Command Dictionary。这也许会在未来Dicom标准中被支持,但目前来看,还是不可以的。

以上为数据字典的全部内容,如有疑问或建议,欢迎留言。

你可能感兴趣的:(DICOM 协议学习 (4)数据字典 Data Dictionary)