简介
条形码(Barcode)技术是在计算机应用和实践中产生并发展起来的一种自动识别技术,在商业超市货架上各种商品、仓储物流管理、邮政、图书管理、办公自动化、工业过程自动化控制、交通客运中的有价票证等诸多领域,只要留意条形码的使用是无处不在、比比皆是。
条形码自动识别技术与其他自动识别输入技术相比之所以发展迅速,是因为它具有输入速度快、准确度高、成本低、可靠性强、唯一性等优点,因此能在当今的自动识别技术中占有重要的地位。
采用条形码自动识别技术可以以多种方式识别印刷在物品明显部位的条形码,通常条形码的明暗条纹不具有直读性,再加上众多的编码规则和条形码标准,使得获取条形码的信息必须要使用条形码自动识别器。
码制
1、UPC码
2、EAN码
3、交叉25码
4、39码 code 39
5、库德巴码 code bar
6、128码
7、93码
8、49码
9、其他条形码码制gs1-128条码
图像采集
条形码图像采集是数字图像处理的第一步,图像采集的好坏决定着后续图像处理步骤的难易程度。
条形码图像去噪处理
由于外部环境对图像采集设备的影响,整个设备在采集过程中会遇到很多的噪声。例如:由于光电转换器件的灵敏度降低,导致采样到的图像缠在大量的噪声,使信号质量下降。因此,为了减少噪声提高图像质量,后续的图像去噪声处理是必不可少的。
虽然现存的图像去噪声的方法很多,但是大部分都是根据采样图像的噪声统计以及图像的频谱分布。因为噪声能量一般集中于高频,而图像频谱一般只分布于一段有限区间,因此,采用低通滤波法是解决图像采样中包含的高频噪声的有效方法,此方法比较具有代表性。其他的去噪方法还有基于秩阶滤波的方法、基于偏微分方差的方法和基于马尔科夫场模型的方法,还有近些年来使用的小波去噪方法。
经过基于秩一阶滤波的去噪方法、基于马尔科夫场模型的去噪方法和小波去噪方法处理后的图像质量确实是提高了不少,但是这些去噪方法的缺点在于数据处理所需的时间,图像去噪效果好就意味着图像去噪算法复杂程度的提高,去噪算法越复杂,算法处理时间就越长。
基于统计学的方法对图像像素数据进行像素值大小进行排序,可以抑制噪声对图像质量的影响。该方法使用一个元素个数为奇数的模板,将该模板放入所要处理的图像中,在图像里进行滑动,模板覆盖的中心点的像素值取的是模板所覆盖的所有像素的像素值的平均值。对于图像中的噪声点来说,它们会在这个序列的前侧或后侧,所以选取整个序列中部的数值,因为它们通常不属于噪声。因此,中值滤波能起到抑制噪声的功能。
图像二值化处理
对条形码进行边缘提取后,需要对目标区域进行二值化处理,一方面是为了剔除条形码边缘图像中的一些微弱的边缘信息,消除对后续条形码处理造成的影响,同时,另一方面图像二值化处理可以减少需要处理的图像数据量,提高条形码识别的时效性。
应用二值化处理法中的直方图处理法可以准确的分析波峰或者波谷的二值化所需要的阈值;基于聚类的方法是将图像先按照某个阈值分割成两个集合,在此基础上根据最大类间方法求得最小的误差时的阈值。ChienHsing Chou等人提出了一种将图像划分成几个区域,用支持向量机决定每个区域应用何种二值化方法,Mohamed等人将多尺度技术引入二值化领域内,它可以和任何自适应取得阈值方法相结合,得到了较好的二值化处理结果。文献
定位
在日常生活中,对条形码的识别主要是通过扫描枪对准条形码区域来进行识读信息,而且使用扫描枪扫描条形码成本高。因此在本文中,使用图像处理技术实现对条形码信息识别,首先需要解决的一个问题就是如何解决对条形码的定位问题。只有解决了条形码定位的问题,爿‘能继续进行下一步条形码信息识别处理。
当前,世界范围很多专家学者针对性的深入研究了条形码的定位方法,并且提出了对条形码定位的各种方法。例如分块匹配的方法,基于图像纹理特征的方法和使用DCT变换的方法。文献
文献
NCC算法使用的模板在水平方向上和竖直方向上具有平移性,可以利用前后上下模板的相互关系,利用已经计算出来的值,来处理新的像素点,该算法能够有效地降低数据处理过程中的计算量。使用NCC算法对条形码的水平方向上对条形码的左右区域进行定位,因条形码区域起始符、中间分隔符和终止符有固定数目的黑白条,所以定位出条形码区域。
DNA条形码
DNA条形码是利用生物体内一段标准的、有足够变异的、易扩增且相对较短的DNA片段对物种进行快速准确鉴定的技术。该技术极大地增强了人类监测、了解和利用生物多样性资源的能力,其在生命科学、法医学、流行病学,以及医药、食品质量控制等领域均有广泛的应用前景。DNA条形码技术弥补了传统分类学的不足,为生物多样性研究提供了新的思路和方法。
DNA条形码的定义
生物学研究以准确的物种鉴定为基础,在样品保存良好的前提下,传统分类学家依靠已有的理论知识和实践经验对物种进行鉴定。随着人们对物种鉴定要求的逐步提高,传统形态学鉴定已不能满足相关需要,并且传统形态学鉴定具有一定的局限性,例如:容易忽略类群中普遍存在的隐存分类单元,用作鉴定的特征可能存在表型可塑性及遗传可变性,这些都会导致鉴定错误。而随着传统分类学专家队伍的缩减,能否准确、快速地进行物种鉴定成为分类学必须突破的瓶颈。
专家Hebert等对动物界包括脊椎动物和无脊椎动物共11门13320种的线粒体细胞色素C氧化酶亚基I(cyto—chrome coxidaseI,COI)基因序列进行比较分析。除刺胞动物Cnidaria外,98%的物种种内遗传距离差异小于1%,很少超过2%,而种间平均遗传距离差异可达到11.3%。He—bert等应用线粒体COI基因序列鉴定了鳞翅目Lepidoptera 200个近似物种,并提出将线粒体C0I基因序列作为全球动物鉴定系统的核心标记基因片段。同传统的形态学鉴定相比,DNA条形码技术具有以下优势:
1)不受物种发育阶段的影响:以物种DNA序列为检测对象,同种生物在不同生长时期的DNA序列信息一致;
2)操作简单:该技术对研究人员的分类知识与经验要求不高,经过简单培训即可操作,不需要依赖分类学专家;
3)准确性高:每个物种都具有特定的DNA序列信息,利用现有的DNA条形码数据库,可鉴别出全球范围内已收录的所有物种;
4)能够发现传统形态学鉴定所不易发现的新种或隐存种。目前,DNA条形码技术已经成为生物分类和物种鉴定强有力的工具,在生物多样性保护中得到了广泛的应用。
DNA条形码技术虽然发展前景广阔,但对于保存年代久远的博物馆馆藏标本,要获得其标准的DNA条形码序列比较困难,因其DNA大多已降解。DNA微型条形码是指长度为100—200bp的DNA序列,而对于已降解的标本,200bp左右的序列也可以用于扩增。如专家Hajibabaei等的研究表明约130bp的DNA微型条形码可以有效地被应用于蛾类干制标本的鉴定。Meusnier等设计了对通用引物Uni MinibarFl/Uni MinibarRl用于扩增C0I基因的一段130bp的片段,在1866个样本中(包括哺乳类、鱼类、鸟类和两栖类的691种共1566个样本和植物、真菌、藻类的300个样本)的扩增成功率高达92%。
DNA条形码的候选基因
动物DNA条形码研究通常选择线粒体COI基因为候选基因,它是一段长度约为650bp的基因片段,具有长度适宜、进化速率适中等特点,序列的种间差异能较好地区分物种。研究表明,利用COI基因序列能够对北美哥斯达黎加地区1000多种热带鳞翅目昆虫进行有效的区;利用线粒体COI基因序列对澳大利亚207种海洋鱼类进行分析,发现COI基因在鱼类鉴定中具有良好的通用性,能够对鱼类进行有效的物种鉴定;在两栖类的条形码研究中,16SrRNA基因和COI基因曾被提出作为适用于两栖类的条形码基因。同COI基因相比,16SrRNA基因高度保守。尽管16SrRNA基因有时也作为两栖类的条形码标记,但在鉴定物种方面没有COI基因有效。Xia等利用COI基因和16SrRNA基因鉴定来自小鲵科Hynobiidae的54种130个个体。尽管16SrRNA序列的扩增成功率高于COI基因,但由于其进化速率太慢,不能提供足够的信息从而更有效地鉴定山溪鲵属Batrachuperus、拟小鲵属Pseudohynobius和小鲵属Hynobius的部分物种。专家Che等重新设计和优化了2对COI通用兼并引物,在中国两栖类的1l科36属82种111个个体中进行了验证,证实新设计的2对引物能够较广泛地用于两柄类DNA条形码研究。Nagy等重新设计了RepCOI—F/RepCOI—R引物,对马达加斯加地区的468种爬行类的扩增成功率高达84.6%,可大规模地应用于爬行类的DNA条形码研究。
微生物DNA条形码研究中,主要采用ITS基因作为真菌候选基因。国际真菌DNA条形码T作组通过对多个基因序列进行筛选评价,发现了ITS序列可使真菌物种的分辨率达到72%,是目前真菌物种分辨率最高的单一DNA片段(张宇,郭良栋,2012)。ITS序列是核糖体中的一段DNA片段,包括ITSl、ITS2和5.8s3个常用的DNA序列片段,在真菌和可进行光合作用的真核生物中广泛存在,具有很高的种间差异性。ITS的优点在于片段长度适宜、引物通用性强、便于扩增。2011年,第四届国际生命条形码大会建议将ITS基因作为真菌DNA条形码的首选。而细菌一般采用扩增16SrRNA基因,该基因具有更易扩增的特点,在原生生物中表现尤为明显。鉴于单基因在类群中通用性不高的因素,多基因片段联合的DNA条形码鉴定系统已经成为一个探索的趋势。随着DNA metabarcoding、DNA微型条形码、宏条形码等的发展,以及DNA条形码数据库的不断完善,DNA条形码技术将在生物多样性研究领域得到更广泛的应用。
在出入境检验检疫以及鉴定外来入侵物种等方面,传统形态学鉴定需要花费大量时间,很难进行快速检疫,DNA条形码技术为检验检疫及鉴定外来人侵物种提供了新的工具。2011年,“基于DNA条形码的快速检测与分类关键技术”被纳入中国高技术研究发展计划(“863”计划)。其次,DNA条形码技术在中药材鉴定中也有着广阔的应用前景,能够对药材真伪进行鉴定(陈士林等,2013),在生物监管领域具有广泛的应用空间。使用DNA条形码技术不但能在栖息地丧失之前创建生物多样性的库存,而且有助于生物多样性的保护。DNA条形码鉴定具有快速、简便、不受外界环境变化而改变等优势,随着测序技术的迅速发展,鉴定成本不断下降,相信在未来将会具有更广泛的应用。
DNA条形码技术同样面临着取样问题,研究表明较远的同种生物因共生体的不同会导致线粒体DNA序列的差异变大,出现一个物种具有多个不同的条形码。研究过程中取样的数量也会对鉴定结果产生影响。此外,存在足够大小的条形码间隙是DNA条形码准确鉴定物种的前提之一。而随着技术的发展与研究的深入,已发现条形码间隙在有些类群中并不明显,甚至出现了种内差异和种间差异重叠的现象。同时,在DNA条形码研究过程中应严格遵循综合分类学的理念。
应用
条形码在医院医疗器械应用
中国流通的医疗器械常见的条形码主要采用EAN-13编码、HIBC编码和GS1-128编码等。条码一般包括主条码和次条码,主条码包含国家代码、生产厂商代码、产品代码,次条码包含生产日期、有效期、批号、序列号、数量等。此外不同的编码标准和编码内容,主要根据医疗器械的追溯精度是追溯到品类、批次还是单品来决定。
EAN-13编码
EAN-13编码即13位欧洲物品编码European ArticleNumber 的缩写,是最为常见的一种编码方法。EAN-13编码只有主条码而没有次条码,一般应用在第一类和部分第二类等对产品无追溯要求的医疗器械上。条形码的133位为地区代码、4-8位为厂商代码、9-12位为商品代码、13位为校验码。
HIBC编码
HIBC是医疗领域编码Health Industry Barcode的缩写,主要应用于医疗保健行业。由主条码和次条码两部分组成,一般常见的是上下排列,上面是主条码,下面是次条码,也可用“/”将两者连接在一起。HIBC编码规则比较复杂。以“+”作为开始字符,用于区别非医疗产业代码。*号在条码中没有具体含义。$或$$是表示后面字符所包含的项目和格式的字符。HIBC编码在中国流通的医疗器械中比例较少,一般见于部分进口医疗器械。
GS1-128编码
GS1-128编码即UCC/EAN-128编码,是由统一编码委员会UCC和国际物品编码协会EAN共同发布的新的条形码标准,广泛的应用于供应链和交易中。GS1-128编码是目前中国流通的第三类和植入介入等需要追溯的医疗器械中最为常见的一种条形码。
GS1-128编码由指定应用标识符(AI)进行标识,便于识别。常见的有全球贸易项目代码(GTIN)、附加产品标识符、批号代码、系列号、生产日期、有效期、产国(或地区)ISO代码、物理位置的全球位置码等。其中可用于追溯生产厂商的有等,用于追溯产品等,用于追溯批号/系列号等,用于追溯日期等。
GS1-128编码的排列组合可根据需要选择(AI),可以合在一起或者分开排列,组合样式非常多。如图3所示。在通过扫描条码记录信息时,应认清(AI)所对应的含义,如果理解错误容易造成追溯困难或无法追溯。
医疗器械唯一标识UDI
UDI即唯一器械标识Unique Device Identification的缩写。是2013年美国食品药品监督管理局(FDA)出台的用于在美国销售的医疗器械必须标注的条形码。UDI是基于GS1标准开发的、格式更规范统一、解读更便利的一组条码。UDI主要由器械标识DI和生产标识PI两个部分组成。
DI采用全球贸易项目代码(GTIN)。PI由生产日期、有效期、批号代码、系列号组成。其中生产日期和有效期、批号和系列号可以根据需求进行选择。
不同编码的联合使用
在日常所见的医疗器械中,常见到不同编码规则的条形码出现在同一医疗器械的包装上。这种情况下首先要区分不同的代码组合,选择自己更了解且包含所需信息的一组条码进行记录即可。
参考^Sarwate DV,Shanbhag NR.High—speed architectures for Reed—Solomon decoders.Very Large Scale Integration(VLSI)Systems, IEEE Transactions on,2001,9(5):641-655.
^50]Chai D,Hock F.Locating and decoding EAN一1 3 barcodes from images captured by digital cameras[C]//Information,Communications and Signal Processing,2005 Fifth International Conference on.IEEE,2005:1 595- 1599.
^Tropf A,Chai D.Locating 1-D bar codes in DCT—dommn[C]//Acoustics, Speech and Signal Processing,2006.ICASSP 2006 Proceedings.2006 IEEE International Conference on.IEEE,2006,2:II.III.
^Fang L,Xie C. 1一D barcode localization in complex background[C]//Computational Intelligence and Software Engineering (CiSE),2010 International Conference on.IEEE,2010:1.3.
^姚俊,范永法,潘树国.基于模板匹配的有复杂背景的条码图像区域分割.河海大学常州分校学报,2004,17(4):24.27.
^赵广宇,李虎,杨海林,等.2014.DNA条形码技术在昆虫学中的 应用[J].植物保护学报,41(2):129—141.