【独家】加入时间特征的船舶轨迹离线压缩算法——研究AIS数据压缩的意义

船舶AIS轨迹数据


船舶自动识别系统(Automatic Identification System,简称AIS),由岸基(基站)设施和船载设备共同组成,是一种新型的集网络技术、现代通讯技术、计算机技术、电子信息显示技术为一体的数字助航系统和设备。随着船舶AIS设备的强制安装,航运业进入了大数据时代。 

目前,船舶AIS数据有如下几方面的特点与大数据的“4V”特点中的“Value(价值)”、“Variety(多样)”、“Volume(大量)”契合:

第一,船舶 AIS数据的应用广泛。

第二,船舶AIS数据发布频率高, 一般2秒到360秒发布一条,可用来报告船舶的实时信息。

由此,船舶AIS轨迹数据对船舶交通的作用是巨大的。

根据上述船舶AIS数据的特点且随着港航大数据行业的兴起,港航专家们发现利用船舶AIS数据中的动态数据不仅仅可以实现海事管理等功能。他们开始尝试利用这些动态数据中的位置信息进行适当的数据处理后,还可以为码头、船公司、物流企业等提供航线运力、港口服务能力评估等一系列的经济报告。


研究轨迹压缩的意义


一、有助于提高船舶轨迹大数据分析能力

全球各类安装AIS设备的船舶大约有39万余条,根据AIS的特点,每条船都在不断向外发布实时数据,每天能接受到上亿条AIS数据。对计算机来说,普通的计算机与存储设备无法处理与存储这些量级的数据。鉴于这个因素,对于海事局和船公司来说,如何存储和调用这些数据就成为了一个难题。在人力与物质双重浪费的压力之下,必须有一种有效的方法来解决船舶AIS数据的存储难题。

事实上,船舶AIS数据存在大量无效和冗余信息。首先,获得船舶AIS数据并不困难,只要满足岸基设施的硬件条件就可以获得船舶AIS数据。因此,许多船公司拥有数个岸基设备,一条船发出的同一条AIS报文可能被几个岸基设备同时接收,在汇总这些数据后将会出现大量重复冗余数据,而重复数据是毫无意义的。那么在存储过程中,就对数据压缩产生了需求。其次,当对上亿条AIS数据进行查询操作时,计算机的负担是巨大的而且查询效率会变得低下。可是对上亿条AIS数据进行适当的压缩之后,其中的重复、冗余数据被剔除,只留下能够体现船舶运行状态特征的数据,不仅可以解决存储难题,还可以提高计算机查询效率。最后也是最重要的,压缩后的数据可以便于数据分析。分析上亿条数据对于计算机来说十分困难,而对经过低失真率压缩后的数据来说,这些数据保留即了船舶的航行细节,数据质量与原始数据相当。因此,分析压缩后的数据得到的结果与分析原始数据得到结果误差又在可接受误差范围内,但是分析前者的效率将会比分析后者的效率高上数倍。显而易见,压缩后的数据相比原始数据而言,更适于数据分析。

综上所述,如何在保持较低失真度的情况下压缩这些无效或冗余数据就具有重要的研究意义。


二、从理论上改进了轨迹压缩算法

轨迹压缩算法不仅仅可以利用在船舶轨迹上,还可以利用在各种移动物体轨迹上。随着科技的发展,移动物体的轨迹数据将会变得更加多样化保留的信息也会更多。而对移动物体的轨迹压缩仅仅是对轨迹压缩算法的直接应用,还有很多间接应用,比如图像压缩与视频压缩。目前存储在计算机中的图片是由一系列有规律的像素点组成,根据图片中不同规律找出对应相同规律的像素点轨迹,亦可将轨迹压缩算法应用到图像压缩。

综上,在实际应用过程中,轨迹压缩算法被广泛利用。从理论上研究轨迹压缩算法对压缩算法的探索与推进有着积极作用。


轨迹压缩算法研究现状


【独家】加入时间特征的船舶轨迹离线压缩算法——研究AIS数据压缩的意义_第1张图片


如图所示,船舶AIS数据中的船舶轨迹数据是由点集构成的,集合中的每个点都是一条船舶AIS数据,反应了船舶的实时状态。目前的压缩算法一般分为离线与实时两种,目的是为了将重复、冗余数据从原始数据中剔除,尽可能保留可以体现船舶轨迹特征的子集,从而得到了压缩的效果。

实时压缩的优势在于快速;离线压缩的优势在于可以全局考虑船舶的航行轨迹。这两种压缩算法的各自的缺点分别是:

1.第一种压缩算法是二维曲线压缩算法,失去了时间特征。只能保留船舶的大致航行轨迹,对船舶航行状态保留效果较差。比如,一条船发生停泊,在二维平面上就只是一个点。根据停泊前与停泊后的轨迹,由于失去了时间特性,这段停泊状态可能只保留下了一个点,这个点只能描述当时的瞬时位置信息,无法描述一段停泊状态,这样就导致压缩后的数据质量降低。

2.第二种压缩算法引入了时间特征,但是这种算法压缩前需要对数据进行分段并且反复运用复杂的除法、开方等运算操作,加大了计算机的运算负担,导致压缩效率较低。


如何从效率与压缩效果上对这点两种算法进行优化,我们就可以使用到“加入时间特征的船舶轨迹离线压缩算法”。


你可能感兴趣的:(技术控,AIS,大数据,数据压缩,算法,技术)