简要的分析下在物联网环境下设备运维方向解决方案的开发。
物联网环境下,物端,也就是设备有两个基本特征,一个就是数量特别的大,另外一个就是非本地管理。
非本地管理
本地管理的最典型的例子就是PC机,例如Windows电脑,如果电脑出了软件问题,大多数情况,找人来在电脑上诊断,解决。本地管理有一些先决条件,首先在本地有丰富的人机交互接口,可以查看和分析设备内部的运行状况,可以对设备有直接的系统级别的操作。
这些先决条件对于物联网中的终端都是问题,例如,如果加上了屏幕,键盘,鼠标这类外设,终端成本,体积,功耗,复杂度立即上升几个数量级。如果保留串口等硬件接口在设备上,难看+体积大,如果设备可以本地就做出系统级别的修改,那么安全,可维护性,效率等问题都接踵而来。
所以大部分物联网设备都有非本地管理的需求,非本地管理包括了远程管理和无管理。
设备运维很早就出现了,相关的解决方案基本发展分成人工运维阶段,可视化远程运维阶段,自动运维阶段和智能化运维阶段。
远程运维
远程运维的主要特征就是可视化,将设备的内部,外部信息全部远程显示,将设备的仪表盘远程显示在远程的系统中,甚至显示一个虚拟设备在运维端等等。
自动化运维
当设备数量多到一定级别的时候,自动化运维就要高效很多,是必然的发展方向。但是自动化运维根据设备的不同,要复杂很多,简单的如远程重启,或者复杂一点,远程升级下设备的内嵌的操作系统以及应用程序,或者再复杂一点,自动修复那些运行不正常的终端。
智能化运维
智能化的运维是将运维和物联网技术,人工智能技术进行深度融合,在将来可能会有多个发展方向。
一个方向是按需运维,简单讲就是根据用户的使用需求来挑战设备的维护策略,将设备维持在稳定性优先,性能优先,节能优先,功能优先等不同的特性上。
另外一个重要的方向是预测性运维,物联网提供了大量的相关数据,大数据,人工智能技术的发展使得预测设备未来运行状态的可能性和可靠性大大增加,那么一个重要的改进就是将维护作在问题发生之前,更进一步地提高整个系统的可靠性。
有一定的技术壁垒
物联网设备,尤其是无线的物联网设备,其硬件,软件,通信,应用层对用户来讲,都是黑箱,而因为标准化不像PC机那么高,维护起来更加困难。尤其是通信技术部分,对维修人员有较高的技术要求。
规模劣势
在人力成本高涨,自动化,智能化技术快速发展的今天,维护10万个设备和维护1000万个设备可能需要付出的成本差异并不大。这样拥有物联网设备数量较少的公司就面临着规模劣势。长期看,设备运维领域的集中度会持续增加,并不断打破行业的界限。(这也是专业做设备运维的公司的发展方向)
容易忽视
用户总是自然地认为低价的东西不值得运维,一个具体的例子,用户购买了30万的设备和30元设备感受到的运维需求是非常不同的。将来要出现的大规模部署的物联网终端,更多地会向低成本方向发展。
用户容易忽视规模效应。如果一个设备的日故障率是小于0.0001,也就是万分之一。也就是能正常工作的几率要大于99.99%,这听上去已经很不错了。现在用户购买了一万个这样的设备,那么这一万个设备都正常工作的几率是多少呢?0.9999的一万次方,约等于0.37,也就是每天下来只有37%的几率这一万个设备都是正常的。大部分用户都容易忽视规模效应。
最后,用户容易忽视设备故障背后的影响。某些设备没有那么强的功能,(将来大多数物联网设备的功能将比较单一),所以即使工作不正常,也不会造成太大的损失。这里想指出的是,工作不正常的设备,还会在用户的系统中留下垃圾数据,而数据的的完整与可靠性,对将来基于大数据和人工智能的应用,可能比较重要,也就是说,对将来用户业务的开发和扩展会产生影响。
在落实解决方案的时候,我们发现并不容易,因为物联网设备的运维是和终端相关的,和通信相关的,还跟其上的应用相关。一个基础的,通用的解决方案架构如下图所示。
端
在物端这一层, 如何做到零开发就能接入使用运维平台,如何尽可能和用户应用隔离,如何管理到芯片操作系统级别,如何管理到sim,如何在网关上配合低级终端的运维等等有太多的未知的而且难解的问题。
管
在通信的管道这一层,如何运维有线的,无线的,短距离的,长距离的通信,如何从不同的通信协议中找到运维需要的信息,如何使用旁带带宽运行运维本身的应用,在一种通信方式失效的情况下,如何运维,等等,也有很多的问题有待挖掘。
云
在云这一层,如何全方位地获取终端信息,如地理位置信息,如设备内部软件版本信息,运维功能如何与应用功能进行隔离,如何实现对自动化管理的支持,如何对接外部的智能系统等等,也有很多可以思考的问题。
线下运维团队的打通
线上的运维管理不能解决所有的问题,例如硬件问题,硬件烧坏了,软件和平台是无能为力的;能源问题,电池没有电了,软件和平台也解决不了问题,因此线下的运维团队是很有必要设立的。(这里再次出现了规模效应,对于管理海量设备的运维公司可以建立更为有保障的线下运维团队,反之,线下运维团队将成为设备制造商或者用户的利润黑洞。)
因此,运维解决方案包含线下运维模块,提供移动的运维任务分配管理功能是必要的。
写在最后,物联网终端的运维由于和终端和物联网的应用耦合度较高,目前的设备运维还处于产品,地域,甚至公司间相互分割的一种状态,但是我高度地相信,将来一定会出现低耦合,标准化,跨领域的运维技术,拭目以待。