Telemetry是一项远程的从物理设备或虚拟设备上高速采集数据的技术。设备通过推模式(Push Mode)周期性的主动向采集器上送设备的接口流量统计、CPU或内存数据等信息,相对传统拉模式(Pull Mode)的一问一答式交互,提供了更实时更高速的数据采集功能。
随着SDN网络的设备规模日益增大,承载的业务越来越多,用户对SDN网络的智能运维提出了更高的要求,包括监控数据拥有更高的精度以便及时检测和快速调整微突发流量,同时监控过程要对设备自身功能和性能影响小以便提高设备和网络的利用率。
传统网络监控方式(如SNMP get和CLI),因存在如下不足,管理效率越来越低,已不能满足用户需求的演进:
通过拉模式来获取设备的监控数据,不能监控大量网络节点,限制了网络增长。
精度是分钟级别,只能依靠加大查询频度来提升获取数据的精度,但是这样会导致网络节点CPU利用率高而影响设备的正常功能。
由于网络传输时延的存在,监控到的网络节点数据并不准确。
因此,面对大规模、高性能的网络监控需求,用户需要一种新的网络监控方式。Telemetry技术可以满足用户要求,支持智能运维系统管理更多的设备、监控数据拥有更高精度和更加实时、监控过程对设备自身功能和性能影响小,为网络问题的快速定位、网络质量优化调整提供了最重要的大数据基础,将网络质量分析转换为大数据分析,有力的支撑了智能运维的需要。
Telemetry与传统网络监控方式的对比如表6-1所示。
表6-1 Telemetry与传统网络监控方式的对比
Telemetry |
SNMP get |
SNMP Trap |
CLI |
SYSLOG |
|
---|---|---|---|---|---|
工作模式 |
推模式 |
拉模式 |
推模式 |
拉模式 |
推模式 |
精度 |
亚秒级 |
分钟级 |
秒级 |
分钟级 |
秒级 |
是否结构化 |
YANG模型定义结构 |
MIB定义结构 |
MIB定义结构 |
非结构化 |
非结构化 |
更详尽的介绍:
https://blog.51cto.com/gingerbeer/2287783