在数字化业务的驱动下,企业对IT运营的定位已经由“交付型”转变成为IT和业务相结合的“运营型”。对于IT部门来说,理解客户和潜在客户的行为模式以及IT性能如何影响用户体验变得至关重要,只有保障业务系统良好的可用性和性能,才能支撑数字化业务健康高速发展。将被动的接收问题的反馈,变成主动出击,提前把问题发现并迅速解决。
可观测性分析平台结合用户需求,呈现结合业务场景的可观测视图。包括多种多样的可视化图表、基于真实网络和业务的流程图,从数字化视角再现业务数据、用户体验、应用运行状态等信息。
可观测性平台适合大型监测场景,支持同时部署百余台NetInside分析系统。同时针对复杂的用户环境和要求,从应用发现到分析,完全自动化,可根据实际要求个性化。提供更强的融合性,将网络、流量、应用、业务、用户体验、安全融为一体。在简单场景中能够更加专业化,提供灵活、专业、直观可视性,满足任意场合的监测需求。
NetInside可观测性解决方案由软硬件结合组成,即可观测分析平台软件(下称:分析平台)和全流量回溯分析系统(下称:分析系统)硬件组成。其中可观测分析平台是主体部分,分析平台通过安全连接读取全流量分析系统及其它数据源的分析指标和数据,实现全面数据分析和监控。全流量回溯分析系统为独立的运行平台,系统内含操作系统及程序,系统集中数据采集、计算、分析和存储于一体。用户只需要通过浏览器即可轻松访问可观测分析平台或全流量回溯分析系统,查看和展示自己关注的内容。
对可观测分析平台来说,每台回溯分析系统仅为它的一个数据源。分析平台通过安全端口读取每台分析系统的指标数据,根据实际需求独立或关联展示。
采集点即为全流量回溯分析系统,在各个关键节点、区域或位置部署分析系统,通过交换机端口镜像采集关键区域的网络通讯数据,分析并存储。每一台服务器加载各个功能模块对采集得到的网络通讯数据做深入分析,取得需要的各种网络流量指标、应用性能指标和产生相关警报。
用户通过浏览器实现对可观测分析平台和回溯分析系统访问查看,分析平台和分析系统的数据各自保存。可观测性分析平台对回溯分析系统服务器采集的数据和分析结果进行集中的管理,实现集中的告警分析、报表汇总、配置管理等重要功能,同时提供数据的挖掘分析功能,方便用户进行查看、检索、数据挖掘等应用。
通常情况下,回溯分析系统部署在靠近监控的线路旁,监控方法是通过从交换机把流量镜像,然后把镜像的流量导入到设备里分析。整个安装与配置过程在一个小时内能完成,其间对网络是零影响,并且服务器或客户端不需安装任何代理程序(如SNMP代理)。
可观测性分析平台为独立的系统软件,可以安装在任何操作系统平台。回溯分析系统和可观测性分析平台分别为独立的运行主体,互不影响。
分析平台数据采集和存储
可观测分析平台可以独立安装、配置和使用,其自带数据存储和前端服务。
在分析平台,通过添加数据源,获取想要分析和展示的数据。每台回溯分析系统都可以作为分析系统的数据源。分析平台获取数据源的方式灵活多样,包括各种数据库导入、日志文件导入、前端埋点、爬虫数据等等。
所有与分析平台展示相关的配置信息,独立保存在分析平台数据库。分析平台分析呈献的指标数据,都通过标准API即时读取。
分析系统数据采集和存储
为实现全面的链路和应用监控,分析系统常见的数据采集方式有2种:
多层应用架构环境
用户环境由多个设备组成的多层架构应用环境中,数据源来自多台网络设备,需要汇聚数据,然后接入到性能分析设备。
单一应用架构环境
当应用架构较为集中时,数据源可从少量设备镜像获得,只需在对应设备进行镜像设置,然后将镜像流量接入性能分析设备。
全流量支持多种原始数据存储方式,针对不同的应用,可选择是全包存储,还是截取包头一部分存储。
同时,所有的分析数据以动态聚合的方式,长期保存在设备中。
用户通过访问Web浏览器访问可观测性分析平台主界面,进行仪表监控、视图操作、配置和告警查看等。支持主流浏览器,如Firefox和Chrome等。
当前IT系统的运维分块管理(运维、研发、数据库等),运维数据不互通,形成信息孤岛的难题。当APP或网站应用访问异常时,维护人员需要从网络、服务器、数据库、代码等多个层面排查,且需要协调多个部门联合排查,往往会出现各部门排查都没有问题但用户访问依然很慢,且跨部门沟通时间长、效率低、数据关联有限,无法快速定位问题点,直接影响了用户的体验,而由此带来的风险是影响公司的收入。
分析平台通过读取和采集各种平台数据,集业务、应用、网络、用户体验和安全数据于一体,清晰展现应用的各个环节真实情况,出现网络或应用问题及时发现,并让问题解决部门有明确的职责归属,让IT管理不再出现盲人摸象,被动救火的局面。
而且,分析平台支持的数据源及数据类型,仍在不断的增加中,这对企业进一步完整完善大数据分析平台提供可靠的参考信息和决策依据。
随着信息化的迅猛发展和多种新型技术的使用,每个行业都正在经历快速的技术迭代和管理需求变化,这也对运维产品功能和技术水平提出前所未有的要求,传统的设备和系统运行监控方案也无法满足管理需求。
IT部门不但需要自动识别和发现所有应用,看到每一个应用的运行状况和用户体验好坏,更需求实现自身想要的、更适合自身使用习惯的,甚至针对不同视角和不同管理层级人员的个性化展示内容。
通过分析平台自定义视图界面,用户根据实际需要,创建不同的目录菜单,创建不同类型的视图内容,并根据自身喜好设置登陆后的默认显示视图,充分满足个性化需求。
另外,用户还可以通过使用网深科技提供的多种视图模板,或借鉴和分享同行业成功经验,通过导出导入的操作流程,快速学习和使用已有成果。
目前,分析平台支持业务性能、应用性能、业务访问、应用访问、网络流量、传输效率、安全数据等类别高达百余种指标数据。
使用分析平台,能够将系统自动识别的任何流量、任何对象,以及任何对象的钻取分析结果,按照场景、行业、部门及个人等需求,形成独立的实时监测分析与告警大屏。同时,大屏中的任何对象,支持进一步钻取分析。
通过海量数据融合,建立以业务、用户体验、应用性能可观测为核心,创建全“业务链”应用管理模式,贯穿并透视整个业务过程,将业务流程中各应用系统的关系和各个环节数据进行关联,从前端、网络、系统、应用等多个环节对问题进行分析,定位问题根源并进行性能优化,提升用户体验,提高IT管理质量。
NetInside可观测性分析平台在全流量回溯分析系统的基础上,从新设计,从原来的智能运维分析系统,进一步集管理、运维、安全与优化于一体,实现个性化平台。
通过分析平台可实现:
业务管理人员,全盘把握实时业务性能,实时了解用户感受,进行主动性能管理,持续提升用户体验;
IT安全运维人员,利用全流量行为分析技术,快速发现存在异常或风险的服务器,自动发现感染蠕虫病毒或木马的客户端。
IT网络运维人员,在业务运行出现潜在风险时即预警,而不是出现故障时才着手处理;
程序开发人员,查看最慢的页面和语句,查看错误码信息和页面调用参数,修正程序bug,定位性能瓶颈节点,持续提升性能。
面向全景内容的监控视图
自定义动态大屏视图,涵盖用户、业务、应用、网络运行及性能状况,以图表和简洁的数字为不同角色展示各自的关注信息。为使用者提供直观全面的监控内容视图。
站在统一视角进行运维和排障
不同于传统的网络运维方式,分析超越了网络和基础设施视角,将网络运维的视角放在了用户体验、业务、应用和线路上,以一个个应用组件的网络行为作为监控对象,真正与整个IT运维团队站在了统一视角上,让沟通变得史无前例的高效,避免将宝贵的排障时间窗口浪费在额外的沟通上。
自动联动分析能力
分析平台上展示的任意数据,都可以与数据源自动关联分析。这种特有的自动关联能力,同时附上支撑结论的指标和直观的图表及数据信息。凝聚了NetInside技术专家们对数据包分析的知识经验的分析引擎,实现真正的去专家化,并从耗时耗力的人工故障诊断和数据包分析中解放出来。