什么是什么以及为什么
在数字时代,识别和理解大量不同数据模式的IT组织最有能力发现,修复和预防与性能相关的问题。但是,当数字转换(DX)的混合和多云基础设施承诺造成复杂性并超过IT性能管理流程时,就该将人工智能(AI)的力量应用于IT运营(ITOps)了。
AIOps是将机器学习(ML),分析和人工智能应用于大量不同数据以实时自动发现并应对潜在问题的体现。Ovum在他们的“ 在雷达上”报告中指出了IT运营面临的挑战,他们说:“如果仅突出过程中的另一个瓶颈,就使流程的一个方面自动化是没有好处的。” 该博客将描述四个简单步骤,以确保IT运营不仅避免成为业务DX计划的瓶颈,而且通过使用AIOps推动数字化转型来突出其成功DX计划的价值,从而发挥其领导作用。
成功实现AIOps的4个步骤
[if !supportLists]1. [endif]仔细选择初始用例尽管有许多潜在的数字化转型候选对象(例如,BMC服务与咨询专业人员通过将我们的三种产品(监视和事件管理,服务管理和自动化)的功能相结合,为许多客户提供了帮助。卓越的,业务定义的解决方案),重要的是要专注于可以实现和实际实现的最大化转换结果的解决方案。考虑到AI开发的当前状态,我们看到许多客户最初将注意力集中在AIOps核心的用例上,这些用例也为更高级的用例奠定了基础。这些初始用例包括以下内容:
[if !supportLists]· [endif]应用程序性能监视(APM)–采用服务意识,以用户为中心的方法来提高应用程序性能。随着应用程序开发人员和所有者拥护DevOps和Agile来加快创新速度,它已不足以监视可用性,错误和作业完成时间。现在,期望IT人员能够确保正确处理数据,帮助识别导致问题的代码并诊断最终用户体验问题,例如应用程序响应时间慢。
[if !supportLists]· [endif]动态基准(又名行为学习)–了解哪些问题可能会成为实际问题,以便您首先了解要解决的问题。IT的主要难题之一可能是虚假事件和来自整个环境中安装的许多监视工具的警报。这些警报可能指示面向客户的应用程序或服务存在严重问题。但是,警报通常只会使收件箱混乱,并导致错误警报。AIOps降低了与整个环境中无数事件相关的噪声。首先,AIOps学习环境在繁忙和缓慢的时间内的行为。然后,它可以将该行为的知识应用于系统生成的警报,以确定警报是否实际上指示出较大的事件,可能会对服务产生影响。
[if !supportLists]· [endif]预测性事件管理–在潜在问题影响用户之前进行预警。从整个环境中收集的数据收集的相同情报可以应用于预测警报。AIOps使技术人员可以知道某个事件或一系列事件直接与制造中的已知问题相关。在这种情况下,AIOps将召唤一些看上去无害的事件来引起更多关注,因为过去的那些事件已导致更大的问题。这种类型的预测性警报可以使IT人员避免最初从最终用户那里首先听到有关问题的信息,并使企业能够避免任何服务中断影响客户。预测性信息还可以通过在组内任何利益相关者意识到潜在问题之前消除潜在问题,帮助IT从被动状态演变为主动状态。
[if !supportLists]· [endif]事件驱动的自动化–自动执行标准化的分类和补救任务。AIOps在超复杂的多源云环境中连接并驱动自动化。如果结果仍然需要人工干预,则无法大规模提供大量数字IT数据的机器辅助分析。AIOps可以生成工作流并衡量这些过程的效果,并将结果作为要分析的经验教训的数据反馈到系统中。AIOps响应应基于可用数据自动进行,而无需用户干预和决策。
我建议根据BMC客户成功帮助客户实现可观价值的许多实例,重点关注这些可实现的用例,其中包括市值84亿美元的Boston
Scientific,在过去35年来一直是全球医疗技术领导者。
[if !supportLists]2. [endif]成功组织起来成功采用AIOps不仅需要技术,还需要实施新的角色,流程和数据策略。对于大多数组织而言,成功采用AIOps要求文化上的改变,因为通常需要进行结构调整以将重点放在数据源上,而不是实施中涉及的技术上。如先前博客中有关数字化转型推动因素的讨论,我们看到成功的组织将流程标准化以简化自动化;改善治理以支持新角色并有效解决组织变更管理;并建立实践社区(CoP),这些实践社区集成在我们客户的治理结构中,以将多种相似的技术,人员技能和其他资源组合成有效的团队。
[if !supportLists]3. [endif]开发核心功能通过实施AIOps以身作则,领先DX,IT可以开发其他数字转换解决方案共有的核心功能。这些可能包括:
[if !supportLists]· [endif]机器学习 –
AIOps使IT部门可以从基于规则的人工分析管理过渡到机器辅助分析和机器学习系统。之所以需要这样做,不仅是因为人类代理可以实现的分析数量和复杂性受到限制,而且还需要实现以前无法实现的一定水平的变更适应。IT分析最终与模式匹配有关。IT系统,用户和生态系统表现出的行为和关系可以指出根本原因,隔离问题并指出未来的问题。机器学习将机器的计算能力和速度应用于IT数据中模式的发现和关联。它比人类可以更快,更有效地执行此操作,并且可以根据数据的变化动态地更改所使用的算法。
[if !supportLists]· [endif]开放式数据访问 –这是所有核心功能中最关键的。IT将始终拥有来自不同供应商的多种记录技术和系统。这些也会因IT学科而异。将数据从其组织孤岛中释放出来以进行大数据聚合和分析可能是IT团队尝试实现AIOps所面临的最困难的挑战。一个有效的AIOps平台必须具有一个数据架构,该架构可以使用来自各种IT来源的数据,以及对其进行结构,标记和组织,以便对一致和可重复的分析有用。
[if !supportLists]· [endif]大数据规模和速度 –就像从消防水带上喝水一样,支持数字化转换生成的数据的数量,波动性和速度可能是压倒性的。传统的关系数据仓库既不可扩展,也无法响应,无法支持这种数量的数字数据。数据分析需要实时进行,不仅在资源可用时脱机。AIOps大数据平台还必须支持响应性临时数据探索和深度查询。最初创建用于处理数据仓库中的大型数据湖的大数据技术已迅速发展为可扩展的响应式数据处理引擎,也可以满足AIOps的需求。AIOps体现了深度数据研究与在线,实时分析的统一,从而提高了IT决策水平。
[if !supportLists]4. [endif]跟踪交付的价值为了使IT成功地领导DX计划,它必须证明采用AIOps所带来的商业价值。BMC客户成功通过建立集中的正式业务价值注册中心来帮助客户跟踪业务价值。在业务价值注册表中,价值应与总体业务目标联系在一起,例如减少平均修复时间(MTTR)。支持那些业务目标或价值案例的关键绩效指标(KPI)应该与最佳实践保持一致并且是可衡量的。最后,必须“收集”并持续管理价值,以提供交付给企业的完整,可参考的价值历史。
使用AIOps推动数字化转型
AIOps是一种变革性技术,是一次旅程,而不是目的地。最初的成功实施可以帮助DX计划并提高IT部门作为真正业务合作伙伴的知名度。当今的数字业务要求IT部门跟上不断增长的客户需求,而为此,IT组织必须采用AIOps之类的技术。如果不对后端进行数字化转换,企业就无法在前端提供数字化体验。AIOps将简化复杂分布式环境的管理,使IT运营能够根据业务与整个混合云生态系统智能地协调基础架构,应用程序和服务,并满足客户的需求。
最后,由于宕机成本高昂,有98%的组织表示,一小时的宕机成本超过10万美元;81%的受访者表示该数字超过30万美元;另有33%的人表示,成本可能在100万美元至500万美元之间,这导致组织将重点放在通过AIOps实施的数字化转型上可以带来巨大的业务价值。
如果您希望在整个AIOps旅程中获得帮助,请填写我们的表格与专家联系。我们很乐意与您交谈以了解我们如何提供帮助。
Ahoova介绍:
珠海国津软件凭藉多年的行业经验知识积累、自2009年开始自主研发基于ITIL V3和ISO20000国际标准推出的IT服务管理系统(ITSM),产品国际化程度高,面向全球市场;包括基于ITIL框架的各类相关功能模块:门户管理、请求(事件)管理、问题管理、变更管理、发布管理、配置项(固定资产)管理、知识库管理、服务级别管理、云端SaaS应用、手机端应用等等,功能齐全。整套系统以JAVA开发,B/S结构,历经多年的市场锤炼,产品精细化程度高,可维护性、可扩展性、安全性、跨平台能力、客户自定义能力等等都得到了广大客户的认可,并且可以集成其它的第三方主流企业级应用系统、呼叫中心等等。目前该产品广泛应用于海内外的金融、物流、高等院校、政府机构、制造业及IT外包商等领域,并且在不断地依据客户需求、市场要求快速迭代更新。
官网链接:www.fuwuguanli.net