6 月 21 日晚 20:00,理想发布了 2022 年的旗舰车型 L9。三维空间交互、超强计算平台、五屏视听系统、AD Max 旗舰级智能驾驶......作为一款大型家庭智能旗舰全尺寸 SUV,不论从配置还是体验设计上都可谓“全部拉满”。而理想 ONE 作为造车新势力里月销过万的车型,也是中国品牌有史以来第一款 30 万价位之上月销过万的车型。理想目前已经成为中国家庭用户购车首选的新能源汽车品牌之一——在最新的 5 月新能源造车新势力销量排行上,理想以交付 11496 辆排名第一。
最近几年,在工业科技领域,越来越多像理想这样的中国企业摒弃了传统的“弯道超车”策略,纷纷选择开辟全新赛道“换道超车”。其中“用户体验第一”不但是理想打出区分度的标志,也是其他行业的企业一直在不断探索的方向,试图开辟属于自己的优势赛道。例如,在基础软件领域扮演关键角色的数据库。
我们知道,在科技制造业,生产流水线的平稳高效运转是企业的生命线。其中核心的产线执行系统如果出现故障,将直接导致停产,每一秒都意味着供应链和人力、资源、机会成本的巨大损失,甚至可以掀起蝴蝶效应。
假想这样一个场景: 在紧张的生产交付周期中,某天开始产线系统突然出现某个流转环节请求超时,物料拉取和排产都受到影响,初步确认是数据库负载打满问题后,作为救火队员的 DBA 打开慢日志开始分析,看着满屏幕的 SQL 执行列表:耗时、执行次数,执行计划各种指标彼此关联,无法快速判断根因……顶着巨大的压力,DBA 开始杀连接企图让系统恢复,但杀连接的速度却追不上应用系统自动重试的速度……
最终,研发团队回滚了系统新功能的发布,执行有损降级后恢复了系统,造成的生产影响已无法挽回。一股无力感涌上心头,作为 SRE 都知道,故障复盘会上又是一场血雨腥风。
今年,理想汽车自研 MES 生产制造系统、WMS 仓储管理系统都用上了OceanBase 3.0 版本。在智能运维体系的护航下,异常 SQL 的诊断是实时自动分析的,DBA 在关键时刻只需看一眼可疑 SQL 列表,就能快速判断问题根因,并且获得合理的应急优化建议。而这仅仅是自研的 OceanBase 智能化的一个小缩影。
去年,国内 L2 级辅助驾驶的乘用车达到了 22.2% 的市场渗透率,而理想在更高级的 L3 甚至 L4 辅助驾驶演进道路上,选择了完全自主掌控的自研路线。此外增程系统、底盘控制系统,中央域控制器也全部自主研发。作为新生力量,却已走到业界前列。这种洞察和策略跟 OceanBase 坚持的“从 0 打造下一代数据库”不谋而合。使用已有的方案产品来改造,可能在短时间内走得更快,但完整的自主研发,才能在未来走得更远。
举个具体的例子:OceanBase 通过基于 Paxos 协议实现了数据库服务“故障自动恢复” 和 “数据零丢失”,并且即使在网络条件复杂的情况下依然保持稳定的性能和可用性。作为共识协议的“本源”、容错性最好的 Paxos,其工程实现难度也是最大的。这也是业界不少产品采用 Raft 简化版算法的原因。通过内核工程师们的持续努力,OceanBase 早在 1.0 版本就完整独立地实现了基于 Multi-Paxos 算法的日志同步机制,并在极致场景下打磨多年迭代到如今的 3.0 版本,这也为 OceanBase 支撑跨城远距离的“多地多活”部署架构提供了坚实基础。
迁移至 OceanBase 后,理想的产线执行系统数据库抖动频率平均下降约 80%,对于常见的故障事件也真正做到了“先恢复,后分析”。这,就是自研的意义所在。
OceanBase 基于 Multi-Paxos 的基本架构
理想 L9 标配旗舰级的智能驾驶系统:理想 AD Max。除了具备感知、决策、规划能力来保障系统的可靠性和高成长性外,在安全层面,动力转向系统、制动系统和算力平台供电系统,同样进行了冗余设计,保障执行机构的可靠性。通过将之前百万级的自动驾驶高阶传感器和计算平台变成标配,L9 将实现全场景的导航辅助驾驶功能。此外,独创的智能驾驶交互系统,在启动状态下,安全驾驶交互屏和 HUD 将提供最重要的环境和警示信息,让智能驾驶更安全、更便捷。
而“智能驾驶”这个话题,对于 OceanBase 来说,最早的探索实践可以追溯到 2017 年。如今的 OceanBase 智能运维体系,围绕监控、诊断、报告三个维度,为用户提供了功能丰富、简单易用的“强大武器”,下面让我们来分别介绍。
传统数据库的监控体系,往往需要用户在多如牛毛的监控项中找到可能异常的指标,并对各个指标之间进行关联和因果分析,实际上极度依赖专家经验。
OceanBase 运维管理工具 OCP,将专家经验直接内嵌到每层监控中,从表层的响应 RT 一直下钻到单个物理节点的基础指标,用户只需在每层监控中点击关联的可疑指标,就能将问题层层定位。告别过去“同时打开十几个监控页,反复对比分析”的低效排查。
此外,OCP 智能监控还能够支持从“告警 -> 监控 -> 事务 -> SQL -> Trace ”的整个链路进行关联分析,帮助用户更快速地定位问题。
相比其他大多数以慢 SQL 监控为主的数据库诊断产品,新的 OCP 3.3 版本中,智能化诊断进化到了新的高度。不但支持前面提到的可疑 SQL 自动分析,还提供诸如事务诊断、SQL 请求分析、SQL 执行画像、智能优化建议、死锁分析等等丰富的功能,大大提升对“异常 SQL”这个数据库异常事件背后最大元凶的处理能力和应急效率:
大事务分析诊断:有效针对悬挂事务或长事务进行干预,避免业务阻塞:
SQL 请求分析:直观展示当前数据库中各类耗时 SQL 的执行次数分布、响应时间分布:
SQL 执行画像分析: OceanBase 作为一个 HTAP 数据库,以 Parallel 模式执行的复杂 SQL 可以清晰地通过画像进行分析:
用户甚至可以直观的以类似火焰图的形式看到物理执行计划中耗时最高的算子:
SQL 优化建议:直接提供最优索引创建推荐、历史最优计划推荐以及租户规格扩容推荐等建议,可操作性非常强,大量场景中用户只需按照建议执行优化操作即可快速解决问题。
死锁分析:死锁是关系型数据库都可能遇到的问题,OceanBase 除了在机制上可以避免持续死锁的影响,在新的 OCP 3.3 中还可以对死锁做更直观的分析。包括死锁参与者的角色,死锁发生的执行顺序,死锁节点对应的执行 SQL,帮助客户对死锁的根因进行分析,并对循环依赖进行分析进而解决。
除了上述提到的监控以及诊断相关的功能外,在数据库巡检智能化方面,OCP 还提供了不少激动人心的功能,其中之一就是万众期待的数据库性能报告:
性能报告
OceanBase 从 OCP 3.3 开始提供集群、租户维度的性能分析报告,涵盖从传统的基本信息到集群负载、等待事件、内存占用到分布式架构特有的 RPC 类型分析,可以为 OceanBase 深度优化提供全面的参考材料,并随着版本进化不断完善。
系统日志聚合
数据库的运维和问题排查普遍离不开系统日志分析,而对于具有多个分布式节点的集群,其日志分析往往充满挑战:传统方式是登录到对应的节点,再通过一系列的人工过滤才能定位到需要的日志内容,如果问题可能涉及分布式的多个节点,这个过程将更加痛苦。OCP 的日志聚合分析功能彻底解决了这个问题。整个集群的日志不但在控制台即可一目了然,还能根据集群、节点、日志类型、关键字等等维度进行任意维度的过滤聚合,再也不用登录到每台节点去“正则+grep”,大幅提升排查分析效率。
说完了智能化方面的探索,再来回头看看此次的理想 L9:全尺寸 SUV,大空间,堆满了旗舰级配置。有 7.4.3 的天空环绕全景声音响;全座椅电动调节、加热通风、多点按摩;还有沉浸式多屏影音系统……除此之外,对于用户体验的极致追求,还体现在多处细节:Switch 一线直连,全家游戏同乐;三维空间交互技术,在车里以人类最自然的方式交互;HUD 和安全驾驶屏结合,解放中控屏,使地图导航和全景泊车都获得震撼效果。可以说一切围绕着体验不断打磨。
而 OceanBase 作为一个数据库,我们也围绕着这个强大的内核组建了豪华的生态工具家族,让用户从项目初始评估到启动数据迁移,从在线业务切换到发起增量订阅,最后再到面向研发的变更管控,都给用户提供了“符合直觉且易用性强”的功能体验。彻底告别过去多个平台割裂、数据孤岛、难以维护的局面。下面让我们分别来看看。
迁移评估工具 OMA
在迁移前一键获得当前系统的兼容性报告,此外还包括动态评估、性能负载回放等能力,大幅减少和降低迁移改造的盲点和风险,提升项目交付效率。
数据迁移工具 OMS
不但提供一站式异构数据库迁移切换能力,还提供多种数据源的增量订阅、聚合同步功能,同时支持增量动态 DDL,显著减少链路维护成本,提升幸福感。
开发者工具 ODC
除了常见的 SQL 研发调试功能,ODC 最新版本还集成了流程管控和操作审计功能,通过特殊角色用户管控普通用户的各类数据库变更操作,管理员可对数据库进行变更审计。该功能显著提升了研发协同效率,并且降低了生产变更的风险。
理想 L9 作为一款全尺寸新旗舰家庭 SUV,理想汽车通过科技和匠心,为用户提供安全,舒适的未来驾乘体验,帮助人们“创造移动的家,创造幸福的家”。而 OceanBase 作为面向未来的下一代智能化数据库,不但能为多种场景的业务提供稳定支撑,提升研发和运维幸福感,还能显著提升生产协同效率,更好地为企业创造价值。相信未来 OceanBase 和理想会继续携手前进,擦出新的火花。
白超 | 大窑(花名)OceanBase解决方案架构师 、蚂蚁集团数据库团队DBA专家
此次 OceanBase 和理想汽车的邂逅,不但是“数据库新势力遇上造车新势力”,更是在新的大背景下两家创新型企业在理念、洞察上的不谋而合。
在和理想技术团队的沟通合作过程中,可以明显感觉到科技制造业因其特殊性导致的对信息系统的严苛要求。也很高兴这次能够和理想的工程师们一起大胆探索,深度交流,碰撞出很多创新的想法。今后,OceanBase 会继续向更加智能化、自动化的方向发展,打造数据库的“无人驾驶”,帮助更多像理想一样的未来企业成为科技制造业的领跑者。