可靠性02

                                                                                                                                           互联网类产品可靠性关注点
类别 场景 可靠性分析和要求
网络组网 局部网络不稳定,升级,容量不均衡 全球负载均衡GTM,自动容灾切换
核心网元提供基础性服务:命名服务,云管理节点,消息总线部件等 核心部件的高可靠性保证(参照可靠性公共设计需求)
网络不稳定是常态,消息丢失和时延 重路由,幂等性要求,CAP最终一致性;网络分裂仲裁
分布式网络系统 时钟同步
故障管理 外部网元不稳定,IT级可靠性,性能无法保证 异步访问,故障隔离,最终一致性;远程服务失败本地缓存
内部网元不稳定,IT级可靠性,低成本主机 故障迁移,会话无状态
大容量 高并发 异步IO/NIO;无锁并发
突发访问,秒杀 流控保护,简化业务而非拒绝;锁定优化
数据可靠性 缓存及分布式存储 数据一致性,最终一致性
存储设备故障,局点灾难 备份恢复方案,错时全备
监控 资源虚拟化,业务云化 分层监控:物理层、资源层、业务层
海量主机节点,负载均衡部署 资源统计,可视化,集成视图;节点负荷监控
升级扩容 全球访问业务不中断,海量用户一次性升级困难且风险太大 按主机逐批升级,按用户逐批升级;客户端自动升级
水平扩容业务无损 一致性哈希,会话无状态

你可能感兴趣的:(可靠性02)