《架构真经》笔记

《架构即未来》和《架构真经》是架构姊妹篇,本来想两本都买来学习,但是《架构即未来》看了一下目录,感觉偏“道”一些,理解和应用有些难度,没有《架构真经》的实战性这么强。以下内容是基于《架构真经》中的一些架构原则做了整理,方便阅读。

《架构真经》笔记_第1张图片
架构设计原则.png

1.数据库

1.1.评估规则

  • 数据量、存储量
  • 响应时间长短
  • 关系

1.2.关注明锁和监控暗锁

最大化数据库并发和吞吐量

1.3.禁用分阶段提交事务

容易阻塞其它事务

1.4.永远不要为确认操作是否有效而读取刚刚写入的数据

1.5.nosql

  • no select for update
  • no select *

2.缓存设计

2.1.利用CDN缓存

  • 加快访问速度
  • 动静分离

2.2.httpheader

max-age
Expires
cache-control
Last-Modified
ETags

2.3.应用缓存

缓存命中率>85%


3.分布式系统设计

3.1.CAP要求不能同时满足

  • 一致性C
    从客户角度看,一组操作同时发生
  • 可用性A
    每个操作必须都能收到预期的响应
  • 分区容错性P
    即使个别消息丢失,操作仍然可以完成
  • 解决

[BASE思想]
o o 基本可用BA
o o 软状态S
o o 最终一致E
[放宽时间约束]
o o 放宽一致性可以使我们在解决扩展问题时有更大的灵活性

  • 无状态实施方案

4.方案设计

4.1.采用帕累托原则简化范围

80-20原则,收益的80%来自于20%的工作

4.2.考虑成本优化和可扩展性简化设计

4.2.1.扩展性设计

DID方法

  • Implement(I) 实施3倍的容量
  • Design(D) 设计20倍的容量
  • Deploy(D) 部署1.5倍的容量

4.3.依靠其他人的经验来简化部署


5.拆分和扩展

5.1.水平扩展(X轴)

5.1.1.复制服务或者数据库分散事务处理负载
  • 数据库读写分离
  • 多部署服务实例
5.1.2.事务的ACID属性
  • 原子性Atomicity
  • 一致性Consistency
  • 隔离性Isolation
  • 持久性Durability

5.2.拆分(Y轴)

5.2.1.垂直拆分,面向数据或者服务

服务拆分,例如拆分会员、商品、积分等

5.3.拆分(Z轴)

5.3.1.分片,把数据或者服务分割成几块
  • 例如扩大客户基数,按照用户ID取模或者散列算法分片
  • 数据分片,理论上可以无限扩存储

6.避免工具被过度使用

  • 缺乏实验和使用新技术的勇气,结果导致工具被锁定和过渡使用
  • 我们都试图使用熟悉的工具解决问题,类似技能的人员解决仍然会得到一致的答案,过度
    1)需要拿出一部分资源主动分析、试验和采用新工具
    2)花时间学习新事物,保持开放心态

7.避免过度设计

7.1.通过测试人员是否能够轻松的理解解决方案来验证

7.2.过度设计分类

  • 产品的设计和实施超过实际的需求
  • 把事情做得过于复杂和以复杂的方式去实现

7.3.好工程师的度量

多快简化一个复杂的问题,然后构思出一个易于理解并可以维护的解决方案


8.流量风险

  • 空前极具增长的大量用户请求
  • 用户行为都集中在少数热点上

9.发现问题

9.1.从失败而不是成功中能学习到更多的东西

若隐藏失败,结果必然是反复失败

9.2.观察客户或用A/B Test验证

9.3.QA的作用以较低成本发现问题

  • 提升工程速度和增加缺陷检出率
  • QA不提升质量
    代码评审和测试驱动开发(TDD,提前编写测试代码)可以提升质量

9.4.代码支持回滚能力

大部分回滚问题出现在数据库

  • 数据库结构的变更仅可以增加,而不应该删除列或者表

9.5.测试

  • 单元测试
  • 系统测试
  • 回归测试

最终实现完全自动化


10.故障

10.1.设立故障隔离域建立“泳道”

不允许跨越泳道边界进行同步调用

  • 例如支付网关,每个客户独立网关泳道
    沿物理服务器边界划分泳道

10.2.消除单点故障(SPOF)

10.3.避免系统串联

  • 串联电路和并联电路的优劣势
  • 减少串联组件或增加并联组件降低故障风险

10.4.增加上下线开关


11.监控

11.1.监控目的

1)有问题吗?
2)问题在哪里?
3)有什么问题?

11.2.监控内容

  • 应用监控
    告警无法确定对于客户的实际影响
  • 业务监控
  • 硬件监控

11.3.监控预测问题是否可能发生

  • 控制图的统计工具
  • 神经元网络或贝叶斯网络这样的机器学习算法

11.4.日志

11.4.1.使用自动化的工具监控日志
  • ELK
  • 检索目标行、统计错误
  • 超过预警阈值告警
11.4.2.日志是监控、事件管理、应用调试的重要工具

12.数据中心

12.1.系统部署3个或更多活的数据中心

12.2.使用云平台来解决突发增长

  • 双活迁移三活数据中心,云可做第三数据中心
  • 批量处理、测试环境、或者峰值容量,可以考虑放云环境

12.3.分析

  • 归纳
    是从数据中形成假设的过程
  • 演绎
    是对数据进行假设检验以确定有效性的过程

12.4.数据梯级存储策略

12.4.1.RFM方案
  • Recency数据多久前被访问过
    近因
  • Frequency数据多久被访问一次,即数据访问频率
    频率
  • Monetization特定数据对业务的价值
    货币化分析
12.4.2.存储数据无价值
  • 不被访问的时间越久
  • 访问的频率越低
  • 数据对业务价值越低

13.风险评估模型

13.1.风险=问题发生的概率*发生的影响

13.2.发生的影响

13.2.1.服务不可用时间/数据损失百分比/受影响的响应时间
13.2.2.影响的百分比
  • 影响客户的百分比
  • 受影响功能的百分比

14.浏览器访问

14.1.减少域名解析

  • 浏览器对每个服务器或者网关代理的最大持久并发连接数有限制
    不要把所有对象放在同一个域里

14.2.减少页面元素

  • 浏览器允许每个子域名拥有自己的最大并发连接数
  • 通过添加域名最大化并发连接数量
  • gzip压缩

14.3.重定向

  • 重定向使用服务器配置实现,避免代码的解决方案
  • 重定向不利于搜索引擎收录
  • http状态码301/302

14.4.使用cookie保存会话数据

  • cookie越大,页面加载速度越慢
  • 使用https发送cookie

15.硬件网络

15.1.采购

  • 尽可能采用小型廉价的硬件
    处理器最多最大的设备往往是利润最高

15.2.防火墙

  • 不要用在低价值的静态内容防护上
  • 防火墙失败是仅次于数据库的第二大网站瘫痪黑手

16.异步通信

16.1.非关键请求

  • 请求以非阻塞方式发出,而且调用方不阻止等待响应
    与MQ交互调用注意异步

16.2.使用原则

  • 外部API/第三方调用
  • 长期运行的进程
    进程长时间运行容易缓慢
  • 经常改变且易出错/过于复杂的方法
    避免将关键代码与复杂而且经常改变的代码捆绑在一起
  • 时间约束
    两个进程之间不存在时间约束,列如注册成功和发送邮件,不能耽误注册页面结果反馈给用户

16.3.同步调用方式必须设置超时


PS:欢迎加个人微信交流 @jinleivinus ,也可以扫描以下二维码,转载请注明出处。


《架构真经》笔记_第2张图片
WechatIMG227

你可能感兴趣的:(《架构真经》笔记)