第3章 大型网站核心架构要素

关于什么是架构,一种比较通俗的说法是“最高层次的规划,难以改变的决定”,这协规划和决定奠定了事物未来发展的方向和最终的蓝图。

3.1 性能

性能是网站架构设计的一个重要方面,任何架构软件方案都必须考虑可能会带来的性能问题。优化网站性能的手段也非常多,从用户浏览器到数据库,影响用户请求的所有环节都可以进行性能优化。

浏览器端:可以通过浏览器缓存,使用页面压缩,合理布局页面,减少Cookie传输等手段改善性能;
CDN:将网站静态内容分发至离用户最近的网络服务商机房,使用户通过最短访问路径获取数据;
反向代理服务器:在网站机房部署反向代理服务器,缓存热点文件,加快请求响应速度,减轻应用服务器负载压力;
缓存:在应用服务器端,可以使用本地缓存和分布式缓存,通过缓存在内存中的热点数据处理用户请求,加快请求处理过程,减轻数据库压力;
异步:通过异步操作将用户请求发送至消息队列等待后续任务处理,而当前请求直接返回响应给用户;
集群/分布式:在用户高并发请求的情况下,可以将多台应用服务器组成一个集群共同对外服务,提高整体处理能力,改善性能;
代码优化:在代码层面,也可以通过使用多线程,改善内存管理等手段优化性能;
数据库优化:在数据库服务端,索引,缓存,SQL优化等性能优化手段都已经比较成熟。而方兴未艾的NoSQL数据库通过优化数据模型,存储结构,伸缩特性等手段在性能方面的优势也日趋明显;

衡量网站性能有一系列指标,重要的有响应时间RTTPSQPS系统性能计数器等,必须保证系统在持续运行且访问压力不均匀的情况下保持稳定的性能特性。

3.2 可用性

高可用设计的目标就是当服务器宕机的时候,服务或者应用依然可用。

网站高可用的主要手段是冗余,应用部署在多台服务器上同时提供访问,数据存储在多台服务器上互相备份,任何一台服务器宕机都不会影响应用的整体可用,也不会导致数据丢失。

对于应用服务器而言,多台应用服务器通过负载均衡设备组成一个集群共同对外提供服务,任何一台服务器宕机,只需把请求切换到其他服务器就可实现应用的高可用,但是一个前提条件是应用服务器上不能保存请求的会话信息。否则服务器宕机,会话丢失,即使将用户请求转发到其他服务器上也无法完成业务处理。

对于存储服务器而言,由于其上存储着数据,需要对数据进行实时备份,当服务器宕机时需要将数据访问转移到可用的服务器上,并进行数据恢复以保证继续有服务器宕机的时候数据依然可用。

除了运行环境,网站的高可用还需要软件开发过程的质量保证。通过预发布验证自动化测试自动化发布灰度发布等手段,减少将故障引入到线上环境的可能,避免故障范围扩大。

3.3 伸缩性

所谓伸缩性是指通过不断向集群中加入服务器的手段来缓解不断上升的用户并发访问压力和不断增长的数据存储需求。衡量架构伸缩性的主要标准就是是否可以用多台服务器构建集群,是否容易向集群中添加新的服务器。加入新的服务器后是否可以提供和原来的服务器无差别的服务。集群中可容纳的总的服务器数量是否有限制。

对于应用服务器集群,只要服务器上不保存数据,所有服务器都是对等的,通过使用合适的负载均衡设备就可以向集群中不断加入服务器。

对于缓存服务器集群,加入新的服务器可能会导致缓存路由失效,进而导致集群中大部分缓存数据都无法访问。虽然缓存的数据可以通过数据库重新加载,但是如果应用已经严重依赖缓存,可能会导致整个网站崩溃。需要改进缓存路由算法保证缓存数据的可访问性。

对于关系数据库集群,虽然支持数据复制,主从热备等机制,但是很难做到大规模集群的可伸缩性,因此关系数据库的集群伸缩性方案必须在数据库之外实现,通过路由分区等手段将部署有多个数据库的服务器组成一个集群。

对于NoSQL集群,由于先天就是为海量数据而生,因此其对伸缩性的支持通常都非常好,可以做到在较少运维参与的情况下实现集群规模的线性伸缩。

3.4 扩展性

网站的扩展性架构直接关注网站的功能需求。衡量网站架构扩展性好坏的主要标准就是在网站增加新的业务产品时,是否可以实现对现有产品透明无影响,不需要任何改动或者很少改动既有业务功能就可以上线新产品,不同产品之间是否很少耦合,一个产品改动对其他产品无影响,其他产品和功能不需要受牵连进行改动。

网站可伸缩架构的主要手段是事件驱动架构分布式服务

事件驱动架构:在网站通常利用消息队列实现,将用户请求和其他业务事件构造成消息发布到消息队列,消息的处理者作为消费者从消息队列中获取消息进行处理。

分布式服务:将业务和可复用服务分离开来,通过分布式框架调用。

3.5 安全性

网站的安全架构就是保护网站不受恶意访问和攻击,保护网站的重要数据不被窃取。

衡量网站安全架构的标准就是针对现存和潜在的各种攻击与窃密手段,是否有可靠的应对策略。

你可能感兴趣的:(第3章 大型网站核心架构要素)