架构技术初步学习

文章目录

  • 1、分层
  • 2、冗余
  • 3、分割
  • 4、异步
  • 5、分布式
  • 6、安全
  • 7、自动化
  • 8、集群
  • 9、缓存

每一个模式描述了一个在我们周围不断重复发生的问题及该问题解决方案的核心。这样,你就能一次又一次地使用该方案而不必做重复工作。 所谓网站架构模式即为了解决大型网站面临的高并发访问、海量数据、高可靠运行灯一系列问题与挑战。为此,在实践中提出了许多解决方案,以实现网站高性能、高可靠性、易伸缩、可扩展、安全等各种技术架构目标。
学习文章来源:https://www.toutiao.com/i6491047042792555021/


1、分层

分层是企业应用系统中最常见的一种架构模式,将系统在横向维度上切分成几个部分,每个部分负责一部分相对简单并比较单一的职责,然后通过上层对下层的依赖和调度组成一个完整的系统。

在网站架构中,常见的三层架构即MVC模式(MVC全名是Model View Controller,是模型(Model)-视图(View)-控制器(Controller)的缩写),其中:

  • 模型层(Model)主要负责封装各种对数据的操作,包括数据库操作、缓存、文件等;
  • 视图层(View)主要负责页面显示,现阶段大部分网站架构,视图层基本指的都是HTML/HTML5+JavaScript(或JQuery,Vue.js等视图层框架)+CSS制作的网页;
  • 而控制器层(Controller),则主要从Model获取数据显示到视图中,Model更新数据后通知View更新视图。MVC三层也普遍被称为应用层、服务层和数据层。

架构技术初步学习_第1张图片

分层架构是逻辑上的,在物理部署上,三层架构可以部署在同一个物理机器上,但是随着网站业务的发展,必然需要对已经分层的模块分离部署,即三层结构分别部署在不同的服务器上,使网站拥有更多的计算资源以应对越来越多的用户访问

这一点,也符合轻耦合的原则,特别现阶段,许多网站的开发还会发展出App、小程序、PC、微信Web等不同端,所有视图层通过接口访问的形式去调用数据做展示,能有效减少工作量,提高工作效率和用户体验,与此同时,在代码逻辑处理上,也会更加清晰和简单,各司其职。
架构技术初步学习_第2张图片


2、冗余

网站需要7×24小时连续运行,那么就得有相应的冗余机制,以防某台机器宕掉时无法访问,而冗余则可以通过部署至少两台服务器构成一个集群实现服务高可用。数据库除了定期备份还需要实现冷热备份。甚至可以在全球范围内部署灾备数据中心。

刚开始看到这个标题,有点无法理解,对于代码编程角度来说,冗余代码是非常不好的存在,但其实,这里指的冗余,是指服务器以及数据库方面的冗余,例如多服务器集群的负载均衡,多数据库的主从库、读写分离等一系列冗余手段,从而应对突发状况。


3、分割

如果说分层是将软件在横向方面进行切分,那么分隔就是在纵向方面对软件进行切分。

简单来说,就是将网站划分成高内聚低耦合的功能模块,不同的团队,可以处理不同的应用场景以及功能逻辑。比如在应用层,将不同业务进行分割,例如将购物、论坛、搜索、广告分割成不同的应用,由独立的团队负责,部署在不同的服务器上;在同一个应用内部,如果规模庞大业务复杂,会继续进行分割,比如购物业务,可以进一步分割成机票酒店业务、3C业务,小商品业务等更细小的粒度。而即使在这个粒度上,还是可以继续分割成首页、搜索列表、商品详情等模块,这些模块不管在逻辑上还是物理部署上,都可以是独立的。同样在服务层也可以根据需要将服务分割成合适的模块。从代码角度来说,就是建立不同的Controller。


4、异步

使用异步,业务之间的消息传递不是同步调用,而是将一个业务操作分成多个阶段,每个阶段之间通过共享数据的方法异步执行进行协作。

大型网站架构中,系统解耦合的手段除了前面提到的分层、分割、分布等,还有一个重要手段是异步,业务之间的消息传递不是同步调用,而是将一个业务操作分成多个阶段,每个阶段之间通过共享数据的方式异步执行进行协作。例如:服务端使用的分布式消息队列来处理业务逻辑,视图层使用Ajax异步加载数据以减少用户等待时间等。此操作可以提高系统可用性,加快网站响应速度,消除并发访问高峰。
但需要注意的是,异步处理需要严格的产品设计支持,不是所有场景都适用,否则有可能适得其反(例如:异步加载数据过程中,由于网络状况不佳导致的页面空白、图片挂掉等情况)。


5、分布式

对于大型网站,分层和分隔的一个主要目的是为了切分后的模块便于分布式部署,即将不同模块部署在不同的服务器上,通过远程调用协同工作。分布式意味着可以使用更多的计算机完同样的工作,计算机越多,CPU、内存、存储资源就越多,能过处理的并发访问和数据量就越大,进而能够为更多的用户提供服务。

分布式有些类似上述的分层和分割,只是分布式是更加细致的处理方式,原理简单来说如下图:

架构技术初步学习_第3张图片

分布式主要用于解决高性能、高并发的场景,在网站应用中,常用的分布式方案有一下几种:

  • 分布式应用和服务:将分层和分隔后的应用和服务模块分布式部署,可以改善网站性能和并发性、加快开发和发布速度、减少数据库连接资源消耗。
  • 分布式静态资源:网站的静态资源如JS、CSS、Logo图片等资源对立分布式部署,并采用独立的域名,即人们常说的动静分离。静态资源分布式部署可以减轻应用服务器的负载压力;通过使用独立域名加快浏览器并发加载的速度。
  • 分布式数据和存储:大型网站需要处理以P为单位的海量数据,单台计算机无法提供如此大的存储空间,这些数据库需要分布式存储。
  • 分布式计算:目前网站普遍使用Hadoop和MapReduce分布式计算框架进行此类批处理计算,其特点是移动计算而不是移动数据,将计算程序分发到数据所在的位置以加速计算和分布式计算。

架构技术初步学习_第4张图片


6、安全

网站在安全架构方面有许多模式:通过密码和手机校验码进行身份认证;登录、交易需要对网络通信进行加密;为了防止机器人程序滥用资源,需要使用验证码进行识别;对常见的XSS攻击、SQL注入需要编码转换;垃圾信息需要过滤等。

这一点,网站重中之重,一般来说,接口调用的加密、用户私密信息的加密、交易方面的数据加密是最基础的安全处理方式,其次是针对服务器漏洞、SQL注入等一系列的安全措施尤为重要,更加高深的甚至涉及到各个网络层的安全问题,服务器底层安全问题,服务器权限问题等等。


7、自动化

具体有自动化发布过程,自动化代码管理、自动化测试、自动化安全检测、自动化部署、自动化监控、自动化报警、自动化失效转移、自动化失效恢复等。

无论是项目开发期间,亦或是项目发布期间,自动化尤为重要,Git的代码管理、Docker的自动化容器、PHPUnit自动化单元测试、ELK(Elasticsearch+Logstash+Kibana )日志收集等等。


8、集群

对于用户访问集中的模块需要将独立部署的服务器集群化,即多台服务器部署相同的应用构成一个集群,通过负载均衡设备共同对外提供服务。
服务器集群能够为相同的服务提供更多的并发支持,因此当有更多的用户访问时,只需要向集群中加入新的机器即可;另外可以实现当其中的某台服务器发生故障时,可以通过负载均衡的失效转移机制将请求转移至集群中其他的服务器上,因此可以提高系统的可用性。


9、缓存

缓存目的就是减轻服务器的计算,使数据直接返回给用户。在现在的软件设计中,缓存已经无处不在。具体实现有CDN、反向代理、本地缓存、分布式缓存等。
使用缓存有两个条件:访问数据热点不均衡,即某些频繁访问的数据需要放在缓存中;数据在某个时间段内有效,不过很快过期,否在会因为数据过期而脏读,影响数据的正确性。

需要注意,缓存后数据的实时性,以免出现数据更新延迟导致的逻辑错误问题。

你可能感兴趣的:(架构师)