大型电商网站架构演进之路(一)

      现在电商网站越来越多,除了阿里、京东、唯品会、聚美优品这种耳熟能详的巨头还有很多垂直领域的,比如找钢网、酒仙网、本来生活、Roseonly等,这些网站的主流功能基本类似,无非是完成整个交易流程,但是由于面向的用户量级不一样,所处的发展阶段不一样,背后的实现方式也是有很大的差别,下面来给大家聊聊大型电商的架构演变之路。

大型电商网站,已经不只是WEB

     早些年提起电商网站,人们会说不就是一个web网站吗,跟BBS基本类似,网上还有很多开源的版本,最出名的应该就是EShop和Shopex了,十几兆的源码拿过来,分分钟就自己可以搭建一个电商网站。但是我想说现在的大型电商网站已经不止是 HTML、Apache、IIS、Lighttpd、JAVA、C/C++、PHP、MySQL、Mssql、Oracle。。。还有跨进程通信、数据缓存、磁盘IO优化、大容量存储、分布式计算、负载均衡、网络安排、IDC建设。。。

架构演变之一:物理分离webserver与数据库

     上文提到最简单的电商网站一台机器就可以搞定,类似ecshop,webserver与数据库放在一台机器上一样可以搭起个电商网站,从外观看还是挺像模像样的,笔者曾用ecshop给朋友搭建过电商网站,效果如下从外观看绝对想不到这是一台机器搭建起来的.

大型电商网站架构演进之路(一)_第1张图片
大型电商网站架构演进之路(一)_第2张图片

    上面的这个网站尽管样式很漂亮、该有的功能也都有了,但是实践中你会发现,自己玩玩还行,真的投入生产恐怕噩梦就来了,随便搞个活动,当同时有几十人或者上百人来下单的时候,你就会发现有人开始抱怨网站打开不,或者响应很慢了。这个时候你能做的就是重启机器,然后起来后没几分钟网站再挂掉,然后你再重启机器。。。

    因为一台机器的CPU、内存、硬盘IO读取都是有上限的,而且很容易就达到这种上限,当CPU或者内存或者硬盘任何一个达到上限的时候就是用户崩溃你要重启机器的时候了,那面对这种情况应该如何优化呢?下面来介绍演变的第一步,webserver与数据库分离,既然一台机器有瓶颈那我们就想办法部署在多台机器上,最常用的方法就是把webserver与数据库进行分离,分别部署在不同的机器上,进行物理的分离。通常将webserver部署在一台机器,数据库部署在另外一台机器上,这种演进方式比最初的单台机器扩展性稍微好些,性能至少可以翻一倍。

架构演变之二:增加页面缓存

    按照上面的方法将webserver与数据库分离后,你的网站性能会提升些,但还不足以让你高枕无忧,用户稍微再多一点,估计PV在万级的时候,你将面临的挑战是数据库压力大,连接数多,响应比较慢。这个时候可以优化的方案是增加页面缓存,因为电商上有些页面相对比较静态,例如一些活动页,这些页面如果也请求到webserver,再到底层数据库就是比较浪费资源了,这种页面是可以进行缓存起来的,不需要耗费后面网站的资源,前端页面缓存的方式有很多,比较常用的是squid反向代理。

大型电商网站架构演进之路(一)_第3张图片

    squid反向代理的好处是可以降低web服务器的负载,加速客户端浏览。代理可以缓存一些web的页面,降低web服务器的访问量,所以可以降低web服务器的负载, web服务器同时处理的请求数少了,响应时间自然就快了;同时代理也缓存了一些页面,可以直接返给客户端。

架构演变之三:页面片段缓存,小数据量异步请求

    有了squid的反向代理,性能可以有一定幅度的提升,但是电商的纯静态页面还是比较少的,单纯通过squid缓存技术并不能解决问题,电商中请求量最大的是活动页和商详,这两个地方都不是纯静态页面,商品的价格、促销、库存都要实时或者准实时展示,如果整个页面缓存下来会存在用户看到的价格跟实际的价格不一致,针对这种情况,我们需要把一个页面再分解下,例如商详,主图、文描这种都是基本固定的,价格、促销、库存是实时在变化的,所有比较好的方案是将主图、文描这种基本不变化的缓存下来,价格、促销、库存通过ajax异步读取。

架构演变之四:数据缓存

    页面缓存,异步读取后,网站下一步遇到的瓶颈会是在哪里呢?DB、DB还是DB,每一次的异步请求,基本都要把请求打到DB这一层,商品的最新价格要从DB读取,商品的最新库存数量要从DB读取,这时候DB的读取速度就是整个网站的瓶颈所在,那么如何解决这个问题呢? 缓存、缓存、还是缓存。将不是经常变动的数据进行缓存,常用的缓存方式redis或者memcache都可以,如何使用缓存,看似简单其实有很多学问在里面,这里只提几个关键的点,大家可以自己思考下,使用缓存的时候需要考虑的因素有:什么样的数据适合缓存?是不是DB所有的数据都有必要缓存?如何保持缓存与DB的数据一致性?采用本机缓存还是网络缓存?本机缓存又分进程级缓存还是共享内存?如何提高缓存的命中率?缓存需不需要持久化?缓存的淘汰机制怎样选择?关于缓存的使用后面找时间单独开篇介绍下。增加了数据缓存后,这种方式性能可以有比较大的提升,支持个几十万至百万左右的PV应该是不成问题的。目前市面上的中小型的电商网站应该大部分采用这种架构,这种架构基本已经可以支持中小型电商的性能要求。

下一篇将介绍国内中大型电商网站的架构,类似唯品会、聚美优品,京东、淘宝,敬请期待。

你可能感兴趣的:(大型电商网站架构演进之路(一))