CDN学习

  1. 前置知识:
    基本概念
    CDN的全称是Content Delivery Network,即内容分发网络。其基本思路是尽可能避开互联网上有可能影响数据传输速度和稳定性的瓶颈和环节,使内容传输的更快、更稳定。通过在网络各处放置节点服务器所构成的在现有的互联网基础之上的一层智能虚拟网络,CDN系统能够实时地根据网络流量和各节点的连接、负载状况以及到用户的距离和响应时间等综合信息将用户的请求重新导向离用户最近的服务节点上。其目的是使用户可就近取得所需内容,解决 Internet网络拥挤的状况,提高用户访问网站的响应速度。
    CDN学习_第1张图片
    主要特点
    1、本地Cache加速 提高了企业站点(尤其含有大量图片和静态页面站点)的访问速度,并大大提高以上性质站点的稳定性
    2、镜像服务 消除了不同运营商之间互联的瓶颈造成的影响,实现了跨运营商的网络加速,保证不同网络中的用户都能得到良好的访问质量。
    3、远程加速 远程访问用户根据DNS负载均衡技术智能自动选择Cache服务器,选择最快的Cache服务器,加快远程访问的速度
    4、带宽优化 自动生成服务器的远程Mirror(镜像)cache服务器,远程用户访问时从cache服务器上读取数据,减少远程访问的带宽、分担网络流量、减轻原站点WEB服务器负载等功能。
    5、集群抗攻击 广泛分布的CDN节点加上节点之间的智能冗余机制,可以有效地预防黑客入侵以及降低各种D.D.o.S攻击对网站的影响,同时保证较好的服务质量 。 (来自百度百科)
    缓存服务器
    缓存指的是将需要频繁访问的网络内容存放在离用户较近、访问速度更快的系统中,以提高内容访问速度的一种技术。缓存服务器就是存放频繁访问内容的服务器。
    缓存提供了比将访问对象放在Internet Web服务器上更好的方法,它将需要频繁访问的Web页面和对象保存在离用户更近的系统中,当再次访问这些对象的时候加快了速度。
    Web缓存服务器的应用模式主要是正向代理和反向代理。正向代理(Proxy)模式是代理网络用户访问internet,客户端将本来要直接发送到internet上源服务器的连接请求发送给代理服务器处理。正向代理的目的是加速用户在使用浏览器访问Internet时的请求响应时间,并提高广域网线路的利用率。正向代理浏览器无需和该站点建立联系,只访问到Web缓存即可。通过正向代理,大大提高了后续用户的访问速度,使他们无需再穿越Internet,只要从本地Web缓存就可以获取所需要的信息,避免了带宽问题,同时可以大量减少重复请求在网络上的传输,从而降低网络流量,节省资费。
    反向代理(Reverse Proxy)模式是针对Web服务器加速功能的,在该模式中,缓存服务器放置在web应用服务器的前面,当用户访问web应用服务器的时候,首先经过缓存服务器,并将用户的请求和应用服务器应答的内容写入缓存服务器中,从而为后续用户的访问提供更快的响应。
    第一公里
    这是指万维网流量向用户传送的第一个出口,是网站服务器接入互联网的链路所能提供的带宽。这个带宽决定了一个网站能为用户提供的访问速度和并发访问量。一个网站,其服务的用户越多,对其出口带宽的要求就越大,当用户请求的数据量超过网站的出口带宽,就会在出口处形成拥塞。越是业务繁忙时,用户的访问数量越多,这个拥塞就越严重,网站会在最需要向用户提供服务时失去用户。
    最后一公里
    这里是指万维网流量向用户传送的最后一段接入链路,即用户接入带宽。用户的平均接入带宽,是影响互联网上层应用发展的决定性因素之一。
    对等互联关口
    “对等互连”是指不同基础运营商之间的互联互通,一般两个运营商之间只有两三个互联互通点,这两三个点上产生了巨大的流量。当某个网站服务器部署在运营商A的IDC机房之中,运营商B的用户要访问该网站,就必须经过A、B之间的互联互通点进行跨网访问。从互联网的架构来看,不同网络之间的互联互通带宽,对任何一个运营商网络的流量来说,占比都比较小,收敛比是非常的高,因此这里通常是互联网传输中的拥堵点。
    长途骨干传输
    长距离传输时延问题,从网站服务器到用户之间要经过网站所在的IDC、骨干网、用户所在的城域网、用户所在接入网等,距离非常遥远。骨干网的拥塞问题,由于互联网上的绝大部分流量都要通过骨干网络进行传输,这就要求骨干网络的承载能力必须与互联网的应用同步发展,但是两者并无法完全同步,当骨干网络的升级和扩容滞后于互联网智商的应用的发展时,就会阶段性地使得大型骨干网的承载能力成为互联网发展的瓶颈。
  2. 传统的访问流程
    CDN学习_第2张图片
    互联网的设计理念是:网络是中立的和无控制的,任何人都没有决定权;网络是应用无关的,他的任务就是如何更好的将数据包进行端到端的传输。
    B/S架构,即Browser-Server(浏览器-服务器)架构,是对传统C/S架构的一种变化或者改进架构。在这种架构下,用户只需使用通用浏览器,主要业务骡子在服务器端实现。B/S架构,主要是利用了不断成熟的WWW浏览器技术,结合浏览器的多种Script语言和ActiveX等技术,在通用浏览器上实现C/S架构霞需要复杂的软件才能实现强大功能。
    CDN学习_第3张图片
    (1)用户在自己的浏览器中输入要访问的网站域名。
    (2)浏览器向本地DNS服务器请求对该域名的解析。
    (3)本地DNS服务器中如果缓存有这个域名的解析结果,则直接相应用户的解析请求。
    (4)本地DNS服务器中如果没有关于这个域名的解析结果的缓存,则以递归方式向整个DNS系统请求解析,获得应答后将结果反馈给浏览器。
    (5)浏览器得到域名解析结果,就是该域名相应的服务设备的IP地址。
    (6)浏览器向服务器请求内容。
    (7)服务器将用户请求内容传送给浏览器
  3. CDN访问流程
    CDN学习_第4张图片
    (1)当用户点击网站页面的内容URL,经过本地DNS系统解析,DNS系统会最终将域名的解析权交给CNAME只想的CDN专用DNS服务器。
    (2)CDN的DNS服务器将CDN的全局负载均衡设备IP地址返回用户。
    (3)用户向CDN的全局负载均衡设备发起内容URL访问请求。
    (4)CDN全局负载均衡设备根据用户IP地址,以及用户请求的内容URL,选择一台用户所属区域负载均衡设备,告诉用户向这台设备发起请求。
    (5)区域负载负载均衡设备会为用户选择一台合适的缓存服务器提供服务,选择的依据包括:根据用户IP地址,判断那一台服务器距离用户最近;根据用户所请求的URL中所携带的内容名称,判断哪一台服务器上有用户所需内容;查询各个服务器当前的负载情况,判断哪一台服务器尚有服务能力。基于以上这些条件的综合分析之后,区域负载均衡设备会向全局负载均衡设备返回一台缓存服务器的IP地址。
    (6)全局负载均衡设备把服务器的IP地址返回给用户。
    (7)用户向缓存服务器发起请求,缓存服务器相应用户请求,将用户所需内容传送到用户终端。如果这台缓存服务器上并没有用户想要的内容,而区域均衡设备依然将它分配给了用户,那么这台服务器就要向它的上一级缓存服务器请求内容,直至追溯到网站的原服务器将内容拉到本地。
    DNS服务器根据用户IP地址,将域名解析成相应节点的缓存服务器IP地址,实现用户就近访问。使用CDN服务的网站,只需将其域名解析权交给CDNde GSLB 设备,将需要分发的内容注入CDN,就可以实现内容加速。
  4. CDN关键技术
    CDN是基于原理:1、选择最有设备为用户提供服务;2、如果某个任农被很多用户所需要,它就被缓存到距离用户最近的节点中。
    典型的CDN系统架构由分发系统、负载均衡系统和运营管理系统三大部分组成:
    CDN学习_第5张图片
    (1)分发服务系统:该系统的主要作用是实现将用户从内容源中心向边缘的推送和存储,承担实际的内容数据流的全网分发工作和面向最终用户的数据请求服务。分发服务系统最基本的工作单元就是许许多多的Cache设备(缓存服务器),Cache负责直接相应最终用户的访问请求,把缓存在本地的内容快速地提供给用户。同时Cache还负责与源站点进行内容同步,把更新的内容以及本地没有的内容从源节点获取并保存在本地。对于分发系统,在承担内容的更新、同步和相应用户需求的同时,还需要向上层的调度控制系统提供每个Cache设备的健康状况信息、响应情况,有时还需要提供内容分布信息,以便调度控制系统根据设定的策略决定由那个Cache来响应用户的请求最优。
    (2)负载均衡系统:这是一个CDN系统的神经中暑,主要功能是负责对所有发起服务请求的用户进行访问调度,确定提供给用户的最终实际访问地址,大多数CDN系统的负载均衡系统是分级实现的,这里以最基本的两级调度体系进行简要说明。一般而言,两级调度体系分为全局负载均衡和本地负载均衡。区中,全局负载均衡主要根据用户仅进行原则,通过对每个服务节点进行“最优”判断,确定向用户提供服务的Cache的物理位置。本地负载均衡主要负责节点内部的设备负载均衡,当用户请求从GSLB调度到SLB时,SLB会根据节点内个Cache设备的实际能力或内容分布等因素对用户进行重定向。
    (3)运营管理系统:与一般的电信运营管理系统类似,分为运营管理和网络管理两个子系统。运营管理子系统是CDN系统的业务管理功能实体,负责处理业务层面的与外界系统交互所必需的的一些收集\整理\交付工作.
    (SLB 实际上承担了NAT(Network Address Translation,网络地址转换功能),向用户屏蔽了Cache设备的IP地址。
    1. CDN的优势
  5. CDN应用场景
  6. 目前学术成果(中文论文)
  7. 目前学术成果(英文论文)
  8. Tips:
    8秒定律
    用户访问一个网站时,如果等待网页打开的时间超过8秒,会有超过30%的用户放弃等待。根据2012年的统计:一个网站10秒后网页打不开,会有40%的用户跳出该页面;大部分手机用户愿意等待的加载时间为

你可能感兴趣的:(CDN学习)