提高并发量常用的方法

增加页面缓存

页面静态化方案

squid

  • 概念

    • Squid是一个高性能的代理缓存服务器
  • 原理

    • 用户请求一个web页面,Squid随之连接到远程服务器(比如:http://squid.nlanr.net/)并向这个页面发出请求。然后,Squid显式地聚集数据到客户端机器,而且同时复制一份。当下一次有人需要同一页面时,Squid可以简单地从磁盘中读到它,那样数据迅即就会传输到客户机上(实际上和页面静态化方案很像)
  • CentOS 6.4下Squid代理服务器的安装与配置链接

    http://www.cnblogs.com/mchina/p/3812190.html

增加页面片段缓存

  • Http对同一域名的请求有连接的限制(所以一个页面中使用大量的ajax请求可能存在局限性)

OSCache

  • 概念

    • OSCache是一个使用较多的高性能J2EE缓存框架,适用于任何Java应用程序的普通缓存解决方案。可以不受限制的缓存部分jsp页面或http请求;支持永久缓存,将缓存内存随意写入硬盘;支持集群-集群缓存数据,而不需要修改代码;控制缓存对象过期时间,可插入式刷新策略;
  • 使用

    • 主要是使用cache标签

    • 常用属性说明

      • key
        1. 标识缓存内容的关键词
        2. 在指定的作用范围内必须是唯一的
        3. 默认的key是被访问页面的URI和后面的请求字符串

ESI(Edge Side Include)

  • 概念

    • ESI是一种数据缓冲服务器,它提供将Web网页的部分(这里指页面的片段)进行缓冲/缓存的技术及服务
    • 页面缓存会将整个页面都缓存起来
  • 使用

    • 页面片段缓存时使用esi提供的标签
  • 注意点

    • squid中就有esi的模块,但是由于squid想做的事情太多,使得整体显得很臃肿,因此esi通常和varnish配合使用

数据缓存

  • 概念

    • 缓存本质上是一个内存hash表,以key-value的方式存储在内存hash表中
  • 缓存的形式

    1. 所用框架本身的实现机制
      • 如hibernate和mybatis中的一二级缓存
    2. 第三方缓存数据库
      • redis
      • memcached
      • mongodb

增加服务器(搭建集群)

  • 负载均衡问题

    1. 硬件负载均衡

      • 指的是服务器硬件层面的负载均衡(如F5)
    2. 软件负载均衡

      • 指在一台或多台服务器相应的操作系统上安装一个或多个附加软件来实现负载均衡

      • 实现方式

        1. LVS(Linux Virtual Server)Linux虚拟服务器

          • LVS是工作在网络层。相对于其它负载均衡的解决办法,它的效率是非常高的
          1. 三种工作模式
            • NAT

            • TUN

            • DR

        2. Nginx

        3. HAProxy

      • 负载均衡算法

        1. 轮询算法(循环队列)

        2. 最小连接数算法(即给每个服务器设置一个计数器,每次都会连接连接数最小的服务器)

        3. 快速响应算法(根据服务器当前的cpu和内存等使用情况)

  • 状态信息同步问题

    1. cookie技术

    2. UDP技术

    3. 状态信息广播

  • 共享文件技术

    1. NFS

分库

  • 分片式数据库

    • 分片式数据库的水很深,一般需要认真的评判是否真的需要分片式数据库(海量数据)

分表、DAL和分布式缓存

  • 分表

    • 分库分表规则的封装
  • DAL

    • 数据库连接的管理(超时、异常)

    • 数据库操作的控制(超时、异常)

  • 分布式缓存

    • redis集群是分片式缓存(插槽)

    • 搭建redis集群时会自动分配插槽,而缓存数据的存储是根据CRC算法算出来的,所以只要插槽还在,数据就不会丢失,再加上主从复制,就是实现redis的高可用性

搭建硬件负载均衡

  • 随着服务器数量的增加,这时软件负载均衡可能很难承担巨大的web访问量,这时资金条件允许的情况下可以考虑硬件负载均衡

数据读写分离

  • 主从复制

    • 原理

      1. 主库对数据库的所有操作都写在二进制日志中
      2. 从库把主库的二进制日志拷贝到自己的中继日志
      3. 从库根据二进制日志做数据重演从而达到数据同步。
  • 读写分离

    • 原理

      • 配置多个读库,从而提高对数据库读的能力,因为对数据库的操作,80%都是读,所以读写分离可以提高数据库的并发量

分布式

  • 分布式应用和服务
- 将一个系统划分为不同的子系统进行分布式部署,将访问压力分散到各个服务器
  • 分布式静态资源

    • 静态资源独立部署,并采用独立的域名,就是人们常说的动静分离
  • 分布式数据和存储

    • 分布式计算
  • 分布式架构需要高性能、稳定的通信服务框架

    1. 通信

      • HttpClient

        • httpclient是一个可以发送和接收http请求的工具包

        • 它不是一个浏览器,只是模拟发送和接收http请求(默认是没有带cookie信息的)

    2. 服务调用

      • Dubbo

        • Dubbo是阿里巴巴的分布式服务框架,采用生产和消费者模型
    3. 消息机制

      • RabbitMQ

      • ActiveMQ

总结

  • 不要为了技术而技术,技术的更新迭代应该基于业务的发展,即业务成就技术

  • 要提高并发量的关键在于明晰系统的瓶颈,不同的网站、系统有不同的架构,存在的瓶颈点也是不一样的

  • (PS)文章中涉及到技术点没有在本文中详细介绍,后面会陆续对本文涉及的技术点做详细介绍

你可能感兴趣的:(提高并发量常用的方法)