负载均衡(LB)具体解释

二、LB

LoadBalance就是把负载均衡分配到集群的各个节点,从而提高总体的吞吐能力。Oracle 10g RAC提供了两种手段来实现负载,其一是通过Connection Balancing。依照某种算法把用户分配到不同的节点。其二是通过service。在应用层面上进行分散。

 

Connection Balancing

Connection Balancing这样的负载均衡是在用户连接这个层次上进行的。也就是在用户请求建立连接时。依据每一个的负载决定把连接分配到哪个实例上。而一旦建立连接之后,会话的全部操作就都在这个实力上完毕,而不会再分配给其它实例。

 

client均衡(Client-Side LB)

client均衡(Client-Side LB)是oracle 8i使用的方法。配置方法是在client的tnsnames.ora文件里增加LOAD_BALANCE=YES条目。当client发起连接时,会从地址列表中随机选取一个,再使用随机算法吧连接请求分散到各个实例。

 

一个Client-Side LB的TNS配置实比例如以下:

TAF_SERVER =

 (DESCRIPTION =

    (ADDRESS= (PROTOCOL = TCP)(HOST = felix1-vip)(PORT = 1521))

    (ADDRESS= (PROTOCOL = TCP)(HOST = felix2-vip)(PORT = 1521))

    (LOAD_BALANCE= yes)

   (CONNECT_DATA =

     (SERVER = DEDICATED)

     (SERVICE_NAME = taf_server)

     (FAILOVER_MODE =

       (TYPE = SELECT)

       (METHOD = BASIC)

       (RETRIES = 180)

       (DELAY = 5)

      )

    )

  )

 

这样的方法的缺点非常明显。由于在分配连接时没有考虑每一个节点的真是负载,最后分配结果不一定是平衡的。而且随机算法须要长时间片。假设在短时间内同一时候发起多个连接,这些连接有可能都被分配到一个节点上;甚至更坏的情况下,连接可能会被分配到故障节点上。因此Oracle又引入了server端(Server-Side LB)方式。

 

总结:client均衡的最大缺点就是不能依据各个实例的真实负载来分散用户连接

 

server端均衡(Server-Side)

server端负载均衡的实现依赖于listener(监听)手机的负载信息。在数据库执行过程中,PMON后台进程会手机系统的负载信息,然后登记到Listener中。最少一分钟,最多十分钟PMON就要做一次信息更新。而且假设节点的负载越高,更新频率就越高,以保证Listener可以掌握每一个节点准确的负载情况。假设Listener关闭,PMON进程会每隔1妙检查Listener是否重新启动,除了这个自己主动的、定时的更新任务外,用户也可以有用altersystem register命令来手工进行这个过程。

这个自己主动更新动作能够从listener的日志中看到。

注意:实例启动时PMON进程进行的第一次登记过程叫做Server-Rgister,而后的更新过程叫做service-update;

 

TNSLSNR for Linux: Version 10.2.0.5.0 - Productionon 03-JUN-2014 11:51:54

 

Copyright (c) 1991, 2010, Oracle.  All rights reserved.

 

System parameter file is/u01/oracle/10.2.0/db_1/network/admin/listener.ora

Log messages written to/u01/oracle/10.2.0/db_1/network/log/listener.log

Trace information written to/u01/oracle/10.2.0/db_1/network/trace/listener.trc

Trace level is currently 0

 

Started with pid=25371

Listening on: (DESCRIPTION=(ADDRESS=(PROTOCOL=tcp)(HOST=felix1)(PORT=1521)))

Listener completed notification to CRS on start

 

TIMESTAMP * CONNECT DATA [* PROTOCOL INFO] * EVENT[* SID] * RETURN CODE

03-JUN-2014 11:51:54 *(CONNECT_DATA=(CID=(PROGRAM=)(HOST=felix1)(USER=oracle))(COMMAND=status)(ARGUMENTS=64)(SERVICE=LISTENER)(VERSION=169870592))* status * 0

03-JUN-2014 11:52:15 * service_register * felix2 *0

03-JUN-2014 11:52:15 * service_register * felix1 *0

03-JUN-2014 11:52:15 * service_update * felix1 * 0

03-JUN-2014 11:52:15 * service_register * +ASM1 *0

 

 

Listener日志尽管记录了PMON进程的注冊和更新动作。可是注冊的内容却没有体现,要想获得这些内容,能够通过各种1025事件来获得,这个时间是跟中PMON活动的。

 

SQL> alter session set events '10257 trace namecontext forever,level 16';

 

Session altered.

 

SQL>

 

获取跟踪文件:

CREATE OR REPLACE FUNCTION get_trace  return varchar is

  Resultvarchar2(4000);

begin

 dbms_output.enable(1000000);

  begin

    for x in(SELECT      d.VALUE

         ||'/'

         ||LOWER (RTRIM (i.INSTANCE, CHR (0)))

         ||'_ora_'

         ||p.spid

         ||'.trc'

           trace_file_name

  FROM   (SELECT  p.spid

           FROM   v$mystat m, v$session s,v$process p

          WHERE   m.statistic# = 1 AND s.SID= m.SID AND p.addr = s.paddr) p,

        (SELECT   t.INSTANCE

           FROM   v$thread t, v$parameter v

          WHERE   v.NAME = 'thread'

                  AND (v.VALUE = 0 OR t.thread# = TO_NUMBER (v.VALUE))) i,

        (SELECT   VALUE

           FROM   v$parameter

          WHERE   NAME = 'user_dump_dest')d) loop

      Result:= Result || x.trace_file_name;

    End loop;

  End;

 return(substr(Result, 1, 4000));

end get_trace;

 

 

 

 

 

select get_trace from dual;

 

GET_TRACE

--------------------------------------------------------------------------------

/u01/oracle/admin/felix/udump/felix1_ora_27465.trc

 

 

PMON进程不仅回忆本地的Listener注冊。还能够向其它节点的listener注冊。但究竟要向何处注冊,是由remote_listener和local_listener这两个參数决定。Local_Listener不用设置,而remote须要设置。參数值是一个tnsnames项。

 

SQL> show parameter listener

 

NAME                                 TYPE        VALUE

------------------------------------ -----------------------------------------

local_listener                       string      LISTENER_FELIX1

remote_listener                      string      LISTENERS_FELIX

SQL>

 

Tnsnames.ora中相应的LISTENERS_FELIX的内容例如以下:

 

LISTENERS_FELIX =

  (ADDRESS_LIST=

    (ADDRESS= (PROTOCOL = TCP)(HOST = felix1-vip)(PORT = 1521))

    (ADDRESS= (PROTOCOL = TCP)(HOST = felix2-vip)(PORT = 1521))

  )

 

有了PMON的自己主动注冊机制后。集群的每一个节点的Listener都掌握全部节点的负载状态,当收到client的连接请求时,就会把连接转给负载最小的节点,这个节点有可能是自己也可能是其它节点,也就是Listener会转发用户连接的请求listener的节点选择方法依据用户所请求的连接方式会有所不同:

a.       假设用户请求的是Dedicate专有连接,Listener首先选择负载最小的节点,假设多个节点负载同样。则从中选择负载最小的实例;

b.       假设用户请求的是shared server共享连接,除了做节点负载比較和实例负载比較之外,还要在所选实例上,选择最小的Dispatcher进行转发。

 

两种LB的配置方法:

对于client-Side LB。须要在客户的tnsnames条目中增加LOAD_BALANCE=YES。对于Server-Side LB,须要配置REMOTE_LISTENER这个參数。

在配置LB时有一点须要注意:须要从各个实例的listener文件里却掉缺省的SID_LIST_LISTENER_NAME条目,这样才干保证Listener获得的信息都是动态注冊的。而不是从文件里读出的静态信息。

 

改动前:

[oracle@felix2 admin]$ cat listener.ora

# listener.ora.felix2 Network Configuration File:/u01/oracle/10.2.0/db_1/network/admin/listener.ora.felix2

# Generated by Oracle configuration tools.

 

LISTENER_FELIX2 =

 (DESCRIPTION_LIST =

   (DESCRIPTION =

     (ADDRESS = (PROTOCOL = TCP)(HOST = felix2-vip)(PORT = 1521)(IP = FIRST))

     (ADDRESS = (PROTOCOL = TCP)(HOST = 192.168.10.102)(PORT = 1521)(IP =FIRST))

    )

  )

 

----------------------------------------

SID_LIST_LISTENER_FELIX2 =

  (SID_LIST=

   (SID_DESC =

     (SID_NAME = PLSExtProc)

     (ORACLE_HOME = /u01/oracle/10.2.0/db_1)

     (PROGRAM = extproc)

    )

  )

 

[oracle@felix2 admin]$

 

 

 

改动后配置例如以下:

[oracle@felix2 admin]$ catlistener.ora

# listener.ora.felix2 Network Configuration File:/u01/oracle/10.2.0/db_1/network/admin/listener.ora.felix2

# Generated by Oracle configuration tools.

 

LISTENER_FELIX2 =

 (DESCRIPTION_LIST =

   (DESCRIPTION =

     (ADDRESS = (PROTOCOL = TCP)(HOST = felix2-vip)(PORT = 1521)(IP = FIRST))

     (ADDRESS = (PROTOCOL = TCP)(HOST = 192.168.10.102)(PORT = 1521)(IP =FIRST))

    )

  )

 

[oracle@felix2 admin]$

 

 

利用service分散负载

Connection Balancing方法的不足之处,Oracle的集群时“共享一切“的架构,全部节点都共享一份磁盘数据。

实例间通过cachefusion机制进行数据同步,所以RAC的性能在非常大程度上受限于cache fusion的性能。因此。要提高RAC的性能能够从双方面入手,一方面提高cache fusion的能力。这能够通过更好的互联设备,比方G级的Private network。或者使用Infiniband等DRA技术;还有一方面,能够尽量降低cache fusion的流量,降低实例间的相互依赖。

而service就是后一种思路基础上发展出来的。

先看一下与service很相似的Partition技术。假设一个表中的数据量巨大。Oralce会建议採用了Partition Table,把数据依照一定的规律分散到多个物理段(Segment)中,这样訪问数据时就限制在某些个局部的Segment上。

把“分散数据“思想机一部提升,在RAC环境中。假设可以把数据依照顾用进行分离。考虑以下这个场景:一个ERP应用包含生产、销售、供应链管理多个模块。

假设这个数据库採用了2节点的RAC在没有进行“数据分散”之前,两个用户都使用销售模块。那么这两个用户就可能被分配到两个节点上,在操作过程中,销售数据就要在cache fusion的作用下。不断在两个节点间传递,假设有来了另外两个生产模块的用户,这两个用户又被分配到两个节点上。在操作的过程中,生产部分的数据又要在Cache fusion的协助下在两个实力之间同步。

可见。假设仅有connectionbalance一种机制。表面上看起来用户是被分配到了不同的实例上,似乎负载被分散了。可是这样的分散是没有结合每一个用户的业务需求进行的。是一种纯技术手段(因此能够把它叫做纯技术手段分散)。

如果换一种解决思想,假如把销售模块的用户都分配到节点1上,生产模块的用户都分配到节点2上,在如果这两个模块之间的数据交叉不多,这是销售模块的数据都集中在节点1上。生产库模块的数据都集中在节点2上,cachefusion的工作量就会急剧降低,这就从根本上攻克了性能的问题。

这个思想是借助于service分散负载的基本思想。

通过把应用依照功能模块进行划分成Service,进而把每一个service固定在某些RAC节点上,从而从根本上提供系统的性能。这样的分散负载的方法不是仅靠DBA进行配置就能完毕的,须要DBA和开发者合作,在了解业务数据特点之后才干看到效果。

在RAC环境下。Service并非必须的,可是假设借助service相应用的划分,相信对整个系统性能的提升是大有裨益的。

使用service还有另外一个优点:能够在数据库内部创建Service的TAF參数,假设在client通过service连接数据库。clienttnsnames.ora中就不再须要FAIL-OVER的很多设置。

假设使用service方法,client配置须要使用service_name条目,比如以下的红字部分:

 

 

TAF_SERVER =

 (DESCRIPTION =

    (ADDRESS= (PROTOCOL = TCP)(HOST = felix1-vip)(PORT = 1521))

    (ADDRESS= (PROTOCOL = TCP)(HOST = felix2-vip)(PORT = 1521))

     (CONNECT_DATA =

     (SERVER = DEDICATED)

      (SERVICE_NAME = taf_server)

    )

  )

 

 

具体探究參考《大话RAC》张晓明  p238~242,讲的特别好!

。!。

你可能感兴趣的:(负载均衡(LB)具体解释)