在Blog里零零散散的讲了一些DB 维护的东西,比较杂,也比较散。 这里就Oracle Data Guard 这块做一个小结。 主要是流程上的东西。 做个参考,以后装DG,照这个流程走就ok了。
一. 服务器设置
1.1 硬盘的规划
根据自己的业务量来规划硬盘。 我上周搭建的DG,用了4块SAS 硬盘。 单盘300G,1.5w转/s。 这个IOPS 大概在150M/s。 是个估算值。 做了RAID1.
不同的RAID 对IOPS 是有影响的。
1.2 将硬盘挂载到服务器上
这块参考我的Blog:
Linux 下挂载硬盘的 方法
http://blog.csdn.net/xujinyang/article/details/6925116
二. 安装DB
这部分包括2块,安装DB 软件和升级。 如果是10g的话,可以先将DB升级到10.2.0.5。 升级的原因是为了避免某些bug。
先安装软件,升级,升级完在用DBCA 创建实例。 这样比安装DB 和创建实例之后升级要简单点。
2.1 安装DB 软件
具体步骤参考BLog:
32 位系统,参考: linux平台下oracle数据库安装
http://blog.csdn.net/xujinyang/article/details/6830215
64 位系统参考:64位 linux 平台下Oracle 安装文档
http://blog.csdn.net/xujinyang/article/details/6829320
2.2 升级DB 软件
具体步骤参考Blog:
linux平台下oracle从10.2.0.1升级到10.2.0.4
http://blog.csdn.net/xujinyang/article/details/6830174
其实,升级的步骤,在升级包的readme.html 里有详细的说明,可以照那个步骤来。
2.3 在主库DBCA创建实例
在我的Blog有说明:
如何搭建一个数据库服务器平台
http://blog.csdn.net/xujinyang/article/details/6822424
在这里简单的说一下:
(1)redo 文件默认是50M,改成100M
(2)每个redo group里改成2个 redo logfile。 大小100M
(3)检查一下字符集:ZHS16GBK
(4)设置SGA,PGA 大小。
OLTP 系统一般的规则是:
SGA=内存*80%*80%
PGA=内存*80%*20%
三. 搭建DG 环境
这块内容参考BLog:
Oracle Data Guard 理论知识
http://blog.csdn.net/xujinyang/article/details/6833263
Oracle Data Guard Linux 平台 Physical Standby 搭建实例
http://blog.csdn.net/xujinyang/article/details/6829555
在这里补充一点, 在我装的2套DG上都遇到一个问题。 就是主库的sys 用户密码会改变。 怀疑和安装过程中copy 密码文件的过程有关。因为找不到其他原因了。 所以安装之后,用原来的sys密码连接一下。 如果不能使用,赶紧重新设置一下。然后在copy到备库。 不然在客户端就不能用sys用户登陆了。
如果是现在有DG,不知道sys用户密码。 我在测试环境下测试过,在不停DG的情况下,直接修改sys用户密码,然后copy到备库。这样是可以使用的。 生产库上没有做过。
四. 后续的调整
在这部分,主要是修改一些参数和数据文件的变动。
4.1 修改数据文件
用SQL 命令,或者用Toad 都可以。
(1)将SYSTEM,SYSAUX 这2个系统表空间增加到1G,并设置为自动增长,每次10M
(2)UNDO 表空间,设成32G(4*8G) 或者16G(2*8G)。关闭自动扩展。
(3)TEMP 表空间,设成32G(4*8G) 或者16G(2*8G)。关闭自动扩展。
4.2 参数修改
(1) 修改undo_retention
undo_retention 只是指定undo 数据的过期时间,默认是900s,15分钟。建议改成10800s,即3个小时。
SQL> alter system set undo_retention=10800 scope=both;
系统已更改。
(2)修改sessions 和 processes 参数
SQL> alter system set sessions=2000 scope=spfile;
系统已更改。
SQL> alter system set processes=1000 scope=spfile;
系统已更改。
(3)修改CONTROL_FILE_RECORD_KEEP_TIME 参数
该参数设置控制文件中存储备份记录的时间,在用RMAN的时候会涉及到这个参数。 备份记录包括完全的数据库备份记录,以及指定的数据文件,控制文件,参数文件和归档目录的备份记录。数据库参数CONTROL_FILE_RECORD_KEEP_TIME以天为单位(默认值为7天),因此在默认情况下,Oracle 会将RMAN备份和恢复记录保存7天。 可以将该参数设置为0到365之间的任意值。
SQL> alter system set control_file_record_keep_time=14;
系统已更改。
(4)设置open_links_per_instance 和 open_links 参数
关于这2个参数的说明,参考Blog:
open_links_per_instance 和 open_links 参数说明
http://blog.csdn.net/xujinyang/article/details/6831334
这2个参数修改之后,需要重启才能生效,所以,在安装DB的时候,就把这个参数修改了。 默认值是4,如果用到话就太小了。 所以在安装的时候,就给修改了。 修改建议值:100。
SQL> alter system set open_links=100 scope=spfile;
系统已更改。
五. 部署RMAN 备份
在部署脚本之前,记得修改2个参数:
RMAN> CONFIGURE CONTROLFILE AUTOBACKUP ON;
RMAN> CONFIGURE RETENTION POLICY TO RECOVERY WINDOW OF 7 DAYS;
配置DG主库RMAN 归档文件的删除策略:
RMAN> configure archivelog deletion policy to applied on standby;
参考:
Nocatalog 下的RMAN 增量备份 shell脚本
http://blog.csdn.net/xujinyang/article/details/6830525
Linux 平台下 RMAN 全备 和 增量备份 shell 脚本
http://blog.csdn.net/xujinyang/article/details/6838002
如何 搭建 RMAN 备份平台
http://blog.csdn.net/xujinyang/article/details/6837452
六. 在备库部署删除归档文件脚本
DG 备库的归档文件不能自动删除。 需要使用脚本来删除。
参考:
Oracle Data Guard 备库 归档文件 删除脚本
http://blog.csdn.net/xujinyang/article/details/6833094
七. 部署其他的监控脚本
这部分监控如CPU,磁盘空间,表空间使用率。 alert log 日志等。 以前有个shell 的脚本,可以监控这些。 最近在整理一个Python的监控脚本。
7.1 alert log 按天存放
这样做主要还是方便查看alert log。 参考:
Oracle alert log 按天 存放 脚本
http://blog.csdn.net/xujinyang/article/details/6925178
7.2 以前弄的一个监控DG的批处理脚本
每天早上上班运行下,DG 的情况就能清楚的显示出来了。 省事很多。 后来懒的运行批处理命令,改成每天定时发到邮箱了。
Check.sql
conn sys/PWD@SID as sysdba
host title 数据库日常检查
column dest_name format a30
column destination format a20
column MEMBER format a45
column 归档地 format a20
column TABLESPACE_NAME format a10
column FREE_RATE format a10
host cls
prompt **************************** 实 例 状 态 ************************************;
select instance_name 实例名,version 版本,status 状态,database_status 数据库状态 from v$instance;
prompt **************************** 数据库状态 *************************************;
select name,log_mode 归档模式,open_mode 打开模式 from v$database;
prompt **************************** 控制文件状态 ***********************************;
column name format a40
select status,name from v$controlfile;
prompt **************************** 日志文件状态 ***********************************;
select GROUP#,status,type,member from v$logfile;
prompt***************************** 归档目的地状态 *********************************;
select dest_name ,status 状态,database_mode 数据库模式,destination 归档地 from v$archive_dest_status where dest_id in ('1','2');
set heading off;
select '************数据库已连续运行 '|| round(a.atime-b.startup_time)||' 天 '||'*******************************************' from(select sysdate atime from dual) a,v$instance b;
set heading on;
prompt***************************** 会 话 数 *************************************;
select sessions_current 当前会话数,sessions_highwater 实例最高值 from v$license;
prompt********************** 表空间监控(FREE_RATE小于10%为异常) ********************;
select a.tablespace_name, round(a.total_size) "total_size(MB)",
round(a.total_size)-round(b.free_size,3) "used_size(MB)",
round(b.free_size,3) "free_size(MB)", round(b.free_size/total_size*100,2)||'%' free_rate
from ( select tablespace_name, sum(bytes)/1024/1024 total_size
from dba_data_files
group by tablespace_name ) a,
( select tablespace_name, sum(bytes)/1024/1024 free_size
from dba_free_space
group by tablespace_name ) b
where a.tablespace_name = b.tablespace_name(+);
prompt **************************** 表空间OFFLINE(显示为空正常) ********************;
select tablespace_name 表空间名,status 状态 from dba_tablespaces where status='OFFLINE';
prompt **************************** SEQUENCE同步数 *********************************;
select max(sequence#)from v$log_history;
CONN sys/PWD@SID_ST as sysdba;
prompt **************************** 备库SEQUENCE同步数 *****************************;
select max(sequence#)from v$log_history;
prompt **************************** 备库日志未应用(显示为空正常) *******************;
select sequence#,applied from v$archived_log where applied='NO' and sequence#>2453;
prompt **************************** 备库日志应用(显示最近十个日志) *****************;
select * from(select sequence#,applied from v$archived_log order by sequence# desc) where rownum<=10;
set time on
disconnect
Check.bat
sqlplus /nolog @check.sql
7.3 其他监控脚本
参考:
8个DBA最常用的监控Oracle数据库的常用shell脚本
http://blog.csdn.net/xujinyang/article/details/6830090
八. 导入数据
用逻辑导出导入就可以了。 在导入之前建好表空间,注意:数据和索引分别存放在不同的表空间。 在建用户。最后导入数据。
对于某些系统(如移动的BOSS计费系统),在建sequence的时候,注意下sequence 的cache 大小。默认值是20. 一般是够用的。
Oracle Sequence Cache 参数说明
http://blog.csdn.net/xujinyang/article/details/6831361
导入的过程也会产生归档文件,只需要在主库导入即可。 备库会自动同步。 如果数据量大的话,这个同步过程会比较慢。 因为imp 会产生大量的归档文件。
DG 的东西就这么多了。 最后3句话:
(1)备份重于一切
(2)责任重于一切
(3)DBA要胆大心细,遇事不慌
------------------------------------------------------------------------------