Oracle健康检查巡检指南
检查范围:
1.主机配置
2.内存参数
3.系统配置
4.硬盘利用率和可用空间
5.CPU利用率
6.当前操作系统补丁情况
7.Oracle配置
8.配置文件的内容和位置
9.目录结构
10.数据文件和位置
11.表空间
12.Invalid数据库对象
13.数据库运行日志文件alert.log
14.网络信息和NET 8
15.TCP/IP配置
16.Network吞吐量
17.NET8信息
18.数据库备份和恢复概况
19.备份策略
20.恢复策略
健康检查基本工具
ORACLE工具RDA(REMOTE DIAGNOSTIC AGENT)进行系统信息收集。
操作系统工具和命令检查操作系统
SQL命令检查数据库配置,SQL命令在ORACLE工具SQL*PLUS中运行。
ORACLE工具STATSPACK进行数据库性能资料的收集
系统参数检查
检查项查看命令参数数值
Server
hostname
name
OS Version lsb_release -a
cpu More /proc/cpuinfo 查看
sql数据库迁移另一个硬盘
physical id
Memory top
主机型号Dmidecode |grep Product
内存参数
命令需要查询的参数参数值
more
/f max shared memory segment size (SHMMAX) shared memory identifiers (SHMMNI)
max attached shm segment per process (SHMSEG)
Oracle用户限制:
命令:ulimit -a
time(seconds)      unlimited
file(blocks)        unlimited
data(kbytes)      1048576
stack(kbytes)      131072
memory(kbytes)    unlimited
coredump(blocks)  4194303
nofiles(descriptors)  2048
硬盘可用空间
命令:df
Filesystem kbytes used avail%used Mounted
on
/
dev/vg00/lvol32097152399680168425619%/
/dev/vg00/lvol12097152203992187847210%/stand
数据库配置检查
--了解数据库的当前版本
[root@ora9i ~]# su - oracle
[oracle@ora9i ~]$ sqlplus '/as sysdba'
SQL*Plus: Release 9.2.0.4.0 - Production on Thu Apr 23 23:42:50 2009
Copyright (c) 1982, 2002, Oracle Corporation.  All rights reserved.
Connected to:
Oracle9i Enterprise Edition Release 9.2.0.4.0 - Production
With the Partitioning, OLAP and Oracle Data Mining options
JServer Release 9.2.0.4.0 - Production
--安装的产品选项
SQL> set linesize 1000
SQL> set pagesize 1000
SQL> select * from v$option;
--被使用的产品选项
SQL> set linesize 1000
SQL> set pagesize 1000
SQL> col COMP_NAME for a40
SQL> select COMP_ID, COMP_NAME, VERSION,STATUS from
dba_registry;
-
-数据库参数
查看数据库启动时使用到的参数文件
查看数据库的非默认参数
关注各个参数
SQL> show parameter spfile
select name,value from v$parameter where isdefault='FALSE'
--运行日志和跟踪文件
Oracle 数据库进程生成跟踪文件来记录错误或冲突,这些跟踪文件可以用来进一步分析问题。
定期检查alert.log文件,以便及早发现问题.
控制文件
每个数据库至少有一个控制文件。控制文件记录了数据库的物理结构及同步信息。
建议:控制文件位于不同的磁盘上。
控制文件是Oracle数据库最重要的物理文件,它以二进制文件的形式在。不仅记载了数据库的特理结构信息(即构成数据库的数据文件和日志文件),在装载和打开数据时也需要这些文件,而且它们还记载了日志序列号、检查点和日志历史信息,同步和恢复数据库时需要这些信息。在创建数据库时会创建控制文件,如果数据库发生改变,则系统会自动修改控制文件,以记录当前数据库的状态。一旦控制文件损坏,数据库将会宕机。如果没有数据库的备份和归档日志文件,数据库将无法恢复。
名称状态
/dev/vg02/rcntl1
/dev/vg02/rcntl2
/dev/vg02/rcntl3
在控制文件中到参数:
这些是控制文件中的参数。如果需要修改,可以通过重建控制文件来实现。
参数数值
MAXLOGFILES16
MAXLOGMEMBERS3
MAXDATAFILES100
MAXINSTANCES8
MAXLOGHISTORY23360
Redo log文件
对于恢复操作,最为关键的结构是在线Redo Log。在线Redo Log一般由两个或两个以上预先分配的存储数据库变化的文件组成。为了防止例程故障,每个数据库的例程都有相关的在线Redo Log。
每个数据库至少有两个Redo Log组,每组至少有一个日志文件。Oracle的多重在线Redo Log文件可以确保在线日志文件的安全。对于多重在线Redo Log文件,LGWR同时将相同的Redo Log信息写入不同的Redo Log文件中,从而减少单个文件丢失的损失。
当Oracle无法访问一个Redo Log文件时,这个文件状态变为
GROUP#STATUS TYPE MEMBER
1 ONLINE /dev/vg01/rlv_undolog01
1 ONLINE /dev/vg01/rlv_undolog01_1
2 ONLINE /dev/vg01/rlv_undolog02
2 ONLINE /dev/vg01/rlv_undolog02_1
3 ONLINE /dev/vg01/rlv_undolog033 ONLINE /dev/vg01/rlv_undolog03_14 ONLINE /dev/vg01/rlv_undolog04_14 ONLINE /dev/vg01/rlv_undolog045 ONLINE /dev/vg01/rlv_undolog05_15 ONLINE /dev/vg01/rlv_undolog05INVALID 。当Oracle 推测一个Redo Log 文件不完整或者不正确时,它的状态变为STALE 。当一个STALE 的文件被重用时,即其所在日志文件组活动时,此文件也能够使用。
在线Redo Log 文件减少了数据库数据丢失的损失,比如当发生例程故障时,没有被写入数据文件的数据可以从在线Redo Log 文件中恢复。
查看logfile
SQL> set linesize 1000SQL> set pagesize 1000
SQL> select group#,thread#,bytes/1024/1024 size_MB , members,archived,status from v$Log;
GROUP#THREAD#SIZE_MB MEMBERS ARC STATUS 113602YES ACTIVE 213602NO
CURRENT 513602YES INACTIVE 4
1
360
2
YES INACTIVE
513602YES INACTIVE
SQL>set linesize 1000SQL>set
pagesize 1000
SQL> select * From v$logfile order by 1;
归档Redo log 文件
Oracle 允许将写满的在线Redo Log 文件存放在一个或多个脱机位置,即归档Redo Log 。在线日志文件通过归档写入归档日志文件。后台进程

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。