HACMP日常系统管理
1:日常日志:
日常日志主要是记录平时事件的启动,从中可以了解HACMP的动作,例如主机standby网卡故障,有fail_standby事件发生,系统管理员可从日志中得知何时出的故障,及有没有解决。
主要日志文件有:
/tmp/hacmp.out:记录HACMP启动或有动作时执行的各事件。此文件一天刷新一次,保留七天,文件保存为/tmp/hacmp.out.1-7
/usr/adm/cluster.log:记录HACMP的错误信息及各事件,另记录事件发生的时间;
/tmp/cm.log:保存HACMPclstrmgr进程产生信息的时间;
/usr/sbin/cluster/ddHACMP的历史记录文件。
2:启动和关闭HACMP
每次机器启动后,由系统管理员手工启动HACMP,机器shutdown前,手工关闭HACMP
启动命令:# smit clstart 选项按缺省,启动顺序为先启主机,待主机的/tmp/hacmp.out文件中node_up_local_complete执行完后,再启动备机的HACMP
关闭命令:# smit clstop  shutdown mode选项要确认为graceful
当出现以下情况时须按指定步骤操作:主、备机在关电后,再次启动时,备机正常,主机不能启动。
指定步骤:在备机上执行 # smit hacmp 选择 cluster configuration进入,选择Cluster Resources进入,选择Chage/show Resources for a Resource Group进入,将Inactive Takeover Activated 改为true执行。退出到命令行,启动HACMP,这时备机接管主机的资源。
3:查看HACMP状态:
HACMP中,它启动一个进程来监控各节点。用 # ps –ef|grep clinfo命令查看clinfo 进程是否启动。若未启动,有两种方法启动此进程:
1) 执行 # /usr/sbin/cluster/clinfo
2) 启动HACMP时,# smit clstart Startup Cluster Information Daemon改为true
用/usr/sbin/cluster/clstat命令查看各节点状态,因现使用的是字符终端,出现的将是字符界面。须注意的是集的substate属性,正常为Stable,不是Stable时,HACMP可能有动作或是不正常。
4:校验HACMP
执行 # /usr/sbin/cluster/diag/clverify,将会出现一个交互式界面,可以检验HACMP软件(bos)和拓扑结构(topology),管理员可按提示操作。
5:在磁盘阵列上添加逻辑卷,扩大卷组:
首先把主、备机的HACMP停下。
在主机上:# varyonvg sharevg
扩大卷组或增加逻辑卷;
# varyoffvg sharevg
在备机上:# exportvg sharevg
# smit importvg sharevg重新import进来;
# grep命令查看进程smit chvg sharevg 在下次启动时不自动激活;
# varyoffvg sharevg
6:增加文件系统、新的卷组,并要接管:
首先把主、备机的HACMP停下。
在主机上:# varyonvg sharevg
增加文件系统、新的卷组;
# varyoffvg sharevg
在备机上:# exportvg sharevg
# smit importvg sharevg重新import进来;
# smit chvg sharevg 在下次启动时不自动激活;
# varyoffvg sharevg
在主机上:# smit hacmp  Cluster Configuration Cluster Resources  Chage/Show Resources for a Resource Group
Filesystems选项中加入新的文件系统,Volume Groups选项中加入新的卷组名;
#smit hacmp  Cluster Configuration Cluster Resources Synchronize Cluster Resources按缺省选项执行。
7HACMP备份:
HACMP允许将集的配置存储在一个文件中,称为snapshot,系统管理员可从此文件中恢复HACMP的配置。
文件缺省存放在/usr/sbin/cluster/snapshots目录下,生成两个文件,后缀名分别为.odm.info,.odm文件存放AIX ODM数据库类的信息,.info为集的信息,可查看。
创建方法:# smit hacmp Cluster Configuration Cluster Snapshots Add a Cluster Snapshot,在Cluster Snapshot Name中填写fibha,在Cluster Snapshot Description中填写fib ha backup,执行。
系统管理员将/usr/sbin/cluster/snapshots下的fibha.odmfibha.info文件备份。
恢复方法:先将备份的fibha.odmfibha.info文件拷入/usr/sbin/cluster/snashots目录下,执行# smit hacmp  Cluster Configuration Cluster Snapshots Apply a Cluster Snapshot选择fibha,执行。
8:错误恢复:
HACMP配置出现问题时,启动不能正常结束,此时/tmp/hacmp.out文件中会出现event errot <event name>,管理员应按以下步骤停止HACMP
# smit hacmpCluster Recovery AidsRecovery from Script Failure选择一块正在工作的网卡,建议用standby网卡,执行。然后再将HACMP关闭。


兴业银行HACMP配置清单
cluster ID:xx      ------------------  xx 为分行代号
cluster name : clusterfib
(例:clusterxx,其中xx代表各分行拼音开头字母)
node name :
主机:fibzj                           (例:xxzj
备机:fibbj                           (例:xxbj
cluster configuration: Cascading  (主从热备模式)
TCP/IP Network Adapter worksheet:
Interface Adapter    Adapter  Adapter      Network  Network
Name      Ip Label    Function  Ip addr      Name      Attribute
zj-en0    fibzj-boot  boot      12.10  fibhanet  public
zj-en0    fibzj-svc  service  12.11  fibhanet  public
zj-en1    fibzj-stb  standby  99.11  fibhanet  public
bj-en0    fibbj-svc  service  12.12  fibhanet  public
bj-en1    fibbj-stb  standby  99.12  fibhanet  public
zj-tty1  fibzj-tty  serial                fibtty    private
bj-tty1  fibbj-tty  serial                fibtty    private

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。