数据库应用案例102人与自然
MAN AND NATURE
中国航班
CHINA FLIGHTS
民航气象数据库系统报文入库异常案例的分析与探讨
王慧 |中国民用航空温州空中交通管理站
摘要:随着中国民航事业的不断发展,航
班量的不断增加,民航气象业务为确保航空安
全和航班正点率提供了重要的保障。民航气象
数据库系统是民航气象业务的核心系统,主要
提供飞行气象情报及气象资料的交换、备供、
分析、存储等功能,它主要包括通信子系统,
数据库子系统、信息处理子系统以及相关网络
设备。
关键词:民航气象数据库;案例;系统报
文入库
本文以一次报文入库异常事件为切入点,
深入分析此类事件的处理方法,为设备保障人
员进行故障排查提供思路和参考。
1报文入库异常事件
2019年7月2日,预报员发现民航气象
数据库质量评定系统查不到相关报文。故障排
查流程如图1。经初步检查,数据库自7月1
日11时起报文无法入库,查询日志信息显示
数据入库错误。查看系统监控中数据库表空间信息,发现数据库应用库飘红,空间占用率达到99.92%。随即查看气象数据库的自动归档文件目录/home/../20190702下为空。分析以上现象,初步可以判断,故障原因是民航气象数据库自动归档异常导致应用库数据转移至历史库过程卡死,最终导致应用库爆满,报文无法正常入库。为尽快使数据库恢复使用,首先对应用库数据进行清理工作,使用truncate table MHAPP.ELE01_AWOS DROP STORAGE;对应用库中的自观数据进行清理,结果发现清理进程卡死,无法正常工作。考虑有可能是数据库进程为开启状态,数据接收和清理两个进程有冲突导致。使用mmsctl stop all指令,停止所有进程后执行上述truncate语句;可以成功清理相应数据。应用库清理完后,数据库暂时能够正常写入,报文入库正常。但是数据库归档文件仍无法正常形成。
2自动归档故障排查
数据库归档原理是dmsserver进程在世界时间08:35(北京时间16:35)自动调用expdp命令,在20190702文件夹下生成dmp 文件,再把生成的dmp文件打包成相应的zip 文件,最终生成33个压缩格式的归档文件。
2.1查看错误日志
打开dmserr.log文件,查看归档错误日志信息如下:
[ERROR]no such file exists please connect to maintenancers.
2.2人工排查
根据自动归档原理,机务员决定远程登录
数据库服务器执行expdp指令进行手工排查。
首先执行sqlplus / as sysdba进入SQL后执行命
令如下:
SQL> select * from dba_directories where
DIRECTORY_NAME=’DIRNAME’;
由此可以确定dirname目录位置,然后退
出SQL执行如下命令:
$expdp userdbs/userdbs tables=MHAPP.
IMAGE01_STAR directory=dirname filesize=800M
d u m p f i l e=I M A G E01_S T A R.%U.d m p
logfile=IMAGE01_STAR.log
输入上述命令后,出现如下两个报错:
ORA-31634: job already exists
ORA-31664: unable to construct unique job
name when defaulted
至此,到expdp归档失败是因为上面两
个错误。
2.3分析错误信息
Expdp是服务端的工具程序,只能在服务
端执行,用来导出数据库,当数据泵开始工作
时,会加载一个JOB_NAME来表明该操作的
任务名称,当导出工作完成后会自动卸载工作。
在民航气象数据库中一共有99个JOB_NAME
可使用且无法扩展,这就意味着同时只能有
99个数据泵工作。根据ORA-31634和ORA-
31664两个报错信息可以得知,数据泵工作流
无法加载JOB_NAME,数据泵工作流没有正常
释放而是一直占用JOB_NAME。
2.4故障处理
通过以上分析得知需要清理DBA_
DATAPUMP_JOBS表中NOT RUNNING的选项,
具体分两步执行:
2.4.1查询生成清理DBA_DATAPUMP_
JOBS的SQL语句
SQL> SELECT ‘DROP TABLE ‘ ||
OWNER_NAME ||’.’|| JOB_NAME ||’;’
FROM DBA_DATAPUMP_JOBS’;
2.4.2上述命令后生成99条SQL语句,复
制生成的SQL语句,对表DBA_DATAPUMP_
JOBS进行清理。
2.5验证自动归档
通过指令 dmsctl来停止服务,打开配置文
件f.
更改datetofile_time的值来设定自动归档
时间,通过指令dmsctl start server开启服务。
大概40分钟后会在20190702文件夹下生成
33个压缩格式的归档文件。
3结语
民航气象数据库系统报文入库异常将直接
导致气象资料的缺失,进而影响气象服务的质
量,因此报文入库异常问题一直深受维护人员
的重视。常见的报文入库故障原因有队列异常
关闭、通道堆积严重、网络传输中断、落地进
程关闭、入库进程异常等。本文详细描述了由
于归档程序异常而导致的报文无法入库的故障
处理过程,为民航气象数据库系统报文入库异
常抢修工作提供新的参考,对做好民航气象数
据库维护工作具有一定的现实意义和实际价值。
图1 故障排查流程
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论