Topas命令详细解释
基于我工作的某项目组给出aix性能监控工具topas的解析。发上来供大家参考。
先上附图,根据图中区域分别解释和说明原因。
日常的CCCC运行维护需要我们了解操作系统的性能信息。而操作系统的最全面动态,而又查看方便的性能试图就是topas 命令了,下面以topas输出为例,对AIX系统的性能监控做简要描述,供项目运维组和其他同事参考。
另:1.操作系统报错信息errpt查看。2.磁盘空间使用率采用df查看。这里主要分析性能问题。而运维项目组最为关心的就是日常的操作系统性能问题。
说明:性能阈值的需求基于目前管理的CCCC系统主机性能得出,并不具备一般意义上性能问题分析。
区域1:反映CPU使用率和工作状况。
Kernel:说明:操作系统的内核占用的CPU时间比率。操作系统作为根底软件,为应用程序支持和服务的同时,本身的运行也需要一定的CPU和内存资源〔顺便提到内存资源,后面不再阐述这个内容了〕,特别是内存资源,系统负载越重,相应的内核占用的CPU和内存资源也会越多。
一般来说,内核占用的CPU时间不会太多的。一般小于应用的CPU使用率。
User:说明:用户进程占用的CPU时间比率。这个为CPU
使用率的关键数值。该使用率反映了用户在操作系统根底上运行的各种软件占用的CPU时间比率的总和。一般来说,如果User+Kernel连续大于70%,即可以认为系统可能存在CPU上的严重性能问题。而我们的实际维护工作中,如果发现某一个CCCC主机〔bjdb0261,bjdb0271除外,这两个主机的负载一直比拟高〕的User+Kernel大于30%,就要看看下面的第四区域,看看是不是有进程持续占用了大量的CPU资源,例如,某一个交易处理程序的CPU使用率持续在20%左右〔曾经发生过〕。
Wait 说明:CPU处于等待状态占CPU时间的比率。CPU 的等待一般都为等待IO的响应,众所周知,目前计算机的主要瓶颈都在IO。应用程序执行的时候,需要读写磁盘等外部存储的数据,进程就会发起IO请求后等待IO完成。这个等待的过程占用CPU时间就是wait。当这个值很高的时候,就说明IO来不与响应很多的IO请求,这个时候,就只能从IO层面想方法优化了。aix系统netstat命令详解
Idle:说明:CPU空闲时间比率,这个就不用说了吧。就是CPU多少时间比率在闲着。
CPU占用率出问题的主要可能原因:数据库服务器执行某一个SQL或者存储过程〔存储过程就是封装起来的sql程序包而已〕需要大量的运算〔一般为软件设计不合理〕。或者应用程序中存在异常的地方,比如死循环,或者其他写程序时的逻辑错误
导致。一般程序出错会导致一个CPU被全部占用,比如上述的20%占用的原因就是一个交易程序长期占用一个CPU全部时间片〔系统共计5个CPU〕。
区域2:反映网络使用率的状况。
Netwok;列出了网卡接口,KBPS即每秒钟多少KB〔千字节〕I-Pack每秒钟输入的数据包个数,O-Pack 每秒钟输出的数据包个数KB-In每秒钟输入的字节数KB-Out每秒钟输出的字节数。
当我们发现网络拥堵时〔出现网卡传输失效的报错,即网卡发送数据包失败。或者网络响应明显变慢的时候,如果CPU没有问题,那么请检查网络流量〕发现某一个网卡的KBPS持续大于四位数,甚至五位数时〔这个值要是网卡千兆还是百兆而定〕。就要看看这个网卡是什么网卡,在处理什么业务了。在命令行执行netstat –in 查看对应en*接口的ip地址,通过ip地址看看是带卡还是生产服务网卡流量高。然后通过netstat –v en* 看看网卡的详细工作状态,出现了多少错包,冲突包,crc校验错或者网络重置过等信息。上述信息请详细看netstat –v en*的输出.如果出现大量crc,错包的话,可能网线有问题或者接触不良。
如果上述均正常,而网络反响慢,如此有可能是交换机拥堵。网络出现问题的可能原因:通过百兆的带管网加载大量数据〔以前出现过〕,大量队列的长时间的ftp传输,或者网线,交换机问题等。
区域3:反映磁盘使用率的状况。
Disk Busy%磁盘繁忙的百分比,即磁盘能满足的最大IOPS 〔每秒IO操作数〕和当前IO数量的比率。其他的参数不再解释。望文生义即可。一般主要看磁盘的Busy%,当磁盘的Busy%持续大于85%时,即认为磁盘相当繁忙,已经可能要出问题了。当然,自己知道已经确定要产生大量IO操作的内容如此不必在意,等其完成即可。出现问题的原因:CCCC的应用服务器上面写日志进程或者查询日志的进程大量读写日志,导致磁盘繁忙率高,或者其他程序频繁读写磁盘导致。系统中hdisk0,hdisk1一般为系统盘,内置SCSI磁盘的相对IOPS是较低的。很容易满负荷运行。
区域4:反映进程信息的状况。
Name:进程的名称,即进程被执行时启动的二进制文件的名称。PID,进程的ID,进程的ID在系统中唯一,是我们了解跟踪进程信息重要数值。跟踪进程的CPU使用,磁盘IO读写,进程的内存和pagingspace占用等等均需要使用。CPU%进程占用CPU时间的比率,PgSp,进程占用的pagingspace的空间大小。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。