NMI是什么
NMI是什么
,就是不可屏蔽的中断。根据Intel的Software Developer⼿册Volume 3,NMI的来源有两个:
– NMI pin
– delivery mode NMI messages through system bus or local APIC serial bus
NMI通常⽤于通知操作系统发⽣了⽆法恢复的硬件错误,也可以⽤于系统调试与采样,⼤多数服务器还提供了⼈⼯触发NMI的接⼝,⽐如NMI按钮或者iLO命令等。
1. ⽆法恢复的硬件错误通常包括:芯⽚错误、内存ECC校验错、总线数据损坏等等。
crash是什么意思2. 当系统挂起,失去响应的时候,可以⼈⼯触发NMI,使系统重置,如果早已配置好了kdump,那么会保存crash dump以供分析。有的
服务器提供了NMI按钮,⽽⼑⽚服务器通常不提供按钮,但可以⽤iLO命令触发。
3. Linux还提供⼀种称为”“的机制,⽤于检测系统是否失去响应(也称为lockup),可以配置为在发⽣loc
kup时⾃动触发panic。原理是周
期性地⽣成NMI,由NMI handler检查hrtimer中断的发⽣次数,如果⼀定时间内这个数字停顿了,表⽰系统失去了响应,于是调⽤panic 例程。NMI watchdog的开关是通过内核参数 i_watchdog 或者在boot parameter中加⼊”nmi_watchdog=1″参数实现,⽐如:在RHEL上编辑 /boot/grub/menu.lst:
kernel /vmlinuz-2.6.18-128.el5 ro root=/dev/sda nmi_watchdog=1
然后你会看到:
# grep NMI /proc/interrupts
NMI: 0 0 0 0
Linux kernel笼统地把NMI分为三⼤类:内存校验错 mem_parity_error(),总线数据损坏 io_check_error(),其他的全部归⼊
unknown_nmi_error()。kernel对NMI是不能精确定位的,对故障诊断很不利,硬件驱动程序可以注册⾃⼰的NMI处理例程,kernel会在发⽣NMI之后通过notify_die()调⽤这些第三⽅注册的处理例程。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。