Standby System Controller 재부팅 발생

1. 장애 상황

    - Standby System Controller 재부팅 발생 

2. 확인 사항

    추가 증상 발생 여부 NMS Log (SNMP 기반) 확인 필요  
    - 1회성으로 추정되며 추가 증상 발생 시 H/W Fault 의심되므로 RMA 후 교체 권고  

3. 원인규명

    Standby System Controller Kernel Panic으로 인해 Active SUP (Supervisor)에게 EPC health check 응답을 하지 못하게 되어 재부팅 발생  
    - Active SUP에서 EOBC/EPC message를 20ms 마다 보내 health check를 하고 있고 40ms 내에 응답받지 못하면 heartbeat 실패로 1회 카운트 
      연속적으로 16회 실패 카운트가 되면 Active SUP이 해당 모듈을 Reload 시킵니다.  

4. 조치 사항

    - 1회성으로 추정되며 추가 증상 발생 시 H/W Fault 의심되므로 RMA 후 교체 

5. 증적자료   

'장애 이력 (원인 및 조치)' 카테고리의 다른 글

BPDU Guard로 인한 Err-disabled 발생  (0) 2025.03.24