EC2 인스턴스에서 실행 중이던 앱에 접속이 안되어 인스턴스 상태 확인을 해보니 상태검사 1/2개 통과 라는 메시지를 발견해 이를 해결하기 위한 과정을 정리해본다.
-> 시스템 로그의 정확한 분석에 실패해 나의 경우 해결은 아직 못했다.(2023.01.21)
상태 검사
Amazon ec2는 아래 두 가지 상태 확인을 통해 각 ec2 인스턴스 상태를 모니터링한다.
1. 시스템 상태 확인
시스템 상태 확인은 인스턴스가 실행되는 기본 호스트에서의 문제를 탐지합니다. 네트워크, 하드웨어 또는 소프트웨어 문제로 인해 기본 호스트가 응답하지 않거나 이에 연결할 수 없는 경우 이 상태 확인에 실패합니다.
2. 인스턴스 상태 확인
인스턴스 상태 확인 실패는 인스턴스의 연결 가능성에 문제가 있음을 나타냅니다. 이 문제는 다음과 같은 운영 체제 수준 오류로 인해 발생합니다.
1. 운영 체제 부팅 실패
2. 올바른 볼륨 탑재 실패
3. CPU 및 메모리 소진
4. 커널 패닉
5. 네트워크가 작동하지 않음
위 두 가지중 어떤것이 문제인지 파악하기 위해서는 'ec2 콘솔 -> 인스턴스 -> 상태 검사' 탭을 참조하면 알 수 있다.
아래는 문제가 생긴 내 인스턴스의 상태 검사 탭인데 나의 경우 시스템 상태 검사 : 통과, 인스턴스 상태 검사: 인스턴스 연결성 검사 실패 였다.
원인 분석
인스턴스 상태 검사를 통과 하지 못한 경우 원인 분석을 위해 시스템 로그를 확인하고 시스템 로그에 있는 데이터에 따라 그에 맞는 해결 방법을 적용해야 한다.
1. 인스턴스 리부트: ec2 console -> 인스턴스 ->인스턴스 상태 -> 인스턴스 재시작
2. 시스템 로그 확인: 재시작 후 인스턴스 상태가 '실행중' 이면 -> 작업 -> 모니터링 및 문제해결 -> 시스템 로그 가져오기
누르면 다음과 같이 로그를 볼 수 있고 다운로드 할 수 도 있다.
분석 결과
aws 에서는 친절하게도 위 로그에서 발견 할수 있는 대표적인 error 들을 정리해 분석시 참조 할 수 있게 제공한다.
link: Troubleshoot system log errors for Linux-based instances
하지만 아쉽게도 내 시스템 로그에는 위에 해당 하는 에러는 없었다. 의심 가는 로그는
'GRUB failed boot detection' 라는 문구 인데 직접적인 관련이 있는지는 아직 모르겠다.
더 분석해 봐야겠다.
참고 자료: https://aws.amazon.com/ko/premiumsupport/knowledge-center/ec2-linux-status-check-failure/
'AWS' 카테고리의 다른 글
[aws] ELB Application Load Balancer를 이용한 SSL 설정 (1) | 2023.02.03 |
---|---|
[aws]ec2 인스턴스 도메인 연결 (0) | 2023.01.26 |
[aws] ec2와 rds 연동 (0) | 2023.01.22 |
[aws] 인바운드 규칙 변경 (2) | 2023.01.18 |
[AWS] ec2 인스턴스 볼륨 추가 및 마운트 (0) | 2023.01.15 |