개발자

쿠버네티스에서 pod삭제 및 pod재스케쥴링 불가

2024년 08월 09일조회 31

쿠버네티스에서 pod들이 삭제가 안되고 재스케쥴링도 안됩니다... 별이상없다가 갑자기 발생했습니다. deploy로 만들어놓은 pod를 삭제했더니 terminating과 containercreating상태가 유지되거나 helm으로 deploy한 pod들이 init, containercreating, terminating상태 유지되고 더 이상 진행이 안됩니다. pod의 describe, event, log node상태(Ready상태, 각 리소스 확인)도 모두 이상없고 파이널라이저 설정은 따로 하지 않았습니다. 문제가 무엇일까요?

이 질문이 도움이 되었나요?
'추천해요' 버튼을 누르면 좋은 질문이 더 많은 사람에게 노출될 수 있어요. '보충이 필요해요' 버튼을 누르면 질문자에게 질문 내용 보충을 요청하는 알림이 가요.

답변 0

답변이 없을 때 보이는 아이콘

첫 답변을 기다리고 있어요.

지금 가입하면 모든 질문의 답변을 볼 수 있어요!

현직자들의 명쾌한 답변을 얻을 수 있어요.

또는

이미 회원이신가요?

AI 답변
커리어리 AI 봇 프로필 이미지

커리어리 AI 봇

GPT가 달아주는 답변입니다.

2024년 08월 09일

이 문제는 쿠버네티스 클러스터 내에서 발생하는 다양한 이슈 때문에 나타날 수 있습니다. 여기 몇가지 트러블슈팅 방법들이 있습니다: 1. Pod 삭제 문제: 쿠버네티스에서 pod 삭제가 안되는 경우, 일반적으로 그 원인은 파드가 마운트된 스토리지 볼륨에 관련된 이슈거나, 파드 생성 시 사용된 CRD (Custom Resource Definition) 또는 기타 자원이 삭제되지 않아서 일어납니다. 2. Pod 재스케쥴링: 재스케쥴링에 실패하면, 워크로드를 실행할 충분한 자원이 없거나 노드의 일시적인 결함 등 다양한 요인 때문일 수 있습니다. 3. Terminating 상태 및 ContainerCreating 상태 지속: 이는 종료될 컨테이너와 새롭게 스케줄링 될 컨테이너 모두 대기 중인 것을 의미합니다. 종료 프로세스가 완료되지 않았거나, 새로운 컨테이너를 시작하는 데 필요한 리소스 부족으로 인해 발생할 수 있습니다. 정확한 원인을 찾으려면 'kubectl describe pod <pod-name>' 및 'kubectl logs <pod-name>'와 같은 명령들을 사용하여, 문제가 발생한 특정 파드의 로그와 이벤트를 분석해야 합니다. 발생한 오류 메시지와 경고를 참고하여, 문제를 해결하는 데 도움이 되는 추가 조치를 결정할 수 있습니다. 더 나아가 쿠버네티스 API 서버, Etcd, 컨트롤러 관리자 및 스케줄러 등 쿠버네티스 마스터 구성 요소의 로그도 확인해 볼 필요가 있습니다. 이외에도 네트워크 이슈나 한계값에 도달했는지 (예: 열린 파일 수나 프로세스 수) 확인해 보는 것도 좋습니다. 또한 체크해볼만한 점으로는 Node의 디스크 공간/인오드 사용량, Docker daemon 상태 등이 있습니다. 위 방법들로도 문제를 해결하지 못한다면 직접적인 원인을 찾기 위해 클러스터 내부에서 실행되고 있는 서비스들의 로직을 검토하거나 클러스터 전체에 영향을 줄 수 있는 설정 변경 이력등을 파악하는 것이 필요합니다.

목록으로

지금 가입하면 모든 질문의 답변을 볼 수 있어요!