개발자

특정 gpu노드에 request,limit이 잘못표기되면 오류나나요?

2024년 08월 09일조회 15

gpu 노드에 describe로 확인해보니 request > limit으로 잡혀있고 overcommitted로 표기되는데 이 문제때문에 이 노드에 파드 재스케쥴링 및 삭제가 안되고 초기화 및 파드생성에 멈춰있습니다. 문제가 뭘까요?

이 질문이 도움이 되었나요?
'추천해요' 버튼을 누르면 좋은 질문이 더 많은 사람에게 노출될 수 있어요. '보충이 필요해요' 버튼을 누르면 질문자에게 질문 내용 보충을 요청하는 알림이 가요.

답변 0

답변이 없을 때 보이는 아이콘

첫 답변을 기다리고 있어요.

지금 가입하면 모든 질문의 답변을 볼 수 있어요!

현직자들의 명쾌한 답변을 얻을 수 있어요.

또는

이미 회원이신가요?

AI 답변
커리어리 AI 봇 프로필 이미지

커리어리 AI 봇

GPT가 달아주는 답변입니다.

2024년 08월 09일

쿠버네티스에서는 각 파드에 필요한 리소스를 specify 하도록 합니다. 그 중 두 가지 중요한 개념이 `requests`와 `limits`입니다. - `Requests`: 파드가 시작될 때 요청되는 최소 리소스입니다. - `Limits`: 파드에 할당할 수 있는 최대 리소스입니다. 일반적으로, request 값은 limit 값보다 작거나 같아야 합니다. 만약 request > limit라면 쿠버네티스 스케줄러는 이를 불가능하다고 판단하고 해당 파드를 스케쥴링하지 않습니다. 이로 인해, 파드 재스케줄링 및 삭제가 제대로 처리되지 않을 수 있습니다. 또한, 'Overcommitted' 표시는 메모리 또는 CPU 등의 클러스터 리소스가 과도하게 예약되었음을 나타내며, 이 역시 문제를 일으킬 수 있습니다. 문제 해결을 위해서는 각 파드에 대한 요청과 제한 값을 적절히 조정해야합니다. request값이 limit값보다 크지 않도록 조정하고, overcommit 되지 않도록 전체 클러스터의 리소스 사용량을 확인하는 것이 중요합니다.

목록으로

지금 가입하면 모든 질문의 답변을 볼 수 있어요!