
mangoboost
CFO Group
정규직(풀타임)대면근무인프라·DevOps
AI 요약
MangoBoost에서 데이터센터(IDC) 물리 인프라 운영부터 GPU 기반 AI/HPC 클러스터 운영 및 모니터링·인시던트 대응까지 담당할 인프라 엔지니어를 채용합니다. 서버 랙팅·케이블링, 전력·환경 모니터링(FMS), GPU/PDU 최적화, Slurm 등 스케줄러 관리 및 온콜 대응 경험을 요구합니다.
주요 업무
데이터센터(IDC) 물리 인프라 운영(랙 장착, 광/UTP 케이블링, 자산 라벨링), 전력·온습도 등 환경 모니터링(FMS) 및 환경 사고 대응, 고밀도 GPU 랙 전력(PDU) 최적화 및 냉각(Hot/Cold aisle) 관리, 하드웨어 교체 및 펌웨어 업데이트(BIOS, IPMI), GPU 가속 AI 학습 클러스터 구축·운영 및 자원 최적화, Slurm 등 잡 스케줄러 관리 및 사용자/프로젝트별 자원 할당, 인프라 변경관리(MOP 문서 기반) 및 통합 모니터링·온콜 인시던트 대응.
자격 요건
인프라 운영 및 관리 3–7년 경력, IDC 물리 운영(랙·케이블링) 및 서버 하드웨어 트러블슈팅 실무 경험, Linux 서버 운영(커널·네트워크 성능 최적화) 경험, 대규모 GPU 클러스터 또는 HPC 환경 운영 경험, 문제 근본 원인 분석 역량.
기술 스택
LinuxGPU/HPC 클러스터SlurmLSFFMSDCIMInfiniBandRoCEPDUBIOSIPMI서버 하드웨어 트러블슈팅고속 네트워킹AWSNCP랙/케이블링(광/UTP)온콜/모니터링