
megazone
[메가존클라우드] Platform Engineer
정규직(풀타임)대면혼합근무인프라·DevOps
AI 요약
메가존클라우드(Megazone AIR) GenAI-Platform 팀의 플랫폼/인프라 엔지니어 채용공고입니다. Kubernetes(EKS/GKE/NKS/온프레) 클러스터 설계·구축·운영, AI 모델 학습을 위한 Job scheduler(Kueue) 인프라 운영, 데이터 거버넌스 플랫폼(Kaldea) 인프라 운영, AIR 컴포넌트 배포를 위한 CI/CD 및 IaC(Terraform/Ansible) 기반 인프라 관리, 모니터링/로깅(Prometheus, Grafana, ELK/EFK) 구축 등이 주요 업무입니다. MLOps 환경 및 대규모 분산 시스템 경험, Go/Python 개발 역량이 있으면 우대합니다. 경력 3~10년, 정규직(3개월 평가) 채용입니다.
주요 업무
Kubernetes(EKS, GKE, NHN NKS, 온프레) 클러스터 설계·구축·운영 및 AIR Platform 컴포넌트 배포 자동화, AI 모델 학습용 Job scheduler(Kueue) 인프라 구축·운영, 데이터 거버넌스 플랫폼(Kaldea) 인프라 구축·운영, AIR Platforms 컴포넌트 배포를 위한 CI/CD 파이프라인 구축·운영, Prometheus/Grafana/ELK(또는 EFK) 기반 모니터링 및 로깅 시스템 구축, Terraform/Ansible 등 IaC 기반 인프라 관리
자격 요건
Kubernetes 운영 경험(3년 이상) 우대, 클라우드 플랫폼(AWS/GCP/Azure) 사용 경험, Linux 시스템 및 네트워크 이해, CI/CD 및 IaC 도구 사용 경험, Docker 및 컨테이너 오케스트레이션 이해, 팀 협업과 문제 해결 능력. 우대: MLOps 환경 구축·운영(Kubeflow, MLflow), Kueue 또는 Kubernetes 기반 Job scheduler 운영 경험, 대규모 분산 시스템 아키텍처 설계·운영, 데이터 플랫폼 연동 경험(Kafka, Spark), Go 또는 Python 기반 시스템 개발 능력.
기술 스택
KubernetesAmazon EKSGoogle GKENHN NKSKueueKaldeaCI/CDPrometheusGrafanaELKEFKTerraformAnsibleDockerKubeflowMLflowKafkaSparkGoPythonLinux