
moreh
SRE/DevOps Engineer
정규직(풀타임)대면혼합근무인프라·DevOps
AI 요약
대규모 AI 모델과 GPU/NPU 클러스터용 소프트웨어 스택을 개발·운영하는 모레에서 SRE/DevOps 엔지니어를 채용합니다. 수백 노드 규모의 온프레미스 GPU 클러스터와 고대역 네트워크, 분산 스토리지 등 인프라 구축·운영, 시스템 소프트웨어 및 컨테이너 오케스트레이션, IaC·CI/CD 자동화 및 모니터링·장애 대응을 담당합니다.
주요 업무
대규모 클러스터(컴퓨트 서버, GPU, 고대역 네트워크, 분산 스토리지) 구축 및 운영; GPU 드라이버·통신 라이브러리·디렉터리·분산 파일시스템 등 시스템 소프트웨어 설치·관리; Kubernetes 등 컨테이너 오케스트레이션 설치·운영; Terraform·Ansible 등 IaC로 자동화; CI/CD 파이프라인(Jenkins/ArgoCD 등) 구축·관리; 클러스터 자원 및 성능 모니터링 구축과 장애 원인 분석·해결.
자격 요건
컴퓨터공학 또는 관련 전공 학부 졸업 또는 동등 경력. 다음 중 하나 충족: 2년 이상 SRE/DevOps 경력 또는 2년 이상 Linux 기반 온프레/퍼블릭 클라우드 시스템 구축·운영 경력. Python/Go/Shell 등 스크립트 언어 활용 능력, 컴퓨터 시스템 이해, 논리적 사고 및 문제 해결 능력, 해외여행 결격사유 없음, 팀워크와 협업 태도.
기술 스택
LinuxGPU/NPU 클러스터CPU 서버고대역 네트워크 (InfiniBand, RoCE)분산 스토리지/분산 파일 시스템GPU 드라이버통신 라이브러리PythonGoShellDockerKubernetesTerraformAnsibleJenkinsArgoCDCI/CD모니터링 솔루션