Jobs
moreh 로고

moreh

경력 7년 이상

정규직(풀타임)대면혼합근무인프라·DevOps

AI 요약

모레에서 대규모 AI 모델과 GPU/NPU 클러스터를 위한 AI 소프트웨어 스택을 운영·개선할 Senior SRE/DevOps 엔지니어를 채용합니다. 대규모 GPU 클러스터 아키텍처 설계, HPC 튜닝, Kubernetes/IaC 기반 운영, 고성능 네트워크·분산 스토리지 관리가 핵심입니다.

주요 업무

대규모 AI 가속기 클러스터 아키텍처 설계 및 구축, 이기종 AI 가속기 기반 GPU 클러스터 인프라 총괄 관리, 서버 스펙·Rack 구조·전력·냉방 용량 산정, LLM/생성형 AI 모델 아키텍처에 따른 Token 처리 용량 산정, Linux 커널 및 서버 하드웨어 성능 최적화, RDMA 네트워크 및 드라이버/라이브러리 최적화, 대규모 Kubernetes 클러스터 설계·배포·운영, Terraform/Ansible 기반 IaC 관리, GPU 클러스터 모니터링 시스템 구축, CI/CD 및 Git 형상 관리 리드, InfiniBand/RoCEv2/Ultra Ethernet 네트워크 설계·관리, Ceph/Vast Data 등 분산 스토리지 운영

자격 요건

컴퓨터공학 또는 관련 전공 학부 졸업 혹은 동등 경력 보유, 7년 이상의 SRE/DevOps/Infra Engineer 경력, GPU 클러스터 및 인프라 최적화에 대한 깊은 이해, 인프라 코드화 및 자동화 경험, 오픈소스 도구 이해 및 영문 기술 문서 적용 능력, 팀워크 및 협업 역량, 해외여행 결격 사유 없음

기술 스택

LinuxKubernetesTerraformAnsibleCI/CDGitRDMAInfiniBandRoCEv2Ultra EthernetCephVast DataPythonGoShellGPUNVIDIAAMDTenstorrentHPCLGTMPLGELK
AI 점수 72tool

moreh의 다른 공고

알림

알림이 없습니다