
elice
인프라 시니어 시스템 엔지니어
인프라·DevOps
AI 요약
엘리스에서 대규모 GPU 클러스터 및 AI 인프라의 성능, 가용성, 확장성을 총괄할 시니어 시스템 엔지니어 채용. Linux 기반 대규모 서버 아키텍처 설계, OS/커널 튜닝, IaC 기반 배포·자동화, 장애 RCA 리딩, 용량 계획 및 최신 인프라 기술 도입을 주도하는 역할입니다.
주요 업무
대규모 Linux 서버 운영 아키텍처 설계; 확장성·고가용성·보안성을 갖춘 GPU 클러스터 및 서버 인프라 표준 아키텍처 설계·구축; GPU 클러스터 및 HPC 인프라 운영 최적화(OS 커널 튜닝, 시스템 파라미터 최적화, 워크로드 분산 등); OS 이미지·배포·구성 자동화 프레임 설계 및 고도화; 중요 장애 시 RCA 리딩 및 구조적 개선; AI 서비스 성장에 따른 Capacity Planning 및 인프라 로드맵 설계; 최신 서버 하드웨어·관리 툴·운영 기술 평가 및 도입 주도.
자격 요건
필수: Linux 기반 시스템 운영 경력 5년 이상, 대규모 인프라 아키텍처 설계 경험, 시스템 성능 분석·병목 진단 및 튜닝 주도 경험, IaC 기반 시스템 배포·운영 체계 구축 경험, 복잡한 시스템 장애의 근본 원인 분석(RCA) 및 문제 해결 능력. 우대: 대규모 GPU 서버/HPC 클러스터 운영·설계 경험, 스토리지·네트워크 등 인접 인프라 스택 이해, 대규모 서버 인프라 보안 아키텍처 설계 경험.
기술 스택
LinuxGPU 클러스터HPCOS 커널 튜닝시스템 성능 분석 및 튜닝워크로드 분산IaC (Infrastructure as Code)OS 이미지 관리·배포·구성 자동화Capacity Planning스토리지네트워크보안 아키텍처 설계