cerebras

Deployment Engineer, AI Inference

AI 요약

Cerebras Systems는 GPU보다 56배 큰 세계 최대 AI 칩을 개발하는 회사로, 단일 칩으로 수십 개의 GPU 성능을 제공하며 AI 학습 및 추론 속도를 혁신합니다. 현재 전 세계 주요 기업, 국립 연구소, 의료 시스템에 솔루션을 제공하고 있으며, 특히 Mayo Clinic과의 파트너십 및 세계 최고 속도의 생성형 AI 추론 솔루션 출시로 주목받고 있습니다. 이번 채용은 최첨단 추론 클러스터를 구축하고 운영할 숙련된 배포 엔지니어를 모집하며, 대규모 AI 워크로드의 안정적이고 효율적인 배포를 담당하게 됩니다. 혁신적인 AI 플랫폼 구축에 기여할 기회를 제공합니다.

주요 업무

AI 추론 복제본 및 클러스터 소프트웨어 배포, 이기종 데이터센터 환경 운영, 용량 할당 최대화 및 복제본 배치 최적화, 베어메탈 추론 인프라 운영 및 K8S 기반 플랫폼 전환 지원, 텔레메트리/관찰 가능성/알림 솔루션 개발 및 확장, 완전 자동화된 배포 파이프라인 개발 및 확장, 기술 및 고객 요구사항을 관련 팀에 전달 가능한 요구사항으로 변환, AI 컴퓨팅 인프라 및 관련 기술 동향 파악

자격 요건

5-7년의 온프레미스 컴퓨팅 인프라 운영 (머신러닝 또는 HPC 선호) 또는 복잡한 AWS 기반 하이브리드 배포 인프라 개발/관리 경험, Python을 활용한 자동화, 오케스트레이션, 배포 도구에 대한 강력한 숙련도, Linux 기반 시스템 및 명령줄 도구에 대한 탄탄한 이해, Docker 컨테이너 및 K8S와 같은 컨테이너 오케스트레이션 플랫폼에 대한 광범위한 지식, 스파인-리프(Clos) 네트워킹 아키텍처에 대한 친숙함, Prometheus, InfluxDB, Grafana와 같은 텔레메트리 및 관찰 가능성 스택에 대한 숙련도, 복잡한 배포에 대한 강력한 책임감, 빠르게 변화하는 환경에서의 효과적인 업무 수행 능력

기술 스택

PythonLinuxDockerKubernetes (K8S)PrometheusInfluxDBGrafanaAWS

지원하기

AI 요약

주요 업무

자격 요건

기술 스택

cerebras의 다른 공고

알림