
slack
Senior/Staff Software Engineer- Machine Learning Infrastructure, Slack
개발AI·머신러닝인프라·DevOps데이터
AI 요약
Salesforce의 Slack AI 팀에서 대규모 머신러닝 모델의 학습 및 추론을 위한 인프라를 설계하고 운영할 시니어/스태프 소프트웨어 엔지니어를 채용합니다. Kubernetes, Ray, GPU 인프라 등을 활용하여 Slack의 AI 기능을 뒷받침하는 확장성 있고 안정적인 플랫폼을 구축하는 것이 핵심입니다.
주요 업무
대규모 ML 모델의 학습, 서빙 및 배포를 위한 시스템 설계 및 운영; 고처리량 및 저지연 워크로드를 지원하는 GPU 기반 추론 인프라 고도화; Ray, Airflow, Spark 등을 활용한 분산 학습 및 데이터 처리 시스템 아키텍처 설계; KubeRay, vLLM 등을 활용한 Kubernetes 기반 플랫폼 및 오케스트레이션 레이어 구축; 운영 우수성을 위한 모니터링, 관측성 및 알림 시스템 개발; AI 플랫폼, 모델링, 보안 및 제품 팀과 협업하여 인프라 설계; 기술 표준 설정 및 아키텍처 방향 제시 등 기술적 리더십 발휘.
자격 요건
인프라, 백엔드 시스템, 플랫폼 엔지니어링 또는 MLOps 분야의 풍부한 소프트웨어 엔지니어링 경험; Kubernetes 및 컨테이너 기반 플랫폼 구축 및 운영에 대한 전문가 수준의 지식; Ray, KubeRay, vLLM 등 현대적 ML 인프라 및 서빙 프레임워크 활용 능력; GPU 인프라의 성능 최적화 및 대규모 운영 경험; Airflow, Spark 등 데이터 인프라 및 오케스트레이션 기술 경험; AWS, GCP, Azure 등 퍼블릭 클라우드 플랫폼 및 IaC(Infrastructure as Code) 경험; 관련 기술 분야 학위 필수; 비동기 글로벌 협업 환경에서의 우수한 커뮤니케이션 능력.
기술 스택
KubernetesRayKubeRayvLLMGPUAirflowSparkAWSGCPAzureIaCContainer
slack의 다른 공고
Staff Software Engineer, Electron & Browser Infrastructure - Slack Desktop
개발Staff Software Engineer, Slack Desktop Client
개발Senior Director, Product Management
제품·기획·디자인Staff Software Engineer, Android - Slack Productivity Mobile
개발Staff ML Engineer, Fine Tuning - Slack
AI·머신러닝, 개발Software Engineer II, Service Network - Slack
개발, 인프라·DevOpsStaff Software Engineer, Data Ingestion - Slack
개발, 데이터Sr. Security Software Engineer, Vulnerability Management - Slack
개발, 보안, 인프라·DevOps