Jobs
together 로고

together

Senior Software Engineer - Together Cloud

개발AI·머신러닝인프라·DevOps하드웨어·임베디드

AI 요약

Together AI는 생성형 AI 라이프사이클을 위한 AI 가속 클라우드 플랫폼을 구축하는 기업으로, 차세대 AI 클라우드 인프라를 설계하고 운영할 시니어 AI 인프라 엔지니어를 채용합니다. GB200 GPU, BlueField DPU 등 최첨단 하드웨어를 가상화하고 대규모 분산 학습 환경을 지원하는 핵심적인 역할을 담당합니다.

주요 업무

차세대 AI 클라우드 플랫폼 설계 및 구축, 최첨단 ML 하드웨어(GB200, BlueField DPU) 가상화, Kubernetes 및 Slurm 기반 셀프 서비스 AI 클라우드 제공, 하드웨어 관리 자동화(Infiniband 파티셔닝, 스토리지 프로비저닝 등)를 위한 백엔드 서비스 개발, 수천 개의 GPU 규모 IaaS 소프트웨어 레이어 구축, 대규모 데이터셋용 고성능 오브젝트 스토리지 작업, 분산 학습을 위한 관측성 스택 및 노드 라이프사이클 관리 시스템 구축.

자격 요건

5년 이상의 전문 소프트웨어 개발 경력 및 백엔드 언어(Golang 선호) 숙련도, 고성능/운영 품질의 코드 작성 능력, 클라우드 제공업체(AWS, Azure, GCP)를 통한 대규모 분산 마이크로서비스 아키텍처 구축 및 운영 경험, 기술 및 비기술 팀원과의 원활한 커뮤니케이션 능력. (우대사항) Kubernetes 내부 구조(Operator, CNI/CSI, 스케줄러 등) 경험, 가상화 기술(QEMU/KVM, Kubevirt, SR-IOV 등) 경험, 데이터센터 네트워킹(VLAN, VXLAN, OVS 등) 경험, Cluster API 경험, GPU 가상화 및 Infiniband 경험, 인프라 자동화(Terraform, Ansible) 및 모니터링(Prometheus, Grafana) 경험, GPU 프로그래밍(CUDA, NCCL) 지식.

기술 스택

GolangKubernetesAWSAzureGCPQEMUKVMKubevirtSR-IOVVLANVXLANTerraformAnsiblePrometheusGrafanaGitHub ActionsArgoCDCUDANCCLInfinibandSlurm
AI 점수 95core

together의 다른 공고

알림

알림이 없습니다