Jobs
openai 로고

openai

Software Engineer, Data Infrastructure - Research

개발AI·머신러닝데이터인프라·DevOps

AI 요약

OpenAI의 Workload 팀에서 차세대 LLM 학습 및 추론을 위한 대규모 데이터셋 인프라를 설계하고 구축할 엔지니어를 채용합니다. 수천 개의 GPU 규모에서 멀티모달 데이터셋을 효율적으로 처리하고, 연구원들이 모델 역량 강화에 집중할 수 있도록 표준화된 API와 파이프라인을 제공하는 핵심적인 역할입니다.

주요 업무

멀티모달(MM) 데이터를 포함한 표준화된 데이터셋 API 설계 및 유지관리. GPU 규모의 데이터 로딩을 위한 선제적 테스트 및 확장성 검증 파이프라인 구축. 학습 및 추론 파이프라인에 데이터셋을 원활하게 통합하여 사용자 경험 최적화. 데이터셋 인터페이스 문서화 및 가이드 제공. 데이터셋의 재현성 및 무결성 보장을 위한 보호 시스템 구축. 분산 데이터 로딩 시 발생하는 성능 병목 현상(Straggler 등) 디버깅 및 해결. 데이터셋 오류 및 병목 현상 파악을 위한 시각화 및 검사 도구 개발.

자격 요건

분산 시스템, 데이터 파이프라인 또는 인프라 분야의 강력한 엔지니어링 기초 역량. API 설계, 모듈형 코드 작성 및 확장 가능한 추상화 구축 경험. 대규모 머신 플릿에서의 병목 현상 디버깅 능력. 협업 능력과 신뢰성 있는 인프라 구축에 대한 열정. (우대사항) 데이터 관련 수학, 확률론 또는 분산 데이터 이론 지식. GPU 규모의 분산 시스템 또는 실시간 데이터 확장 작업 경험.

기술 스택

Distributed SystemsData PipelinesInfrastructureGPULLMMultimodal (MM)API DesignScalable Abstractions
AI 점수 95core

openai의 다른 공고

알림

알림이 없습니다