
openai
Data Engineer
개발AI·머신러닝데이터
AI 요약
OpenAI의 Applied 팀에서 데이터 파이프라인과 핵심 테이블 구축을 담당할 시니어 데이터 엔지니어를 채용합니다. ChatGPT 연구진과 협력하여 모델 학습을 지원하고, 제품 성장 및 안전 시스템을 위한 데이터 인프라를 설계 및 관리하는 역할을 수행합니다.
주요 업무
- 데이터 파이프라인 설계, 구축 및 관리 (사용자 이벤트 데이터 통합)
- 제품 지표(성장, 참여도, 매출 등) 추적을 위한 표준 데이터셋 개발
- 인프라, 데이터 사이언스, 제품, 마케팅, 재무, 연구 팀과의 협업
- 견고하고 결함 허용적인 데이터 수집 및 처리 시스템 구현
- 데이터 아키텍처 및 엔지니어링 의사결정 참여
- 데이터 보안, 무결성 및 규정 준수 보장
자격 요건
- 데이터 엔지니어 경력 3년 이상 및 총 소프트웨어 엔지니어링 경력 8년 이상
- Python, Scala, Java 중 최소 하나 이상의 프로그래밍 언어 숙련도
- Hadoop, Flink 등 분산 처리 기술 및 HDFS, S3 등 분산 저장 시스템 경험
- Airflow, Dagster, Prefect 등 ETL 스케줄러 프레임워크 전문성
- Spark 코드 작성, 디버깅 및 최적화 능력
기술 스택
PythonScalaJavaHadoopFlinkHDFSS3AirflowDagsterPrefectSpark
openai의 다른 공고
Workforce Program Manager, Global Affairs
경영지원Agent Post-Training, API & Power Users
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Computer Use Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Personality
AI·머신러닝, 연구·R&DAgent Post-Training, Connectors Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Frontier Evals and Environments Research
연구·R&D, AI·머신러닝, 개발Agent Post-Training, Artifacts Research
AI·머신러닝, 연구·R&DB2B Marketing Lead, Korea
마케팅