openai

RE/RS, Data Understanding - Foundations

연구·R&DAI·머신러닝데이터

AI 요약

OpenAI의 Data Understanding 팀에서 대규모 사전학습 데이터의 품질 개선과 정제, 양자화 표현 설계를 연구할 연구자를 채용합니다. 데이터 합성, VQ 표현, 필터링·중복제거·토큰화 등 데이터 파이프라인을 다루며, 데이터 선택/결합/변환의 효과를 실험적으로 검증해 모델 성능과 행동에 미치는 영향을 규명하는 역할입니다.

주요 업무

대규모 프리트레이닝 데이터의 품질 이해 및 개선 연구. 데이터 선택, 결합, 변환을 위한 새로운 방법 개발. 모델 성능을 높이는 데이터셋 설계. 데이터 선택/개입이 모델 학습 및 다운스트림 행동에 미치는 영향을 검증하는 엄밀한 실험 수행. 연구 성과를 확장 가능한 데이터 처리 파이프라인으로 전환. 데이터 합성, VQ representation 구축, 필터링, 중복 제거, 품질 관리, 토큰화 수행.

자격 요건

필수: 새로운 또는 개선된 ML 아이디어를 출판물, 프로젝트, 응용 연구 등을 통해 입증한 강한 실적. 적절한 문제를 선정하고 장기 연구를 주도해 임팩트까지 이끄는 역량. OpenAI의 실증적이고 협업적인 연구 방식에 대한 높은 관심. 우대: AI의 영향(프라이버시, provenance, 데이터 품질)에 대한 사려 깊은 관점. 고성능 딥러닝 또는 대규모 데이터 처리 시스템 구축 경험.

기술 스택

VQtokenizationdeep learningdata processing pipelines

AI 점수 98core

지원하기

RE/RS, Data Understanding - Foundations

AI 요약

주요 업무

자격 요건

기술 스택

openai의 다른 공고

알림