Jobs
character 로고

character

Principal Research Engineer, Post-Training

AI·머신러닝연구·R&D개발인프라·DevOps

AI 요약

Character.AI의 Post-Training 팀에서 대규모 LLM의 중간/후속 학습과 정렬(alignment), 평가, 서빙 시스템을 이끄는 Principal Research Engineer를 채용합니다. 연구와 프로덕션을 연결해 모델 성능·안전성·사용자 몰입도를 높이는 기술 리더십 역할이며, RL·Preference Optimization·SFT·분산학습·GPU 최적화 경험이 핵심입니다.

주요 업무

mid- 및 post-training 시스템의 기술 로드맵 정의 및 추진, 연구 혁신과 프로덕션 안정성/확장성의 균형 조율. 연구원과 엔지니어 멘토링 및 팀 성장 지원. alignment algorithms, optimization techniques, training objectives 개발로 모델 성능·데이터 효율·안전성·사용자 참여도 개선. reinforcement learning, preference optimization, supervised fine-tuning, emerging alignment approaches 연구 주도. 실제 모델 성능을 측정하는 평가 프레임워크와 quality signal 구축. 대규모 생성모델의 training/inference 시스템 설계, 데이터 파이프라인 아키텍처링, distributed training/GPU utilization/serving efficiency 최적화. experimentation platform, data quality system, model observability 개선.

자격 요건

필수: Computer Science, Machine Learning, AI 또는 관련 분야 PhD, 혹은 동등한 산업 경력. 머신러닝/AI 연구 또는 대규모 분산 시스템에서 기술 프로젝트·팀 리딩 경험. transformers, reinforcement learning, alignment methods, large language models에 대한 깊은 이해. 프로덕션 환경에서 영향력 있는 연구 또는 applied ML 시스템을 낸 경험. 생산 수준의 ML 시스템/인프라 설계·구축·운영 역량. GPU 기반 대규모 모델 training/serving/debugging/optimization 경험. LLM training, mid-training, post-training 팀 리딩 경험. product experimentation, online evaluation, A/B testing framework 경험. 깨끗하고 유지보수 가능한 확장형 코드 작성 능력. 팀 간 기술 방향에 영향을 줄 수 있는 뛰어난 커뮤니케이션 및 리더십. 우대: Mistral, Qwen 같은 오픈소스 모델을 직접 mid/post-training으로 persona, creative writing, role-playing 용도에 맞게 튜닝한 경험. Kubernetes, Docker 등 cloud-native ML infrastructure 경험. 주요 머신러닝 학회 논문 또는 AI 커뮤니티 기여.

기술 스택

Pythontransformersreinforcement learninglarge language modelsMistralQwensupervised fine-tuningKubernetesDockerGPUdistributed trainingA/B testing
AI 점수 97core

character의 다른 공고

알림

알림이 없습니다