
speak
Machine Learning Engineer, Assessments
정규직(풀타임)대면혼합근무AI·머신러닝데이터연구·R&D
AI 요약
언어 학습 앱 Speak에서 평가(Assessments)용 ML 시스템을 설계·구현·운영할 ML 엔지니어 채용. 말하기 능력 평가를 위한 채점·피드백 모델과 파이프라인 구축, 검증·모니터링, 데이터·라벨링 전략 수립을 통해 평가 플랫폼을 제작하고 제품 전반에 걸쳐 적용하는 역할입니다.
주요 업무
평가용 ML 시스템의 end-to-end 개발·배포·운영; 채점 모델 및 파이프라인 구축(특징 추출 → 모델 학습 → 추론 → 피드백 생성); 모니터링·회귀 테스트·정확도 유지 및 반복 개선; 평가의 평가지표·테스트셋·오프라인/온라인 분석 등 평가·검증 프레임워크 구현; 평가 요건을 측정 가능한 수용기준과 가드레일로 번역; Assessment Design Lead(콘텐츠/러닝디자인)와 긴밀히 협업해 평가 플랫폼 전략 공동 개발; 제품별 단기 배포 주도 및 총괄; 총괄적(요약형) 말하기 평가(summative) 프로덕션화 및 개선; 형성평가(formative) 프로토타입 설계·검증(주별/월별 개선 측정); 데이터 및 라벨링 전략 지원 및 라벨 수집·분석 파이프라인 구축/개선.
자격 요건
말하기 능력 평가 도메인 전문성(언어학, 응용언어학, 교육학 또는 동등 경험); 평가·검증(evaluation & validation) 설계 및 운영 경험; 자동화된 숙련도 평가 시스템 구축 관련 실무 4년 이상(또는 동등 수준 경험); 모델을 프로덕션에 배포한 경험(신뢰성·모니터링·반복 개선 포함); 통계·Python·PyTorch 등 일반적 ML/분석 역량; 비기술 파트너(Content/LD, PM 등)와의 협업 및 커뮤니케이션 능력. 우대: 음성/오디오 ML 경험, 심리측정학(신뢰도/타당도, 보정) 지식.
기술 스택
PythonPyTorch모델 학습(ML training)특징(Feature) 추출모델 배포/추론(Serving/Inference)모니터링 및 회귀 테스트평가/검증 프레임워크통계(Statistics)음성/오디오 ML데이터 라벨링 및 파이프라인심리측정학(우대)