Jobs
sionicai 로고

sionicai

Research

정규직(풀타임)원격근무AI·머신러닝연구·R&D

AI 요약

Sionic AI(사이오닉에이아이)는 기업용 AI Agent 플랫폼 'Storm'의 멀티모달 시각 이해(VLM) 사후학습 및 정렬 연구를 담당할 VLM Post-training Researcher(멀티모달 AI 연구원)를 채용합니다. 문서 파싱·시각 추론·Agentic VLM 설계, SFT/RLHF/GRPO 기반 정렬, 합성 데이터 및 데이터 파이프라인 설계, 대규모 GPU 분산 학습 운영, 평가 체계 개발 및 학술 공개 등을 수행합니다.

주요 업무

VLM/LMM 사후학습 및 정렬(슈퍼바이즈드 파인튜닝, RLHF/GRPO 등); RL을 활용한 VLM 태스크(문서 파싱, 시각 추론, 차트 이해 등) 적용; 표·그래프·도면·차트 등 복잡한 문서 구조 이해를 위한 도메인 특화 VLM 모델 개발; 다국어 멀티모달 LMM 성능 개선; OCR-free 문서 이해, layout-aware 추론, multi-page 문서 이해 연구 및 적용; Agentic VLM 파이프라인 설계(시각적 탐색, 도구 활용, 반복 추론); Chain-of-Thought 기반 Visual Reasoning 강화; 평가 체계 및 내부 벤치마크 설계·구축; 멀티모달 데이터 수집·필터링 파이프라인 설계 및 합성 데이터 생성·전처리; 최신 GPU 클러스터(대규모 분산 학습) 설계·운영; 연구 결과의 국제 학회 논문/오픈소스/특허 공유 및 최신 논문 재현.

자격 요건

석사 학위 이상 보유자; 탑티어 국제 학회에 1저자 논문 출판 경험; VLM/LMM 또는 LLM의 사후학습(Post-training) 및 정렬(Alignment) 연구·적용 경험 (SFT, RLHF, DPO, GRPO 등); 적극적으로 실험하는 연구 성향. 우대: VLM/LMM post-training으로 벤치마크 SOTA 달성 경험, 프리트레이닝/지속학습 경험, Document Understanding/Visual Reasoning/Agentic VLM/Visual Grounding/GUI Agent 관련 연구 경험, 대규모 데이터·모델 파이프라인 개발 경험, 합성 데이터 생성 경험, 효율적 추론 관련 연구 경험, Kaggle/대회 상위권 입상 경험.

기술 스택

VLM (Vision-Language Model)LMM (Large Multimodal Model)LLMSupervised Fine-Tuning (SFT)RLHF / GRPO / DPOReinforcement Learning (RL)RAG (Retrieval-Augmented Generation)Embedding 모델Multimodal / Visual ReasoningVisual GroundingChain-of-ThoughtOCR-free document understandingMulti-page document processingAgentic VLM / Agent 파이프라인Synthetic Data GenerationData/Model 파이프라인 설계분산 학습 / GPU 클러스터 (NVIDIA B200/B300 등)평가 체계 설계 / 벤치마크
AI 점수 95core

sionicai의 다른 공고

알림

알림이 없습니다