
moreh
경력 0~4년
정규직(풀타임)대면혼합근무AI·머신러닝연구·R&D개발
AI 요약
Moreh에서 대규모 이기종 GPU/NPU 클러스터 기반 AI 추론 시스템을 연구·개발하는 Research Engineer 채용입니다. 최신 LLM, AI Agent, 추론 최적화 기술을 분석·검증하고 실제 서비스에 적용하는 역할입니다.
주요 업무
오픈소스 모델 기반 AI Agent 및 Coding Agent 시스템 연구·개발, Agent Workflow 설계 및 성능 평가 체계 구축, 최신 Agent 기술 및 오픈소스 프로젝트 분석·적용, Agent Serving 및 Multi-Agent System 연구를 수행합니다. 또한 KV Cache Compression, Speculative Decoding, Semantic Routing, Prefix Caching 등 추론 최적화 기술 연구, LLM 추론 워크로드 분석 및 성능 모델링, vLLM/SGLang 등 프레임워크 분석·개선, 품질·비용·지연시간 trade-off 분석, 대규모 GPU/NPU 클러스터 추론 시스템 설계·최적화, 최신 AI 시스템 논문 구현 및 검증을 담당합니다.
자격 요건
컴퓨터공학 또는 관련 분야 석사 이상, 혹은 이에 준하는 연구·개발 경험이 필요합니다. Python 기반 소프트웨어 개발 경험, AI 시스템 소프트웨어 또는 분산 시스템 이해, LLM 및 생성형 AI 이해가 요구됩니다. 새로운 기술을 빠르게 학습·실험하고, 문제 정의부터 가설 수립·실험 설계·결과 분석을 주도할 수 있어야 하며, 팀워크와 협업 역량이 필요합니다.
기술 스택
PythonLLMAI AgentvLLMSGLangCUDAROCmTritonOpenCLTileLangTensorRT-LLMGPUNPU