
rebellions
Forward Deployed Engineering
AI·머신러닝인프라·DevOps영업
AI 요약
Rebellions에서 고객 대상 기술 연락 담당자(솔루션/필드 애플리케이션 엔지니어)를 채용합니다. AI 추론(inference) 솔루션의 도입 촉진을 위해 제품 데모·기술 프레젠테이션을 수행하고, 고가용성 및 페일오버를 고려한 프로덕션 수준의 AI 추론 인프라 설계·배포·최적화를 담당합니다. 성능(처리량, 지연, 에너지 효율) 평가 및 병목 분석, 워크로드 스케줄링·라우팅 최적화, 기술 문서 작성 및 내부 엔지니어링과의 협업을 통해 제품 방향에 기여하는 역할입니다.
주요 업무
고객과의 전체 협업 라이프사이클에서 주요 기술 연락창구 역할 수행, 제품 데모·기술 프레젠테이션을 통한 Rebellions AI 솔루션 도입 촉진, 고가용성·페일오버를 고려한 프로덕션급 AI 추론 인프라 설계, 처리량·지연·에너지 효율 등 엔드투엔드 성능 평가 및 시스템 병목 식별, 워크로드 스케줄링·라우팅 전략 최적화, 고객·파트너용 기술 문서·베스트프랙티스·통합 가이드 작성, 내부 소프트웨어·하드웨어 팀과 협업하여 고객 피드백 전달 및 제품/비즈니스 방향 제시.
자격 요건
학사(컴퓨터공학, 전기공학 또는 관련 전공) 이상, 문제 해결 능력 및 분석적 접근, AI 추론 및 서빙 프레임워크(vLLM, TensorRT-LLM)에 대한 깊은 이해, PyTorch 실무 지식, Python 및 Kubernetes 기반 환경에서 AI 추론 워크로드를 프로덕션에 배포·문제해결한 경험, 강한 커뮤니케이션 및 협업 능력. 이상적 요건: AI/ML 시스템 배포·고객 대응·시스템 레벨 성능 최적화 관련 5년 이상 경력, 엔드투엔드 AI 추론 시스템 설계·배포·벤치마크 경험, NPU/GPU/엣지 AI 칩 등 하드웨어 가속 이해, 양자화(quantization) 및 파이프라이닝 등 모델 최적화 경험, Field Application Engineer/솔루션·세일즈 엔지니어 경험, 기술 문서·블로그·백서 작성 경험.
기술 스택
vLLMTensorRT-LLMPyTorchPythonKubernetesNPUGPUedge AI chipsquantizationpipeliningAI inference serving