dnotitia

Optimization Engineer

정규직(풀타임)대면혼합근무개발AI·머신러닝하드웨어·임베디드연구·R&D

AI 요약

디노티시아의 LLM 추론 성능 개선을 담당하는 Optimization Engineer 채용공고입니다. vLLM 등 오픈소스 추론 엔진 분석·커스터마이징, 정량적 프로파일링을 통한 병목 해소, Quantization·Pruning 등 모델 경량화와 CPU-GPU 데이터 이동·메모리 계층 최적화 등 시스템 전반의 성능 최적화를 설계·구현하는 역할입니다. 신입(학사 이상) 및 경력(유관 업무 3년 이상)을 모집하며 C++/Python, Transformer 및 LLM 구조 이해, Git·Linux 경험을 요구합니다.

주요 업무

LLM 추론 엔진 설계·개발, 오픈소스 기반 추론 프레임워크(vLLM 등) 구조 분석 및 커스터마이징, LLM 워크로드 정량적 분석 및 병목 프로파일링, Quantization·Pruning 기반 추론 경량화 설계·구현, 최신 논문·구현체 기반 최적화 기법 적용, CPU-GPU 데이터 이동 최소화 및 메모리 계층 활용 등 시스템/하드웨어 맞춤 최적화

자격 요건

신입: 유관 전공 학사 이상. 경력: 유관 업무 3년 이상. C++ 또는 Python 기반 개발 능력. Transformer 구조 및 LLM 아키텍처에 대한 기초 이해. Quantization 또는 Pruning 이론 및 실습 경험. Git, Linux 환경 기반 개발 및 디버깅 경험.

기술 스택

C++PythonvLLMLLMTransformerQuantizationPruningCUDAGPU 최적화PyTorchTorchScriptTorchDispatchTorchDynamoLinuxGit컴퓨터 아키텍처Heterogeneous Computing메모리 계층(HBM, L2 cache)

AI 점수 92core

지원하기

Optimization Engineer

AI 요약

주요 업무

자격 요건

기술 스택

dnotitia의 다른 공고

알림