dnotitia

[전문연구요원] Optimization Engineer

정규직(풀타임)대면혼합근무개발AI·머신러닝하드웨어·임베디드연구·R&D

AI 요약

디노티시아에서 LLM 추론 성능을 개선하는 Optimization Engineer(최적화 엔지니어)를 채용합니다. vLLM 등 오픈소스 추론 엔진 구조 분석 및 커스터마이징, 정량적 프로파일링을 통한 병목 해소, Quantization·Pruning 등 모델 경량화, CPU–GPU 데이터 이동 및 메모리 계층 최적화 등 시스템 전반의 추론 최적화를 설계·구현하는 역할입니다. 최신 논문 적용과 하드웨어 특화 최적화 경험을 중시합니다.

주요 업무

LLM 추론 엔진 설계 및 개발; 오픈소스 기반 추론 프레임워크(vLLM 등) 구조 분석 및 커스터마이징; LLM 워크로드 정량적 분석 및 병목 프로파일링; Quantization·Pruning을 활용한 추론 경량화 설계·구현; 최신 논문 및 공개 구현체 기반 최적화 기법 습득·적용; CPU-GPU 데이터 이동 최소화 및 메모리 계층 활용 등 시스템/하드웨어 맞춤 추론 경로 최적화.

자격 요건

학사 이상 관련 전공 또는 유관 업무 3년 이상; C++ 또는 Python 기반 개발 능력; Transformer 구조 및 LLM 아키텍처 기초 이해; Quantization 또는 Pruning 기법 이론 및 실습 경험; Git 및 Linux 환경 기반 개발 및 디버깅 경험.

기술 스택

C++PythonvLLM (오픈소스 추론 프레임워크)Transformer / LLM 아키텍처QuantizationPruningCUDAGPU 최적화(커널 개발)PyTorch (TorchScript, TorchDispatch, TorchDynamo)GitLinuxCPU-GPU 협업/오프로드 전략컴퓨터 아키텍처/메모리 계층(HBM, L2, shared memory)

AI 점수 95core

지원하기

[전문연구요원] Optimization Engineer

AI 요약

주요 업무

자격 요건

기술 스택

dnotitia의 다른 공고

알림