
stradvision
Sr. Embedded AI Engineer
정규직(풀타임)대면근무AI·머신러닝하드웨어·임베디드연구·R&D
AI 요약
STRADVISION 서울 오피스에서 임베디드 환경(자동차 SoC)에 Transformer 기반 멀티카메라 및 E2E 자율주행/ADAS 모델을 양산화하기 위한 임베디드 AI 엔지니어를 채용합니다. INT8 PTQ/QAT 양자화, 모델 포팅, 런타임/가속기 최적화, HW-aware 모델 재설계 가이드 제공 및 멀티-SoC(RENESAS, TI, Qualcomm, NVIDIA) 대상 배포 파이프라인 구축·성능 인프라 운영이 주요 업무입니다.
주요 업무
1) 멀티카메라 Transformer 인식 모델의 INT8 PTQ/QAT 양자화, 캘리브레이션 파이프라인, 정확도 회복(혼합정밀도·선택적 양자화 등) 및 PyTorch→ONNX→타깃 런타임 변환/패키징 및 변환 이슈 해결. 2) SoC 제약에 맞춘 HW-aware 모델 재설계 피드백 제공(어텐션/FFN 비용·활성화 메모리 저감, 토큰/BEV 그리드 관리, 비지원 연산 대체 등) 및 디자인 규칙 문서화. 3) Renesas(DRP-AI), NVIDIA(Orin/Thor, TensorRT/DLA), Qualcomm(QNN/SDK), TI(TIDL) 등 다중 SoC의 NPU/GPU/DLA/DSP 백엔드에서 레이턴시·스루풋·메모리 최적화 및 검증. 4) 반복 가능한 프로파일링·회귀 허니스 구축, 성능 대시보드·릴리스 아티팩트 발행, 플랫폼·펌웨어 팀과 협업해 런타임 통합·메모리·IO 병목 해소.
자격 요건
석사 이상 + 3년 또는 박사 + 1년(또는 동등경력), 총 3–6년 이상 딥러닝 실무 경험(비전/ML/로보틱스). 임베디드/엣지(자동차/로보틱스/컨수머)로 DL 모델을 배포한 실무 경험, INT8 양자화(PTQ/QAT) 및 성능 튜닝 경험. Python 및 C/C++ 숙련, 모델 디버깅·프로파일링·배포 자동화 능력. TensorRT, ONNX Runtime, QNN, TIDL, DRP-AI, TVM 등 적어도 하나 이상의 배포 스택 실무 지식. Transformer 기반 비전 모델 최적화 경험(어텐션/활성화 메모리/혼합정밀도/연산 제약).
기술 스택
PyTorchONNXTensorRTONNX RuntimeQNN / Qualcomm QNN SDKTIDLDRP-AITVM / 컴파일러(Mlir/LLVM)PythonC/C++INT8 양자화(PTQ, QAT)NVIDIA Orin/ThorRenesas (DRP-AI)TI (Jacinto/TDA4)퀄컴(SoC)NPU/GPU/DLA/DSP 최적화프로파일링·성능 회귀 인프라