notaai

R&D

정규직(풀타임)대면혼합근무AI·머신러닝하드웨어·임베디드개발연구·R&D

AI 요약

Nota(플랫폼명: NetsPresso)에서 온디바이스 NPU 환경에 Gen AI 모델을 탑재·최적화하는 포지션입니다. 고객 모델의 구조와 하드웨어 제약을 분석해 NPIR 기반 모델 변환, Quantization, Graph Optimization, Compression 등을 적용하고 NPU 백엔드 컴파일러를 통해 배포 및 성능 검증을 수행합니다. 현장 고객 대응 및 기술 커뮤니케이션, 최적화 워크플로우 자동화와 제품 개선 기여가 주요 역할입니다.

주요 업무

고객 모델 최적화 프로젝트 수행; Gen AI 모델 구조 분석 및 최적화 전략 수립; NetsPresso 스택을 활용한 모델 변환·최적화·검증; 정확도·지연시간·메모리 등 trade-off 분석 및 고객 요구에 따른 최적화; 타겟 하드웨어(NPU/GPU/CPU) 대응 및 NPU 백엔드 컴파일러를 이용한 배포·성능 검증; 모델 변환 이슈 분석·해결; 현장 요구사항·기술 이슈를 제품 개선에 반영; 반복적 워크플로우를 자동화 도구·스크립트·내부 라이브러리로 자산화.

자격 요건

관련 전공 학위(컴퓨터공학, 전자공학 등), 관련 분야 3년 이상 경력, PyTorch/ONNX/TFLite 등 딥러닝 프레임워크를 이용한 모델 개발·변환·추론 경험, Quantization·Graph Optimization·Compression 등 최적화 기술 적용 경험, Linux·Git/GitHub·Docker 사용 경험, 고객/외부 파트너와의 기술 커뮤니케이션 가능, 국내외 출장 가능자. 우대: LLM/VLM 대상 최적화 경험, On-device NPU 변환·배포 경험, ExecuTorch·TensorRT·TFLite·OpenVINO·AIMET 등 활용 경험, 컴파일러/IR(MLIR/ONNX/TVM 등) 및 그래프 최적화 패스 이해, 하드웨어 벤더/AI 솔루션사에서의 FAE/Solutions Engineer 경험.

기술 스택

NetsPressoNPIRPyTorchONNXTFLiteQuantizationGraph OptimizationModel CompressionExecuTorchTensorRTOpenVINOAIMETMLIRTVMLinuxGit/GitHubDockerNPU 백엔드 컴파일러

AI 점수 80tool

지원하기

R&D

AI 요약

주요 업무

자격 요건

기술 스택

notaai의 다른 공고

알림