
uber
Senior ML Engineer, Computer Vision - Applied AI
AI·머신러닝연구·R&D
AI 요약
Uber Applied AI의 Senior Machine Learning Engineer — Computer Vision 포지션으로, 문서 이해·전사(transcription) 시스템을 위한 최첨단 비전/멀티모달 모델을 개발·배포합니다. 신분증, 영수증, 인보이스, 메뉴 등 다양한 문서를 대규모 생산 환경에서 처리하며, 모델 개발부터 운영·모니터링·최적화까지 전 주기를 담당합니다.
주요 업무
최첨단 computer vision 및 multimodal 모델 개발·학습. Identity documents, receipts, invoices, restaurant menus 등의 문서를 transcribe하고 이해하는 VLM/파운데이션 모델 적용. 온디바이스와 서버사이드 모델을 결합한 확장 가능한 vision system 설계. ML Infrastructure 및 Earner/Product 팀과 협업하여 데이터 요구사항, 라벨링 전략, 평가 지표, 통합 경로 정의. 모델 개발부터 실험, 프로덕션 배포, 모니터링, 스케일까지 전 주기 소유. transcription accuracy, document understanding performance, robustness를 측정하는 평가 프레임워크 구축. model compression, quantization, hardware-aware optimization을 통한 성능 최적화. 프로덕션 데이터와 실패 사례 분석을 통해 품질과 안정성 지속 개선.
자격 요건
필수: 5년 이상 머신러닝 실무 경험, 특히 computer vision 또는 multimodal systems 중심 경험. deep learning fundamentals에 대한 탄탄한 이해(학습, 평가, 디버깅). Python 숙련. PyTorch, JAX, TensorFlow(Lite) 등 현대 ML 프레임워크 사용 능력. ML 모델의 프로덕션 배포 경험 및 실제 데이터셋 다룬 경험. 강한 문제 해결 능력과 제품 중심의 cross-functional 협업 역량. 우대: robotics, computer vision, embodied AI 경험. 대규모 vision/multimodal 모델 학습·최적화 경험(VLMs, foundation models). object detection, segmentation, OCR, document layout understanding, point cloud processing 이해. edge/mobile 배포 경험 및 quantization, pruning, TensorFlow Lite, ONNX 등 성능 최적화 경험. 대규모 문서/비주얼 데이터셋 큐레이션·증강 경험. distributed training systems 및 scalable ML infrastructure 이해.
기술 스택
PythonPyTorchJAXTensorFlow LiteGeminiVision-Language ModelsVLMsOCRONNXquantizationpruning
uber의 다른 공고
Staff Software Engineer – AV Labs
개발, AI·머신러닝, 연구·R&DStaff Frontend Engineer, Core Services Eng
개발Software Engineer II
개발Software Engineer I
개발, 인프라·DevOpsStaff iOS Engineer, Core Services Eng
개발, 제품·기획·디자인Staff Machine Learning Engineer, Core Services Eng (GenAI)
AI·머신러닝, 연구·R&DStaff Program Manager, Tech
경영지원Staff Technical Program Manager
경영지원, 보안, 인프라·DevOps