
amazonus
Software Development Engineer - Testing Infrastructure & Performance, Trainium/Neuron, Annapurna Labs
개발데이터인프라·DevOps품질·테스트연구·R&D
AI 요약
AWS Annapurna ML의 Neuron 팀에서 Trainium/Inferentia용 소프트웨어 릴리즈 품질과 성능을 검증하는 Software Development Engineer를 채용합니다. Python 기반 자동화 테스트 인프라, 성능 데이터 파이프라인, 대시보드, 알림/트리아지 도구를 구축해 ML 워크로드의 회귀를 조기에 탐지하고 릴리즈 준비도를 높이는 역할입니다.
주요 업무
Python 기반 자동화 테스트 인프라 설계·구축·운영, 분산 테스트 결과와 성능 벤치마크를 수집·처리하는 데이터 파이프라인 구축, 성능 대시보드 개발, 모델 컴파일/실행/성능을 검증하는 통합 테스트 프레임워크 유지보수, 성능 회귀를 조기 탐지하는 알림 및 트리아지 도구 개발, Compiler/Runtime/Training 팀과 벤치마크·SLA·품질 게이트 정의, 새로운 모델 아키텍처·학습 워크플로·하드웨어 세대 지원 확장.
자격 요건
필수: 컴퓨터공학 또는 동등 학위 이상, Python을 생산/인프라 환경에서 사용한 경험, ETL/배치·스트리밍·데이터웨어하우징 등 데이터 파이프라인 구축 경험, 테스트 프레임워크 및 대규모 테스트 자동화 경험. 우대: 컴퓨터공학/머신러닝/엔지니어링 관련 석사 또는 MXNet, TensorFlow, Caffe, PyTorch 등 딥러닝 툴킷 경험, Grafana/QuickSight/CloudWatch 등 성능 대시보드·관측 도구 경험, 분산 시스템 테스트 또는 hardware-in-the-loop 테스트 인프라 경험, AWS 서비스(S3, DynamoDB, Lambda, Step Functions, ECS) 경험, 통계적 회귀 탐지/성능 분석 경험.
기술 스택
PythonETLbatch processingstreaming processingdata warehousingGrafanaQuickSightCloudWatchMXNetTensorFlowCaffePyTorchAWS S3DynamoDBLambdaStep FunctionsECS
amazonus의 다른 공고
Software Development Engineer II, AWS DynamoDB Web Service
Software Development Manager, Amazon Connect Customer (AWS)
Software Engineer II, Leo Regulus
개발, AI·머신러닝Software Development Engineer, Amazon Software Builder Experience (ASBX) - Agentic Conversations
개발, AI·머신러닝, 인프라·DevOpsSoftware Development Engineer, Aurora DSQL
개발, 인프라·DevOpsSr. Software Dev Engineer, Amazon Security - Vulnerability Management Engineering
개발, 보안Software Engineer II, Leo Regulus
개발, AI·머신러닝Software Development Engineer
개발, AI·머신러닝, 하드웨어·임베디드, 인프라·DevOps, 보안