
anthropic
TPU Kernel Engineer신규
개발AI·머신러닝하드웨어·임베디드연구·R&D
AI 요약
Anthropic에서 TPU 커널 엔지니어를 채용합니다. 대규모 ML 시스템의 성능 최적화와 TPU용 커널 설계 및 구현을 담당하며, 연구팀과 협력하여 모델 변화가 성능에 미치는 영향을 분석하고 LLM의 추론 성능을 극대화하는 역할을 수행합니다.
주요 업무
연구/학습/추론 전반의 ML 시스템 성능 이슈 해결, TPU 커널 설계 및 최적화, 연구원에게 모델 변경에 따른 성능 영향 피드백 제공, LLM을 위한 저지연/고처리량 샘플링 구현, 저정밀도 추론을 위한 모델 최적화, 시스템 성능 정량 모델 구축, 맞춤형 집합 통신 알고리즘 설계 및 구현.
자격 요건
관련 분야 학사 학위 이상 또는 그에 준하는 경력, TPU/GPU 또는 기타 가속기를 위한 ML 시스템 최적화 경험, 대규모 ML 시스템 및 커널 설계/구현 경험, 컴퓨터 아키텍처에 대한 깊은 이해, ML 프레임워크 내부 구조 및 트랜스포머 기반 언어 모델링 지식, 어셈블리 수준의 디버깅 능력.
기술 스택
TPUGPUML FrameworksTransformersAssemblyComputer ArchitectureLow-precision inferenceLLM