
glean
Software Engineer, Agents Runtime
AI 요약
Glean은 AI 기반 지식 관리 플랫폼으로, 조직 내 정보 검색, 정리, 공유를 돕습니다. Google Drive, Slack 등과 연동하여 생산성과 협업을 증진합니다. 본 채용은 Glean의 AI 에이전트 및 어시스턴트 경험을 지원하는 저지연, 안정적이고 안전한 기반을 구축하는 Agents Runtime 팀에서 진행됩니다. 분산 시스템, 프로덕션 관찰 가능성, ML 인프라 통합을 통해 즉각적이고 정확하며 신뢰할 수 있는 경험을 제공하는 것을 목표로 합니다.
주요 업무
AI 에이전트 및 어시스턴트 경험을 지원하는 저지연, 안정적이고 안전한 기반 구축. 멀티턴 오케스트레이션, 도구 호출, 모델 라우팅, 메모리, 스트리밍, 안전과 같은 핵심 런타임 서비스 설계 및 운영. 분산 시스템, 프로덕션 관찰 가능성, ML 인프라 통합. 아키텍처 및 설계부터 프로덕션 출시 및 지속적인 안정성까지 런타임 문제 엔드투엔드 책임. 세션 수명 주기, 스트리밍 응답, 구조화된 도구 실행, 메모리/상태, 정책/가드레일을 위한 핵심 서비스 구축 및 발전. 성능, 정확성, 비용 설계 (지연 시간 감소, 토큰/도구 예산 최적화). LLM 제공업체 및 내부 평가 프레임워크와 통합. 장애 격리, 재시도, 타임아웃, 서킷 브레이킹, 백프레셔, 점진적 성능 저하를 통한 플랫폼 강화. 딥 옵저버빌리티 계측 및 고가용성/온콜 우수성을 위한 플레이북/SLO 생성. 제품, 품질, 애플리케이션 팀과 협력하여 로드맵 투자 우선순위화.
자격 요건
3년 이상의 프로덕션 분산 시스템 또는 클라우드 네이티브 애플리케이션 구축 경험, 컴퓨터 과학 또는 관련 분야 학사 학위 또는 이에 상응하는 실무 경험, Python, Go, Java 또는 C++ 중 하나 이상에 대한 강력한 코딩 능력, 제품 마인드, 소유권 중심의 태도, Kubernetes 및 주요 클라우드(GCP, AWS, Azure) 운영 경험, 이벤트/스트리밍 시스템, 캐싱, 저지연 경로용 데이터 저장소에 대한 친숙함, LLM/에이전트 빌딩 블록에 대한 실질적인 이해, 강력한 관찰 가능성 및 디버깅 기술. 우대 사항: 정책/가드레일, 멀티테넌트 격리, 속도 제한, 동시성 제어, 비용 최적화 경험.
기술 스택
PythonGoJavaC++KubernetesGCPAWSAzurePub/SubKafkaRedisOpenAIAnthropicGoogle GeminiOpenTelemetry