Jobs
toss 로고

toss

Site Reliability Engineer

인프라·DevOps개발

AI 요약

토스의 Site Reliability Engineer(SRE) 채용공고로, 대규모 트래픽 환경에서 서비스의 안정성(가용성·확장성·응답지연) 확보를 위해 모니터링 시스템 구축·개선, 장애 대응 및 재발 방지 설계, 성능 테스트 환경 구축 및 병목 해결, Kubernetes/네트워크/오픈소스 인프라 개선 등을 수행하는 역할입니다. Java/Kotlin 및 Spring 계열 개발 경험과 리눅스·네트워크에 대한 깊은 이해, MSA·Kubernetes·Istio·Redis·Kafka·ELK 등 인프라 운영 경험을 우대합니다.

주요 업무

서비스의 Stability, Scalability, Availability, Latency 지속 개선; 대규모 트래픽 환경을 위한 모니터링 시스템 개선; 장애 발생 시 원인 분석 및 복구, 재발 방지를 위한 설계·해법 마련; 성능 테스트 환경 구축·수행 및 개선 포인트 도출; 네트워크·애플리케이션·오픈소스·Kubernetes 단일 장애 지점 탐색 및 개선; 오픈소스 제품 실험·도입 검토 및 필요시 서버/웹 직접 구현.

자격 요건

Java/Kotlin, Spring Framework 관련 개발 경험; 성능 테스트를 통한 가용성 확인 및 병목 해결 능력; 리눅스 및 네트워크 시스템에 대한 깊은 이해; MSA, Kubernetes, Istio, Redis, Kafka, ELK 기반 인프라 운영 경험; Mission-Critical 서비스 운영에 대한 책임감과 문제 해결 경험; 새로운 기술 적응 및 지속적 성장 의지.

기술 스택

KotlinJavaGradleNettySpring MvcSpring WebfluxSpring BootSpring Cloud GatewaySpring Cloud ConfigJPA/HibernateMySQLMongoDBHadoopRedisMemcachedZookeeperKubernetesIstioHaproxyNginxGoCDArgoCDConsulVaultGitDockerSpinnakerJenkinsCephHarborKafkaELKPrometheusThanosinfluxDataGrafana
AI 점수 30none

toss의 다른 공고

알림

알림이 없습니다