Google이 SRE(Site Reliability Engineer)라는 직군을 만든 만큼 SRE에 대한 홍보(?)도 열심히 하고 있습니다. 언제부터 있었는지 잘 모르겠지만 Google의 SRE 사이트에 속담을 모아놓은 페이지가 생겼습니다.


이는 모든 SRE가 가져야 하는 일반적인 신념을 정리한 것입니다.


- 두 시스템이 동작하기 위해 서로 동의해야 한다면 언젠가는 필연적으로 의견이 맞지 않을 것이다.

- 차이는 줄이고 평균값은 높인다.

- 백업은 마지막 복원에만 유효하다.

- SLO가 없다면 노가다 운영 작업이 업무다.

- 희망은 전략이 아니다.

- 서비스 성장에 따라 유지보수를 비선형적으로 확장해라.

- 모든 인시던트가 새롭기를 바란다.


대부분의 내용에 동의하지만 많은 고민을 했던 "서비스 성장에 따라 유지보수를 비선형적으로 확장해라."와 "희망은 전략이 아니다."가 가장 많이 공감이 가고 "모든 인시던트가 새롭기를 바란다."는 잘 하고 있지 못해서 더 많은 생각이 들게 되네요.


"SLO가 없다면 노가다 운영 작업이 업무다."는 SLO를 요즘 많이 고민하고 있지만 아직 잘 정리되고 있진 않아서 이해가 될듯 말듯 한 상태입니다.


https://sre.google/prodverbs/

Prodverbs, Pithy Insights From Running Production Services

sre.google

Prodverbs, Pithy Insights From Running Production Services

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 4월 20일 오전 12:57

 • 

저장 10조회 2,642

댓글 0