여러해를 SRE로 일을 하면서도 SRE에대한 개념이 모호했는데 새로운 회사에서 아무것도 없는 상태에서 SRE를 정립하려하니 조금 더 개념이 명확해 진 것 같다. 얼마전까지만 해도 테크톡이고 컨퍼런스고 이런게 뭐가 중요하냐 라고 생각하면서 한귀로 듣고 한귀로 흘렸는데, 내가 직접 구체화 시키고 프로세스를 만들려다보니 남들이 어떻게 했는가를 쳐다보는게 정말 도움이 많이 되기 시작했다.
SRE는 결국은 운영을 하는 사람들이다. 그럼 DevOps랑 SRE가 뭐가 다르냐? SRE는 DevOps라는 추상적인 개념을 구체화 시킨 방법론 같은거라고 보면 된다. 결국은 비슷한 말이라는 소리. SRE의 핵심은 SLO와 SLI를 구현하는데에서 시작한다. 그리고 이것을 지키기위해서 어떤 프로세스를 만들고 어떤 부분을 자동화할 것인지를 고민하는 직책이다.
그러다보니 어쩔수 없이 여기저기서 예고없이 튀어나오는 장애들과 친할 수 밖에 없고 어떻게하면 장애발생을 사전에 진단할 수 있을지, 어떻게하면 더 빠르고 안전하게 복구를 할 수 있는지 그리고 어떻게 하면 안전하게 배포를 진행할 수 있는지 등에 관심이 많을 수 밖에 없다.
결론적으로 SRE는 SLO의 수호자 라고 생각하면 편하다.