if kakao 2022 키노트 영상입니다.
해당 영상에서는 지난 10월 15일 카카오 전면 장애 원인을 분석하고 재발방지 대책을 설명합니다.
그리고 끝으로는 미래투자에 관해서도 설명합니다.
장애를 통해 다음 단계로 나가는 노력이 인상적입니다.
📝 주요 장애 원인
이중화와 위기대응 과정에 문제 발견.
### 원인분석:이중화
* 데이터센터 간 이중화가 미흡
일부 시스템이 판교 데이터 센터 내에서만 이중화됨.
장애 시 다른 데이터 센터로 전환되어야하는데 이 부분도 판교 데이터 센터에만 적용됨.
* 운영 관리 도구의 이중화 미흡
* 이중화 전환 후 가용자원 부족
판교 데이터 센터에 전원이 들어와서 복구될때까지 전체 시스템 복구가 불가능했음.
### 원인분석:위기 대응
* 장애 복구 인력과 자원이 부족
* 장애 대응을 위한 커뮤니케이션 채널 혼선
* 재해 발생 시 컨트롤타워 부재
더 자세한 이야기는 영상으로 확인해보세요!