1️⃣ 적합한 도구나 플랫폼 찾기
수많은 클라우드 도구와 플랫폼 중에 자기 회사에 가장 적합한 툴을 찾는 것은 상당히 어렵다. 가장 좋은 방법은 클라우드 관찰 서비스를 제공하는 포괄적인 툴을 사용하는 것이다.
2️⃣ 수많은 메트릭 중에서 중요한 메트릭 필터하기
클라우드 네이티브 인프라는 상당히 많은 양의 메트릭을 생성한다. 중요한 것을 저장하고 추적하는 데 초첨 두는 것이 우선순위이며 그 외 메트릭을 생성하고 관리하는데 큰 비용을 지불하지 않아도 된다. 필요한 메트릭을 잘 정의하고 이를 추적하는 데 집중하자.
3️⃣ 마이크로서비스 모니터하기
단일 마이크로서비스가 무려 100개 이상의 머신에 운영될 수 있고, 100개 넘는 마이크로서비스가 단일 머신에 운영될 수 있다. 따라서 클라우드 환경에서는 수동적인 모니터링은 불가능하며, 자동적으로 퍼포먼스 문제를 캐치할 수 있는 시스템이 필요하다.
4️⃣ 비용
클라우드 서비스를 배포하고 관리하는 데 엄청난 비용이 발생한다. 많은 클라우드 서비스는 비용을 절감할 수 있도록 도와주지만 한계가 있다. 클라우드 환경에서 팀은 서버를 추가할 때 발생하는 비용을 미리 계산하거나 자동화와 같은 특정 기능은 추가 비용이 발생할 수 있다는 것을 잘 알아둬야 한다.
5️⃣ 세큐리티 & 컴플라이언스
새로운 보안 프로토콜이 추가되면 기업은 인프라가 보안 표준을 준수하는지 확인해야 한다. 뿐만아니라 기업은 인증된 사용자만이 인프라에 저장된 데이터에 액세스할 수 있도록 보장해야 한다. 이때 클라우드 관찰 가능성 플랫폼을 배포해서 시스템의 보안 상태를 모니터링하는 것이 좋다.
📌 지난 포스팅에서 언급했지만 클라우드 환경에서 보안을 위협하는 가장 큰 요소는 크레덴셜 관리입니다. 서비스를 구축할 때 액세스를 제한하고 문제가 발생할시 쉽게 발견하고 관리할 수 있도록 해야 합니다.
6️⃣ 신뢰성 문제
신뢰성 문제는 인프라의 다양한 요소로 인해 발생할 수 있으므로 식별 및 해결이 어려울 수 있다. 이때 에러와 버그의 근원을 빨리찾을 수 있는 플랫폼을 사용하면 좋다. 되도록 모니터링과 로깅 그리고 중요한 메트릭을 쉽게 확인할 수 있는 플랫폼을 사용하자.
7️⃣ 분산 시스템의 가시성 부족
분산 시스템에서는 관련 측정 기준을 추적하고 다양한 개별 서비스의 상호 연관성을 식별하는 것이 어려울 수 있다. 분산 추적 기능을 갖춘 플랫폼을 사용하면 모든 마이크로서비스에 대한 지능적인 통찰력을 얻을 수 있으며 발생할 수 있는 성능 문제를 사전에 파악하고 미리 해결할 수 있다.
8️⃣ 구식 기술로 최신 상태 유지하기
최신 상태를 유지하려면 최대한 현재 기술 스택을 잘 이해하고 자주 업데이트되는 툴을 사용하는 것이 좋다.
9️⃣ 기술 전문가 부족
클라우드 인프라로 마이그레이션하는 기업이 겪는 가장 큰 어려운 점은 부족한 클라우드 전문가다. 관련 기술 지식이 적거나 없는 경우가 태반이며, 기업은 전문 지식이 있는 인력을 채용해야 한다. 또한 잘 작성된 가이드라인과 연수 과정 그리고 트레이닝 세션이 필요하다.
🔟 조직과 팀의 방향성 변화 필요
클리우드 인프라로 옮기기 위해 필요한 역할과 책임을 파악하고 잘 숙지하는 것이 중요하다. 서버를 프로비저닝하거나 클라우드 도구를 사용해보지 않았던 팀에게 버추얼 머신은 생소한 개념일 수 있다. 따라서 팀원은 클라우드 인프라에 관련된 새로운 스킬을 습득해야 하고 이해해야 한다.