제가 NIA [한국지능정보사회진흥원]의 2022년 5월호에 기고한 글입니다. 원본 글을 제 브런치에서 공유합니다. xxOps라는 말이 버즈워드처럼 쓰여집니다. 그 중에 데이터옵스는 무엇인지에 대
제가 NIA [한국지능정보사회진흥원]의 2022년 5월호에 기고한 글입니다. 원본 글을 제 브런치에서 공유합니다. xxOps라는 말이 버즈워드처럼 쓰여집니다. 그 중에 데이터옵스는 무엇인지에 대해서 기술해 보았습니다. 1. 데이터옵스(DataOps)의 정의 데이터옵스(DataOps)는 사용자에게 신뢰할 수 있는 고품질 데이터를 빠르게 제공하기 위해 사람, 프로세스 및 기술을 융합 사용하는 것을 말한다. 이 시도는 조직 전체의 협업을 지원하여 민첩성, 속도 및 새로운 데이터 이니셔티브를 대규모로 추진하여 생산성과 효율성을 극대화하는데 중점을 둔다. 즉 데이터옵스는 조직 전체의 데이터 관리자와 데이터 소비자 간의 데이터 흐름의 커뮤니케이션, 통합 및 자동화를 개선하는 데 중점을 둔 협업 데이터 관리 방식이다. 데이터옵스는 자동화를 사용하여 데이터 액세스, 준비, 통합 및 최종 소비자에 제공하는 과정에 나오는 운영의 비효율성과 관련된 문제를 해결하도록 설계되었다. ... 2. 사람과 프로세스 그리고 도구 데이터옵스 프레임워크를 시작하기 전에 중요한 점이 있다. 모든 변화는 비즈니스의 진정한 목표를 이해하는 데서 시작되어야 한다는 것이다. 예를 들어, 다음과 같은 질문이 그 목표점 세팅에 도움이 된다. • 이 데이터는 고객의 결정과 서비스에 어떤 영향을 제공하는가? • 시장에서 경쟁 우위를 유지하는 데 이 데이터가 어떻게 도움이 될 수 있는가? • 데이터를 통해, 재정적 우선순위를 어떻게 해결할 수 있는가? 3. 데이터 옵스 설계 구조 데이터옵스 프로세스를 설계하기 위해 5가지 핵심 영역으로 나누어 그 흐룸을 정의한다. 1. 데이터 큐레이션 서비스 2. 메타데이터 관리 3. 데이터 거버넌스 4. 마스터 데이터 관리 5. 셀프서비스 상호 작용 4. 데이터옵스와 PaaS 데이터 수집에서 최종 사용자를 위한 분석 대시보드, 모델링 및 인공지능을 사용한 인사이트에 이르기까지 가치 사슬 전반에 걸쳐 클라우드 플랫폼이 데이터옵스를 지원하고 있다. 자동화된 데이터 수집 및 여러 소스의 로드를 통해 프로덕션 데이터를 쉽게 프로비저닝 할 수 있다. 데이터 변환에 자동화 엔진을 사용하면 파이프라인에서 시간이 많이 걸리고 오류가 발생하기 쉬운 단계가 줄어들고 분석 작업과 성능이 지속적으로 향상되며 배포 및 릴리스가 빨라진다. 다음과 같은 프로세스 관리가 클라우드 플랫폼 상 모두 마이크로서비스와 API로 매우 유연성 있게 연결되고 교체가 된다.