[NETFLIX] 데이터 메시

오늘은 제가 애정하는 Netflix 사의 기술블로그를 읽어 보았습니다.

실시간으로 대량의 데이터를 처리하는 솔루션으로 Data Mesh에 관해 소개하는 글입니다.


배경

Netflix의 핵심 기술 중 하나는 실시간 처리 기술 (스트림 처리) 입니다. 이전에는 스트리밍 파이프라인 솔루션으로 Keystone을 사용했지만 새로운 아이디어를 시도하고 확장하게 되면서 차세대 파이프라인 솔루션으로 Data Mesh를 만들게 되었습니다.


Data Mesh

이전에는 완전 관리형 스트리밍 데이터 파이프라인 제품이었으나 더 다양한 데이터를 처리하오록 범위를 확장하여 현재는 Netflix 시스템 간 범용 데이터 이동 및 처리 플랫폼으로 정의합니다.


Archtecture

  • 데이터 메시 시스템

    • 제어 플레인 (Data Mesh Controller)

      • 사용자 요청 수신, 파이프라인 배포

    • 데이터 파이프라인(Data Mesh Pipeline)

      • 들어오는 데이터를 읽고, 변환, 저장

    • Connectors : 컨트롤러와 통신하여 소스자동 생성, 업데이트

    • Sources : 중앙집중식 카탈로그에 데이터를 공유

    • Processors : Flink 작업

    • Transports :Kafka를 사용하여 통신

    • Schema : 템플릿 적용


마무리

데이터 메시를 데이터 이동 뿐만 아니라 데이터 처리, 변환에도 사용하므로 좋은 효율성을 가졌고, 복잡하지만 효과적인 시스템이라고 합니다.


  • 링크: Data Mesh — A Data Movement and Processing Platform @ Netflix | by Netflix Technology Blog | Netflix TechBlog

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2023년 11월 20일 오전 1:00

댓글 0

    함께 읽은 게시물

    PAS 프레임워크

    ... 더 보기

     • 

    댓글 1 • 저장 23 • 조회 5,901


    🎯 유튜브에 100번째 코딩 테스트 문제 풀이 영상을 올렸습니다!

    ... 더 보기

    달레의 코딩 테스트

    www.youtube.com

    달레의 코딩 테스트

    TypeScript 5.4 릴리즈: 클로저 타입 추론

    ... 더 보기

    Announcing TypeScript 5.4 - TypeScript

    TypeScript

    Announcing TypeScript 5.4 - TypeScript

     • 

    저장 11 • 조회 2,449


    기회

    

    ... 더 보기

    조회 374


    오늘은 투자 완료일이자 아미고 런칭 100일. 별 생각 없었는데, VC 파트너님이 축하한다며 파티 안하냐고 전화주셨길래 편의점에서 맥주 한 캔과 꼬깔콘으로 조촐하게 파티 했습니다. 이제부터가 진짜 시작이겠죠. 잘 부탁드립니다.

    ... 더 보기

    조회 1,771