구릉

실시간 어플리케이션(페이스북,트위터 등) 에서의 분산 카운트

배경: 페이스북, 트위터, 유투브 등 실시간 애플리케이션들은 많은 사용자 상호작용(예: 좋아요, 댓글)을 처리해야 합니다. 이러한 애플리케이션들은 매분 수백만 건의 쓰기 요청을 받을 수 있으며, 쓰기 작업은 읽기보다 시간이 더 많이 소요됩니다. 이로 인해 동시성 문제가 복잡해지고, 특히 카운터(노드 메모리 내의 변수)의 동시 쓰기가 증가하면 잠금 경합이 비선형적으로 증가합니다.
분산 카운터의 필요성: 단일 트윗이 백만 개의 좋아요를 받을 때, 각 좋아요에 대한 쓰기 요청을 처리해야 합니다. 이를 동시에 처리하면 데이터 불일치가 발생할 수 있습니다. 이를 해결하기 위해, 요청들은 데이터 일관성을 위해 큐에서 순차적으로 처리됩니다. 하지만 이 방법은 지연을 추가합니다. 실시간 애플리케이션은 사용자 경험의 질을 높이기 위해 가능한 한 최소한의 지연 시간을 제공하고자 합니다.
분산 카운터의 도입: 샤딩된 카운터는 각 카운터에 필요한 수만큼의 샤드를 지정하여 다양한 계산 단위에서 병렬로 실행하는 방식입니다. 이를 통해 성능을 향상시키고 경합을 줄일 수 있습니다. 사용자가 특정 트윗에 좋아요를 누를 때, 시스템은 해당 트윗 카운터로 쓰기 요청을 전달하고, 사용 가능한 샤드 중 하나를 선택하여 좋아요 수를 증가시킵니다.
분산 카운터의 설계: 샤딩된 카운터를 생성할 때 샤드의 수를 결정하는 것이 중요합니다. 샤드 수가 적으면 쓰기 경합이 높아지고, 많으면 읽기 작업에 더 많은 오버헤드가 발생합니다. 샤드 수는 특정 카운터에 대한 단기적인 쓰기 부하를 예측하는 여러 요인에 따라 결정됩니다. 예를 들어, 많은 팔로워를 가진 사용자의 트윗은 적은 팔로워를 가진 사용자의 트윗보다 더 많은 샤드를 가질 수 있습니다.
분산 카운터의 운영: 샤딩된 카운터는 라운드 로빈, 무작위 선택, 메트릭스 기반 선택 등 다양한 방법으로 샤드를 선택할 수 있습니다. 읽기 요청이 있을 때, 시스템은 모든 샤드의 값을 집계하여 총 카운트를 반환합니다. 샤딩된 카운터의 배치는 특정 사용 사례에 따라 달라질 수 있으며, 카운터 값은 적절한 데이터 저장소에 저장될 수 있습니다.
평가: 샤딩된 카운터는 단일 장애 지점의 위험을 제거하고, 시스템의 가용성을 높입니다. 또한, 필요에 따라 샤드를 추가하여 확장성을 제공하며, 각 쓰기 요청을 적절한 샤드에 매핑하여 신뢰성을 향상시킵니다.

https://medium.com/@sureshpodeti/sharded-counters-8a9a760a7b53

Sharded Counters

Medium

다음 내용이 궁금하다면?

이미 회원이신가요?

2023년 12월 5일 오전 2:40

함께 읽은 게시물

조찬우

Coupang Sr. iOS Engineer

하루 전

defer, 에러 핸들링과 비동기에서 어떻게 활용할까?

d

defer (async throwing contexts)

iOYES

저장 1 • 조회 754

석민

커리어 코치

하루 전

약점 극복

저장 3 • 조회 497

psmon

웹노리라이터

3일 전

액터모델과 오버엔지니어링

불

WEBNORI

wiki.webnori.com

저장 4 • 조회 1,243

이재호

책 <일 잘하는 팀장> 저자. 네오위즈 AI 개발자

2일 전

[필사노트] 헤르만 헤세, '데미안'

해

07화 헤르만 헤세, '데미안'

Brunch Story

조회 648

동크루트

AI 엔지니어, SW 엔지니어

4일 전

AI 시대에 갈피 못잡던 구글의 역습

실

AI 시대에 갈피 못잡던 구글의 역습 : 오호츠크 리포트

55check.com

댓글 1 • 저장 7 • 조회 2,058

달레

Apollo GraphQL Software Engineer

2일 전

리트코드 102. Binary Tree Level Order Traver

코

Binary Tree Level Order Traversal | 알고달레

알고달레

저장 11 • 조회 1,953

비슷한 게시물

조용구 Senior Front-end Engineer

[JavaScript] 배열과 커스텀 큐 성능 차이

노수진 메타 소프트웨어 엔지니어

Swift Predicate과 Predicate Macro

조용구 Senior Front-end Engineer

(CSS view() 공유) CSS에서 이런 기능이 있네요!

박경은 Software Engineer

트랜잭션 격리 수준 분석: Prisma를 활용한 실습 가이드

안희수 유비스톰 백엔드 개발자

SAP에서 ABAP라는걸 쓴다길래 궁금해서 확인해봤습니다

asbubam 당근마켓 SRE팀

5000명 회원을 돌파한 Twitter Golang Insiders

주간 인기 TOP 10

달레 Apollo GraphQL Software Engineer

🎯 유튜브에 100번째 코딩 테스트 문제 풀이 영상을 올렸습니다!

김하림 우아한형제들 프론트엔드 개발자

타입 안전한 API 모킹으로 프론트엔드 생산성 높이기

Arawn Park Senior Engineer & Engineering Lead

나는 시스템 빌더이다

석민 커리어 코치

이직의 조건

골빈해커 Chief Maker

어제 출시된 따끈따끈한 ChatGPT Codex를 실제 프로젝트

동크루트 AI 엔지니어, SW 엔지니어

샘 알트만: "지금 당신이 o3보다 더 똑똑하다고 생각하세요?"

장홍석 스페이스오디티 부대표/CPO

< '네이버 다녀요'라는 말에 아무도 무슨 일을 하는지는 묻지 않

장홍석 스페이스오디티 부대표/CPO

< 초동 100만 장, 그런데 팬은 어디 있죠? - 엔터 테크와

송요창 배민 프론트엔드 프로그래머

ChatGPT 버전명 설명

레드버스백맨 리서처 앤 라이터

⟪디자인의 역할은 프로세스에서 낭비를 줄이고 생산성을 개선하는 것

실시간 어플리케이션(페이스북,트위터 등) 에서의 분산 카운트

댓글 0

함께 읽은 게시물

defer, 에러 핸들링과 비동기에서 어떻게 활용할까?

약점 극복

액터모델과 오버엔지니어링

[필사노트] 헤르만 헤세, '데미안'

AI 시대에 갈피 못잡던 구글의 역습

리트코드 102. Binary Tree Level Order Traver

비슷한 게시물

주간 인기 TOP 10

추천 프로필