영영

자비스앤빌런즈 PM

개발자와 소통하기 (feat. Unique key)

갓 회사에 입사했을 때였습니다. 아주 간단한 기능을 제안했는데, 개발자로부터 그 기능은 구현하기 쉽지 않다는 피드백을 받았어요. 그때 개발자와 이야기를 나누면서 저는 새로운 개념을 이해했는데요. 그건 바로 외부 스크래핑 데이터 에 대한 것입니다. 일반적인 데이터베이스에서 데이터들은 각 데이터마다 Key값을 갖습니다. 보통 Index라고도 불리는데 생성되는 시점에 따라 순차적으로 Index가 부여되어서 각 데이터들을 구분합니다. 따라서 이 데이터들은 언제 어디서든 붙잡을 수 있어요. Index가 있으니까요. 저희 회사 같은 경우는 외부 사이트에서 데이터를 스크래핑해서 서비스를 제공하는 곳이었어요. 그런데 외부 사이트에서는 Index를 제공해주지 않아서 데이터를 구분하기가 어려웠어요. 자연스럽게 적재한 순서대로 우리가 부여해주면 되지! 라고 생각했죠. 그런데 개발자로부터 그것 또한 불가한 일이라는 피드백을 받았어요. 데이터가 너무 유동적이었기 때문이예요. 여기서 유동적이라는 말의 의미는 기존의 것 이외에 새로운 데이터가 추가되는 것 이외에 기존 데이터들이 바뀌는 경우도 의미해요. 예를 들어, 카드 소비 데이터 같은 경우 오늘에는 1000원 승인 데이터였는데 내일에는 1000원 취소 데이터로 바뀔 수가 있습니다. 그래서 도대체 오늘의 1000원 승인 데이터와 내일의 취소 1000원 데이터를 같다고 봐야할지, 다르게 봐야할지조차 혼란스러웠습니다. 결국 외부 스크래핑 데이터를 가공해서 서비스 하기 위해서는 각 데이터들을 구분할 수 있도록 Unique한 Key를 정해주는 것이 가장 중요합니다. 보통은 스크래핑한 데이터를 조합해서 Unique한 Key를 생성하는데요. 여기서 Unique라는 것은 유일무이하다는 것을 의미합니다. Key값만 잘 만들어놓아도 정말 많은 것들을 해볼 수가 있습니다. 단적인 예로 이미 1번 스크래핑을 한 상태에서 추가적으로 데이터를 가져올 때 스크래핑 시간을 단축할 수 있습니다. Key값이 다른 데이터만 가져오면 되니까요. 또한 카드 소비 데이터와 고객이 입력한 사용처를 매칭해주면 간단한 가계부도 제공할 수 있어요. 데이터 이미 알만큼 알지! 라고 생각했던 저에게 스크래핑 데이터는 신선한 충격이었습니다. 데이터에 대한 이해도도 높아진 좋은 경험이었습니다.

다음 내용이 궁금하다면?

이미 회원이신가요?

2022년 11월 10일 오후 1:33

조회 963

함께 읽은 게시물

Somewon Yoon

프로젝트 썸원 Content Owner

4일 전

최근에 발견한 신박한 뉴스레터 Top 4

1. 롱라이프랩(LLNC) : 시니어 비즈니스를 전문적으로 다루는 뉴스레터로, 초고령사회에 진입하고 있는 한국 사회에 필요한 생각과 레퍼런스를 전해주는 뉴스레터입니다. 건축학 박사 과정 중인 분께서 운영하는 뉴스레터라서, 마치 논문처럼 꼼꼼하게 사례를 분석해

•

조회 383

김소진

제니휴먼리소스 대표(헤드헌터/ 커리어코치)

2일 전

절대 폭락하지 않는 투자처

절

저장 1 • 조회 47

장홍석

스페이스오디티 부대표/CPO

2일 전

< 왜 어떤 제품에만 '열광적인 팬'이 생길까요? >

댓글 1 • 저장 1 • 조회 252

토마스 정

삼성 벤처스 아메리카 / Sr. Managing Director

2일 전

생각해볼 부분이 많은 chart

우리는 이런 세상에 살고 있고, 이중 몇몇은 더 잘될것이고, 몇몇은 말이되는 multiple로 내려올것.

저장 1 • 조회 128

장홍석

스페이스오디티 부대표/CPO

3일 전

< 잡초를 없애려면 잡초 말고 오히려 잔디를 깎아야 한다 >

1. 자기 철학이 있는 사람들은 어떻게 그런 경지에 오르게 되는 것일까?

댓글 1 • 저장 4 • 조회 363

Somewon Yoon

프로젝트 썸원 Content Owner

2일 전

한 여름 밤의 콘텐츠 클럽 모집 안내

[썸원 이벤트] 한 여름 밤의 콘텐츠 클럽 모임 안내

somewon on Notion

조회 301

주간 인기 TOP 10

달레 Apollo GraphQL Software Engineer

야근의 관성

변성윤 머신러닝 엔지니어, Engineering Manager

무신사의 대용량 트래픽 경험기

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

기초 프로그래밍을 좀 더 열심히 공부할 걸..

진용진 Product manager

디자인 컴포넌트 기반 AI 프로토타이핑

황경찬(Boaz) P.E.C CEO

AI와 코딩할 때, 혹시 결과만 말하고 계신가요? 얼마 전 프로필

장홍석 스페이스오디티 부대표/CPO

< 인생을 바꾸는 ‘큰 돌멩이’의 법칙 >

이원형 라인플러스 소프트웨어 엔지니어

Gemini CLI가 무료라길래 주말에 사용해봤습니다. 기존에

psmon 웹노리라이터

DDD와 액터모델

골빈해커 Chief Maker

(웹)프론트엔드 개발이 쉬워보인다면 CSS나 WebGL 차력쇼나

레드버스백맨 리서처 앤 라이터

⟪트레바리 <리서치 하는데요> 6번째 시즌을 오픈합니다⟫

개발자와 소통하기 (feat. Unique key)

댓글 0

함께 읽은 게시물

최근에 발견한 신박한 뉴스레터 Top 4

절대 폭락하지 않는 투자처

< 왜 어떤 제품에만 '열광적인 팬'이 생길까요? >

생각해볼 부분이 많은 chart

< 잡초를 없애려면 잡초 말고 오히려 잔디를 깎아야 한다 >

한 여름 밤의 콘텐츠 클럽 모집 안내

주간 인기 TOP 10

추천 프로필