Airbnb Tech blog에 데이터팀이나 프로덕트팀에 새로 합류한 주니어 데이터과학자를 위한 포스트가 있어 소개드립니다.
여기서 글쓴이는 효과적으로 일을 하기 위한 4가지를 제안하고 있습니다.
1. Prioritization (우선순위)
2. Estimating how long tasks will take (작업 소요시간 추정)
3. How to get your questions answered (질문에 대한 답변을 얻는 법)
4. Communicating & sharing your work (커뮤니케이션, 작업 공유)
---
[Prioritization (우선순위)]
"To work well with PMs, you need some understanding of what they do."
- PM들과 잘 협력하기 위해서, PM들이 하는 일에 대한 이해가 필요합니다.
"In practice this means that whenever someone asks you for data, you should make sure they articulate what they need it for. Oftentimes, this process will allow you to learn that what someone wants does not always address what they need.
- 데이터 추출이나 분석을 요청을 받을 때, 왜 이 데이터가 필요하진 명확히 설명을 부탁해야 합니다.
목표 달성 혹은 문제 해결을 위해 데이터 담당자로서 더 적합한 접근 방법과 데이터를 제시할 수 있는 기회가 있을 수 있기 때문입니다
---
[Estimating how long tasks will take (작업 소요시간 추정]
"I’ve noticed that the tasks that take junior data scientists the longest to complete are usually not those that are the most intellectually challenging. Instead, they are those that are the least well-defined, or those in which infrastructure needs are not fully articulated or understood."
- 주니어 분석가 입장에서 가장 시간이 오래 걸리는 부분은, 지적(코딩, 방법론)인 부분이 아닌, 작업 진행을 위해 어떤 인프라와 툴이 있고, 어떤 데이터베이스에 어떤 테이블을 봐야 할지, 어떤 조건으로 데이터를 전 처리해야 할지입니다.
"Do you understand what’s being asked for analytically?"
"do the data exist?"
"ask that logging be added, and make it clear that any analysis will be delayed until you have sufficient data. "
- 어떤 분석을 요청하는지에 대한 명확한 이해 -> 데이터가 존재하는지? -> 존재하지 않으면 데이터 태깅 및 충반한 데이터 적재까지의 시간이 필요하며 다소 지연이 될 수 있음을 공유 해야합니다.
---
[How to get your questions answered (질문에 대한 답변을 얻는 법)]
"you do not get ahead by monopolizing information."
"We’re all better when information flows freely and is widely accessible."
- 정보를 독점하지 않고, 자유롭게 흐르고 접근할 수 있어야 조직 전체가 더 나아갈 수 있습니다.
---
[Communicating & sharing your work (커뮤니케이션, 작업 공유)]
"this often means that it is not your job to tell business partners how much work you did or how hard it was or what the various model evaluation measures were"
- 분석요청자 혹은 PM에게 분석 리포팅은 기술적으로 어떤한 어려움이 있었는지, (가령 데이터 퀄리티 확보와 정합성을 얻기 위한 과정, 최고의 성능을 위한 모델링 작업)을 알리는 것을 의미하지 않습니다.
"If a PM asks a question about your users, answer it as simply as possible"
- 분석 요청자 혹은 PM에 질문에는 가능한 심플하게 답변하는게 좋습니다. (기술적 요소가 아닌)
"Make sure to get feedback early and often from your manager, other data scientists, and business partners on your work."
- 분석 작업 초기에 분석 요청자, PM, 동료 분석가에게 피드백을 받아야 합니다.