데이터 과학, 그거 어떻게 하는건데?

데이터 과학은 21세기 가장 섹시한 직업이라고 불렸던,
(Data Scientist: The Sexxist Job of the 21st Century) 데이터 과학자가
하는 업무의 모든 것들을 의미합니다.

아래 그래프에서 보시다시피,
데이터 과학은 다양한 학문들을 종합한 종합 과학입니다.

기존 개발자들이 사용하던 컴퓨터 과학 (Computer Science) 한 스푼,
통계학자들과 수학자들이 사용하던 수학 (Mathmetics) 한 스푼,
그리고 기업가들과 다양한 기획자들이 사용하는 경영(Business Management) 한 스푼을
첨가하면 데이터 과학이라는 레시피(Recipe)가 만들어집니다.

흥미로운 점은 이 레시피(Recipe)가
각 도메인 별, 분야 별, 그리고 주요 목적과 환경에 따라
천차만별로 달라진다는 점입니다.

데이터라는 하나의 이름만 같지,
어떤 데이터를 어떻게 사용하고 해석할지,
그리고 그 결과물로 어떤 비즈니스에 도입할지에 따라
데이터 과학은 다양한 형태의 모습으로 변형됩니다.

어떤 기업은 명확하고 정확한 데이터 자체를 중요시 여기는 반면,
또 다른 기업은 패턴을 찾아내는 케이스가 더 중요시 여겨지기도 합니다.

그렇기 때문에, 각 분야에 종사하고 있는 데이터 직무 종사자들은
사실 자신의 영역 외에는 데이터가 어떻게 처리되고 사용되는지를
모르고 있는 경우들도 많습니다.

이런 한계점들이 데이터 과학을 입문하는 입문자들의 발목을 잡고 있다고 생각해요.

내가 어디까지 얼마나 배워야 하는지,
그리고 배운 내용을 통해 어떤 결과물을 어떻게 전달해야 하는지를
누가 정확하게 알려준 적이 없어, 데이터 과학의 가장 큰 병목을 만들고 있습니다.

그렇기 때문에 가장 데이터 과학을 배울 수 있는 가장 좋은 방법은
바로 직접 데이터 과학을 사용해 의사결정을 해보는 것입니다.

엑셀, SQL, 파이썬, 태블로, R, SAS, SPSS, Scala 뭐든 상관없습니다.
여러분이 직접 데이터를 활용해 무엇이든 알아낸다면,
그 뒤로는 여러분만의 데이터 과학이 시작될 것입니다.

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 12월 15일 오후 11:47

댓글 0

    함께 읽은 게시물

    데이터 이야기 #6: 기본 데이터 직군 - 데이터 엔지니어

    앞서 포스팅에서는 기본 데이터 직군이라 할 수 있는 데이터 엔지니어, 데이터 분석가, 데이터 과학자 중 먼저 데이터 분석가와 데이터 과학자에 대해서 이야기해보았다. 이번 포스팅에서는 데이터 엔지니어에 대해 이야기해보고자 한다.

    ... 더 보기

     • 

    저장 17 • 조회 3,631


    🚀 [2025 셀프 호스팅 가이드]

    ... 더 보기

    selfh.st - Self-hosted content and software

    selfh.st

    selfh.st - Self-hosted content and software

     • 

    저장 32 • 조회 961


    아미고(Ameego)의 피드백 중에서 아미고가 불친절😅해서 좋다는 이야기를 꽤 들었는데요.


    UX가 나쁘다는 것이 아니라, 앱이 대부분 영어로만 되어 있고, 대화 중 자막이 없고 턴제가 아닌 실시간 대화 중심인 것을 말합니다.


    ... 더 보기

    조회 1,417


    각종 스토리지를 통해 알아 보는 분산 시스템 개념

    1️⃣ Apache Cassandra - 파티션 기반의 Wide Column 저장소 모델을 활용 - multi-master data replication - 높은 가용성(availability)과 low latency를 제공함 - 단일 장애 지점(single point of failure)이 없음 - 궁극적 일관성(eventual consistent) 데이터베이스 - 모든 업데이트는 궁극적으로 레플리카 노드에 도달함 - 궁극적 일관성으로 인해 임시적으로 노드마다 데이터가 다를 수 있음 - Consistent Hashing으로 데... 더 보기

    Fundamentals of Distributed Systems | Baeldung on Computer Science

    Baeldung

    Fundamentals of Distributed Systems | Baeldung on Computer Science

     • 

    저장 72 • 조회 5,862


    데이터 분석 자격증 Top 9(+5)

    ... 더 보기

    The top 9 data analytics certifications

    CIO

    The top 9 data analytics certifications

     • 

    저장 19 • 조회 2,116


    ChatGPT 런칭시, 5일만에 백만명의 사용자가 등록하면서 역사상 가장 빠르게 1백만 사용자를 획득한 서비스가 되었었는데요.


    그런데 이번 이미지 생성 모델 출시 후 인터넷이 지브리피케이션되면서, 한시간만에 백만명의 사용자를 획득했다고 합니다.


    생산성이고 뭐고, 역시 재미난게 짱짱맨이네요.

    조회 1,950