❄️ 데이터 분석도 창의성의 영역에 해당합니다 - 데이터 분석가는 모델링을 하는 능력뿐만 아니라 데이터 자체를 다루는 스킬도 굉장히 중요합니다. - 최근에는 성능 좋은 모델들이 많이 나오는 추세
❄️ 데이터 분석도 창의성의 영역에 해당합니다 - 데이터 분석가는 모델링을 하는 능력뿐만 아니라 데이터 자체를 다루는 스킬도 굉장히 중요합니다. - 최근에는 성능 좋은 모델들이 많이 나오는 추세인데, 여기서 추가적으로 더 좋은 결과를 위해서는 missing data 다루기나 feature engineering과 같이 데이터 자체를 다양한 형태로 가공할 수 있어야 합니다. - 이때 산업에 대한 이해는 물론, 창의적인 발상을 통해 데이터를 보는 각도를 비틀 수 있다면 기존에 풀지 못했던 보틀넥을 해결하거나, 비즈니스에 기여할 수 있는 인사이트를 가져올 수 있습니다. - 이런 관점에서 데이터 분석이 한편으로는 예술의 영역이 될 수도 있지 않을까 조심스레 생각해봅니다. ❄️ 창의적인 접근을 위해서는 더 많은 것을 배우고 경험해야 합니다 많은 경험을 통해 평소에는 생각치 못 한 것들을 엮을 수 있다면 색다른 관점에서 데이터를 바라볼 수 있다고 생각합니다. 캐글은 데이터 분석을 하는 분들이라면 무조건 아는 커뮤니티/사이트 인데요, 캐글 competition에 올라오는 솔루션들을 읽다보면 많은 것들을 배울 수 있습니다. - 대회에서 이긴 사람들이 각 데이터를 어떻게 가공했는지 - 어떤 고민과 문제점이 있었고, 어떻게 해결했는지 - 만약 시간이 더 있었다면 추가로 무얼 하고 싶었는지 캐글 대회별로 '좋아요'를 많이 받은 솔루션들을 묶어 놓은 아티클이 있어서 가져왔습니다. Image, text, tabular 등 모든 데이터 형식이 있고, '캐글러'들끼리 활발한 교류도 있기 때문에 좋은 리소스로 활용하고 있습니다. 링크: https://www.kaggle.com/code/sudalairajkumar/winning-solutions-of-kaggle-competitions/notebook