아마 데이터 분석가들 사이에서 많이 논란이 되는 주제 중 하나가 'R과 파이썬 중 어떤 것이 더 좋은가' 혹은 '둘 중 하나만 선택해야 한다면 무엇을 배워야 하는가' 일 것입니다. 이 글은 이런 측면에서 R과 파이썬 각각이 가진 장점이나 특징을 비교적 잘 정리한 글입니다.
제목에서 짐작할 수 있듯이 글쓴이는 분석 목적이라면 R이 더 적절하고, ML 제품을 개발한다면 파이썬이 더 낫다고 주장하는데 제 생각도 비슷합니다. 제 경우에도 통계 분석을 할 때는 R을 사용하고, 운영 스크립트 개발이나 데이터 엔지니어링 자동화를 할 때는 파이썬을 사용합니다. 이렇게 구분하는 이유는 각각에 대해 코드 생산성에서 차이가 있기 때문이죠.
통계 분석이나 데이터 시각화 측면에서는 R이 파이썬에 비해 압도적으로 생산성이 좋고 결과물도 깔끔한 반면, 운영 자동화를 위한 코딩 측면에서는 파이썬이 훨씬 좋습니다. 그러니 본인의 주업무가 데이터 분석이라면 R, 데이터 엔지니어링이라면 파이썬을 사용하는게 적절할 것 같네요.
물론 그냥 둘 다 사용하시면 이런 고민할 필요가 없습니다.