Spark 작업 빠르게 결과확인하는법?

Question

안녕하세요. spark쓴지도 벌써 2년인데, 아직도 대용량 처리할때마다 pandas때 습관때문에 자꾸 중간결과물들을 확인하는 버릇이 고쳐지질 않네요..

혹시 선배님들은 spark 쓸때, 중간결과물들 빨리 확인하거나 하는 방법 , 노하우 있으신가요?

우태강 · Answer

zeppelin 을 세팅해서 pyspark 노트북으로 보고 있습니다.
다만 spark 자체가 lazy evaluation 이라 경우에 따라선 pandas 만큼 빠르게 보기는 어렵습니다.