#Parquet #파케이 #열기반 저장형태 전 저장 형태 json, csv 같은 것에 document 가 있는 것을 처음봤는데, 신기하네요,, 얼마나 심혈을 기울여 만들었는지 알겠어요. 잠시 보
#Parquet #파케이 #열기반 저장형태 전 저장 형태 json, csv 같은 것에 document 가 있는 것을 처음봤는데, 신기하네요,, 얼마나 심혈을 기울여 만들었는지 알겠어요. 잠시 보셨으니, 파케이 특징을 알아보아요 1. Parquet은 Hadoop 생태계의 모든 프로젝트에서 압축되고 효율적인 컬럼 데이터 표현의 이점을 제공하기 위해 개발되었습니다. 2. parquet은 압축 스킴을 열 단위로 지정할 수 있도록 하며, 향후 개발 및 구현 시 더 많은 인코딩을 추가할 수 있도록 설계되어 있습니다. 3. 여러 개 파일들로 자유롭게 split 가능하고, nested type 을 지원한다.