Apache Iceberg의 FileIO 이해하기
Netflix 에서 오픈소스로 공개하고 지금은 Apache 재단에서 관리하는 Iceberg는 대규모 분석 데이터를 위한 테이블 포맷입니다. Spark, Trino, Flink, Presto 등의 엔진이 Iceberg를 지원하고 있습니다. MinIO (S3 compatible object store)에서 Iceberg와 MinIO를 함께 사용하는 방법을 소개하면서 Iceberg가 어떻게 메타데이터를 관리하는지 그래서 schema evolution, partition 관리, time travel 이 어떻게 이루어지는지 잘 설명했네요. Iceberg의 내부동작이 궁금하시다면 읽어볼만 합니다. https://blog.min.io/lakehouse-architecture-iceberg-minio/