코스 개요

Apache Iceberg 소개

  • Apache Iceberg 개요
  • 기본 개념 검토

Iceberg 아키텍처 심화 탐구

  • Iceberg의 테이블 형식에 대한 심층 분석
  • 메타데이터 및 파일 레이아웃을 포함한 자세한 아키텍처 개요
  • 스키마 및 파티션 진화의 내부 구조

고급 설치 및 설정

  • 다양한 환경에서 Iceberg의 최적 성능을 위한 설정
  • 여러 데이터 처리 엔진과의 통합
  • 고급 설정: 보안, 암호화 및 접근 제어
  • 분산 환경에서 Iceberg 설정

고급 작업 및 유지 관리

  • 대규모 Iceberg 테이블 관리
  • 복잡한 스키마 변경 사항 구현 및 관리
  • 파티션 진화 및 숨겨진 파티셔닝 처리
  • 스키마 및 파티션 변경 사항과 함께 고급 CRUD 작업

쿼리 최적화 기술

  • 쿼리 지연 시간을 줄이는 기술
  • 파티션 프루닝 및 파일 프루닝
  • 메타데이터 캐싱 및 최적화 전략
  • 쿼리 최적화 기술 구현 및 테스트

대규모 데이터셋을 위한 성능 튜닝

  • 대규모 데이터셋을 위한 성능 최적화
  • Iceberg의 내장 기능을 사용하여 성능 튜닝
  • 실제 시나리오에서의 성능 튜닝 사례 연구
  • 대규모 데이터셋을 위한 성능 튜닝

고급 데이터 마이그레이션 및 통합

  • 다른 시스템에서 복잡한 데이터 구조 마이그레이션
  • Iceberg와 실시간 데이터 스트림 통합
  • 복잡한 데이터셋 마이그레이션 및 실시간 데이터 스트림 통합

신뢰성과 일관성

  • 분산 환경에서의 데이터 일관성과 무결성 보장
  • 트랜잭션 보증 구현 및 관리
  • 장애 처리 및 복구 메커니즘
  • 신뢰성과 일관성 기능 구현

고급 기능 및 커스터마이징

  • 사용자 정의 카탈로그 구현
  • Iceberg 확장: 사용자 정의 기능 추가
  • 사용자 정의 카탈로그 구현 및 Iceberg 기능 확장

데이터 거버넌스 및 규정 준수

  • 데이터 거버넌스 정책 구현
  • 데이터 규제 준수
  • 감사 추적 및 데이터 계보 관리
  • 거버넌스 및 규정 준수 기능 구현

요약 및 다음 단계

요건

  • Apache Iceberg의 핵심 개념, 기본 작업 및 Iceberg 테이블 관리에 대한 이해

대상

  • 데이터 엔지니어
  • 데이터 아키텍트
  • 데이터 분석가
  • 소프트웨어 개발자
 21 시간

참가자 수


참가자당 가격

회원 평가 (5)

예정된 코스

관련 카테고리