문의를 보내주셔서 감사합니다! 팀원이 곧 연락드리겠습니다.
예약을 보내주셔서 감사합니다! 저희 팀 멤버 중 한 분이 곧 연락드리겠습니다.
코스 개요
Apache Iceberg 소개
- Apache Iceberg 개요
- 기본 개념 검토
Iceberg 아키텍처 심화 탐구
- Iceberg의 테이블 형식에 대한 심층 분석
- 메타데이터 및 파일 레이아웃을 포함한 자세한 아키텍처 개요
- 스키마 및 파티션 진화의 내부 구조
고급 설치 및 설정
- 다양한 환경에서 Iceberg의 최적 성능을 위한 설정
- 여러 데이터 처리 엔진과의 통합
- 고급 설정: 보안, 암호화 및 접근 제어
- 분산 환경에서 Iceberg 설정
고급 작업 및 유지 관리
- 대규모 Iceberg 테이블 관리
- 복잡한 스키마 변경 사항 구현 및 관리
- 파티션 진화 및 숨겨진 파티셔닝 처리
- 스키마 및 파티션 변경 사항과 함께 고급 CRUD 작업
쿼리 최적화 기술
- 쿼리 지연 시간을 줄이는 기술
- 파티션 프루닝 및 파일 프루닝
- 메타데이터 캐싱 및 최적화 전략
- 쿼리 최적화 기술 구현 및 테스트
대규모 데이터셋을 위한 성능 튜닝
- 대규모 데이터셋을 위한 성능 최적화
- Iceberg의 내장 기능을 사용하여 성능 튜닝
- 실제 시나리오에서의 성능 튜닝 사례 연구
- 대규모 데이터셋을 위한 성능 튜닝
고급 데이터 마이그레이션 및 통합
- 다른 시스템에서 복잡한 데이터 구조 마이그레이션
- Iceberg와 실시간 데이터 스트림 통합
- 복잡한 데이터셋 마이그레이션 및 실시간 데이터 스트림 통합
신뢰성과 일관성
- 분산 환경에서의 데이터 일관성과 무결성 보장
- 트랜잭션 보증 구현 및 관리
- 장애 처리 및 복구 메커니즘
- 신뢰성과 일관성 기능 구현
고급 기능 및 커스터마이징
- 사용자 정의 카탈로그 구현
- Iceberg 확장: 사용자 정의 기능 추가
- 사용자 정의 카탈로그 구현 및 Iceberg 기능 확장
데이터 거버넌스 및 규정 준수
- 데이터 거버넌스 정책 구현
- 데이터 규제 준수
- 감사 추적 및 데이터 계보 관리
- 거버넌스 및 규정 준수 기능 구현
요약 및 다음 단계
요건
- Apache Iceberg의 핵심 개념, 기본 작업 및 Iceberg 테이블 관리에 대한 이해
대상
- 데이터 엔지니어
- 데이터 아키텍트
- 데이터 분석가
- 소프트웨어 개발자
21 시간
회원 평가 (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
코스 - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
코스 - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
코스 - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
코스 - Apache Spark in the Cloud
practice tasks