Apache Iceberg Fundamentals 교육 과정
Apache Iceberg는 SQL 테이블의 신뢰성과 단순성을 빅 데이터에 제공하는 대규모 데이터 세트를 위한 오픈 소스 테이블 형식입니다. 이는 종종 복잡한 스키마, 대용량 파일 및 다양한 데이터 소스를 처리하는 것과 관련된 데이터 레이크의 빅 데이터 관리 문제를 해결하도록 설계되었습니다.
이 강사가 진행하는 실시간 교육(온라인 또는 현장)은 Apache Iceberg를 효과적으로 활용하여 대규모 데이터 세트를 관리하고, 데이터 무결성을 보장하고, 데이터 처리 워크플로를 최적화하는 데 필요한 지식과 기술을 습득하려는 초급 수준의 데이터 전문가를 대상으로 합니다. .
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- Apache Iceberg의 아키텍처, 기능 및 이점을 철저하게 이해하세요.
- 테이블 형식, 파티셔닝, 스키마 발전 및 시간 이동 기능에 대해 알아보세요.
- 다양한 환경에서 Apache Iceberg를 설치하고 구성합니다.
- Iceberg 테이블을 생성, 관리 및 조작합니다.
- 다른 테이블 형식의 데이터를 Iceberg로 마이그레이션하는 프로세스를 이해합니다.
코스의 형식
- 대화형 강의 및 토론.
- 많은 연습과 연습.
- 라이브 랩 환경에서 직접 구현합니다.
코스 맞춤화 옵션
- 이 과정에 대한 맞춤형 교육을 요청하려면 당사에 연락하여 예약하시기 바랍니다.
Course Outline
아파치 아이스버그 소개
- Apache Iceberg 개요
- 최신 데이터 아키텍처의 중요성과 사용 사례
- 주요 기능 및 이점
핵심 개념
- 빙산 테이블 형식 및 아키텍처
- 다른 테이블 형식과 비교
- 파티셔닝 및 스키마 진화
- 시간 여행 및 데이터 버전 관리
Apache Iceberg 설정
- 설치 및 구성
- 다양한 데이터 처리 엔진과 Iceberg 통합
- 로컬 머신에 Iceberg 환경 설정
기본 작업
- Iceberg 테이블 생성 및 관리
- Iceberg 테이블에 쓰기 및 읽기
- 기본 CRUD 작업
데이터 마이그레이션 및 통합
- Hive 및 기타 시스템의 데이터를 Iceberg로 마이그레이션
- BI 도구와의 통합
- 샘플 데이터 세트를 Iceberg로 마이그레이션
성능 최적화
- 성능 튜닝 기술
- 쿼리 및 데이터 검색 최적화
- Iceberg의 성능 최적화
고급 기능 개요
- 파티션 진화와 숨겨진 파티셔닝
- 테이블 진화 및 스키마 변경
- 시간 여행 및 롤백 기능
- Iceberg의 고급 기능 구현
요약 및 다음 단계
Requirements
- 테이블, 스키마, 파티션, 데이터 수집 등의 개념에 대한 지식
- SQL의 기본 지식
청중
- 데이터 엔지니어
- 데이터 설계자
- 데이터 분석가
- 소프트웨어 개발자
Open Training Courses require 5+ participants.
Apache Iceberg Fundamentals 교육 과정 - Booking
Apache Iceberg Fundamentals 교육 과정 - Enquiry
Apache Iceberg Fundamentals - Consultancy Enquiry
Consultancy Enquiry
회원 평가 (3)
트레이너가 개념을 잘 이해하고 있었습니다.
Josheel - Verizon Connect
Course - Amazon Redshift
Machine Translated
analytical functions
khusboo dassani - Tech Northwest Skillnet
Course - SQL Advanced
how the trainor shows his knowledge in the subject he's teachign
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Course - Data Vault: Building a Scalable Data Warehouse
Upcoming Courses
Related Courses
SQL Advanced
14 HoursThis instructor-led, live training in 대한민국 (online or onsite) is aimed at intermediate-level database administrators, developers, and analysts who wish to master advanced SQL functionalities for complex data operations and database management.
By the end of this training, participants will be able to:
- Perform advanced querying techniques using unions, subqueries, and complex joins.
- Add, update, and delete data, tables, views, and indexes with precision.
- Ensure data integrity through transactions and manipulate database structures.
- Create and manage databases efficiently for robust data storage and retrieval.
Amazon Redshift
21 HoursAmazon Redshift은 AWS의 페타바이트 규모의 클라우드 기반 데이터웨어하우스 서비스입니다.
강사가 진행하는 이 실시간 교육에서 참가자는 Amazon Redshift의 기본 사항을 배우게 됩니다.
이 교육을 마치면 참가자는 다음을 수행할 수 있습니다.
- Amazon Redshift 설치 및 구성
- Amazon Redshift을 사용하여 데이터 로드, 구성, 배포, 쿼리 및 시각화
청중
- 개발자
- IT 전문가
과정 형식
- 일부 강의, 일부 토론, 연습 및 집중적인 실습
메모
- 이 과정에 대한 맞춤형 교육을 요청하려면 당사에 연락하여 준비하세요.
Advanced Apache Iceberg
21 Hours대한민국(온라인 또는 현장)에서 진행되는 이 강사가 진행하는 실시간 교육은 데이터 처리 워크플로를 최적화하고, 데이터 무결성을 보장하며, 현대 빅 데이터의 복잡성을 처리할 수 있는 강력한 데이터 레이크하우스 솔루션을 구현하려는 고급 수준의 데이터 전문가를 대상으로 합니다. 데이터 애플리케이션.
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- 메타데이터 관리 및 파일 레이아웃을 포함하여 Iceberg의 아키텍처에 대해 심층적으로 이해하세요.
- 다양한 환경에서 최적의 성능을 발휘하도록 Iceberg를 구성하고 이를 여러 데이터 처리 엔진과 통합합니다.
- 대규모 Iceberg 테이블을 관리하고, 복잡한 스키마 변경을 수행하고, 파티션 발전을 처리합니다.
- 대규모 데이터 세트의 쿼리 성능과 데이터 스캔 효율성을 최적화하는 마스터 기술입니다.
- 데이터 일관성을 보장하고 트랜잭션 보장을 관리하며 분산 환경에서 오류를 처리하는 메커니즘을 구현합니다.
Big Data Consulting
21 Hours대한민국에서 진행되는 이 실시간 교육(온라인 또는 현장)은 데이터 아키텍처, 거버넌스, 클라우드 컴퓨팅 및 빅 데이터 기술에 대한 기술을 향상하여 대규모 데이터 세트를 효과적으로 관리하고 분석하려는 중급 IT 전문가를 대상으로 합니다. 조직 내 데이터 마이그레이션을 위해.
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- 다양한 데이터 아키텍처의 기본 개념과 구성요소를 이해합니다.
- 데이터 거버넌스 원칙과 규제 환경에서의 중요성을 포괄적으로 이해하세요.
- Dama 및 Togaf와 같은 데이터 거버넌스 프레임워크를 구현하고 관리합니다.
- 효율적인 데이터 저장, 처리, 관리를 위해 클라우드 플랫폼을 활용하세요.
Big Data & Database Systems Fundamentals
14 Hours과정은 데이터 과학자 스킬 세트 (Domain : Data and Technology)의 일부입니다.
Azure Data Lake Storage Gen2
14 Hours대한민국에서 진행되는 이 실시간 교육(온라인 또는 현장)은 효과적인 데이터 분석 솔루션을 위해 Azure Data Lake Storage Gen2를 사용하는 방법을 배우려는 중급 수준의 데이터 엔지니어를 대상으로 합니다.
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- Azure Data Lake Storage Gen2의 아키텍처와 주요 기능을 이해합니다.
- 비용과 성능을 고려하여 데이터 스토리지와 액세스를 최적화합니다.
- 분석 및 데이터 처리를 위해 Azure Data Lake Storage Gen2를 다른 Azure 서비스와 통합합니다.
- Azure Data Lake Storage Gen2 API를 사용하여 솔루션을 개발합니다.
- 일반적인 문제를 해결하고 스토리지 전략을 최적화합니다.
Data Vault: Building a Scalable Data Warehouse
28 Hours대한민국에서 강사가 진행하는 이 실시간 교육에서 참가자는 Data Vault을 빌드하는 방법을 배웁니다.
이 교육을 마치면 참가자는 다음을 수행할 수 있습니다.
- Data Vault 2.0의 아키텍처와 디자인 개념, 그리고 Big Data, NoSQL 및 AI와의 상호 작용을 이해합니다.
- 데이터 보관 기술을 사용하여 데이터 웨어하우스의 과거 데이터에 대한 감사, 추적, 검사가 가능합니다.
- 일관되고 반복 가능한 ETL(추출, 변환, 로드) 프로세스를 개발합니다.
- 확장성과 반복성이 뛰어난 창고를 구축하고 배포합니다.
Apache Druid for Real-Time Data Analysis
21 HoursApache Druid 는 Java 작성된 오픈 소스, 열 중심의 분산 데이터 저장소입니다. 대량의 이벤트 데이터를 신속하게 수집하고 해당 데이터에 대해 짧은 대기 시간 OLAP 쿼리를 실행하도록 설계되었습니다. Druid는 일반적으로 비즈니스 인텔리전스 응용 프로그램에서 대량의 실시간 및 과거 데이터를 분석하는 데 사용됩니다. 또한 최종 사용자를위한 빠른 대화식 분석 대시 보드를 제공하는 데 적합합니다. Druid는 Alibaba, Airbnb, Cisco , eBay, Netflix, Paypal 및 Yahoo와 같은 회사에서 사용합니다.
이 강사 주도 라이브 코스에서 데이터웨어 하우스 솔루션의 한계를 살펴보고 Druid가 이러한 기술을 보완하여 유연하고 확장 가능한 스트리밍 분석 스택을 형성하는 방법에 대해 논의합니다. 실습 환경에서 Druid 기반 솔루션을 구현하고 테스트 할 수있는 기회를 제공하는 많은 예제를 살펴 봅니다.
코스의 형식
- 강의, 강의, 실습, 때때로 이해도를 측정하기위한 시험
Greenplum Database
14 Hours대한민국에서 진행되는 이 실시간 교육(온라인 또는 현장)은 비즈니스 인텔리전스 및 데이터 웨어하우징 솔루션을 위한 Greenplum Database을(를) 설정하려는 관리자를 대상으로 합니다.
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- Greenplum을 통해 처리 요구 사항을 해결하세요.
- 데이터 처리를 위해 ETL 작업을 수행합니다.
- 기존 쿼리 처리 인프라를 활용합니다.
IBM Datastage For Administrators and Developers
35 Hours대한민국에서 진행되는 이 실시간 교육(온라인 또는 현장)은 관리 및 개발 관점 모두에서 IBM DataStage에 대한 포괄적인 이해를 갖고 이를 관리하고 활용하려는 중급 IT 전문가를 대상으로 합니다. 각자의 작업장에서 효과적으로 도구를 사용하세요.
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- DataStage의 핵심 개념을 이해합니다.
- DataStage 환경을 효과적으로 설치, 구성 및 관리하는 방법을 알아보세요.
- 다양한 데이터 소스에 연결하고 데이터베이스, 플랫 파일, 외부 소스에서 데이터를 효율적으로 추출합니다.
- 효과적인 데이터 로딩 기술을 구현합니다.
Apache Kylin: Real-Time OLAP on Big Data
14 Hours이 강사 주도의 실시간 트레이닝(대한민국 온라인 또는 현장)은 대규모 데이터 집합에 대한 다차원 분석을 수행하고 실시간 데이터 웨어하우스를 구축하기 위해 Apache Kylin을 활용하고자 하는 중급 레벨의 빅데이터 전문가들을 대상으로 합니다.
이 트레이닝을 마치면 참가자는 다음과 같은 능력을 갖추게 됩니다:
- Apache Kylin을 실시간 스트리밍 데이터 소스와 함께 설정하고 구성합니다.
- 배치 및 스트림 데이터를 위한 OLAP 큐브를 설계하고 구축합니다.
- Kylin의 SQL 인터페이스를 사용하여 서브세컨드 지연 시간으로 복잡한 쿼리를 수행합니다.
- BI 도구와 Kylin을 통합하여 상호 작용형 데이터 시각화를 수행합니다.
- Kylin에서 성능을 최적화하고 자원을 효과적으로 관리합니다.
Oracle SQL for Development and Database Management
35 Hours대한민국에서 강사가 진행하는 이 실시간 교육(온라인 또는 현장)은 Oracle SQL 개발 및 관리 기술을 향상시키고자 하는 중급 수준의 데이터베이스 전문가를 대상으로 합니다.
이 교육을 마치면 참가자는 다음을 수행할 수 있습니다.
- 복잡한 SQL 쿼리를 구축하고 최적화합니다.
- Oracle SQL 도구를 사용하여 데이터베이스를 효율적으로 관리하세요.
- 데이터베이스 개발 및 유지관리에 모범 사례를 적용합니다.
- Oracle 환경에서 사용자 액세스 및 데이터베이스 보안을 관리합니다.