Course Outline

Apache Kylin에 대한 소개

  • OLAP의 개요 및 대규모 데이터 분석에서의 중요성
  • Apache Kylin의 진화와 아키텍처
  • Kylin 50의 주요 기능과 능력

Apache Kylin 설정하기

  • 설치 전제 조건 및 환경 설정
  • Hadoop, Spark, Kafka와 함께 Kylin 구성하기
  • Kylin의 웹 UI와 명령줄 도구 이해하기

Kylin에서 데이터 모델링

  • OLAP 큐브를 위한 스타 및 스노우플레이크 스키마 설계
  • 차원과 측정 정의하기
  • Kylin 웹 UI에서 데이터 모델 생성 및 관리하기

큐브 구축 및 관리

  • 큐브 구축 프로세스와 작업 관리
  • 증분 구축 및 자동 병합 전략
  • 큐브의 상태 및 성능 모니터링하기

Kylin을 이용한 실시간 스트리밍

  • Kafka를 스트리밍 데이터 소스로 통합하기
  • 실시간 큐브와 융합 모델 설정하기
  • 스트리밍 데이터를 활용한 저지연 분석 수행하기

쿼리 및 분석

  • Kylin의 쿼리 인터페이스를 사용하여 SQL 쿼리 실행하기
  • BI 도구 (예: Tableau, Power BI)를 Kylin에 연결하기
  • 다차원 분석 및 드릴다운 수행하기

성능 최적화

  • 큐브 설계와 집계의 베스트 프랙티스
  • 확장성을 위한 리소스 관리 및 튜닝
  • 일반적인 성능 문제 해결하기

고급 주제

  • Kylin에서 보안 및 액세스 제어
  • 사용자 정의 플러그인과 통합을 통해 Kylin 확장하기
  • 자동화를 위한 Kylin의 REST API 탐색하기

요약 및 다음 단계

Requirements

  • Hadoop과 빅데이터 생태계에 대한 이해
  • SQL 및 데이터 웨어하우징 개념에 대한 익숙함
  • Kafka와 같은 스트리밍 데이터 플랫폼의 기본 지식

대상

  • 실시간 분석 솔루션을 구현하고자 하는 빅데이터 엔지니어
  • 큰 데이터셋에서 OLAP 기능을 활용하려는 데이터 분석가
  • 인프라를 최신화하고자 하는 데이터 웨어하우스 아키텍트
 14 Hours

Number of participants


Price per participant

회원 평가 (5)

Upcoming Courses

Related Categories