코스 개요

Greenplum 아키텍처

  • 병렬 처리 및 대칭형 다중 처리
  • 세그먼트 역할 및 클러스터 구성
  • 확장성 및 데이터 이동
  • Greenplum 데이터 웨어하우스 아키텍처

Greenplum 테이블 구조

  • 분산 vs. 무작위 할당 테이블
  • 힙 vs. 추가 전용 테이블
  • 행 vs. 열 저장 형식
  • 분할 및 클러스터 테이블

데이터 분배 및 해싱

  • 해싱 논리와 분배 키
  • 스키우 처리 및 성능 영향
  • 해시 맵 및 행 배치 전략

인덱스 및 성능 최적화

  • 클러스터 및 비클러스터 인덱스
  • B-tree 및 비트맵 인덱스 사용 사례
  • 인덱스 스캔 및 저장 동작

물리적 데이터베이스 설계

  • 정규화 및 논리적 모델 설계
  • 사용자 접근 전략 및 분배 분석
  • 데이터 인구 통계 및 인덱싱 결정

비정규화 기법

  • 도출 데이터, 요약 테이블 및 사전 조인
  • 열 테이블을 수직 분할로
  • 데이터 마트 및 재료화된 뷰

고급 SQL 및 쿼리 실행

  • 조인 전략 및 재분배
  • OLAP 및 윈도우 함수
  • 임시 테이블, 하위 쿼리 및 도출 테이블

EXPLAIN 계획 및 쿼리 조정

  • EXPLAIN 출력 읽기와 해석
  • 비용 분석 및 계획 최적화
  • 조인 이동 및 세그먼트 지역 작업

Greenplum 유틸리티 및 최적 실천 방법

  • ANALYZE 및 VACUUM
  • Nexus를 사용한 데이터 로드 및 이동
  • 보안, 권한 및 성능 팁

요약 및 다음 단계

요건

  • 관계형 데이터베이스와 SQL에 대한 이해
  • 데이터 웨어하우스나 분석 시스템 경험
  • Linux 명령줄 작업에 대한 익숙함

대상

  • 데이터 아키텍트 및 엔지니어
  • 데이터베이스 관리자 및 기술 리더
  • Greenplum을 사용하는 BI 개발자 및 분석 전문가
 21 시간

참가자 수


참가자당 가격

회원 평가 (1)

예정된 코스

관련 카테고리