문의를 보내주셔서 감사합니다! 팀원이 곧 연락드리겠습니다.
예약을 보내주셔서 감사합니다! 저희 팀 멤버 중 한 분이 곧 연락드리겠습니다.
코스 개요
데이터 웨어하우징 기초
- 웨어하우즈 목적, 구성 요소 및 아키텍처
- 데이터 마트, 기업 웨어하우스 및 레이크하우스 패턴
- OLTP와 OLAP의 기본 개념과 작업 분리
차원 모델링
- 사실, 차원 및 그레인
- 스타 스키마와 스노우플레이크 스키마 비교
- 천천히 변화하는 차원의 유형과 처리
ETL 및 ELT 프로세스
- OLTP와 API에서 추출 전략
- 변환, 데이터 청소, 일관성 유지
- 로드 패턴, 조정, 종속성 관리
데이터 품질 및 메타데이터 관리
- 데이터 프로파일링과 검증 규칙
- 마스터 및 참조 데이터 일치화
- 라인지, 카탈로그, 문서화
분석 및 성능
- 큐빙 개념, 집계, 물리적 뷰
- 파티셔닝, 클러스터링, 인덱싱을 통한 분석 최적화
- 작업 관리, 캐싱, 쿼리 튜닝
보안 및 거버넌스
- 액세스 제어, 역할, 행 수준 보안
- 준수 사항과 감사
- 백업, 복구, 신뢰성 관행
현대 아키텍처
- 클라우드 데이터 웨어하우스와 탄력성
- 스트리밍 수집 및 실시간 분석
- 비용 최적화 및 모니터링
캡스톤: 소스에서 스타 스키마까지
- 사실과 차원으로 비즈니스 프로세스 모델링
- 끝에서 끝까지 ETL 또는 ELT 워크플로 구축
- 대시보드 발행 및 메트릭 검증
요약과 다음 단계
요건
- 관계형 데이터베이스와 SQL에 대한 이해
- 데이터 분석 또는 보고서 작성 경험이 있음
- 클라우드 또는 온프레미스 데이터 플랫폼에 대한 기본적인 이해
대상
- 데이터 웨어하우징으로 전환하는 데이터 분석가
- BI 개발자 및 ETL 엔지니어
- 데이터 아키텍트 및 팀 리드
35 시간
회원 평가 (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
코스 - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
코스 - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
코스 - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
코스 - Apache Spark in the Cloud
practice tasks