코스 개요

Teradata 소개

모듈 1: Teradata의 기본 및 아키텍처

  • Teradata란 무엇이며 어떤 용도로 사용되나요?
  • 병렬 아키텍처: AMPs, PEs, BYNET
  • 데이터 분산 및 해싱
  • 주요 개념: 세션, 스풀, 잠금
  • 시스템 연결: Teradata Studio / BTEQ / SQL Assistant

모듈 2: Teradata에서의 SQL 소개

  • 기본 SELECT, WHERE, ORDER BY
  • 데이터 타입 및 캐스팅
  • 수학 함수와 날짜 함수
  • ALIAS, CASE 표현식 사용
  • Teradata의 특수 연산자 (TOP, QUALIFY, SAMPLE)
  • 실제 테이블에 대한 쿼리 실습

모듈 3: Joins, Subqueries 및 Set Operators

  • INNER, LEFT, RIGHT, FULL OUTER JOIN
  • ON 절이 없는 Join (카르테시안 제품)
  • 스칼라 서브쿼리와 상관 서브쿼리
  • UNION, INTERSECT, MINUS
  • 데이터 통합 실습

모듈 4: 분석 함수와 OLAP

  • RANK(), ROW_NUMBER(), DENSE_RANK()
  • PARTITION BY를 사용한 데이터 파티셔닝
  • OVER()와 ORDER BY를 사용한 윈도우
  • LAG(), LEAD(), FIRST_VALUE()
  • KPIs, 트렌드, 누적 등의 사례 /

모듈 5: 데이터 및 테이블 관리

  • 테이블 유형: 영구, 일시, 글로벌 일시
  • 보조 인덱스 및 조인 인덱스 생성과 사용
  • 레코드 삽입, 업데이트, 삭제
  • MERGE, UPSERT 및 중복 제어
  • 트랜잭션과 잠금 제어

모듈 6: 최적화 및 성능 조정

  • Teradata의 옵티마이저: 계획 결정 방법
  • EXPLAIN과 COLLECT STATISTICS 사용법
  • 데이터 편향(Skew) 및 피하는 방법
  • 쿼리 설계의 최선의 관행
  • 병목 현상 식별 (스풀, 잠금, 재분배)
  • 실습: 최적화된 쿼리와 비최적화된 쿼리 비교

모듈 7: 데이터 파티셔닝 및 압축

  • 파티셔닝 유형: 범위, 케이스, 다중 레벨
  • 큰 쿼리에서의 실제 사용 및 이점
  • 블록 레벨 압축(BLC) 및 열 압축
  • 장단점

모듈 8: 데이터 로드 및 추출

  • TPT (Teradata Parallel Transporter) vs. FastLoad / MultiLoad
  • 대량 로드와 배치 삽입의 비교
  • 오류 처리 및 재시도
  • 결과를 파일 또는 외부 시스템으로 추출하기
  • 스크립트와 유틸리티를 사용한 기본 자동화

모듈 9: 기술 사용자를 위한 기본 관리

  • 역할과 권한
  • 리소스 제어 (Query Bands, Priority Scheduler)
  • DBQLOGTBL, DBC.Tables, ResUsage를 사용한 모니터링
  • 공유 환경의 최선의 관행

모듈 10: 통합 최종 실험실

  • 엔드투엔드 실무 사례:
    • 데이터 로드
    • 변환 및 집계
    • OLAP 함수를 사용한 지표 구축
    • 최적화 및 설명
    • 최종 추출
  • 최선의 관행과 일반적인 오류에 대한 토론

요건

  • 관계형 데이터베이스 및 SQL 개념 이해
  • 대규모 데이터셋을 쿼리하거나 데이터 환경에서 작업한 경험이 있음
  • 비즈니스 인텔리전스 또는 분석 목표에 대한 이해

대상 대상자

  • 데이터 분석가 및 비즈니스 인텔리전스 전문가
  • SQL 개발자 및 데이터 엔지니어
  • Teradata 환경에서 데이터를 관리하거나 최적화하는 기술 사용자
 35 시간

참가자 수


참가자당 가격

회원 평가 (1)

예정된 코스

관련 카테고리