Course Outline

  1. 빅데이터 기초
    • Big Data 그리고 기업 세계에서의 역할
    • 기업 내 Big Data 전략 개발 단계
    • Big Data에 대한 전체적인 접근 방식의 기초가 되는 이론적 근거를 설명하세요.
    • Big Data 플랫폼에 필요한 구성 요소
    • 빅데이터 스토리지 솔루션
    • 전통 기술의 한계
    • 데이터베이스 유형 개요
    • Big Data의 4가지 차원
  2. 빅데이터가 비즈니스에 미치는 영향
    • Business Big Data의 중요성
    • 유용한 데이터 추출의 과제
    • 빅데이터와 기존 데이터의 통합
  3. 빅데이터 저장 기술
    • 빅데이터 기술 개요
      • 데이터 저장 모델
      • Hadoop
      • Hive
      • [삼]
      • MongoDB
    • 올바른 빅데이터 기술 선택
  4. 빅데이터 처리
    • 데이터베이스에서 데이터 연결 및 추출
    • 처리를 위한 데이터 변환 및 준비
    • Hadoop MapReduce를 활용하여 분산 데이터 처리
    • Hadoop MapReduce 작업 모니터링 및 실행
    • Hadoop 분산 파일 시스템 빌딩 블록
    • 맵리듀스와 Yarn
    • Spark로 스트리밍 데이터 처리
  5. 빅데이터 분석 도구 및 기술
    • Programming Hadoop 돼지 라틴 언어 사용
    • Hive을 사용하여 빅데이터 쿼리
    • Mahout을 사용한 데이터 마이닝
    • 시각화 및 보고 도구
  6. 비즈니스에서의 빅데이터
    • Big Data 요구사항 관리 및 확립
    • Business Big Data의 중요성
    • 문제에 적합한 빅데이터 도구 선택

데이터 웨어하우징 개념

  • 데이터웨어하우스란?
  • OLTP와 데이터웨어 하우징의 차이점
  • 데이터 취득
  • 데이터 추출
  • 데이터 변환.
  • 데이터 로딩
  • 데이터 마트
  • 종속 데이터 마트와 독립 데이터 마트
  • 데이터베이스 설계

ETL 테스트 개념:

  • 소개.
  • 소프트웨어 개발 수명주기.
  • 테스트 방법론.
  • ETL 테스트 작업 흐름 프로세스.
  • 데이터 단계의 ETL 테스트 책임.

빅데이터 기초

  • Big Data 그리고 기업 세계에서의 역할
  • 기업 내 Big Data 전략 개발 단계
  • Big Data에 대한 전체적인 접근 방식의 기초가 되는 이론적 근거를 설명하세요.
  • Big Data 플랫폼에 필요한 구성 요소
  • 빅데이터 스토리지 솔루션
  • 전통 기술의 한계
  • 데이터베이스 유형 개요

NoSQL Database

Hadoop

지도 축소

Apache Spark

Requirements

대표자는 저장 도구에 대한 인식과 경험이 있어야 하며 대규모 데이터 세트 처리에 대한 인식이 있어야 합니다.

 14 Hours

Number of participants



Price per participant

회원 평가 (4)

Related Courses

Unified Batch and Stream Processing with Apache Beam

14 Hours

Related Categories