코스 개요

  1. 빅데이터 기초
    • Big Data 그리고 기업 세계에서의 역할
    • 기업 내 Big Data 전략 개발 단계
    • Big Data에 대한 전체적인 접근 방식의 기초가 되는 이론적 근거를 설명하세요.
    • Big Data 플랫폼에 필요한 구성 요소
    • 빅데이터 스토리지 솔루션
    • 전통 기술의 한계
    • 데이터베이스 유형 개요
    • Big Data의 4가지 차원
  2. 빅데이터가 비즈니스에 미치는 영향
    • Business Big Data의 중요성
    • 유용한 데이터 추출의 과제
    • 빅데이터와 기존 데이터의 통합
  3. 빅데이터 저장 기술
    • 빅데이터 기술 개요
      • 데이터 저장 모델
      • Hadoop
      • Hive
      • [삼]
      • MongoDB
    • 올바른 빅데이터 기술 선택
  4. 빅데이터 처리
    • 데이터베이스에서 데이터 연결 및 추출
    • 처리를 위한 데이터 변환 및 준비
    • Hadoop MapReduce를 활용하여 분산 데이터 처리
    • Hadoop MapReduce 작업 모니터링 및 실행
    • Hadoop 분산 파일 시스템 빌딩 블록
    • 맵리듀스와 Yarn
    • Spark로 스트리밍 데이터 처리
  5. 빅데이터 분석 도구 및 기술
    • Programming Hadoop 돼지 라틴 언어 사용
    • Hive을 사용하여 빅데이터 쿼리
    • Mahout을 사용한 데이터 마이닝
    • 시각화 및 보고 도구
  6. 비즈니스에서의 빅데이터
    • Big Data 요구사항 관리 및 확립
    • Business Big Data의 중요성
    • 문제에 적합한 빅데이터 도구 선택

데이터 웨어하우징 개념

  • 데이터웨어하우스란?
  • OLTP와 데이터웨어 하우징의 차이점
  • 데이터 취득
  • 데이터 추출
  • 데이터 변환.
  • 데이터 로딩
  • 데이터 마트
  • 종속 데이터 마트와 독립 데이터 마트
  • 데이터베이스 설계

ETL 테스트 개념:

  • 소개.
  • 소프트웨어 개발 수명주기.
  • 테스트 방법론.
  • ETL 테스트 작업 흐름 프로세스.
  • 데이터 단계의 ETL 테스트 책임.

빅데이터 기초

  • Big Data 그리고 기업 세계에서의 역할
  • 기업 내 Big Data 전략 개발 단계
  • Big Data에 대한 전체적인 접근 방식의 기초가 되는 이론적 근거를 설명하세요.
  • Big Data 플랫폼에 필요한 구성 요소
  • 빅데이터 스토리지 솔루션
  • 전통 기술의 한계
  • 데이터베이스 유형 개요

NoSQL Database

Hadoop

지도 축소

Apache Spark

요건

대표자는 저장 도구에 대한 인식과 경험이 있어야 하며 대규모 데이터 세트 처리에 대한 인식이 있어야 합니다.

 14 시간

참가자 수


참가자당 가격

회원 평가 (1)

예정된 코스

관련 카테고리