Course Outline

소개

  • 프로젝트 팀이 채택하는 이유와 방법 Hadoop
  • 모든 것이 어떻게 시작되었는지
  • Hadoop 프로젝트에서 프로젝트 관리자의 역할

Hadoop의 아키텍처 및 주요 개념 이해

  • HDFS
  • 맵리듀스
  • Hadoop 생태계의 다른 부분들

Big Data은 무엇으로 구성되나요?

저장에 대한 다양한 접근 방식 Big Data

기초로서의 HDFS(Hadoop 분산 파일 시스템)

Big Data 처리 방법

  • 분산 처리의 힘

MapReduce를 사용한 데이터 처리

  • 데이터를 단계별로 선택하는 방법

대규모 분산 처리에서 클러스터링의 역할

  • 아키텍처 개요
  • 클러스터링 접근법

YARN을 사용하여 데이터 및 프로세스 클러스터링

Big Data 스토리지에서 비관계형 Database의 역할

Hadoop의 비관계형 Database 작업: HBase

데이터 웨어하우징 아키텍처 개요

Hive로 Data Warehouse 관리하기

쉘 스크립트에서 Hadoop 실행

Hadoop 스트리밍 작업

기타 Hadoop 도구 및 유틸리티

Hadoop 프로젝트 시작하기

  • 복잡성 해소

기존 프로젝트를 Hadoop으로 마이그레이션

  • 인프라 고려 사항
  • 할당된 리소스 이상으로 확장

Hadoop 프로젝트 이해관계자 및 툴킷

  • 개발자, 데이터 과학자, 비즈니스 분석가 및 프로젝트 관리자

Hadoop 새로운 기술 및 접근 방식의 기반

맺음말

Requirements

  • 프로그래밍에 대한 일반적인 이해
  • 데이터베이스에 대한 이해
  • Linux의 기본 지식
 14 Hours

Number of participants



Price per participant

회원 평가 (3)

Related Courses

Related Categories