Course Outline
소개
- 프로젝트 팀이 채택하는 이유와 방법 Hadoop
- 모든 것이 어떻게 시작되었는지
- Hadoop 프로젝트에서 프로젝트 관리자의 역할
Hadoop의 아키텍처 및 주요 개념 이해
- HDFS
- 맵리듀스
- Hadoop 생태계의 다른 부분들
Big Data은 무엇으로 구성되나요?
저장에 대한 다양한 접근 방식 Big Data
기초로서의 HDFS(Hadoop 분산 파일 시스템)
Big Data 처리 방법
- 분산 처리의 힘
MapReduce를 사용한 데이터 처리
- 데이터를 단계별로 선택하는 방법
대규모 분산 처리에서 클러스터링의 역할
- 아키텍처 개요
- 클러스터링 접근법
YARN을 사용하여 데이터 및 프로세스 클러스터링
Big Data 스토리지에서 비관계형 Database의 역할
Hadoop의 비관계형 Database 작업: HBase
데이터 웨어하우징 아키텍처 개요
Hive로 Data Warehouse 관리하기
쉘 스크립트에서 Hadoop 실행
Hadoop 스트리밍 작업
기타 Hadoop 도구 및 유틸리티
Hadoop 프로젝트 시작하기
- 복잡성 해소
기존 프로젝트를 Hadoop으로 마이그레이션
- 인프라 고려 사항
- 할당된 리소스 이상으로 확장
Hadoop 프로젝트 이해관계자 및 툴킷
- 개발자, 데이터 과학자, 비즈니스 분석가 및 프로젝트 관리자
Hadoop 새로운 기술 및 접근 방식의 기반
맺음말
Requirements
- 프로그래밍에 대한 일반적인 이해
- 데이터베이스에 대한 이해
- Linux의 기본 지식
회원 평가 (3)
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Course - Data Analysis with Hive/HiveQL
Many hands-on sessions.
Jacek Pieczątka
Course - Administrator Training for Apache Hadoop
practical things of doing, also theory was served good by Ajay