Course Outline
소개
- 프로젝트 팀이 채택하는 이유와 방법 Hadoop
- 모든 것이 어떻게 시작되었는지
- Hadoop 프로젝트에서 프로젝트 관리자의 역할
Hadoop의 아키텍처 및 주요 개념 이해
- HDFS
- 맵리듀스
- Hadoop 생태계의 다른 부분들
Big Data은 무엇으로 구성되나요?
저장에 대한 다양한 접근 방식 Big Data
기초로서의 HDFS(Hadoop 분산 파일 시스템)
Big Data 처리 방법
- 분산 처리의 힘
MapReduce를 사용한 데이터 처리
- 데이터를 단계별로 선택하는 방법
대규모 분산 처리에서 클러스터링의 역할
- 아키텍처 개요
- 클러스터링 접근법
YARN을 사용하여 데이터 및 프로세스 클러스터링
Big Data 스토리지에서 비관계형 Database의 역할
Hadoop의 비관계형 Database 작업: HBase
데이터 웨어하우징 아키텍처 개요
Hive로 Data Warehouse 관리하기
쉘 스크립트에서 Hadoop 실행
Hadoop 스트리밍 작업
기타 Hadoop 도구 및 유틸리티
Hadoop 프로젝트 시작하기
- 복잡성 해소
기존 프로젝트를 Hadoop으로 마이그레이션
- 인프라 고려 사항
- 할당된 리소스 이상으로 확장
Hadoop 프로젝트 이해관계자 및 툴킷
- 개발자, 데이터 과학자, 비즈니스 분석가 및 프로젝트 관리자
Hadoop 새로운 기술 및 접근 방식의 기반
맺음말
Requirements
- 프로그래밍에 대한 일반적인 이해
- 데이터베이스에 대한 이해
- Linux의 기본 지식
회원 평가 (6)
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Course - Impala for Business Intelligence
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Course - Data Analysis with Hive/HiveQL
Many hands-on sessions.
Jacek Pieczątka
Course - Administrator Training for Apache Hadoop
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Course - Big Data Analytics in Health
The fact that all the data and software was ready to use on an already prepared VM, provided by the trainer in external disks.
vyzVoice
Course - Hadoop for Developers and Administrators
practical things of doing, also theory was served good by Ajay