문의를 보내주셔서 감사합니다! 팀원이 곧 연락드리겠습니다.
예약을 보내주셔서 감사합니다! 저희 팀 멤버 중 한 분이 곧 연락드리겠습니다.
코스 개요
섹션 1: Hadoop 소개
- Hadoop의 역사, 개념
- 생태계
- 배포
- 고수준 아키텍처
- Hadoop 신화
- Hadoop의 도전 과제
- 하드웨어/소프트웨어
- 실습 : Hadoop 첫 번째 경험
섹션 2: HDFS
- 디자인과 아키텍처
- 개념(수평 확장, 복제, 데이터 로케일리티, 랙 인식)
- 데몬 : 네임노드, 세컨더리 네임노드, 데이터 노드
- 통신/하트비트
- 데이터 무결성
- 읽기/쓰기 경로
- 네임노드 고가용성(HA), 연합
- 실습 : HDFS와 상호작용하기
섹션 3: MapReduce
- 개념과 아키텍처
- 데몬(MRV1) : 잡트래커, 태스크트래커
- 단계 : 드라이버, 맵퍼, 셔플/정렬, 리듀서
- MapReduce 버전 1과 버전 2(YARN)
- MapReduce 내부 구조
- Java MapReduce 프로그램 소개
- 실습 : 샘플 MapReduce 프로그램 실행
섹션 4: Pig
- Pig vs Java MapReduce
- Pig 작업 흐름
- Pig Latin 언어
- Pig를 사용한 ETL
- 변환 및 조인
- 사용자 정의 함수(UDF)
- 실습 : 데이터 분석을 위한 Pig 스크립트 작성
섹션 5: Hive
- 아키텍처와 디자인
- 데이터 유형
- Hive에서의 SQL 지원
- Hive 테이블 생성 및 쿼리 실행
- 파티션
- 조인
- 텍스트 처리
- 실습 : Hive를 사용한 데이터 처리 실습
섹션 6: HBase
- 개념과 아키텍처
- HBase vs RDBMS vs Cassandra
- HBase Java API
- HBase에서의 시간 시리즈 데이터
- 스키마 디자인
- 실습 : HBase 쉘을 사용한 상호작용; HBase Java API를 사용한 프로그래밍; 스키마 디자인 실습
요건
- Java 프로그래밍 언어에 익숙해야 합니다(대부분의 프로그래밍 실습은 Java로 진행됩니다)
- Linux 환경에 익숙해야 합니다(Linux 명령 줄을 탐색하고, vi 또는 nano를 사용하여 파일을 편집할 수 있어야 합니다)
실습 환경
설치 필요 없음 : 학생들의 컴퓨터에 Hadoop 소프트웨어를 설치할 필요가 없습니다! 학생들을 위해 작동하는 Hadoop 클러스터가 제공됩니다.
학생들은 다음과 같은 것을 준비해야 합니다
- SSH 클라이언트(Linux와 Mac은 이미 ssh 클라이언트를 가지고 있으며, Windows의 경우 Putty가 추천됩니다)
- 클러스터에 액세스하기 위한 브라우저, Firefox가 추천됩니다
28 시간
회원 평가 (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
코스 - Python, Spark, and Hadoop for Big Data
연습 중에 제임스는 제가 막히는 부분을 더 자세하게 설명해주었습니다. 저는 NIFI에 완전히 낯선 사람이었고, 제임스는 NIFI의 실제 목적과 오픈 소스와 같은 기본 개념까지 모두 설명해주었습니다. 그는 초보자 수준부터 개발자 수준까지 모든 Nifi 개념을 다루었습니다.
Firdous Hashim Ali - MOD A BLOCK
코스 - Apache NiFi for Administrators
기계 번역됨
처음부터 가지고 있었던 것입니다.
Peter Scales - CACI Ltd
코스 - Apache NiFi for Developers
기계 번역됨
아제이가 실용적인 부분뿐만 아니라 이론도 잘 전달해주었습니다.
Dominik Mazur - Capgemini Polska Sp. z o.o.
코스 - Hadoop Administration on MapR
기계 번역됨
저는 이 VM을 매우 좋아했습니다. 강사는 주제뿐만 아니라 다른 주제에 대해서도 매우 밝았으며, 매우 친절하고 친근하였습니다. 두바이의 시설을 좋아했습니다.
Safar Alqahtani - Elm Information Security
코스 - Big Data Analytics in Health
기계 번역됨