문의를 보내주셔서 감사합니다! 팀원이 곧 연락드리겠습니다.
예약을 보내주셔서 감사합니다! 저희 팀 멤버 중 한 분이 곧 연락드리겠습니다.
코스 개요
섹션 1: HDFS에서의 데이터 관리
- 다양한 데이터 형식 (JSON / Avro / Parquet)
- 압축 방식
- 데이터 마스킹
- 실습 : 다양한 데이터 형식 분석; 압축 활성화
섹션 2: 고급 Pig
- 사용자 정의 함수
- Pig 라이브러리 소개 (ElephantBird / Data-Fu)
- Pig을 사용한 복잡한 구조화된 데이터 로드
- Pig 튜닝
- 실습 : 고급 Pig 스크립팅, 복잡한 데이터 유형 파싱
섹션 3: 고급 Hive
- 사용자 정의 함수
- 압축된 테이블
- Hive 성능 튜닝
- 실습 : 압축된 테이블 생성, 테이블 형식 및 설정 평가
섹션 4: 고급 HBase
- 고급 스키마 모델링
- 압축
- 대량 데이터 잉스트
- 넓은 테이블 / 긴 테이블 비교
- HBase와 Pig
- HBase와 Hive
- HBase 성능 튜닝
- 실습 : HBase 튜닝; Pig 및 Hive에서 HBase 데이터 접근; Phoenix를 사용한 데이터 모델링
요건
- Java 프로그래밍 언어에 익숙해야 합니다 (대부분의 프로그래밍 연습은 Java로 이루어짐)
- Linux 환경에서 편안하게 작업할 수 있어야 합니다 (Linux 명령 줄을 탐색하고, vi 또는 nano를 사용하여 파일을 편집할 수 있어야 함)
- 하둡에 대한 기본 지식이 필요합니다.
실습 환경
무설치: 학생들의 컴퓨터에 하둡 소프트웨어를 설치할 필요가 없습니다! 학생들을 위해 작동하는 하둡 클러스터가 제공됩니다.
학생들은 다음을 준비해야 합니다
21 시간
회원 평가 (5)
실시간 예제
Ahmet Bolat - Accenture Industrial SS
코스 - Python, Spark, and Hadoop for Big Data
기계 번역됨
연습 중에 제임스는 제가 막히는 부분을 더 자세하게 설명해주었습니다. 저는 NIFI에 완전히 낯선 사람이었고, 제임스는 NIFI의 실제 목적과 오픈 소스와 같은 기본 개념까지 모두 설명해주었습니다. 그는 초보자 수준부터 개발자 수준까지 모든 Nifi 개념을 다루었습니다.
Firdous Hashim Ali - MOD A BLOCK
코스 - Apache NiFi for Administrators
기계 번역됨
처음부터 가지고 있었던 것입니다.
Peter Scales - CACI Ltd
코스 - Apache NiFi for Developers
기계 번역됨
아제이가 실용적인 부분뿐만 아니라 이론도 잘 전달해주었습니다.
Dominik Mazur - Capgemini Polska Sp. z o.o.
코스 - Hadoop Administration on MapR
기계 번역됨
저는 이 VM을 매우 좋아했습니다. 강사는 주제뿐만 아니라 다른 주제에 대해서도 매우 밝았으며, 매우 친절하고 친근하였습니다. 두바이의 시설을 좋아했습니다.
Safar Alqahtani - Elm Information Security
코스 - Big Data Analytics in Health
기계 번역됨