Course Outline

Big Data 개요:

  • Big Data이 무엇인가
  • Big Data이 인기를 얻고 있는 이유
  • Big Data 사례 연구
  • Big Data 특징
  • Big Data에서 작업할 수 있는 솔루션

Hadoop 및 구성 요소:

  • Hadoop이 무엇이며 그 구성 요소는 무엇인가
  • Hadoop 아키텍처 및 데이터 처리 및 처리 특징
  • Hadoop 역사에 대한 간략한 설명, 이를 사용하는 회사 및 시작 이유
  • Hadoop 프레임워크 및 구성 요소 - 상세 설명
  • HDFS 및 Hadoop 분산 파일 시스템에 대한 읽기 및 쓰기
  • 다양한 모드(독립형/가상/Pseudo/Multi Node 클러스터)로 Hadoop 클러스터 설정

(이것에는 VirtualBox/KVM/VMware에서 Hadoop 클러스터 설정, 신중하게 살펴볼 필요가 있는 네트워크 구성, Hadoop 데몬 실행 및 클러스터 테스트가 포함됩니다)

  • Map Reduce 프레임워크가 무엇이며 어떻게 작동하는지
  • Hadoop 클러스터에서 Map Reduce 작업 실행
  • Hadoop 클러스터의 맥락에서 복제, 미러링 및 랙 인식 이해

Hadoop 클러스터 계획:

  • 하둡 클러스터 계획 방법
  • 하둡 클러스터를 계획하기 위한 하드웨어-소프트웨어 이해
  • 작업 부하 이해 및 클러스터 계획으로 실패 방지 및 최적 성능 달성

MapR이 무엇인지, 그리고 왜 MapR인지:

  • MapR 개요 및 아키텍처
  • MapR Control System, MapR 볼륨, 스냅샷 및 미러 작업 이해
  • MapR의 맥락에서 클러스터 계획
  • MapR과 다른 배포판 및 Apache Hadoop 비교
  • MapR 설치 및 클러스터 배포

클러스터 설정 및 관리:

  • 서비스, 노드, 스냅샷, 미러 볼륨 및 원격 클러스터 관리
  • 노드 이해 및 관리
  • Hadoop 구성 요소 이해 및 MapR 서비스와 함께 Hadoop 구성 요소 설치
  • 클러스터(NFS 포함)에 데이터 Access 및 서비스 및 노드 관리
  • 볼륨을 사용하여 데이터 관리, 사용자 및 그룹 관리, 노드에 역할 할당, 노드 커미션 및 디커미션, 클러스터 관리 및 성능 모니터링, 성능 모니터링을 위한 구성/분석 및 메트릭 모니터링, MapR 보안 구성 및 관리
  • MapR 테이블의 원생 저장소인 M7 이해 및 작업
  • 최적 성능을 위한 클러스터 구성 및 튜닝

클러스터 업그레이드 및 다른 설정과의 통합:

  • MapR 소프트웨어 버전 업그레이드 및 업그레이드 유형
  • MapR 클러스터를 사용하여 HDFS 클러스터에 접근 구성
  • Amazon Elastic Mapreduce에서 MapR 클러스터 설정

위의 모든 주제는 학습자가 기술에 대한 실습 경험을 할 수 있도록 데모 및 실습 세션을 포함합니다.

Requirements

  • Linux FS에 대한 기본 지식
  • 기본 Java
  • Apache Hadoop에 대한 지식 (권장)
 28 Hours

Number of participants


Price per participant

회원 평가 (1)

Upcoming Courses

Related Categories