Course Outline

[1. 개요:

  • Big Data이란 무엇입니까?
  • Big Data이 인기를 얻고 있는 이유
  • Big Data 사례 연구
  • Big Data 특징
  • Big Data에서 작업할 솔루션입니다.

Hadoop 및 구성요소:

  • Hadoop는 무엇이며 그 구성 요소는 무엇입니까?
  • Hadoop 처리할 수 있는 데이터의 구조와 특징/프로세스.
  • Hadoop 역사, 사용 기업, 사용 이유에 대해 간략히 설명합니다.
  • Hadoop 프레임 작업 및 구성요소 - 자세히 설명합니다.
  • HDFS 및 읽기란 무엇입니까 - Hadoop 분산 파일 시스템에 씁니다.
  • Hadoop 클러스터를 다양한 모드(독립형/의사/다중 노드 클러스터)로 설정하는 방법.

(여기에는 VirtualBox/KVM/VMware에서 Hadoop 클러스터 설정, 주의 깊게 조사해야 하는 네트워크 구성, Hadoop 데몬 실행 및 클러스터 테스트가 포함됩니다.)

  • Map Reduce 프레임 작업이란 무엇이며 어떻게 작동합니까?
  • Hadoop 클러스터에서 Map Reduce 작업을 실행 중입니다.
  • Hadoop 클러스터의 맥락에서 복제, 미러링 및 랙 인식을 이해합니다.

Hadoop 클러스터 계획:

  • hadoop 클러스터를 계획하는 방법
  • hadoop 클러스터를 계획하기 위해 하드웨어-소프트웨어를 이해합니다.
  • 워크로드를 이해하고 클러스터를 계획하여 장애를 방지하고 최적의 성능을 발휘합니다.

MapR이란 무엇이며 MapR을 사용하는 이유는 다음과 같습니다.

  • MapR 및 해당 아키텍처 개요
  • MapR 제어 시스템, MapR 볼륨, 스냅샷 및 미러에 대한 이해 및 작동.
  • MapR의 맥락에서 클러스터를 계획합니다.
  • MapR을 다른 배포판 및 Apache와 비교합니다 Hadoop.
  • MapR 설치 및 클러스터 배포.

클러스터 설정 및 관리:

  • 서비스, 노드, 스냅샷, 미러 볼륨 및 원격 클러스터를 관리합니다.
  • 노드를 이해하고 관리합니다.
  • Hadoop 구성 요소에 대한 이해, MapR 서비스와 함께 Hadoop 구성 요소 설치.
  • Access NFS 관리 서비스 및 노드를 통해 클러스터에 데이터를 전송합니다.
  • 볼륨을 사용하여 데이터 관리, 사용자 및 그룹 관리, 노드에 역할 관리 및 할당, 노드 폐기 시운전, 클러스터 관리 및 성능 모니터링, 성능 모니터링을 위한 지표 구성/분석 및 모니터링, MapR 보안 구성 및 관리.
  • MapR 테이블용 M7 기본 스토리지를 이해하고 사용합니다.
  • 최적의 성능을 위한 클러스터 구성 및 튜닝.

클러스터 업그레이드 및 다른 설정과의 통합:

  • MapR의 소프트웨어 버전 업그레이드 및 업그레이드 유형.
  • HDFS 클러스터에 액세스하도록 Mapr 클러스터를 구성합니다.
  • Amazon Elastic Mapreduce에서 MapR 클러스터를 설정합니다.

위의 모든 주제에는 학습자가 기술을 직접 경험할 수 있는 데모 및 연습 세션이 포함됩니다.

Requirements

  • LinuxFS의 기본지식
  • 기본 자바
  • Apache Hadoop에 대한 지식(권장)
 28 Hours

Number of participants



Price per participant

회원 평가 (1)

Related Courses

Related Categories