코스 개요
-
Scala 개요
- Scala의 간단한 소개
- 실습: Scala를 알아보기
-
Spark 기본 개념
- 배경 및 역사
- Spark와 Hadoop
- Spark 개념 및 아키텍처
- Spark 에코시스템 (코어, Spark SQL, MLlib, 스트리밍)
- 실습: Spark 설치 및 실행
-
Spark 첫 번째 시선
- 로컬 모드에서 Spark 실행
- Spark 웹 UI
- Spark 셸
- 데이터셋 분석 – 1부
- RDD 검사
- 실습: Spark 셸 탐색
-
RDDs
- RDD 개념
- 파티션
- RDD 연산 / 변환
- RDD 유형
- 키-값 쌍 RDD
- RDD에서 MapReduce
- 캐싱 및 지속성
- 실습: RDD 생성 및 검사; RDD 캐싱
-
Spark API 프로그래밍
- Spark API / RDD API 소개
- 첫 번째 프로그램 Spark에 제출
- 디버깅 / 로깅
- 구성 속성
- 실습: Spark API 프로그래밍, 작업 제출
-
Spark SQL
- Spark에서 SQL 지원
- 데이터프레임
- 테이블 정의 및 데이터셋 가져오기
- SQL을 사용하여 데이터프레임 쿼리
- 저장 형식: JSON / Parquet
- 실습: 데이터프레임 생성 및 쿼리; 데이터 형식 평가
-
MLlib
- MLlib 소개
- MLlib 알고리즘
- 실습: MLlib 애플리케이션 작성
-
GraphX
- GraphX 라이브러리 개요
- GraphX API
- 실습: Spark를 사용하여 그래프 데이터 처리
-
Spark 스트리밍
- 스트리밍 개요
- 스트리밍 플랫폼 평가
- 스트리밍 연산
- 슬라이딩 윈도우 연산
- 실습: Spark 스트리밍 애플리케이션 작성
-
Spark와 Hadoop
- Hadoop 소개 (HDFS / YARN)
- Hadoop + Spark 아키텍처
- Hadoop YARN에서 Spark 실행
- Spark를 사용하여 HDFS 파일 처리
-
Spark 성능 및 튜닝
- 브로드캐스트 변수
- 누적기
- 메모리 관리 및 캐싱
-
Spark 운영
- 프로덕션 환경에서 Spark 배포
- 샘플 배포 템플릿
- 구성
- 모니터링
- 문제 해결
요건
필수 사전 지식
Java / Scala / Python 언어 중 하나에 대한 친숙함 (우리 실험실은 Scala와 Python에서 진행)
Linux 개발 환경에 대한 기본 이해 (명령줄 탐색 / VI 또는 nano를 사용하여 파일을 편집)
회원 평가 (6)
비슷한 연습을 다양한 방법으로 수행하는 것이 각 구성 요소(Hadoop/Spark, 단독/클러스터)가 개별적으로 그리고 함께 어떤 역할을 하는지 이해하는 데 큰 도움이 됩니다. 이는 로컬 머신에서 애플리케이션을 개발할 때와 클러스터에 배포될 때 어떻게 테스트해야 하는지를 결정하는 데 아이디어를 제공해주었습니다.
Thomas Carcaud - IT Frankfurt GmbH
코스 - Spark for Developers
기계 번역됨
아제이(Ajay)는 매우 친절하고 도움이 되었으며, 논의한 주제에 대해 깊은 지식을 가지고 있었습니다.
Biniam Guulay - ICE International Copyright Enterprise Germany GmbH
코스 - Spark for Developers
기계 번역됨
Ernesto did a great job explaining the high level concepts of using Spark and its various modules.
Michael Nemerouf
코스 - Spark for Developers
기계 번역됨
The trainer made the class interesting and entertaining which helps quite a bit with all day training.
Ryan Speelman
코스 - Spark for Developers
기계 번역됨
We know a lot more about the whole environment.
John Kidd
코스 - Spark for Developers
기계 번역됨
Richard is very calm and methodical, with an analytic insight - exactly the qualities needed to present this sort of course.
Kieran Mac Kenna
코스 - Spark for Developers
기계 번역됨