Course Outline

소개

  • Spark 개요 및 Hadoop 기능 및 아키텍처
  • 빅데이터 이해
  • Python 프로그래밍 기초

시작하기

  • Python, Spark 및 Hadoop 설정
  • Python의 데이터 구조 이해
  • PySpark API 이해
  • HDFS 및 MapReduce 이해

Spark와 Hadoop을 Python와 통합

  • Python에서 Spark RDD 구현
  • MapReduce를 사용하여 데이터 처리
  • HDFS에서 분산 데이터세트 생성

Machine Learning Spark MLlib 사용

Spark Streaming로 Big Data 처리 중

추천 시스템 작업

Kafka, Sqoop, Kafka 및 Flume 사용

Spark 및 Hadoop을 사용하는 Apache Mahout

문제 해결

요약 및 다음 단계

Requirements

  • Spark 및 Hadoop 사용 경험
  • Python 프로그래밍 경험

청중

  • 데이터 과학자
  • 개발자
 21 Hours

Number of participants



Price per participant

회원 평가 (3)

Related Courses

Related Categories