Course Outline

Google Colab 및 Apache Spark 소개

  • Google Colab 개요
  • Apache Spark 소개
  • Google Colab에서 Spark 설정

Apache Spark을 통한 데이터 처리

  • RDD 및 DataFrame 작업
  • 대형 데이터셋 로드 및 처리
  • 구조화된 데이터 쿼리용 Spark SQL 사용

Spark를 통한 고급 분석

  • Spark MLlib를 통한 머신러닝
  • 실시간 데이터 분석 수행
  • Spark를 통한 분산 컴퓨팅

Google Colab에서의 시각화 및 Collaboration

  • Colab와 인기 시각화 라이브러리 통합
  • Colab 노트북을 통한 협업 워크플로우
  • 결과 공유 및 내보내기

Big Data 워크플로우 최적화

  • Spark 성능 튜닝
  • 메모리와 저장 공간 사용 최적화
  • 대형 데이터셋용 워크플로우 확장

클라우드에서의 Big Data

  • 클라우드 기반 도구와 Google Colab 통합
  • 빅데이터용 클라우드 저장소 사용
  • 분산 클라우드 환경에서 Spark 작업

사례 연구 및 최선 전략

  • 실제 세계 빅데이터 애플리케이션 검토
  • Apache Spark 및 Colab을 사용한 사례 연구
  • 빅데이터 분석을 위한 최선 전략

요약 및 다음 단계

Requirements

  • 데이터 과학 개념의 기본 지식이 필요합니다.
  • Apache Spark에 대한 익숙함.
  • Python 프로그래밍 기술.

대상

  • 데이터 과학자.
  • 데이터 엔지니어.
  • 빅데이터를 처리하는 연구원.
 14 Hours

Number of participants


Price per participant

회원 평가 (5)

Upcoming Courses

Related Categories