Course Outline

Google Colab 및 Apache Spark 소개

  • Google Colab 개요
  • Apache Spark 소개
  • Google Colab에서 Spark 설정하기

Apache Spark을 사용한 데이터 처리

  • RDD 및 DataFrames 작업
  • 대용량 데이터 세트 로딩 및 처리
  • 구조화된 데이터 쿼리를 위해 Spark SQL 사용

Spark를 사용한 고급 분석

  • Spark MLlib을 사용한 머신 러닝
  • 실시간 데이터 분석 수행
  • Spark를 사용한 분산 컴퓨팅

시각화 및 Collaboration Google Colab에서

  • 인기 있는 시각화 라이브러리와 Colab 통합
  • Colab 노트북을 사용한 협업 워크플로
  • 결과 공유 및 내보내기

Big Data 워크플로 최적화

  • 성능을 위한 Spark 튜닝
  • 메모리 및 스토리지 사용 최적화
  • 대규모 데이터세트에 대한 워크플로 확장

Big Data 클라우드에서

  • Go클라우드 기반 도구와 ogle Colab 통합
  • 빅데이터를 위한 클라우드 스토리지 활용
  • 분산 클라우드 환경에서 Spark 사용

사례 연구 및 모범 사례

  • 실제 빅데이터 애플리케이션 검토
  • Apache Spark 및 Colab을 사용한 사례 연구
  • 빅데이터 분석을 위한 모범 사례

요약 및 다음 단계

Requirements

  • 데이터 과학 개념에 대한 기본 지식
  • Apache Spark에 대한 친숙함
  • Python 프로그래밍 기술

청중

  • 데이터 과학자
  • 데이터 엔지니어
  • 빅데이터를 다루는 연구자들
 14 Hours

Number of participants


Price per participant

회원 평가 (5)

Upcoming Courses

Related Categories