Course Outline
Google Colab 및 Apache Spark 소개
- Google Colab 개요
- Apache Spark 소개
- Google Colab에서 Spark 설정하기
Apache Spark을 사용한 데이터 처리
- RDD 및 DataFrames 작업
- 대용량 데이터 세트 로딩 및 처리
- 구조화된 데이터 쿼리를 위해 Spark SQL 사용
Spark를 사용한 고급 분석
- Spark MLlib을 사용한 머신 러닝
- 실시간 데이터 분석 수행
- Spark를 사용한 분산 컴퓨팅
시각화 및 Collaboration Google Colab에서
- 인기 있는 시각화 라이브러리와 Colab 통합
- Colab 노트북을 사용한 협업 워크플로
- 결과 공유 및 내보내기
Big Data 워크플로 최적화
- 성능을 위한 Spark 튜닝
- 메모리 및 스토리지 사용 최적화
- 대규모 데이터세트에 대한 워크플로 확장
Big Data 클라우드에서
- Go클라우드 기반 도구와 ogle Colab 통합
- 빅데이터를 위한 클라우드 스토리지 활용
- 분산 클라우드 환경에서 Spark 사용
사례 연구 및 모범 사례
- 실제 빅데이터 애플리케이션 검토
- Apache Spark 및 Colab을 사용한 사례 연구
- 빅데이터 분석을 위한 모범 사례
요약 및 다음 단계
Requirements
- 데이터 과학 개념에 대한 기본 지식
- Apache Spark에 대한 친숙함
- Python 프로그래밍 기술
청중
- 데이터 과학자
- 데이터 엔지니어
- 빅데이터를 다루는 연구자들
회원 평가 (5)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Course - ArcGIS Fundamentals
실험실 연습
Tse Kiat - ST Engineering Training & Simulation Systems Pte. Ltd.
Course - Automated Monitoring with Zabbix
Machine Translated
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
Course - QGIS for Geographic Information System
저는 Pablo의 스타일이 마음에 들었습니다. 그가 보고서 디자인, HTML을 사용한 사용자 정의, 간단한 ML 알고리즘 구현에 이르기까지 많은 주제를 다루었다는 점입니다. Go이론적 정보/연습의 균형을 유지합니다. 파블로는 제가 관심을 갖고 있는 모든 주제를 다루었고 제 질문에 포괄적인 답변을 해주었습니다.
Cristian Tudose - SC Automobile Dacia SA
Course - Advanced Data Analysis with TIBCO Spotfire
Machine Translated
Actual application of spotfire and all basic functions.