코스 개요
Google Colab 및 Apache Spark 소개
- Google Colab 개요
- Apache Spark 소개
- Google Colab에서 Spark 설정
Apache Spark을 통한 데이터 처리
- RDD 및 DataFrame 작업
- 대형 데이터셋 로드 및 처리
- 구조화된 데이터 쿼리용 Spark SQL 사용
Spark를 통한 고급 분석
- Spark MLlib를 통한 머신러닝
- 실시간 데이터 분석 수행
- Spark를 통한 분산 컴퓨팅
Google Colab에서의 시각화 및 Collaboration
- Colab와 인기 시각화 라이브러리 통합
- Colab 노트북을 통한 협업 워크플로우
- 결과 공유 및 내보내기
Big Data 워크플로우 최적화
- Spark 성능 튜닝
- 메모리와 저장 공간 사용 최적화
- 대형 데이터셋용 워크플로우 확장
클라우드에서의 Big Data
- 클라우드 기반 도구와 Google Colab 통합
- 빅데이터용 클라우드 저장소 사용
- 분산 클라우드 환경에서 Spark 작업
사례 연구 및 최선 전략
- 실제 세계 빅데이터 애플리케이션 검토
- Apache Spark 및 Colab을 사용한 사례 연구
- 빅데이터 분석을 위한 최선 전략
요약 및 다음 단계
요건
- 데이터 과학 개념의 기본 지식이 필요합니다.
- Apache Spark에 대한 익숙함.
- Python 프로그래밍 기술.
대상
- 데이터 과학자.
- 데이터 엔지니어.
- 빅데이터를 처리하는 연구원.
회원 평가 (4)
실제 예제를 통해 프로그램이 어떻게 작동하는지 실제로 체험할 수 있었습니다. 이론적 개념과 실용적인 적용 방법 사이의 좋은 설명과 통합이 이루어졌습니다.
Ian - Archeoworks Inc.
코스 - ArcGIS Fundamentals
기계 번역됨
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
코스 - QGIS for Geographic Information System
I really enjoyed the training. I found all modules to be applicable to problems that I am trying to solve at work. The integration of the training with jupyter notebooks was really impressive.
Mark Firmin - Environment and Climate Change Canada
코스 - Python for Geographic Information System (GIS)
훈련에서 가장 마음에 들었던 점은 조직과 위치였습니다.
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
코스 - ArcGIS for Spatial Analysis
기계 번역됨