코스 개요
빅데이터 에코시스템 소개
- 빅데이터 기술과 아키텍처 개요
- 일괄 처리 vs. 실시간 처리
- 확장성을 위한 데이터 저장 전략
Apache Spark를 통한 고급 데이터 처리
- Spark 작업의 성능 최적화
- 고급 변환 및 작업
- 구조화된 스트리밍 작업
Machine Learning 스케일링
- 분산 모델 학습 기술
- 대규모 데이터셋의 하이퍼파라미터 튜닝
- 빅데이터 환경에서의 모델 배포
Big Data을 위한 Deep Learning
- TensorFlow와 PyTorch을 Spark와 통합
- 분산 딥러닝 학습 파이프라인
- 이미지, 텍스트 및 시간 시리즈 분석의 사용 사례
실시간 분석 및 데이터 스트리밍
- Apache Kafka를 통한 스트리밍 데이터 수집
- 스트리밍 처리 프레임워크
- 실시간 시스템에서의 모니터링 및 알림
Data Governance, 보안 및 윤리
- 데이터 프라이버시 및 준수 요구 사항
- 빅데이터 시스템에서의 Access 제어 및 암호화
- 대규모 분석에서의 윤리적 고려사항
Business Intelligence와 Big Data 통합
- 빅데이터를 위한 데이터 시각화 및 대시보드
- 빅데이터 파이프라인을 BI 도구에 연결
- 고급 분석을 통해 비즈니스 결과 도출
요약 및 다음 단계
요건
- 데이터 분석 및 통계 모델링 개념에 대한 깊은 이해
- Python, R, 또는 Scala와 같은 데이터 처리 도구 및 프로그래밍 언어 경험
- Hadoop 또는 Spark와 같은 분산 컴퓨팅 프레임워크에 대한 familiarity
대상
- 대규모 데이터 처리 및 예측 분석을 마스터하려는 데이터 과학자
- 고급 분석 워크플로우를 설계하고 구현하려는 고급 분석가
- 혁신적인 데이터 기반 솔루션에 집중하는 R&D 전문가
회원 평가 (4)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
코스 - ArcGIS Fundamentals
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
코스 - QGIS for Geographic Information System
I really enjoyed the training. I found all modules to be applicable to problems that I am trying to solve at work. The integration of the training with jupyter notebooks was really impressive.
Mark Firmin - Environment and Climate Change Canada
코스 - Python for Geographic Information System (GIS)
The thing I liked the most about the training was the organization and the location