Course Outline
빅데이터 에코시스템 소개
- 빅데이터 기술과 아키텍처 개요
- 일괄 처리 vs. 실시간 처리
- 확장성을 위한 데이터 저장 전략
Apache Spark를 통한 고급 데이터 처리
- Spark 작업의 성능 최적화
- 고급 변환 및 작업
- 구조화된 스트리밍 작업
Machine Learning 스케일링
- 분산 모델 학습 기술
- 대규모 데이터셋의 하이퍼파라미터 튜닝
- 빅데이터 환경에서의 모델 배포
Big Data을 위한 Deep Learning
- TensorFlow와 PyTorch을 Spark와 통합
- 분산 딥러닝 학습 파이프라인
- 이미지, 텍스트 및 시간 시리즈 분석의 사용 사례
실시간 분석 및 데이터 스트리밍
- Apache Kafka를 통한 스트리밍 데이터 수집
- 스트리밍 처리 프레임워크
- 실시간 시스템에서의 모니터링 및 알림
Data Governance, 보안 및 윤리
- 데이터 프라이버시 및 준수 요구 사항
- 빅데이터 시스템에서의 Access 제어 및 암호화
- 대규모 분석에서의 윤리적 고려사항
Business Intelligence와 Big Data 통합
- 빅데이터를 위한 데이터 시각화 및 대시보드
- 빅데이터 파이프라인을 BI 도구에 연결
- 고급 분석을 통해 비즈니스 결과 도출
요약 및 다음 단계
Requirements
- 데이터 분석 및 통계 모델링 개념에 대한 깊은 이해
- Python, R, 또는 Scala와 같은 데이터 처리 도구 및 프로그래밍 언어 경험
- Hadoop 또는 Spark와 같은 분산 컴퓨팅 프레임워크에 대한 familiarity
대상
- 대규모 데이터 처리 및 예측 분석을 마스터하려는 데이터 과학자
- 고급 분석 워크플로우를 설계하고 구현하려는 고급 분석가
- 혁신적인 데이터 기반 솔루션에 집중하는 R&D 전문가
회원 평가 (5)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Course - ArcGIS Fundamentals
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
Course - QGIS for Geographic Information System
저는 Pablo의 스타일이 마음에 들었습니다. 그가 보고서 디자인, HTML을 사용한 사용자 정의, 간단한 ML 알고리즘 구현에 이르기까지 많은 주제를 다루었다는 점입니다. Go이론적 정보/연습의 균형을 유지합니다. 파블로는 제가 관심을 갖고 있는 모든 주제를 다루었고 제 질문에 포괄적인 답변을 해주었습니다.
Cristian Tudose - SC Automobile Dacia SA
Course - Advanced Data Analysis with TIBCO Spotfire
기계 번역됨
Actual application of spotfire and all basic functions.
Michael Capili - STMicroelectronics, Inc.
Course - Introduction to Spotfire
The thing I liked the most about the training was the organization and the location