Course Outline

빅데이터 에코시스템 소개

  • 빅데이터 기술과 아키텍처 개요
  • 일괄 처리 vs. 실시간 처리
  • 확장성을 위한 데이터 저장 전략

Apache Spark를 통한 고급 데이터 처리

  • Spark 작업의 성능 최적화
  • 고급 변환 및 작업
  • 구조화된 스트리밍 작업

Machine Learning 스케일링

  • 분산 모델 학습 기술
  • 대규모 데이터셋의 하이퍼파라미터 튜닝
  • 빅데이터 환경에서의 모델 배포

Big Data을 위한 Deep Learning

  • TensorFlow와 PyTorch을 Spark와 통합
  • 분산 딥러닝 학습 파이프라인
  • 이미지, 텍스트 및 시간 시리즈 분석의 사용 사례

실시간 분석 및 데이터 스트리밍

  • Apache Kafka를 통한 스트리밍 데이터 수집
  • 스트리밍 처리 프레임워크
  • 실시간 시스템에서의 모니터링 및 알림

Data Governance, 보안 및 윤리

  • 데이터 프라이버시 및 준수 요구 사항
  • 빅데이터 시스템에서의 Access 제어 및 암호화
  • 대규모 분석에서의 윤리적 고려사항

Business Intelligence와 Big Data 통합

  • 빅데이터를 위한 데이터 시각화 및 대시보드
  • 빅데이터 파이프라인을 BI 도구에 연결
  • 고급 분석을 통해 비즈니스 결과 도출

요약 및 다음 단계

Requirements

  • 데이터 분석 및 통계 모델링 개념에 대한 깊은 이해
  • Python, R, 또는 Scala와 같은 데이터 처리 도구 및 프로그래밍 언어 경험
  • Hadoop 또는 Spark와 같은 분산 컴퓨팅 프레임워크에 대한 familiarity

대상

  • 대규모 데이터 처리 및 예측 분석을 마스터하려는 데이터 과학자
  • 고급 분석 워크플로우를 설계하고 구현하려는 고급 분석가
  • 혁신적인 데이터 기반 솔루션에 집중하는 R&D 전문가
 42 Hours

Number of participants


Price per participant

회원 평가 (5)

Upcoming Courses

Related Categories