Course Outline

빠른 개요

  • 데이터 소스
  • 마인드 데이터
  • 추천 시스템
  • 타겟 Marketing

데이터 유형

  • 구조화 대 비구조화
  • 정적 vs 스트리밍
  • 태도, 행동 및 인구통계학적 데이터
  • 데이터 중심 분석과 사용자 중심 분석
  • 데이터 유효성
  • 데이터의 양, 속도 및 다양성

모델

  • 건물 모델
  • 통계 모델
  • 기계 학습

데이터 분류

  • 클러스터링
  • kGroups, k-평균, 가장 가까운 이웃
  • 개미 군집, 새 떼

예측 모델

  • 의사결정 트리
  • 지원 벡터 머신
  • 나이브 베이즈 분류
  • 신경망
  • 마르코프 모델
  • 회귀
  • 앙상블 방법

ROI

  • 이익/비용 비율
  • 소프트웨어 비용
  • 개발 비용
  • 잠재적인 이점

모델 구축

  • 데이터 준비(맵리듀스)
  • 데이터 정리
  • 방법 선택
  • 모델 개발 중
  • 테스트 모델
  • 모델 평가
  • 모델 배포 및 통합

오픈 소스 및 상용 소프트웨어 개요

  • R-project 패키지 선정
  • Python 도서관
  • Hadoop 그리고 머하웃
  • Big Data 및 Analytics와 관련된 선택된 Apache 프로젝트
  • 선택된 상용 솔루션
  • 기존 소프트웨어 및 데이터 소스와의 통합

Requirements

SQL, 데이터 웨어하우스, 비즈니스 인텔리전스, OLAP 등과 같은 전통적인 데이터 관리 및 분석 방법의 이해. 기초 통계 및 확률의 이해(평균, 분산, 확률, 조건부 확률 등....)

 21 Hours

Number of participants



Price per participant

회원 평가 (2)

Related Courses

Unified Batch and Stream Processing with Apache Beam

14 Hours

Related Categories