Course Outline

빠른 개요

  • 데이터 소스
  • 마인드 데이터
  • 추천 시스템
  • 타겟 Marketing

데이터 유형

  • 구조화 대 비구조화
  • 정적 vs 스트리밍
  • 태도, 행동 및 인구통계학적 데이터
  • 데이터 중심 분석과 사용자 중심 분석
  • 데이터 유효성
  • 데이터의 양, 속도 및 다양성

모델

  • 건물 모델
  • 통계 모델
  • 기계 학습

데이터 분류

  • 클러스터링
  • kGroups, k-평균, 가장 가까운 이웃
  • 개미 군집, 새 떼

예측 모델

  • 의사결정 트리
  • 지원 벡터 머신
  • 나이브 베이즈 분류
  • 신경망
  • 마르코프 모델
  • 회귀
  • 앙상블 방법

ROI

  • 이익/비용 비율
  • 소프트웨어 비용
  • 개발 비용
  • 잠재적인 이점

모델 구축

  • 데이터 준비(맵리듀스)
  • 데이터 정리
  • 방법 선택
  • 모델 개발 중
  • 테스트 모델
  • 모델 평가
  • 모델 배포 및 통합

오픈 소스 및 상용 소프트웨어 개요

  • R-project 패키지 선정
  • Python 도서관
  • Hadoop 그리고 머하웃
  • Big Data 및 Analytics와 관련된 선택된 Apache 프로젝트
  • 선택된 상용 솔루션
  • 기존 소프트웨어 및 데이터 소스와의 통합

Requirements

SQL, 데이터 웨어하우스, 비즈니스 인텔리전스, OLAP 등과 같은 전통적인 데이터 관리 및 분석 방법의 이해. 기초 통계 및 확률의 이해(평균, 분산, 확률, 조건부 확률 등....)

  21 Hours
 

Number of participants


Starts

Ends


Dates are subject to availability and take place between 10:00 and 17:00.
Open Training Courses require 5+ participants.

회원 평가 (2)

Related Courses

Unified Batch and Stream Processing with Apache Beam

  14 Hours

Related Categories