Course Outline

Spark.mllib: 데이터 유형, 알고리즘 및 유틸리티

    데이터 유형 기본 통계 요약 통계 상관 관계 계층화 샘플링 가설 테스트 스트리밍 유의성 테스트 무작위 데이터 생성
분류 및 회귀 선형 모델(SVM, 로지스틱 회귀, 선형 회귀)
  • 나이브 베이즈
  • 의사결정 트리
  • 나무 앙상블(Random Forest 및 그래디언트 부스트 트리)
  • 등장성 회귀
  • 협업 필터링 교번 최소 제곱법(ALS)
  • k-평균 클러스터링
  • 가우스 혼합
  • PIC(전력 반복 클러스터링)
  • 잠재 디리클레 할당(LDA)
  • k-평균을 이등분
  • 스트리밍 k-평균
  • 차원성 감소 특이값 분해(SVD)
  • 주성분 분석(PCA)
  • 특징 추출 및 변환
  • 빈번한 패턴 마이닝 FP-성장
  • 연관 규칙
  • 접두사 범위
  • 평가 지표
  • PMML 모델 내보내기
  • 최적화(개발자) 확률적 경사하강법
  • 제한된 메모리 BFGS(L-BFGS)
  • Spark.ml: ML 파이프라인을 위한 상위 수준 API
  • 개요: 추정기, 변환기 및 파이프라인 특징 추출, 변환 및 선택 분류 및 회귀 클러스터링 고급 항목

    Requirements

    다음 중 하나에 대한 지식:

    • 자바
    • Scala
    • 파이썬
    • 스파크R.
      35 Hours
     

    Number of participants


    Starts

    Ends


    Dates are subject to availability and take place between 10:00 and 17:00.
    Open Training Courses require 5+ participants.

    회원 평가 (8)

    Related Courses

    Related Categories