연락처 정보

코스 개요

소개

이 섹션에서는 머신러닝을 언제 사용해야 하는지, 무엇을 고려해야 하는지, 그리고 그것이 무엇을 의미하는지, 장단점까지 포함하여 일반적인 머신러닝 소개를 제공합니다. 데이터 유형(정형/비정형/정적/스트림), 데이터 유효성/볼륨, 데이터 중심 분석 vs 사용자 중심 분석, 통계적 모델 vs 머신러닝 모델, 비지도 학습의 과제, 편향-분산 트레이드오프, 반복/평가, 교차 검증 접근 방식, 지도/비지도/강화 학습에 대해 다룹니다.

주요 주제

1. 나이브 베이즈 이해

  • 베이즈 방법의 기본 개념
  • 확률
  • 공동 확률
  • 베이즈 정리에 따른 조건부 확률
  • 나이브 베이즈 알고리즘
  • 나이브 베이즈 분류
  • 라플라스 추정치
  • 나이브 베이즈와 함께 수치적 특성 사용하기

2. 의사 결정 트리 이해

  • 분할 정복
  • C5.0 의사 결정 트리 알고리즘
  • 최적의 분할 선택
  • 의사 결정 트리 가지치기

3. 뉴럴 네트워크 이해

  • 생물학적 뉴런에서 인공 뉴런으로
  • 활성화 함수
  • 네트워크 위상
  • 레이어의 수
  • 정보의 흐름 방향
  • 각 레이어의 노드 수
  • 역전파를 통한 뉴럴 네트워크 학습
  • 딥러닝

4. 서포트 벡터 머신(SVM) 이해

  • 초평면을 사용한 분류
  • 최대 마진 찾기
  • 선형 분리 가능한 데이터의 경우
  • 비선형 분리 가능한 데이터의 경우
  • 비선형 공간을 위한 커널 사용하기

5. 클러스터링 이해

  • 머신러닝 작업으로서의 클러스터링
  • 클러스터링을 위한 k-means 알고리즘
  • 클러스터 할당 및 업데이트에 거리 활용
  • 적절한 클러스터 수 선택

6. 분류를 위한 성능 측정

  • 분류 예측 데이터 다루기
  • 혼동 행렬 자세히 살펴보기
  • 혼동 행렬을 사용하여 성능 측정
  • 정확도 너머 – 다른 성능 지표
  • 카파 통계
  • 민감도와 특이도
  • 정밀도와 재현율
  • F-measure
  • 성능 트레이드오프 시각화
  • ROC 곡선
  • 미래 성능 추정
  • 홀드아웃 방법
  • 교차 검증
  • 부트스트랩 샘플링

7. 더 나은 성능을 위한 표준 모델 튜닝

  • automated parameter tuning을 위한 caret 사용
  • 단순화된 튜닝된 모델 생성
  • 튜닝 과정 사용자 정의
  • 메타러닝을 통한 모델 성능 향상
  • 앙상블 이해
  • 배깅(Bagging)
  • 부스팅(Boosting)
  • 랜덤 포레스트
  • 랜덤 포레스트 학습
  • 랜덤 포레스트 성능 평가

부수적 주제

8. 근접 이웃(Nearest Neighbors)을 활용한 분류 이해

  • kNN 알고리즘
  • 거리 계산
  • 적절한 k 선택
  • kNN 사용 전 데이터 준비
  • 왜 kNN 알고리즘은 게으른가?

9. 분류 규칙 이해

  • 분리 정복
  • One Rule 알고리즘
  • RIPPER 알고리즘
  • 의사 결정 트리에서 규칙 추출

10. 회귀 이해

  • 단순 선형 회귀
  • 최소 제곱법(Observable Least Squares) 추정
  • 상관관계
  • 다중 선형 회귀

11. 회귀 트리 및 모델 트리 이해

  • 트리에 회귀 추가

12. 연관 규칙 이해

  • 연관 규칙 학습을 위한 Apriori 알고리즘
  • 규칙 관심도 측정 – 지원(Support)과 신뢰도(Confidence)
  • Apriori 원리를 사용하여 규칙 세트 구축

추가 자료

  • Spark/PySpark/MLlib 및 다중팔 밴딧(Multi-armed bandits)

요건

Python 지식

 21 시간

참가자 수


참가자별 가격

회원 평가 (7)

예정된 코스

관련 카테고리