코스 개요
소개
이 섹션에서는 머신러닝을 언제 사용해야 하는지, 무엇을 고려해야 하는지, 그리고 그것이 무엇을 의미하는지, 장단점까지 포함하여 일반적인 머신러닝 소개를 제공합니다. 데이터 유형(정형/비정형/정적/스트림), 데이터 유효성/볼륨, 데이터 중심 분석 vs 사용자 중심 분석, 통계적 모델 vs 머신러닝 모델, 비지도 학습의 과제, 편향-분산 트레이드오프, 반복/평가, 교차 검증 접근 방식, 지도/비지도/강화 학습에 대해 다룹니다.
주요 주제
1. 나이브 베이즈 이해
- 베이즈 방법의 기본 개념
- 확률
- 공동 확률
- 베이즈 정리에 따른 조건부 확률
- 나이브 베이즈 알고리즘
- 나이브 베이즈 분류
- 라플라스 추정치
- 나이브 베이즈와 함께 수치적 특성 사용하기
2. 의사 결정 트리 이해
- 분할 정복
- C5.0 의사 결정 트리 알고리즘
- 최적의 분할 선택
- 의사 결정 트리 가지치기
3. 뉴럴 네트워크 이해
- 생물학적 뉴런에서 인공 뉴런으로
- 활성화 함수
- 네트워크 위상
- 레이어의 수
- 정보의 흐름 방향
- 각 레이어의 노드 수
- 역전파를 통한 뉴럴 네트워크 학습
- 딥러닝
4. 서포트 벡터 머신(SVM) 이해
- 초평면을 사용한 분류
- 최대 마진 찾기
- 선형 분리 가능한 데이터의 경우
- 비선형 분리 가능한 데이터의 경우
- 비선형 공간을 위한 커널 사용하기
5. 클러스터링 이해
- 머신러닝 작업으로서의 클러스터링
- 클러스터링을 위한 k-means 알고리즘
- 클러스터 할당 및 업데이트에 거리 활용
- 적절한 클러스터 수 선택
6. 분류를 위한 성능 측정
- 분류 예측 데이터 다루기
- 혼동 행렬 자세히 살펴보기
- 혼동 행렬을 사용하여 성능 측정
- 정확도 너머 – 다른 성능 지표
- 카파 통계
- 민감도와 특이도
- 정밀도와 재현율
- F-measure
- 성능 트레이드오프 시각화
- ROC 곡선
- 미래 성능 추정
- 홀드아웃 방법
- 교차 검증
- 부트스트랩 샘플링
7. 더 나은 성능을 위한 표준 모델 튜닝
- automated parameter tuning을 위한 caret 사용
- 단순화된 튜닝된 모델 생성
- 튜닝 과정 사용자 정의
- 메타러닝을 통한 모델 성능 향상
- 앙상블 이해
- 배깅(Bagging)
- 부스팅(Boosting)
- 랜덤 포레스트
- 랜덤 포레스트 학습
- 랜덤 포레스트 성능 평가
부수적 주제
8. 근접 이웃(Nearest Neighbors)을 활용한 분류 이해
- kNN 알고리즘
- 거리 계산
- 적절한 k 선택
- kNN 사용 전 데이터 준비
- 왜 kNN 알고리즘은 게으른가?
9. 분류 규칙 이해
- 분리 정복
- One Rule 알고리즘
- RIPPER 알고리즘
- 의사 결정 트리에서 규칙 추출
10. 회귀 이해
- 단순 선형 회귀
- 최소 제곱법(Observable Least Squares) 추정
- 상관관계
- 다중 선형 회귀
11. 회귀 트리 및 모델 트리 이해
- 트리에 회귀 추가
12. 연관 규칙 이해
- 연관 규칙 학습을 위한 Apriori 알고리즘
- 규칙 관심도 측정 – 지원(Support)과 신뢰도(Confidence)
- Apriori 원리를 사용하여 규칙 세트 구축
추가 자료
- Spark/PySpark/MLlib 및 다중팔 밴딧(Multi-armed bandits)
요건
Python 지식
회원 평가 (7)
저는 교육을 매우 즐겼으며 머신 러닝 주제에 대한 더 깊은 탐구를 고마워했습니다. 이론과 실제 응용 프로그램 사이의 균형이 마음에 들었고, 특히 실습 코딩 세션이 유익했습니다. 트레이너는 흥미로운 예시와 잘 설계된 연습 문제를 제공하여 학습 경험을 더욱 향상시켰습니다. 이 과정은 다양한 주제를 다루었으며, 아비는 모든 질문에 명확하고 쉽게 답변해 우수한 전문성을 보여주었습니다.
Valentina
코스 - Machine Learning
기계 번역됨
이 운동은 이론을 이해하고 단계별로 적용하는 데 도움이 되어 감사합니다. 또한 트레이너가 모든 것을 간단하고 명확하게 설명해 주신 방식도 감사했습니다. 파이썬에 대해 많이 경험하지 않았지만, 쉽게 따라할 수 있었습니다. 그렇지만, 제가 정말 흥미로워하는 것을 배우는 기회를 놓치고 싶지 않았습니다. 또한 제공된 다양한 정보와 트레이너가 개념을 이해하도록 설명하고 지원해 주시는 자세도 감사했습니다. 이 과정 이후, 머신러닝 개념이 훨씬 명확해졌으며, 이제 방향성과 주제에 대한 더 나은 이해를 갖게 되었습니다.
Cristina
코스 - Machine Learning
기계 번역됨
교육이 끝나고 나서 제시된 주제들의 실제 활용 사례를 볼 수 있었습니다.
Daniel
코스 - Machine Learning
기계 번역됨
강의 속도가 좋았고, 이론과 실습 사이의 균형, 주요 주제들, 그리고 강사님이 모든 것을 잘 조화시킨 방식이 마음에 들었습니다. 또한 훈련 인프라도 매우 마음에 들었는데, VM을 사용하는 것이 아주 실용적이었습니다.
Andrei
코스 - Machine Learning
기계 번역됨
간결하게 유지합니다. 개념(의사결정트리 그래프, 선형 방정식, 모델 작동 방식을 증명하기 위한 y_pred 수동 계산)에 대한 직관과 시각적 모델을 만듭니다.
Nicolae - DB Global Technology
코스 - Machine Learning
기계 번역됨
이 강좌는 제가 ML을 이해하는 목표를 이루는 데 큰 도움이 되었습니다. 이 주제에 대해 올바른 소개를 해주신 파블로에게 깊은 존경의 마음을 전합니다. 3일간의 훈련 후 이 주제가 얼마나 방대한지 명확해집니다. 또한 제공해주신 가상 머신 아이디어도 매우 좋아했습니다! 특히 저 지연 시간이 아주 좋았습니다. 이를 통해 모든 수강생들이 자신의 속도로 실험을 진행할 수 있었습니다.
Silviu - DB Global Technology
코스 - Machine Learning
기계 번역됨
실제로 적용되는 부분을 보면서 이론이 실제 것으로 이루어지는 것을 볼 수 있는 것은 매우 뛰어납니다.
Lisa Fekade - Vodacom
코스 - Machine Learning
기계 번역됨