코스 개요
소개
- 패턴 인식, 분류 및 회귀에서 효과적인 알고리즘 구축.
개발 환경 설정
- Python 라이브러리
- 온라인 대 오프라인 에디터
피처 엔지니어링 개요
- 입력 및 출력 변수(피처)
- 피처 엔지니어링의 장단점
원시 데이터에서 발생하는 문제 유형
- 불완전한 데이터, 누락된 데이터 등.
변수 사전 처리
- 누락된 데이터 처리
데이터의 누락 값 처리
범주형 변수 작업
레이블을 숫자로 변환하기
범주형 변수의 레이블 처리
예측력을 향상시키기 위한 변수 변환
- 수치, 범주형, 날짜 등.
데이터 세트 정제하기
머신 러닝 모델링
데이터의 이상치 처리
- 수치 변수, 범주형 변수 등.
요약 및 결론
요건
- Python 프로그래밍 경험.
- Numpy, Pandas 및 scikit-learn 사용 경험이 있음.
- 머신 러닝 알고리즘에 대한 이해.
대상자
- 개발자
- 데이터 과학자
- 데이터 분석가
회원 평가 (2)
ML 생태계는 MLFlow뿐만 아니라 Optuna, Hyperopt, Docker, Docker-Compose도 포함합니다.
Guillaume GAUTIER - OLEA MEDICAL
코스 - MLflow
기계 번역됨
Kubeflow 교육에 원격으로 참여한 것이 즐거웠습니다. 이 교육을 통해 AWS 서비스, K8s, Kubeflow 주변의 모든 DevOps 도구에 대한 지식을 다질 수 있었습니다. 이러한 내용은 주제를 제대로 다루기 위한 필수적인 기반이였습니다. Malawski Marcin에게 그의 인내심과 전문성으로 교육과 최선의 방법에 대한 조언을 해주신 것에 감사드립니다. Malawski는 Ansible, EKS kubectl, Terraform 등 다양한 배포 도구를 활용하여 주제를 다양한 관점에서 접근했습니다. 이제 저는 확신합니다. 제가 올바른 응용 분야로 나아가고 있다는 것을.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
코스 - Kubeflow
기계 번역됨