Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
소개
- 분석 및 머신러닝에서 데이터 준비의 중요성을 이해하기
- 데이터 수명 주기에서 데이터 준비 파이프라인의 역할
- 원시 데이터에서 발생하는 일반적인 문제점과 분석에 미치는 영향 탐구하기
데이터 수집 및 획득
- 데이터 출처: 데이터베이스, API, 스프레드시트, 텍스트 파일 등
- 데이터 수집 시 데이터 품질을 보장하기 위한 기술
- 다양한 출처에서 데이터 수집
Data Cleaning 기술
- 누락된 값, 이상치 및 불일치 식별 및 처리
- 데이터셋에서 중복 및 오류 처리
- 실제 데이터셋 정리
데이터 변환 및 표준화
- 데이터 정규화 및 표준화 기술
- 범주형 데이터 처리: 인코딩, 분할, 특징 공학
- 원시 데이터를 사용할 수 있는 형식으로 변환
Data Integration 및 집계
- 다양한 출처의 데이터셋 병합 및 결합
- 데이터 충돌 해결 및 데이터 유형 일치
- 데이터 집계 및 통합 기술
Data Quality 보증
- 전 과정을 통해 데이터 품질 및 무결성을 보장하는 방법
- 품질 검사 및 검증 절차 구현
- 데이터 품질 보증 사례 연구 및 실용적인 응용
차원 축소 및 특징 선택
- 차원 축소 필요성 이해
- PCA, 특징 선택 및 축소 전략과 같은 기술
- 차원 축소 기술 구현
요약 및 다음 단계
Requirements
- 데이터 개념의 기본 이해
청중
- 데이터 분석가
- Database 관리자
- IT 전문가
14 Hours
회원 평가 (2)
It's a hands-on session.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
Course - Talend Open Studio for ESB
I generally enjoyed the knowledge of the trainer.