문의를 보내주셔서 감사합니다! 팀원이 곧 연락드리겠습니다.
예약을 보내주셔서 감사합니다! 저희 팀 멤버 중 한 분이 곧 연락드리겠습니다.
코스 개요
소개
- 분석 및 머신러닝에서 데이터 준비의 중요성을 이해하기
- 데이터 수명 주기에서 데이터 준비 파이프라인의 역할
- 원시 데이터에서 발생하는 일반적인 문제점과 분석에 미치는 영향 탐구하기
데이터 수집 및 획득
- 데이터 출처: 데이터베이스, API, 스프레드시트, 텍스트 파일 등
- 데이터 수집 시 데이터 품질을 보장하기 위한 기술
- 다양한 출처에서 데이터 수집
Data Cleaning 기술
- 누락된 값, 이상치 및 불일치 식별 및 처리
- 데이터셋에서 중복 및 오류 처리
- 실제 데이터셋 정리
데이터 변환 및 표준화
- 데이터 정규화 및 표준화 기술
- 범주형 데이터 처리: 인코딩, 분할, 특징 공학
- 원시 데이터를 사용할 수 있는 형식으로 변환
Data Integration 및 집계
- 다양한 출처의 데이터셋 병합 및 결합
- 데이터 충돌 해결 및 데이터 유형 일치
- 데이터 집계 및 통합 기술
Data Quality 보증
- 전 과정을 통해 데이터 품질 및 무결성을 보장하는 방법
- 품질 검사 및 검증 절차 구현
- 데이터 품질 보증 사례 연구 및 실용적인 응용
차원 축소 및 특징 선택
- 차원 축소 필요성 이해
- PCA, 특징 선택 및 축소 전략과 같은 기술
- 차원 축소 기술 구현
요약 및 다음 단계
요건
- 데이터 개념에 대한 기본 이해
대상
- 데이터 분석가
- 데이터베이스 관리자
- IT 전문가
14 시간
회원 평가 (2)
It's a hands-on session.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
코스 - Talend Open Studio for ESB
I generally enjoyed the knowledge of the trainer.