Course Outline

소개

  • 분석 및 머신러닝에서 데이터 준비의 중요성을 이해하기
  • 데이터 수명 주기에서 데이터 준비 파이프라인의 역할
  • 원시 데이터에서 발생하는 일반적인 문제점과 분석에 미치는 영향 탐구하기

데이터 수집 및 획득

  • 데이터 출처: 데이터베이스, API, 스프레드시트, 텍스트 파일 등
  • 데이터 수집 시 데이터 품질을 보장하기 위한 기술
  • 다양한 출처에서 데이터 수집

Data Cleaning 기술

  • 누락된 값, 이상치 및 불일치 식별 및 처리
  • 데이터셋에서 중복 및 오류 처리
  • 실제 데이터셋 정리

데이터 변환 및 표준화

  • 데이터 정규화 및 표준화 기술
  • 범주형 데이터 처리: 인코딩, 분할, 특징 공학
  • 원시 데이터를 사용할 수 있는 형식으로 변환

Data Integration 및 집계

  • 다양한 출처의 데이터셋 병합 및 결합
  • 데이터 충돌 해결 및 데이터 유형 일치
  • 데이터 집계 및 통합 기술

Data Quality 보증

  • 전 과정을 통해 데이터 품질 및 무결성을 보장하는 방법
  • 품질 검사 및 검증 절차 구현
  • 데이터 품질 보증 사례 연구 및 실용적인 응용

차원 축소 및 특징 선택

  • 차원 축소 필요성 이해
  • PCA, 특징 선택 및 축소 전략과 같은 기술
  • 차원 축소 기술 구현

요약 및 다음 단계

Requirements

  • 데이터 개념의 기본 이해

청중

  • 데이터 분석가
  • Database 관리자
  • IT 전문가
 14 Hours

Number of participants


Price per participant

회원 평가 (2)

Upcoming Courses

Related Categories