Course Outline

소개

  • 분석 및 기계 학습에서 데이터 준비의 중요성 이해
  • 데이터 준비 파이프라인과 데이터 수명주기에서의 역할
  • 원시 데이터의 일반적인 과제와 분석에 미치는 영향 탐색

데이터 수집 및 획득

  • 데이터 소스: 데이터베이스, API, 스프레드시트, 텍스트 파일 등
  • 데이터를 수집하고 수집 중 데이터 품질을 보장하는 기술
  • 다양한 소스에서 데이터 수집

Data Cleaning 기술

  • 누락된 값, 이상값, 불일치 식별 및 처리
  • 데이터 세트의 중복 및 오류 처리
  • 실제 데이터 세트 정리

데이터 변환 및 표준화

  • 데이터 정규화 및 표준화 기술
  • 범주형 데이터 처리: 인코딩, 비닝 및 기능 엔지니어링
  • 원시 데이터를 사용 가능한 형식으로 변환

Data Integration 및 집계

  • 다양한 소스의 데이터 세트 병합 및 결합
  • 데이터 충돌 해결 및 데이터 유형 정렬
  • 데이터 집계 및 통합 기술

Data Quality 보증

  • 프로세스 전반에 걸쳐 데이터 품질과 무결성을 보장하는 방법
  • 품질 검사 및 검증 절차 구현
  • 데이터 품질 보증의 사례 연구 및 실제 적용

차원 축소 및 특징 선택

  • 차원 축소의 필요성 이해
  • PCA, 기능 선택, 축소 전략과 같은 기술
  • 차원 축소 기술 구현

요약 및 다음 단계

Requirements

    데이터 개념에 대한 기본 이해

청중

    데이터 분석가 Database 관리자 IT 전문가
 14 Hours

Number of participants



Price per participant

회원 평가 (2)

Related Courses

Related Categories