코스 개요

Data Tasks를 위한 Python 기초

  • Python 설치 및 개발 환경 설정
  • 언어 기초: 변수, 데이터 유형, 제어 구조
  • 단순한 Python 스크립트 작성 및 실행

CSV와 Excel 파일 처리

  • csv 모듈과 Pandas를 사용하여 CSV 파일 읽기와 쓰기
  • openpyxl/xlrd 및 Pandas를 사용한 Excel 파일 작업
  • 실습: 파일 변환 자동화

Pandas 입문

  • DataFrame 기초: 생성, 색인, 선택, 필터링
  • 집계 및 그룹화 작업
  • 일반적인 청소 작업: 결측값, 중복, 유형 변환

Polars 입문

  • Pandas와 비교한 Polars의 개념 및 성능 특성
  • Polars에서 기본 DataFrame 작업
  • 사용 사례 예: Pandas 대신 Polars를 선택할 때

고급 데이터 변환 (중급)

  • Pandas에서 복잡한 조인, 윈도 함수, 피벗 작업
  • Polars에서 효율적인 데이터 처리 패턴
  • 연산 체이닝 및 메모리 사용 최적화

Python을 활용한 프로세스 자동화

  • 반복되는 데이터 작업과 ETL 단계를 자동화하는 스크립트 작성
  • OS 스케줄러나 태스크 스케줄러를 사용한 스크립트 예약
  • 로그 기록, 오류 처리, 알림

스크립트 패키징 및 최선의 관행

  • PyInstaller 등의 도구를 사용한 실행 파일 생성
  • 프로젝트 구조화, 가상 환경, 의존성 관리
  • 버전 제어 기초 및 워크플로우 문서화

실습 미니 프로젝트

  • 시작부터 끝까지 작업: 원시 파일 읽기, 데이터 청소 및 변환, 출력 생성
  • 워크플로우 자동화 및 실행 가능한 스크립트 또는 실행 파일로 패키징
  • 피어 피드백에 따른 검토 및 개선

요약 및 다음 단계

요건

  • 프로그래밍 개념에 대한 기본적인 이해 또는 학습 의지
  • 패키지를 설치하는 데 사용되는 명령줄이나 터미널을 사용하는 능력
  • 스프레드시트(CSV/Excel) 작업 경험이 있음

대상자

  • 데이터 분석가 및 데이터 작업을 자동화하는 운영 직원
  • 경량 ETL 스크립팅을 원하는 분석 엔지니어
  • 실용적인 Python 기반 데이터 워크플로우에 관심이 있는 전문가들
 14 시간

참가자 수


참가자당 가격

회원 평가 (5)

예정된 코스

관련 카테고리