코스 개요
Data Tasks를 위한 Python 기초
- Python 설치 및 개발 환경 설정
- 언어 기초: 변수, 데이터 유형, 제어 구조
- 단순한 Python 스크립트 작성 및 실행
CSV와 Excel 파일 처리
- csv 모듈과 Pandas를 사용하여 CSV 파일 읽기와 쓰기
- openpyxl/xlrd 및 Pandas를 사용한 Excel 파일 작업
- 실습: 파일 변환 자동화
Pandas 입문
- DataFrame 기초: 생성, 색인, 선택, 필터링
- 집계 및 그룹화 작업
- 일반적인 청소 작업: 결측값, 중복, 유형 변환
Polars 입문
- Pandas와 비교한 Polars의 개념 및 성능 특성
- Polars에서 기본 DataFrame 작업
- 사용 사례 예: Pandas 대신 Polars를 선택할 때
고급 데이터 변환 (중급)
- Pandas에서 복잡한 조인, 윈도 함수, 피벗 작업
- Polars에서 효율적인 데이터 처리 패턴
- 연산 체이닝 및 메모리 사용 최적화
Python을 활용한 프로세스 자동화
- 반복되는 데이터 작업과 ETL 단계를 자동화하는 스크립트 작성
- OS 스케줄러나 태스크 스케줄러를 사용한 스크립트 예약
- 로그 기록, 오류 처리, 알림
스크립트 패키징 및 최선의 관행
- PyInstaller 등의 도구를 사용한 실행 파일 생성
- 프로젝트 구조화, 가상 환경, 의존성 관리
- 버전 제어 기초 및 워크플로우 문서화
실습 미니 프로젝트
- 시작부터 끝까지 작업: 원시 파일 읽기, 데이터 청소 및 변환, 출력 생성
- 워크플로우 자동화 및 실행 가능한 스크립트 또는 실행 파일로 패키징
- 피어 피드백에 따른 검토 및 개선
요약 및 다음 단계
요건
- 프로그래밍 개념에 대한 기본적인 이해 또는 학습 의지
- 패키지를 설치하는 데 사용되는 명령줄이나 터미널을 사용하는 능력
- 스프레드시트(CSV/Excel) 작업 경험이 있음
대상자
- 데이터 분석가 및 데이터 작업을 자동화하는 운영 직원
- 경량 ETL 스크립팅을 원하는 분석 엔지니어
- 실용적인 Python 기반 데이터 워크플로우에 관심이 있는 전문가들
회원 평가 (5)
우리 프로젝트에서 사용하는 것과 더 유사한 데이터를 사용하여 더 실용적인 연습을 할 수 있다는 사실(래스터 형식의 위성 이미지)
Matthieu - CS Group
코스 - Scaling Data Analysis with Python and Dask
기계 번역됨
I thought the trainer was very knowledgeable and answered questions with confidence to clarify understanding.
Jenna - TCMT
코스 - Machine Learning with Python – 2 Days
Very good preparation and expertise of a trainer, perfect communication in English. The course was practical (exercises + sharing examples of use cases)
Monika - Procter & Gamble Polska Sp. z o.o.
코스 - Developing APIs with Python and FastAPI
The explaination
Wei Yang Teo - Ministry of Defence, Singapore
코스 - Machine Learning with Python – 4 Days
Trainer develops training based on participant's pace