코스 개요
모듈 1: ML 워크플로를 위한 핵심 Python
• 과정 시작과 환경 설정
목표 정렬 및 재현 가능한 Python ML 작업 공간 설정
• Python 언어 필수 요소 (빠른 트랙)
ML 코드베이스에서 자주 사용되는 구문, 제어 흐름, 함수 및 패턴 검토
• ML을 위한 데이터 구조
특성, 레이블, 메타데이터를 위한 리스트, 사전, 집합, 튜플
• 컴프리헨션과 함수 도구
컴프리헨션과 고차 함수를 사용하여 변환 표현
• ML 개발자를 위한 객체 지향 Python
클래스, 메서드, 합성 및 실용적인 설계 결정
• dataclasses와 가벼운 모델링
구성, 예제, 결과를 위한 타입화된 컨테이너
• 데코레이터와 컨텍스트 매니저
타이밍, 캐싱, 로깅 및 리소스 안전한 실행 패턴
• 파일과 경로 작업
견고한 데이터셋 처리 및 직렬화 형식
• 예외 처리와 방어적 프로그래밍
안전하고 투명하게 실패하는 ML 스크립트 작성
• 모듈, 패키지, 프로젝트 구조
재사용 가능한 ML 코드베이스 조직
• 타이핑과 코드 품질
타입 힌트, 문서화, lint-friendly 구조
모듈 2: 수치 Python, SciPy, 데이터 처리
• 벡터화 컴퓨팅을 위한 NumPy 기초
효율적인 배열 연산과 성능에 주의를 기울인 코딩
• 인덱싱, 슬라이싱, 브로드캐스팅, 모양
안전한 텐서 조작과 모양 추론
• NumPy와 SciPy를 사용한 선형 대수 기초
ML에서 사용되는 안정적인 행렬 연산과 분해
• SciPy 심화
통계, 최적화, 곡선 피팅, 희소 행렬
• 탭룰러 ML 데이터를 위한 Pandas
데이터셋 정제, 결합, 집계, 준비
• scikit-learn 심화
추정기 인터페이스, 파이프라인, 재현 가능한 워크플로
• 시각화 기초
데이터 탐색과 모델 행동을 위한 진단 플롯
모듈 3: ML 애플리케이션 구축을 위한 프로그래밍 패턴
• 노트북에서 유지 가능한 프로젝트로의 전환
탐색적 코드를 구조화된 패키지로 리팩토링
• 구성 관리
외부화된 매개변수와 시작 시 검증
• 로깅, 경고, 관찰 가능성
디버깅 가능한 ML 시스템을 위한 구조화된 로깅
• OOP와 합성을 사용한 재사용 가능한 구성 요소
확장 가능한 변환기와 예측기 설계
• 실용적인 설계 패턴
파이프라인, 팩토리 또는 레지스트리, 전략, 어댑터 패턴
• 데이터 검증과 스키마 검사
은밀한 데이터 문제 방지
• 성능과 프로파일링
병목 현상 식별 및 최적화 기법 적용
• 모델 I/O와 추론 인터페이스
안전한 지속성과 깨끗한 예측 인터페이스
• 엔드투엔드 미니 빌드
구성과 로깅이 포함된 프로덕션 스타일 ML 파이프라인
모듈 4: 탭룰러, 텍스트, 이미지에 대한 통계적 학습
• 평가 기초
학습 및 검증 분할, 정직한 교차 검증, 비즈니스 맞춤형 지표
• 고급 탭룰러 ML
규제화된 GLM, 트리 앙상블, 누설 없는 사전 처리
• 캘리브레이션과 불확실성
플랫 스케일링, 이소토닉 회귀, 부트스트랩, 일치도 예측
• 고전적 NLP 방법
토큰화 트레이드오프, TF-IDF, 선형 모델, 나이브 베이즈
• 주제 모델링
LDA 기초와 실용적 제한
• 고전적 컴퓨터 비전
HOG, PCA, 기반 특징 파이프라인
• 오류 분석
편향 검출, 라벨 노이즈, 임의의 상관관계
• 실습 실습
누설 없는 탭룰러 파이프라인
텍스트 베이스라인 비교 및 해석
고전적 비전 베이스라인 및 구조화된 실패 분석
모듈 5: 탭룰러, 텍스트, 이미지에 대한 신경망
• 학습 루프 마스터리
AMP, 클리핑, 재현성을 갖춘 깨끗한 PyTorch 루프
• 최적화와 규제
초기화, 정규화, 옵티마이저, 스케줄러
• 혼합 정밀도와 확장
그래디언트 누적 및 체크포인팅 전략
• 탭룰러 신경망
범주 임베딩, 특징 교차, 감소 연구
• 텍스트 신경망
임베딩, CNN, BiLSTM 또는 GRU, 시퀀스 처리
• 비전 신경망
CNN 기초와 ResNet 스타일 아키텍처
• 실습 실습
재사용 가능한 학습 프레임워크
탭룰러 NN 대 부스팅 비교
CNN과 증강, 스케줄링 실험
모듈 6: 고급 신경망 아키텍처
• 전이 학습 전략
동결 및 해동 패턴, 차별화된 학습률
• 텍스트를 위한 트랜스포머 아키텍처
자기 주의 메커니즘과 미세 조정 방법
• 비전 백본과 밀집 예측
ResNet, EfficientNet, 비전 트랜스포머, U-Net 개념
• 고급 탭룰러 아키텍처
TabTransformer, FT-Transformer, Deep and Cross 네트워크
• 시계열 고려사항
시간 분할과 공변량 시프트 검출
• PEFT와 효율 기법
LoRA, 디스틸레이션, 양자화 트레이드오프
• 실습 실습
미세 조정된 사전 훈련된 텍스트 트랜스포머
미세 조정된 사전 훈련된 비전 모델
탭룰러 트랜스포머 대 GBDT 비교
모듈 7: 생성 AI 시스템
• 프롬프팅 기초
구조화된 프롬프팅과 제어된 생성
• LLM 기초
토큰화, 지시어 조정, 환상 제거
• 검색 강화 생성
청크, 임베딩, 하이브리드 검색, 평가 지표
• 미세 조정 전략
LoRA와 QLoRA, 데이터 품질 제어
• 확산 모델
잠재 확산 직관과 실용적 적응
• 합성 탭룰러 데이터
CTGAN과 프라이버시 고려사항
• 실습 실습
프로덕션 스타일 RAG 미니 애플리케이션
스키마 적용으로 구조화된 출력 검증
선택적 확산 실험
모듈 8: AI 에이전트와 MCP
• 에이전트 루프 설계
관찰, 계획, 행동, 반영, 지속
• 에이전트 아키텍처
ReAct, 계획 및 실행, 다중 에이전트 조정
• 메모리 관리
에피소드, 의미, 스크래치패드 접근 방식
• 도구 통합과 안전성
도구 계약, 샌드박싱, 프롬프트 주입 방어
• 평가 프레임워크
재현 가능한 추적, 작업 스위트, 회귀 테스트
• MCP와 프로토콜 기반 상호 운용성
안전한 도구 노출을 위한 MCP 서버 설계
• 실습 실습
에이전트를 처음부터 구축
MCP 스타일 서버를 통해 도구 노출
안전 제약 조건을 가진 평가 하네스 생성
요건
참가자들은 Python 프로그래밍에 대한 실무 지식이 있어야 합니다.
이 프로그램은 중급에서 고급 기술 전문가를 대상으로 합니다.
회원 평가 (2)
ML 생태계는 MLFlow뿐만 아니라 Optuna, Hyperopt, Docker, Docker-Compose도 포함합니다.
Guillaume GAUTIER - OLEA MEDICAL
코스 - MLflow
기계 번역됨
Kubeflow 교육에 원격으로 참여한 것이 즐거웠습니다. 이 교육을 통해 AWS 서비스, K8s, Kubeflow 주변의 모든 DevOps 도구에 대한 지식을 다질 수 있었습니다. 이러한 내용은 주제를 제대로 다루기 위한 필수적인 기반이였습니다. Malawski Marcin에게 그의 인내심과 전문성으로 교육과 최선의 방법에 대한 조언을 해주신 것에 감사드립니다. Malawski는 Ansible, EKS kubectl, Terraform 등 다양한 배포 도구를 활용하여 주제를 다양한 관점에서 접근했습니다. 이제 저는 확신합니다. 제가 올바른 응용 분야로 나아가고 있다는 것을.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
코스 - Kubeflow
기계 번역됨