Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
다중 모달 AI 소개
- 다중 모달 AI 개요 및 실제 응용
- 텍스트, 이미지 및 오디오 데이터를 통합하는 도전 과제
- 최신 연구 및 발전
데이터 처리 및 특징 공학
- 텍스트, 이미지 및 오디오 데이터셋 처리
- 다중 모달 학습을 위한 전처리 기술
- 특징 추출 및 데이터 융합 전략
PyTorch 및 Hugging Face로 다중 모달 모델 구축
- 다중 모달 학습을 위한 PyTorch 소개
- NLP 및 비전 작업에 Hugging Face Transformers 사용
- 다양한 모달리티를 통합된 AI 모델에 결합
음성, 시각, 텍스트 융합 구현
- 음성 인식에 OpenAI Whisper 통합
- 이미지 처리에 DeepSeek-Vision 적용
- 크로스 모달 학습을 위한 융합 기술
다중 모달 AI 모델 학습 및 최적화
- 다중 모달 AI를 위한 모델 학습 전략
- 최적화 기술 및 하이퍼파라미터 조정
- 편향 처리 및 모델 일반화 향상
실제 응용에 다중 모달 AI 배포
- 생산용 모델 내보내기
- 클라우드 플랫폼에서 AI 모델 배포
- 성능 모니터링 및 모델 유지보수
고급 주제 및 미래 동향
- 다중 모달 AI에서 제로샷 및 몇 샷 학습
- 윤리적 고려 사항 및 책임 있는 AI 개발
- 다중 모달 AI 연구의 새로운 동향
요약 및 다음 단계
Requirements
- 머신러닝과 딥러닝 개념에 대한 깊은 이해
- PyTorch 또는 TensorFlow와 같은 AI 프레임워크 경험
- 텍스트, 이미지 및 오디오 데이터 처리에 대한 familiarity
대상
- AI 개발자
- 머신러닝 엔지니어
- 연구원
21 Hours