문의를 보내주셔서 감사합니다! 팀원이 곧 연락드리겠습니다.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
다중 모달 AI와 Ollama 소개
- 다중 모달 학습 개요
- 시각-언어 통합의 주요 도전 과제
- Ollama의 기능과 아키텍처
Ollama 환경 설정
- Ollama 설치 및 구성
- 로컬 모델 배포 작업
- Ollama를 Python과 Jupyter와 통합
다중 모달 입력 작업
- 텍스트와 이미지 통합
- 오디오와 구조화된 데이터 포함
- 프리프로세싱 파이프라인 설계
문서 이해 응용 프로그램
- PDF와 이미지에서 구조화된 정보 추출
- OCR을 언어 모델과 결합
- 지능형 문서 분석 워크플로우 구축
시각 질문 응답(VQA)
- VQA 데이터셋 및 벤치마크 설정
- 다중 모달 모델 학습 및 평가
- 상호작용형 VQA 애플리케이션 구축
다중 모달 에이전트 설계
- 다중 모달 추론을 위한 에이전트 설계 원칙
- 지각, 언어, 행동 결합
- 실제 사례에 대한 에이전트 배포
고급 통합 및 최적화
- Ollama로 다중 모달 모델 미세 조정
- 추론 성능 최적화
- 확장성과 배포 고려 사항
요약 및 다음 단계
Requirements
- 머신러닝 개념에 대한 깊은 이해
- PyTorch 또는 TensorFlow와 같은 딥러닝 프레임워크 경험
- 자연어 처리 및 컴퓨터 비전에 대한 이해
Audience
- 머신러닝 엔지니어
- AI 연구원
- 비전 및 텍스트 워크플로우를 통합하는 제품 개발자
21 Hours