문의를 보내주셔서 감사합니다! 팀원이 곧 연락드리겠습니다.
예약을 보내주셔서 감사합니다! 저희 팀 멤버 중 한 분이 곧 연락드리겠습니다.
코스 개요
Mistral 멀티모달 모델 소개
- Mistral Medium 및 멀티모달 기능 개요
- OCR/문서 모델과 활용 사례
- 오픈 소스 생태계와의 통합
OCR 및 비전 파이프라인
- Mistral 모델을 활용한 OCR 기초
- 이미지와 스캔 문서 전처리
- 이미지에서 구조화된 텍스트 추출
문서 이해
- 문서용 NLP 파이프라인 설계
- 엔티티 인식, 요약 및 분류
- 텍스트와 비전 데이터의 크로스 모달 링크
검색 및 지식 애플리케이션
- 비전-텍스트 검색 시스템
- OCR 출력을 활용한 의미론적 검색 구축
- 기업 문서 저장소
보조 및 상호작용 애플리케이션
- 멀티모달 조수를 위한 UI 설계
- 접근성 애플리케이션 (예: 비전-텍스트)
- 실세계 생산성 도구
성능 및 최적화
- 멀티모달 파이프라인 확장
- 추론 성능 조정
- 정확성과 효율성의 균형 평가
사례 연구 및 미래 방향
- 멀티모달 AI의 산업적 활용 사례
- OCR 및 문서 AI의 연구 동향
- 비전-텍스트 작업에서 책임 있는 AI 고려사항
요약 및 다음 단계
요건
- 자연어 처리 개념 이해
- Python 및 ML 프레임워크 경험
- 컴퓨터 비전 기초 지식
대상자
- 제품 팀
- ML 연구원
- 응용 ML 엔지니어
14 시간