문의를 보내주셔서 감사합니다! 팀원이 곧 연락드리겠습니다.
예약을 보내주셔서 감사합니다! 저희 팀 멤버 중 한 분이 곧 연락드리겠습니다.
코스 개요
엣지 AI와 Nano Banana 소개
- 엣지-AI 워크로드의 주요 특성
- Nano Banana 아키텍처 및 기능
- 엣지 배포 전략과 클라우드 배포 전략 비교
엣지 배포를 위한 모델 준비
- 모델 선택 및 기준 평가
- 의존성 및 호환성 고려사항
- 추가 최적화를 위한 모델 내보내기
모델 압축 기술
- 가지치기 전략과 구조적 희소성
- 가중치 공유 및 매개변수 감소
- 압축 효과 평가
엣지 성능을 위한 양자화
- 학습 후 양자화 방법
- 양자화 인식 학습 워크플로우
- INT8, FP16 및 혼합 정밀도 접근 방식
Nano Banana를 이용한 가속화
- Nano Banana 가속기 사용
- ONNX와 하드웨어 백엔드 통합
- 가속화된 추론 벤치마킹
엣지 디바이스에 배포
- 임베디드 또는 모바일 애플리케이션으로의 모델 통합
- 런타임 구성 및 모니터링
- 배포 문제 해결
성능 프로파일링 및 트레이드오프 분석
- 지연 시간, 처리량 및 열 제약 조건
- 정확도와 성능 간의 트레이드오프
- 반복적인 최적화 전략
엣지-AI 시스템 유지 관리에 대한 베스트 프랙티스
- 버전 관리 및 지속적인 업데이트
- 모델 롤백 및 호환성 관리
- 보안 및 무결성 고려사항
요약 및 다음 단계
요건
- 머신 러닝 워크플로우에 대한 이해
- Python 기반 모델 개발 경험
- 신경망 아키텍처에 대한 익숙함
대상자
- ML 엔지니어
- 데이터 과학자
- MLOps 실무자
14 시간
회원 평가 (1)
프레젠테이션에서의 흐름, 분위기 및 주제
Lukasz Kowalczyk - Allegro Sp. z o.o.
코스 - Google Gemini AI for Data Analysis
기계 번역됨