코스 개요

엣지 AI와 Nano Banana 소개

  • 엣지-AI 워크로드의 주요 특성
  • Nano Banana 아키텍처 및 기능
  • 엣지 배포 전략과 클라우드 배포 전략 비교

엣지 배포를 위한 모델 준비

  • 모델 선택 및 기준 평가
  • 의존성 및 호환성 고려사항
  • 추가 최적화를 위한 모델 내보내기

모델 압축 기술

  • 가지치기 전략과 구조적 희소성
  • 가중치 공유 및 매개변수 감소
  • 압축 효과 평가

엣지 성능을 위한 양자화

  • 학습 후 양자화 방법
  • 양자화 인식 학습 워크플로우
  • INT8, FP16 및 혼합 정밀도 접근 방식

Nano Banana를 이용한 가속화

  • Nano Banana 가속기 사용
  • ONNX와 하드웨어 백엔드 통합
  • 가속화된 추론 벤치마킹

엣지 디바이스에 배포

  • 임베디드 또는 모바일 애플리케이션으로의 모델 통합
  • 런타임 구성 및 모니터링
  • 배포 문제 해결

성능 프로파일링 및 트레이드오프 분석

  • 지연 시간, 처리량 및 열 제약 조건
  • 정확도와 성능 간의 트레이드오프
  • 반복적인 최적화 전략

엣지-AI 시스템 유지 관리에 대한 베스트 프랙티스

  • 버전 관리 및 지속적인 업데이트
  • 모델 롤백 및 호환성 관리
  • 보안 및 무결성 고려사항

요약 및 다음 단계

요건

  • 머신 러닝 워크플로우에 대한 이해
  • Python 기반 모델 개발 경험
  • 신경망 아키텍처에 대한 익숙함

대상자

  • ML 엔지니어
  • 데이터 과학자
  • MLOps 실무자
 14 시간

참가자 수


참가자당 가격

회원 평가 (1)

예정된 코스

관련 카테고리