Course Outline

CANN 최적화 기능 개요

  • CANN에서 추론 성능 처리 방법
  • 엣지 및 임베디드 AI 시스템을 위한 최적화 목표
  • AI 코어 사용량 및 메모리 할당 이해

분석을 위한 그래프 엔진 사용

  • 그래프 엔진 및 실행 파이프라인 소개
  • 연산자 그래프 및 런타임 메트릭 시각화
  • 최적화를 위한 계산 그래프 수정

프로파일링 도구 및 성능 메트릭

  • CANN 프로파일링 도구(프로파일러)를 사용하여 작업 분석
  • 커널 실행 시간 및 병목 현상 분석
  • 메모리 접근 프로파일링 및 타일링 전략

TIK를 사용한 사용자 정의 연산자 개발

  • TIK 및 연산자 프로그래밍 모델 개요
  • TIK DSL을 사용하여 사용자 정의 연산자 구현
  • 연산자 성능 테스트 및 벤치마킹

TVM을 사용한 고급 연산자 최적화

  • CANN와 TVM 통합 소개
  • 계산 그래프 자동 튜닝 전략
  • TVM과 TIK 사이에서 전환할 때와 방법

메모리 최적화 기술

  • 메모리 레이아웃 및 버퍼 배치 관리
  • 온칩 메모리 소비량 줄이기 기술
  • 비동기 실행 및 재사용 최적화 방법

실제 배포 및 사례 연구

  • 사례 연구: 스마트 시티 카메라 파이프라인 성능 조정
  • 사례 연구: 자율 주행 차량 추론 스택 최적화
  • 반복적인 프로파일링 및 지속적인 개선을 위한 지침

요약 및 다음 단계

Requirements

  • 딥러닝 모델 아키텍처와 학습 워크플로우에 대한 깊은 이해
  • CANN, TensorFlow, 또는 PyTorch를 사용하여 모델 배포 경험
  • Linux CLI, 쉘 스크립팅, 그리고 Python 프로그래밍에 대한 숙련도

대상

  • AI 성능 엔지니어
  • 추론 최적화 전문가
  • 엣지 AI 또는 실시간 시스템에서 작업하는 개발자
 14 Hours

Number of participants


Price per participant

Upcoming Courses

Related Categories