Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
CANN 최적화 기능 개요
- CANN에서 추론 성능 처리 방법
- 엣지 및 임베디드 AI 시스템을 위한 최적화 목표
- AI 코어 사용량 및 메모리 할당 이해
분석을 위한 그래프 엔진 사용
- 그래프 엔진 및 실행 파이프라인 소개
- 연산자 그래프 및 런타임 메트릭 시각화
- 최적화를 위한 계산 그래프 수정
프로파일링 도구 및 성능 메트릭
- CANN 프로파일링 도구(프로파일러)를 사용하여 작업 분석
- 커널 실행 시간 및 병목 현상 분석
- 메모리 접근 프로파일링 및 타일링 전략
TIK를 사용한 사용자 정의 연산자 개발
- TIK 및 연산자 프로그래밍 모델 개요
- TIK DSL을 사용하여 사용자 정의 연산자 구현
- 연산자 성능 테스트 및 벤치마킹
TVM을 사용한 고급 연산자 최적화
- CANN와 TVM 통합 소개
- 계산 그래프 자동 튜닝 전략
- TVM과 TIK 사이에서 전환할 때와 방법
메모리 최적화 기술
- 메모리 레이아웃 및 버퍼 배치 관리
- 온칩 메모리 소비량 줄이기 기술
- 비동기 실행 및 재사용 최적화 방법
실제 배포 및 사례 연구
- 사례 연구: 스마트 시티 카메라 파이프라인 성능 조정
- 사례 연구: 자율 주행 차량 추론 스택 최적화
- 반복적인 프로파일링 및 지속적인 개선을 위한 지침
요약 및 다음 단계
Requirements
- 딥러닝 모델 아키텍처와 학습 워크플로우에 대한 깊은 이해
- CANN, TensorFlow, 또는 PyTorch를 사용하여 모델 배포 경험
- Linux CLI, 쉘 스크립팅, 그리고 Python 프로그래밍에 대한 숙련도
대상
- AI 성능 엔지니어
- 추론 최적화 전문가
- 엣지 AI 또는 실시간 시스템에서 작업하는 개발자
14 Hours