문의를 보내주셔서 감사합니다! 팀원이 곧 연락드리겠습니다.
예약을 보내주셔서 감사합니다! 저희 팀 멤버 중 한 분이 곧 연락드리겠습니다.
코스 개요
CANN 최적화 기능 개요
- CANN에서 추론 성능 처리 방법
- 엣지 및 임베디드 AI 시스템을 위한 최적화 목표
- AI 코어 사용량 및 메모리 할당 이해
분석을 위한 그래프 엔진 사용
- 그래프 엔진 및 실행 파이프라인 소개
- 연산자 그래프 및 런타임 메트릭 시각화
- 최적화를 위한 계산 그래프 수정
프로파일링 도구 및 성능 메트릭
- CANN 프로파일링 도구(프로파일러)를 사용하여 작업 분석
- 커널 실행 시간 및 병목 현상 분석
- 메모리 접근 프로파일링 및 타일링 전략
TIK를 사용한 사용자 정의 연산자 개발
- TIK 및 연산자 프로그래밍 모델 개요
- TIK DSL을 사용하여 사용자 정의 연산자 구현
- 연산자 성능 테스트 및 벤치마킹
TVM을 사용한 고급 연산자 최적화
- CANN와 TVM 통합 소개
- 계산 그래프 자동 튜닝 전략
- TVM과 TIK 사이에서 전환할 때와 방법
메모리 최적화 기술
- 메모리 레이아웃 및 버퍼 배치 관리
- 온칩 메모리 소비량 줄이기 기술
- 비동기 실행 및 재사용 최적화 방법
실제 배포 및 사례 연구
- 사례 연구: 스마트 시티 카메라 파이프라인 성능 조정
- 사례 연구: 자율 주행 차량 추론 스택 최적화
- 반복적인 프로파일링 및 지속적인 개선을 위한 지침
요약 및 다음 단계
요건
- 딥러닝 모델 아키텍처와 학습 워크플로우에 대한 깊은 이해
- CANN, TensorFlow, 또는 PyTorch를 사용하여 모델 배포 경험
- Linux CLI, 쉘 스크립팅, 그리고 Python 프로그래밍에 대한 숙련도
대상
- AI 성능 엔지니어
- 추론 최적화 전문가
- 엣지 AI 또는 실시간 시스템에서 작업하는 개발자
14 시간