Course Outline

중국 AI GPU 에코시스템 개요

  • Huawei Ascend, Biren, Cambricon MLU 비교
  • CUDA vs CANN, Biren SDK 및 BANGPy 모델
  • 산업 동향 및 공급업체 생태계

이동 준비

  • CUDA 코드베이스 평가
  • 대상 플랫폼 및 SDK 버전 식별
  • 툴체인 설치 및 환경 설정

코드 번역 기술

  • CUDA 메모리 접근 및 커널 논리 포팅
  • 컴퓨팅 그리드/스레드 모델 매핑
  • 자동화된 vs 수동 번역 옵션

플랫폼 특정 구현

  • Huawei CANN 연산자와 사용자 정의 커널 사용
  • Biren SDK 변환 파이프라인
  • BANGPy (Cambricon)로 모델 재구축

크로스 플랫폼 테스트 및 최적화

  • 각 대상 플랫폼에서의 실행 프로파일링
  • 메모리 조정 및 병렬 실행 비교
  • 성능 추적 및 반복

혼합 GPU 환경 관리

  • 여러 아키텍처를 사용한 하이브리드 배포
  • 대안 전략 및 장치 검출
  • 코드 유지보수성을 위한 추상화 계층

사례 연구 및 모범 사례

  • Ascend 또는 Cambricon으로 비전/NLP 모델 포팅
  • Biren 클러스터에서 추론 파이프라인 개조
  • 버전 불일치 및 API 간격 처리

요약 및 다음 단계

Requirements

  • CUDA 또는 GPU 기반 애플리케이션 프로그래밍 경험
  • GPU 메모리 모델 및 컴퓨트 커널에 대한 이해
  • AI 모델 배포 또는 가속 워크플로우에 대한 familiarity

대상

  • GPU 프로그래머
  • 시스템 아키텍트
  • 포트팅 전문가
 21 Hours

Number of participants


Price per participant

Upcoming Courses

Related Categories