Course Outline

오디오 분류의 기초

  • 소리 이벤트 유형: 환경, 기계, 인간 생성
  • 사용 사례 개요: 감시, 모니터링, 자동화
  • 오디오 분류 vs 탐지 vs 세분화

오디오 데이터와 특성 추출

  • 오디오 파일과 형식의 종류
  • 샘플링률, 윈도우화, 프레임 크기 고려 사항
  • MFCC, 크로마 특징, 멜 스펙트로그램 추출

데이터 준비와 주석 달기

  • UrbanSound8K, ESC-50 및 사용자 지정 데이터셋
  • 소리 이벤트와 시간 경계 표시
  • 데이터셋 균형 맞추기와 오디오 증강

오디오 분류 모델 구축

  • 오디오에 대한 합성곱 신경망(CNN) 사용
  • 모델 입력: 원시 파형 vs 특성
  • 손실 함수, 평가 지표 및 과적합

이벤트 탐지 및 시간적 위치 지정

  • 프레임 기반 및 세그먼트 기반 탐지 전략
  • 임계값 및 평활화 사용한 탐지 후 처리
  • 오디오 타임라인에 예측 시각화

고급 주제 및 실시간 처리

  • 저 데이터 시나리오에 대한 전이 학습
  • TensorFlow Lite 또는 ONNX를 사용하여 모델 배포
  • 스트리밍 오디오 처리 및 지연 고려 사항

프로젝트 개발 및 응용 시나리오

  • 완전한 파이프라인 설계: 수집에서 분류까지
  • 감시, 품질 관리 또는 모니터링을 위한 개념 증명 개발
  • 로깅, 알림 및 대시보드 또는 API와의 통합

요약 및 다음 단계

Requirements

  • 기계 학습 개념과 모델 학습에 대한 이해
  • Python 프로그래밍 및 데이터 전처리에 대한 경험
  • 디지털 오디오 기본 개념에 대한 익숙함

대상

  • 데이터 과학자
  • 기계 학습 엔지니어
  • 오디오 신호 처리 연구자 및 개발자
 21 Hours

Number of participants


Price per participant

Upcoming Courses

Related Categories