코스 개요

오디오 분류 기초

  • 사운드 이벤트 유형: 환경, 기계, 인간 생성
  • 사용 사례 개요: 감시, 모니터링, 자동화
  • 오디오 분류 vs 감지 vs 세분화

오디오 데이터 및 피처 추출

  • 오디오 파일의 유형과 형식
  • 샘플링 속도, 윈도우링, 프레임 크기 고려사항
  • MFCCs, 콜로마 피처, 멜-스펙트로그램 추출

데이터 준비 및 주석

  • UrbanSound8K, ESC-50 및 사용자 정의 데이터셋
  • 사운드 이벤트와 시간 경계 라벨링
  • 데이터셋 균형 조정 및 오디오 증강

오디오 분류 모델 구축

  • 오디오를 위한 컨볼루셔널 신경망(CNNs) 사용
  • 모델 입력: 원시 파형 vs 피처
  • 손실 함수, 평가 지표 및 과적합

이벤트 감지 및 시간 영역 위치 추정

  • 프레임 기반 및 세그먼트 기반 감지 전략
  • しきい値と平滑化を使用した検出の後処理
  • 오디오 타임라인에서 예측 시각화

고급 주제 및 실시간 처리

  • 데이터 부족 상황에서의 전이 학습
  • TensorFlow Lite 또는 ONNX를 사용한 모델 배포
  • 스트리밍 오디오 처리 및 지연 고려 사항

프로젝트 개발 및 적용 시나리오

  • 전체 파이프라인 설계: 흡수부터 분류까지
  • 감시, 품질 관리, 모니터링을 위한 프로토타입 개발
  • 로그 기록, 알림 및 대시보드 또는 API와의 통합

요약 및 다음 단계

요건

  • 머신 러닝 개념과 모델 학습에 대한 이해
  • Python 프로그래밍 및 데이터 전처리 경험
  • 디지털 오디오 기초 지식

대상자

  • 데이터 과학자들
  • 머신 러닝 엔지니어들
  • 오디오 신호 처리 분야의 연구원 및 개발자들
 21 시간

참가자 수


참가자별 가격

예정된 코스

관련 카테고리