Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
오디오 분류의 기초
- 소리 이벤트 유형: 환경, 기계, 인간 생성
- 사용 사례 개요: 감시, 모니터링, 자동화
- 오디오 분류 vs 탐지 vs 세분화
오디오 데이터와 특성 추출
- 오디오 파일과 형식의 종류
- 샘플링률, 윈도우화, 프레임 크기 고려 사항
- MFCC, 크로마 특징, 멜 스펙트로그램 추출
데이터 준비와 주석 달기
- UrbanSound8K, ESC-50 및 사용자 지정 데이터셋
- 소리 이벤트와 시간 경계 표시
- 데이터셋 균형 맞추기와 오디오 증강
오디오 분류 모델 구축
- 오디오에 대한 합성곱 신경망(CNN) 사용
- 모델 입력: 원시 파형 vs 특성
- 손실 함수, 평가 지표 및 과적합
이벤트 탐지 및 시간적 위치 지정
- 프레임 기반 및 세그먼트 기반 탐지 전략
- 임계값 및 평활화 사용한 탐지 후 처리
- 오디오 타임라인에 예측 시각화
고급 주제 및 실시간 처리
- 저 데이터 시나리오에 대한 전이 학습
- TensorFlow Lite 또는 ONNX를 사용하여 모델 배포
- 스트리밍 오디오 처리 및 지연 고려 사항
프로젝트 개발 및 응용 시나리오
- 완전한 파이프라인 설계: 수집에서 분류까지
- 감시, 품질 관리 또는 모니터링을 위한 개념 증명 개발
- 로깅, 알림 및 대시보드 또는 API와의 통합
요약 및 다음 단계
Requirements
- 기계 학습 개념과 모델 학습에 대한 이해
- Python 프로그래밍 및 데이터 전처리에 대한 경험
- 디지털 오디오 기본 개념에 대한 익숙함
대상
- 데이터 과학자
- 기계 학습 엔지니어
- 오디오 신호 처리 연구자 및 개발자
21 Hours