문의를 보내주셔서 감사합니다! 팀원이 곧 연락드리겠습니다.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
오디오 분류의 기초
- 소리 이벤트 유형: 환경, 기계, 인간 생성
- 사용 사례 개요: 감시, 모니터링, 자동화
- 오디오 분류 vs 탐지 vs 세분화
오디오 데이터와 특성 추출
- 오디오 파일과 형식의 종류
- 샘플링률, 윈도우화, 프레임 크기 고려 사항
- MFCC, 크로마 특징, 멜 스펙트로그램 추출
데이터 준비와 주석 달기
- UrbanSound8K, ESC-50 및 사용자 지정 데이터셋
- 소리 이벤트와 시간 경계 표시
- 데이터셋 균형 맞추기와 오디오 증강
오디오 분류 모델 구축
- 오디오에 대한 합성곱 신경망(CNN) 사용
- 모델 입력: 원시 파형 vs 특성
- 손실 함수, 평가 지표 및 과적합
이벤트 탐지 및 시간적 위치 지정
- 프레임 기반 및 세그먼트 기반 탐지 전략
- 임계값 및 평활화 사용한 탐지 후 처리
- 오디오 타임라인에 예측 시각화
고급 주제 및 실시간 처리
- 저 데이터 시나리오에 대한 전이 학습
- TensorFlow Lite 또는 ONNX를 사용하여 모델 배포
- 스트리밍 오디오 처리 및 지연 고려 사항
프로젝트 개발 및 응용 시나리오
- 완전한 파이프라인 설계: 수집에서 분류까지
- 감시, 품질 관리 또는 모니터링을 위한 개념 증명 개발
- 로깅, 알림 및 대시보드 또는 API와의 통합
요약 및 다음 단계
Requirements
- 기계 학습 개념과 모델 학습에 대한 이해
- Python 프로그래밍 및 데이터 전처리에 대한 경험
- 디지털 오디오 기본 개념에 대한 익숙함
대상
- 데이터 과학자
- 기계 학습 엔지니어
- 오디오 신호 처리 연구자 및 개발자
21 Hours