코스 개요

안전하고 공정한 AI의 기초

  • 주요 개념: 안전성, 편향, 공정성, 투명성
  • 편향 유형: 데이터셋, 표현, 알고리즘적
  • 규제 프레임워크 개요 (EU AI Act, GDPR 등)

세부 조정 모델의 편향

  • 세부 조정이 어떻게 편향을 도입하거나 확대할 수 있는지
  • 사례 연구와 실제 실패 사례
  • 데이터셋과 모델 예측에서 편향 식별

편향 완화 기술

  • 데이터 레벨 전략 (균형 조정, 증강)
  • 훈련 중 전략 (규제, 적대적 탈편향)
  • 사후 처리 전략 (출력 필터링, 캘리브레이션)

모델 안전성과 견고성

  • 안전하지 않거나 유해한 출력 감지
  • 적대적 입력 처리
  • 세부 조정 모델의 레드팀 테스트 및 스트레스 테스트

AI 시스템의 감사와 모니터링

  • 편향과 공정성 평가 지표 (예: 인구 통계학적 동등성)
  • 해석 도구 및 투명성 프레임워크
  • 지속적인 모니터링과 거버넌스 실천

도구 키트와 실습

  • 오픈 소스 라이브러리 사용 (예: Fairlearn, Transformers, CheckList)
  • 세부 조정 모델에서 편향을 감지하고 완화하는 실습
  • 프롬프트 설계 및 제약 조건을 통해 안전한 출력 생성

기업 사용 사례와 준수 준비

  • LLM 워크플로우에서 안전성을 통합하기 위한 최선의 방법
  • 준수를 위한 문서화 및 모델 카드 작성
  • 감사와 외부 검토를 위한 준비

요약 및 다음 단계

요건

  • 머신 러닝 모델과 훈련 과정에 대한 이해
  • 세부 조정 및 LLM 작업 경험이 있음
  • Python과 NLP 개념에 익숙함

대상자

  • AI 준수 팀
  • ML 엔지니어
 14 시간

참가자 수


참가자당 가격

예정된 코스

관련 카테고리