Course Outline

도메인 특정 언어 모델 소개

  • AI의 언어 모델 개요
  • 언어 모델 전문화의 중요성
  • 성공적인 도메인별 모델의 사례 연구

데이터 큐레이션 및 전처리

  • 도메인별 데이터 세트 식별 및 수집
  • 데이터 정리 및 전처리 기술
  • 데이터세트 생성 시 윤리적 고려사항

모델 훈련 및 미세 조정

  • 전이 학습 및 미세 조정 소개
  • 도메인별 훈련을 위한 기본 모델 선택
  • 효과적인 미세 조정을 위한 기술

평가 지표 및 모델 성능

  • 도메인별 모델 평가를 위한 측정항목
  • 도메인별 작업에 대한 벤치마킹 모델
  • 제한사항 및 장단점 이해

배포 전략

  • 도메인별 애플리케이션에 언어 모델 통합
  • Scala배포된 모델의 기능 및 유지 관리
  • 배포 시 지속적인 학습 및 모델 업데이트

법률 분야 초점

  • 법률 언어 모델에 대한 특별 고려 사항
  • 훈련을 위한 판례법 및 법령 코퍼스
  • 법률 연구 및 문서 분석에 적용

의료 도메인 포커스

  • 의료 언어 처리의 과제
  • HIPAA 규정 준수 및 데이터 개인정보 보호
  • 의학 문헌 검토 및 환자 상호 작용의 사용 사례

기술 도메인 포커스

  • 기술 전문 용어와 언어 모델에 대한 의미
  • Collaboration 해당 분야 전문가와 함께
  • 기술 문서 생성 및 코드 주석 달기

프로젝트 및 평가

  • 프로젝트 제안 및 초기 데이터 세트 수집
  • 완료된 프로젝트 및 모델 성과 발표
  • 최종 평가 및 피드백

요약 및 다음 단계

Requirements

  • 머신러닝 개념에 대한 기본 이해
  • Python 프로그래밍에 대한 지식
  • 자연어 처리 기초에 대한 지식

청중

  • 데이터 과학자
  • 머신러닝 엔지니어
 28 Hours

Number of participants


Price per participant

Upcoming Courses