Course Outline

자세한 교육 개요

  1. NLP 소개
    • NLP 이해
    • NLP 프레임워크
    • NLP의 상업적 응용
    • 웹에서 데이터 수집
    • 텍스트 데이터를 가져오기 위한 다양한 API 작업
    • 텍스트 코퍼스 저장 및 저장된 내용과 관련 메타데이터 작업
    • Python과 NLTK 크래시 코스를 사용하는 이점
  2. 코퍼스 및 데이터셋의 실용적인 이해
    • 코퍼스가 필요한 이유
    • 코퍼스 분석
    • 데이터 속성의 종류
    • 코퍼스에 대한 다양한 파일 형식
    • NLP 애플리케이션을 위한 데이터셋 준비
  3. 문장 구조 이해
    • NLP 구성 요소
    • 자연어 이해
    • 형태론 분석 - 어간, 단어, 토큰, 음소 태그
    • 구문 분석
    • 의미 분석
    • 모호성 처리
  4. 텍스트 데이터 전처리
    • 코퍼스 - 원시 텍스트
      • 문장 토큰화
      • 원시 텍스트 어간화
      • 원시 텍스트 어근화
      • 불용어 제거
    • 코퍼스 - 원시 문장
      • Word 토큰화
      • Word 어근화
    • Term-Document/Document-Term 행렬 작업
    • 텍스트 토큰화 및 문장 n-그램
    • 실용적이고 맞춤형 전처리
  5. 텍스트 데이터 분석
    • NLP의 기본 기능
      • 파서와 파싱
      • 품사 태깅과 태거
      • 명명 엔터티 인식
      • N-그램
      • Bag of words
    • NLP의 통계적 특성
      • NLP를 위한 선형 대수학 개념
      • NLP를 위한 확률 이론
      • TF-IDF
      • 벡터화
      • 인코더와 디코더
      • 정규화
      • 확률적 모델
    • 고급 기능 공학 및 NLP
      • word2vec 기본
      • word2vec 모델 구성 요소
      • word2vec 모델 논리
      • word2vec 개념 확장
      • word2vec 모델 적용
    • 사례 연구: Bag of words 적용: Luhn의 알고리즘을 사용한 자동 텍스트 요약
  6. 문서 클러스터링, 분류 및 주제 모델링
    • 문서 클러스터링 및 패턴 마이닝 (계층적 클러스터링, k-means 클러스터링 등)
    • TFIDF, Jaccard 및 코사인 거리 측정치로 문서 비교 및 분류
    • Naïve Bayes 및 최대 엔트로피를 사용한 문서 분류
  7. 중요한 텍스트 Element 식별
    • 차원 축소: 주성분 분석, 특이값 분해, 비음수 행렬 인수분해
    • 잠재 의미 분석을 사용한 주제 모델링 및 정보 검색
  8. 엔티티 추출, Sentiment Analysis 및 고급 주제 모델링
    • 긍정 vs. 부정: 감정 정도
    • 항목 반응 이론
    • 품사 태깅 및 그 응용: 텍스트에 언급된 사람, 장소 및 조직 찾기
    • 고급 주제 모델링: 잠재 디리클레 할당
  9. 사례 연구
    • 비정형 사용자 리뷰 마이닝
    • 제품 리뷰 데이터의 감정 분류 및 시각화
    • 사용 패턴을 위한 검색 로그 마이닝
    • 텍스트 분류
    • 주제 모델링

Requirements

NLP 원리와 AI 비즈니스 응용에 대한 지식과 인식을 이해하는 능력

 21 Hours

Number of participants


Price per participant

회원 평가 (1)

Upcoming Courses

Related Categories