연락처 정보

코스 개요

상세 교육 과정 개요

  1. 자연어 처리 소개
    • NLP 이해하기
    • NLP 프레임워크
    • NLP의 상업적 응용
    • 웹에서 데이터 스크래핑
    • 텍스트 데이터를 검색하기 위한 다양한 API 활용
    • 텍스트 말뭉치 작업 및 저장: 콘텐츠 및 관련 메타데이터 저장
    • Python 및 NLTK 사용의 장점과 크래시 코어
  2. 말뭉치와 데이터 세트에 대한 실용적 이해
    • 왜 말뭉치가 필요한가?
    • 말뭉치 분석
    • 데이터 속성의 유형
    • 말뭉치를 위한 다양한 파일 형식
    • NLP 응용을 위한 데이터 세트 준비
  3. 문장 구조 이해하기
    • NLP 구성 요소
    • 자연어 이해
    • 형태소 분석 - 어간, 단어, 토큰, 품사 태그
    • 통사론 분석
    • 의미론 분석
    • 모호성 처리
  4. 텍스트 데이터 전처리
    • 말뭉치 - 원시 텍스트
      • 문장 토큰화
      • 원시 텍스트를 위한 어간 추출
      • 원시 텍스트의 어근화
      • 불용어 제거
    • 말뭉치 - 원시 문장
      • 단어 토큰화
      • 단어 어근화
    • 항목-문서/문서-항목 행렬 다루기
    • n-그램 및 문장으로의 텍스트 토큰화
    • 실용적이고 맞춤화된 전처리
  5. 텍스트 데이터 분석
    • NLP의 기본 기능
      • 파서와 파싱
      • 품사 태깅과 태거
      • 명사구 추출
      • n-그램
      • 백 오브 워드(Bag of words)
    • NLP의 통계적 기능
      • NLP를 위한 선형대수 개념
      • NLP를 위한 확률 이론
      • TF-IDF
      • 벡터화
      • 인코더와 디코더
      • 정규화
      • 확률 모델
    • 고급 기능 공학 및 NLP
      • word2vec 기초
      • word2vec 모델의 구성 요소
      • word2vec 모델의 로직
      • word2vec 개념의 확장
      • word2vec 모델의 응용
    • 케이스 스터디: 백 오브 워드 응용 - 단순화되고 정확한 루른(Luhn) 알고리즘을 사용한 자동 텍스트 요약
  6. 문서 군집화, 분류 및 토픽 모델링
    • 문서 군집화 및 패턴 마이닝(계층적 군집화, k-means, 군집화 등)
    • TFIDF, 자카드 유사도, 코사인 거리 측정을 사용하여 문서 비교 및 분류
    • 나이브 베이즈와 최대 엔트로피를 사용한 문서 분류
  7. 중요한 텍스트 요소 식별하기
    • 차원 축소: 주성분 분석(PCA), 특이값 분해(SVD), 음의 행렬 계수분해
    • 잠재 의미 분석(Latent Semantic Analysis)을 통한 토픽 모델링 및 정보 검색
  8. 엔티티 추출, 감성 분석 및 고급 토픽 모델링
    • 긍정적 vs 부정적: 감성의 정도
    • 항목 반응 이론(Item Response Theory)
    • 품사 태깅 및 그 응용: 텍스트에서 언급된 사람, 장소, 조직 찾기
    • 고급 토픽 모델링: 잠재 디리클레 할당(Latent Dirichlet Allocation)
  9. 케이스 스터디
    • 비정형 사용자 리뷰 마이닝
    • 제품 리뷰 데이터의 감성 분류 및 시각화
    • 사용 패턴을 위한 검색 로그 마이닝
    • 텍스트 분류
    • 토픽 모델링

요건

NLP 원리에 대한 지식과 이해, 그리고 비즈니스에서의 AI 적용에 대한 감상

 21 시간

참가자 수


참가자별 가격

회원 평가 (1)

예정된 코스

관련 카테고리