Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
자세한 교육 개요
- NLP 소개
- NLP 이해
- NLP 프레임워크
- NLP의 상업적 응용
- 웹에서 데이터 수집
- 텍스트 데이터를 가져오기 위한 다양한 API 작업
- 텍스트 코퍼스 저장 및 저장된 내용과 관련 메타데이터 작업
- Python과 NLTK 크래시 코스를 사용하는 이점
- 코퍼스 및 데이터셋의 실용적인 이해
- 코퍼스가 필요한 이유
- 코퍼스 분석
- 데이터 속성의 종류
- 코퍼스에 대한 다양한 파일 형식
- NLP 애플리케이션을 위한 데이터셋 준비
- 문장 구조 이해
- NLP 구성 요소
- 자연어 이해
- 형태론 분석 - 어간, 단어, 토큰, 음소 태그
- 구문 분석
- 의미 분석
- 모호성 처리
- 텍스트 데이터 전처리
- 코퍼스 - 원시 텍스트
- 문장 토큰화
- 원시 텍스트 어간화
- 원시 텍스트 어근화
- 불용어 제거
- 코퍼스 - 원시 문장
- Word 토큰화
- Word 어근화
- Term-Document/Document-Term 행렬 작업
- 텍스트 토큰화 및 문장 n-그램
- 실용적이고 맞춤형 전처리
- 코퍼스 - 원시 텍스트
- 텍스트 데이터 분석
- NLP의 기본 기능
- 파서와 파싱
- 품사 태깅과 태거
- 명명 엔터티 인식
- N-그램
- Bag of words
- NLP의 통계적 특성
- NLP를 위한 선형 대수학 개념
- NLP를 위한 확률 이론
- TF-IDF
- 벡터화
- 인코더와 디코더
- 정규화
- 확률적 모델
- 고급 기능 공학 및 NLP
- word2vec 기본
- word2vec 모델 구성 요소
- word2vec 모델 논리
- word2vec 개념 확장
- word2vec 모델 적용
- 사례 연구: Bag of words 적용: Luhn의 알고리즘을 사용한 자동 텍스트 요약
- NLP의 기본 기능
- 문서 클러스터링, 분류 및 주제 모델링
- 문서 클러스터링 및 패턴 마이닝 (계층적 클러스터링, k-means 클러스터링 등)
- TFIDF, Jaccard 및 코사인 거리 측정치로 문서 비교 및 분류
- Naïve Bayes 및 최대 엔트로피를 사용한 문서 분류
- 중요한 텍스트 Element 식별
- 차원 축소: 주성분 분석, 특이값 분해, 비음수 행렬 인수분해
- 잠재 의미 분석을 사용한 주제 모델링 및 정보 검색
- 엔티티 추출, Sentiment Analysis 및 고급 주제 모델링
- 긍정 vs. 부정: 감정 정도
- 항목 반응 이론
- 품사 태깅 및 그 응용: 텍스트에 언급된 사람, 장소 및 조직 찾기
- 고급 주제 모델링: 잠재 디리클레 할당
- 사례 연구
- 비정형 사용자 리뷰 마이닝
- 제품 리뷰 데이터의 감정 분류 및 시각화
- 사용 패턴을 위한 검색 로그 마이닝
- 텍스트 분류
- 주제 모델링
Requirements
NLP 원리와 AI 비즈니스 응용에 대한 지식과 인식을 이해하는 능력
21 Hours
회원 평가 (1)
I feel I get the core skills I need to understand how the ROS fits together, and how to structure projects in it.