문의를 보내주셔서 감사합니다! 팀원이 곧 연락드리겠습니다.
예약을 보내주셔서 감사합니다! 저희 팀 멤버 중 한 분이 곧 연락드리겠습니다.
코스 개요
상세 교육 과정 개요
- 자연어 처리 소개
- NLP 이해하기
- NLP 프레임워크
- NLP의 상업적 응용
- 웹에서 데이터 스크래핑
- 텍스트 데이터를 검색하기 위한 다양한 API 활용
- 텍스트 말뭉치 작업 및 저장: 콘텐츠 및 관련 메타데이터 저장
- Python 및 NLTK 사용의 장점과 크래시 코어
- 말뭉치와 데이터 세트에 대한 실용적 이해
- 왜 말뭉치가 필요한가?
- 말뭉치 분석
- 데이터 속성의 유형
- 말뭉치를 위한 다양한 파일 형식
- NLP 응용을 위한 데이터 세트 준비
- 문장 구조 이해하기
- NLP 구성 요소
- 자연어 이해
- 형태소 분석 - 어간, 단어, 토큰, 품사 태그
- 통사론 분석
- 의미론 분석
- 모호성 처리
- 텍스트 데이터 전처리
- 말뭉치 - 원시 텍스트
- 문장 토큰화
- 원시 텍스트를 위한 어간 추출
- 원시 텍스트의 어근화
- 불용어 제거
- 말뭉치 - 원시 문장
- 단어 토큰화
- 단어 어근화
- 항목-문서/문서-항목 행렬 다루기
- n-그램 및 문장으로의 텍스트 토큰화
- 실용적이고 맞춤화된 전처리
- 말뭉치 - 원시 텍스트
- 텍스트 데이터 분석
- NLP의 기본 기능
- 파서와 파싱
- 품사 태깅과 태거
- 명사구 추출
- n-그램
- 백 오브 워드(Bag of words)
- NLP의 통계적 기능
- NLP를 위한 선형대수 개념
- NLP를 위한 확률 이론
- TF-IDF
- 벡터화
- 인코더와 디코더
- 정규화
- 확률 모델
- 고급 기능 공학 및 NLP
- word2vec 기초
- word2vec 모델의 구성 요소
- word2vec 모델의 로직
- word2vec 개념의 확장
- word2vec 모델의 응용
- 케이스 스터디: 백 오브 워드 응용 - 단순화되고 정확한 루른(Luhn) 알고리즘을 사용한 자동 텍스트 요약
- NLP의 기본 기능
- 문서 군집화, 분류 및 토픽 모델링
- 문서 군집화 및 패턴 마이닝(계층적 군집화, k-means, 군집화 등)
- TFIDF, 자카드 유사도, 코사인 거리 측정을 사용하여 문서 비교 및 분류
- 나이브 베이즈와 최대 엔트로피를 사용한 문서 분류
- 중요한 텍스트 요소 식별하기
- 차원 축소: 주성분 분석(PCA), 특이값 분해(SVD), 음의 행렬 계수분해
- 잠재 의미 분석(Latent Semantic Analysis)을 통한 토픽 모델링 및 정보 검색
- 엔티티 추출, 감성 분석 및 고급 토픽 모델링
- 긍정적 vs 부정적: 감성의 정도
- 항목 반응 이론(Item Response Theory)
- 품사 태깅 및 그 응용: 텍스트에서 언급된 사람, 장소, 조직 찾기
- 고급 토픽 모델링: 잠재 디리클레 할당(Latent Dirichlet Allocation)
- 케이스 스터디
- 비정형 사용자 리뷰 마이닝
- 제품 리뷰 데이터의 감성 분류 및 시각화
- 사용 패턴을 위한 검색 로그 마이닝
- 텍스트 분류
- 토픽 모델링
요건
NLP 원리에 대한 지식과 이해, 그리고 비즈니스에서의 AI 적용에 대한 감상
21 시간
회원 평가 (1)
개별 지원
Simon the 2nd - Cboost
코스 - ROS: Programming for Robotics
기계 번역됨