코스 개요

첫째 날: 언어 기초

  • 과정 소개
  • 데이터 과학에 대한 이해
    • 데이터 과학의 정의
    • 데이터 과학 수행 과정
  • R 언어 소개
  • 변수와 타입
  • 제어 구조 (루프/조건문)
  • R 스칼라, 벡터 및 행렬
    • R 벡터 정의
    • 행렬
  • 문자열 및 텍스트 조작
    • 문자 데이터 타입
    • 파일 입출력
  • 리스트
  • 함수
    • 함수 소개
    • 클로저
    • lapply/sapply 함수
  • 데이터프레임
  • 모든 섹션에 대한 실습

둘째 날: 중급 R 프로그래밍

  • 데이터프레임과 파일 입출력
  • 파일에서 데이터 읽기
  • 데이터 준비
  • 내장 데이터셋
  • 시각화
    • 그래픽 패키지
    • plot() / barplot() / hist() / boxplot() / 산점도
    • 히트맵
    • ggplot2 패키지 (qplot(), ggplot())
  • dplyr로 탐색
  • 모든 섹션에 대한 실습

셋째 날: 고급 R 프로그래밍

  • R을 이용한 통계 모델링
    • 통계 함수
    • NA 처리
    • 분포 (이항, 포아송, 정규)
  • 회귀분석
    • 선형 회귀 소개
  • 추천 시스템
  • 텍스트 처리 (tm 패키지 / 워드클라우드)
  • 클러스터링
    • 클러스터링 소개
    • KMeans
  • 분류
    • 분류 소개
    • 나이브 베이즈
    • 결정 트리
    • caret 패키지로 학습
    • 알고리즘 평가
  • R과 빅데이터
    • 데이터베이스에 연결하기
    • 빅데이터 생태계
  • 모든 섹션에 대한 실습

요건

  • 기본 프로그래밍 배경이 선호됩니다.

설정

  • 최신 노트북
  • 최신 R Studio 및 R 환경이 설치되어 있어야 합니다.
 21 시간

참가자 수


참가자당 가격

회원 평가 (7)

예정된 코스

관련 카테고리