Course Outline

소개

    Data Science 프로세스 데이터 과학자의 역할과 책임

개발 환경 준비

    라이브러리, 프레임워크, 언어 및 도구 로컬 개발 협업 웹 기반 개발

데이터 수집

    다양한 유형의 데이터 구조화된 로컬 데이터베이스 데이터베이스 커넥터 일반적인 형식: xlxs, XML, Json, csv, ...
구조화되지 않은 클릭, 검열, 스마트폰
  • 아피스
  • Internet of Things (IoT)
  • 문서, 사진, 비디오, 사운드
  • 사례 연구: 대량의 비정형 데이터를 지속적으로 수집
  • 데이터 저장고관계형 데이터베이스 비관계형 데이터베이스 Hadoop: 분산 파일 시스템(HDFS) Spark: 탄력적 분산 데이터 세트(RDD) 클라우드 스토리지
  • 데이터 준비
  • 수집, 선택, 정리 및 변환 데이터 품질 보장 - 정확성, 의미 및 보안 예외 보고서

      Languages 준비, 처리 및 분석에 사용됨

    R 언어 R 소개 데이터 조작, 계산 및 그래픽 표시

      Python Python 소개

    데이터 조작, 처리, 정리 및 크런치

      데이터 분석
    탐색적 분석 기본 통계 초안 시각화 데이터 이해
  • 인과관계
  • 기능 및 변형
  • Machine Learning 감독됨 vs 감시되지 않음

      언제 어떤 모델을 사용하는가
    Natural Language Processing (NLP)
  • Data Visualization
  • 모범 사례 올바른 데이터에 적합한 차트 선택 색상 팔레트 한 단계 더 발전 대시보드 대화형 시각화
  • 데이터를 활용한 스토리텔링
  • 요약 및 결론
  • Requirements

    • 데이터베이스 개념에 대한 일반적인 이해
    • 통계에 대한 기본 이해
     35 Hours

    Number of participants



    Price per participant

    회원 평가 (2)

    Related Courses

    Related Categories