Course Outline

Data Analysis와 빅데이터 소개

    Big Data이 "큰" 이유는 무엇입니까? 속도, 양, 다양성, 진실성(VVVV)
전통적인 데이터 처리의 한계
  • 분산 처리
  • 통계 분석
  • Machine Learning 분석의 종류
  • Data Visualization
  • Big Data 역할과 책임
  • 관리자 개발자 데이터 분석가

      Languages 데이터 분석에 사용

    R Language 데이터 분석에 왜 R이 필요한가요? 데이터 조작, 계산 및 그래픽 표시

      Python 왜 Python 데이터 분석을 해야 할까요?
    데이터 조작, 처리, 정리 및 크런치
  • Data Analysis에 대한 접근 방식
  • 통계 분석 시계열 분석 상관관계 및 회귀 모델을 이용한 예측 추론Statistics(추정) 빅데이터 세트의 설명Statistics(예: 평균 계산)
  • Machine Learning 지도 학습과 비지도 학습

      분류 및 클러스터링
    특정 방법의 비용 추정
  • 필터링
  • 자연어 처리 텍스트 처리
  • 본문의 의미 이해
  • 자동 텍스트 생성
  • 감성분석/주제분석
  • Computer Vision 이미지 획득, 처리, 분석 및 이해
  • 3D 장면 재구성, 해석 및 이해
  • 이미지 데이터를 사용하여 의사 결정
  • Big Data 인프라
  • 데이터 저장소 관계형 데이터베이스 (SQL) MySQL Postgres Oracle
  • 비관계형 데이터베이스(NoSQL) Cassandra
  • MongoDB
  • Neo4j
  • 계층적 데이터베이스의 미묘한 차이 이해하기

      객체 지향 데이터베이스
    문서 중심 데이터베이스
  • 그래프 중심 데이터베이스
  • 다른
  • 분산 처리 Hadoop 분산 파일 시스템으로서의 HDFS
  • 분산 처리를 위한 MapReduce
  • 대규모 데이터 처리를 위한 Spark 올인원 인메모리 클러스터 컴퓨팅 프레임워크
  • 구조화된 스트리밍
  • 스파크 SQL
  • Machine Learning 라이브러리: MLlib
  • GraphX을 사용한 그래프 처리
  • Scala 능력 퍼블릭 클라우드 AWS, Google, Aliyun 등프라이빗 클라우드OpenStack, Cloud Foundry 등
  • 자동 확장성
  • 문제에 대한 올바른 솔루션 선택
  • Big Data의 미래
  • 요약 및 결론
  • Requirements

    • 수학에 대한 일반적인 이해.
    • 프로그래밍에 대한 일반적인 이해.
    • 데이터베이스에 대한 일반적인 이해.

    청중

    • 개발자/프로그래머
    • IT 컨설턴트
      35 Hours

    Number of participants



    Price per participant

    회원 평가 (2)

    Related Courses

    Related Categories