Data Science for Big Data Analytics 교육 과정

빅 데이터는 너무 방대하고 복잡한 데이터 세트로 전통적인 데이터 처리 응용 프로그램 소프트웨어가 처리하기에 부적합합니다. 큰 데이터 문제로는 데이터 캡처, 데이터 저장, 데이터 분석, 검색, 공유, 전송, 시각화, 쿼리, 업데이트 및 정보 프라이버시가 있습니다.

Data Science for Big Data Analytics 교육 과정

Course Outline

Data Science for Big Data Analytics 소개

데이터 분석 수명주기 소개

이 시점부터 대부분의 훈련 시간(80%)은 R 및 관련 빅 데이터 기술의 예제와 연습에 사용됩니다.

R 시작하기

Hadoop 시작하기

R과 Hadoop를 RHadoop와 통합

데이터 전처리 및 준비

R의 탐색적 데이터 분석 방법

Data Visualization

회귀(미래 가치 추정)

분류

모델 성능 평가 및 선택

앙상블 방법

분류 및 회귀를 위한 서포트 벡터 머신

링크 분석 개념 네트워크 분석을 위한 메트릭 Pagerank 알고리즘 하이퍼링크 유도 주제 Search 링크 예측 연습 및 사례 연구

빈번한 패턴 마이닝 모델 Scala빈번한 패턴 마이닝의 가능성 문제 무차별 대입 알고리즘 Apriori 알고리즘 FP 성장 접근 방식 후보 규칙 평가 연관 규칙 적용 검증 및 테스트 진단 R 및 Hadoop과 연관 규칙 연습 및 사례 연구

추천 시스템 이해 추천 시스템에 사용되는 데이터 마이닝 기술recommenderlab 패키지를 사용하는 추천 시스템 추천 시스템 평가 RHadoop를 사용한 추천 연습: 추천 엔진 구축

텍스트 분석 단계 원시 텍스트 수집 단어 빈도 – 역 문서 빈도 감정 결정 연습 및 사례 연구

회원 평가 (2)

Marija Hornis Dmitrovic - Marija Hornis

Course - Data Science for Big Data Analytics

Teboho Makenete

Course - Data Science for Big Data Analytics

Related Courses

Kaggle

Accelerating Python Pandas Workflows with Modin

GPU Data Science with NVIDIA RAPIDS

Anaconda Ecosystem for Data Scientists

Data Vault: Building a Scalable Data Warehouse

Spark Streaming with Python and Kafka

Confluent KSQL

Apache Ignite for Developers

Unified Batch and Stream Processing with Apache Beam

Apache Apex: Processing Big Data-in-Motion

Apache Storm

Apache NiFi for Administrators

Apache NiFi for Developers

Apache Flink Fundamentals

Python and Spark for Big Data (PySpark)

Related Categories

빅 데이터

데이터 수집

Data Science

This site in other countries/regions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites