From Data to Decision with Big Data and Predictive Analytics 교육 과정
청중
액세스 권한이있는 데이터를 이해하려고하거나 Twitter, Linked in 등의 인터넷에서 사용할 수있는 구조화되지 않은 데이터를 분석하려는 경우이 과정은 사용자를위한 것입니다.
대부분의 의사 결정자와 수집 할 가치가있는 데이터와 분석 할 가치가있는 데이터를 선택해야하는 사람들을 대상으로합니다.
솔루션을 구성하는 사람들을 대상으로하는 것이 아니기 때문에 사람들은 큰 그림의 이점을 누릴 수 있습니다.
배달 모드
과정 중에 대표자는 주로 오픈 소스 기술의 실례를 제시합니다.
단기 강연은 참가자의 발표와 간단한 연습으로 이어진다.
사용 된 컨텐츠 및 소프트웨어
사용 된 모든 소프트웨어는 코스가 실행될 때마다 업데이트되므로 가능한 최신 버전을 확인합니다.
여기에는 데이터 획득, 형식 지정, 처리 및 분석, 기계 학습을 통한 의사 결정 프로세스 자동화 방법을 설명하는 프로세스가 포함됩니다.
Course Outline
빠른 개요
- 데이터 소스
- 마인드 데이터
- 추천 시스템
- 타겟 Marketing
데이터 유형
- 구조화 대 비구조화
- 정적 vs 스트리밍
- 태도, 행동 및 인구통계학적 데이터
- 데이터 중심 분석과 사용자 중심 분석
- 데이터 유효성
- 데이터의 양, 속도 및 다양성
모델
- 건물 모델
- 통계 모델
- 기계 학습
데이터 분류
- 클러스터링
- kGroups, k-평균, 가장 가까운 이웃
- 개미 군집, 새 떼
예측 모델
- 의사결정 트리
- 지원 벡터 머신
- 나이브 베이즈 분류
- 신경망
- 마르코프 모델
- 회귀
- 앙상블 방법
ROI
- 이익/비용 비율
- 소프트웨어 비용
- 개발 비용
- 잠재적인 이점
모델 구축
- 데이터 준비(맵리듀스)
- 데이터 정리
- 방법 선택
- 모델 개발 중
- 테스트 모델
- 모델 평가
- 모델 배포 및 통합
오픈 소스 및 상용 소프트웨어 개요
- R-project 패키지 선정
- Python 도서관
- Hadoop 그리고 머하웃
- Big Data 및 Analytics와 관련된 선택된 Apache 프로젝트
- 선택된 상용 솔루션
- 기존 소프트웨어 및 데이터 소스와의 통합
Requirements
SQL, 데이터 웨어하우스, 비즈니스 인텔리전스, OLAP 등과 같은 전통적인 데이터 관리 및 분석 방법의 이해. 기초 통계 및 확률의 이해(평균, 분산, 확률, 조건부 확률 등....)
Open Training Courses require 5+ participants.
From Data to Decision with Big Data and Predictive Analytics 교육 과정 - Booking
From Data to Decision with Big Data and Predictive Analytics 교육 과정 - Enquiry
From Data to Decision with Big Data and Predictive Analytics - Consultancy Enquiry
회원 평가 (2)
내용은 매우 흥미롭고 대학 마지막 학년에 도움이 될 것이라고 생각했습니다.
Krishan - NBrown Group
Course - From Data to Decision with Big Data and Predictive Analytics
Machine Translated
Richard's training style kept it interesting, the real world examples used helped to drive the concepts home.
Jamie Martin-Royle - NBrown Group
Course - From Data to Decision with Big Data and Predictive Analytics
Upcoming Courses
Related Courses
Predictive AI in DevOps: Enhancing Software Delivery
14 Hours대한민국(온라인 또는 현장)에서 진행되는 이 강사 주도 라이브 교육은 예측 AI를 자신의 DevOps 실습에 통합하려는 중급 DevOps 전문가를 대상으로 합니다.
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- DevOps 파이프라인의 문제를 예측하고 해결하기 위해 예측 분석 모델을 구현합니다.
- 향상된 모니터링 및 운영을 위해 AI 기반 도구를 활용하세요.
- 기계 학습 기술을 적용하여 소프트웨어 제공 워크플로를 개선합니다.
- 선제적인 문제 해결 및 최적화를 위한 AI 전략을 설계합니다.
- DevOps에서 AI 사용에 대한 윤리적 고려 사항을 살펴보세요.
Introduction to Predictive AI
21 Hours대한민국에서 진행되는 이 강사 주도 라이브 교육(온라인 또는 현장)은 Predictive AI의 기본 사항을 파악하려는 초급 IT 전문가를 대상으로 합니다.
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- Predictive AI 및 해당 애플리케이션의 핵심 개념을 이해합니다.
- 예측 분석을 위해 데이터를 수집, 정리 및 전처리합니다.
- 데이터를 탐색하고 시각화하여 통찰력을 얻으세요.
- 예측을 위해 기본 통계 모델을 구축합니다.
- 예측 모델의 성능을 평가합니다.
- 실제 시나리오에 예측 AI 개념을 적용합니다.
Data Vault: Building a Scalable Data Warehouse
28 Hours이 강사가 진행하는 대한민국 실시간 교육에서 참가자는 Data Vault을 구축하는 방법을 배웁니다.
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- Data Vault 2.0의 아키텍처 및 설계 개념과 빅 데이터, NoSQL 및 AI와의 상호 작용을 이해합니다.
- 데이터 보관 기술을 사용하여 데이터 웨어하우스의 기록 데이터를 감사, 추적 및 검사할 수 있습니다.
- 일관되고 반복 가능한 ETL(추출, 변환, 로드) 프로세스를 개발합니다.
- 확장성이 뛰어나고 반복 가능한 창고를 구축하고 배포하세요.
Spark Streaming with Python and Kafka
7 Hours대한민국에서 진행되는 이 실시간 교육(온라인 또는 현장)은 실시간 데이터 처리 및 분석에 Spark Streaming 기능을 사용하려는 데이터 엔지니어, 데이터 과학자 및 프로그래머를 대상으로 합니다.
이 교육이 끝나면 참가자는 Spark Streaming을 사용하여 데이터베이스, 파일 시스템 및 라이브 대시보드에서 사용할 라이브 데이터 스트림을 처리할 수 있습니다.
Confluent KSQL
7 Hours대한민국(온라인 또는 현장)에서 진행되는 이 강사 주도 라이브 교육은 코드를 작성하지 않고 Apache Kafka 스트림 처리를 구현하려는 개발자를 대상으로 합니다.
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- Confluent KSQL를 설치하고 구성합니다.
- SQL 명령만 사용하여 스트림 처리 파이프라인을 설정합니다(Java 또는 Python 코딩 없음).
- 데이터 필터링, 변환, 집계, 조인, 윈도우화 및 세션화를 모두 SQL에서 수행합니다.
- 스트리밍 ETL 및 실시간 분석을 위한 대화형 연속 쿼리를 설계하고 배포합니다.
Apache Ignite for Developers
14 Hours대한민국에서 진행되는 이 실시간 교육(온라인 또는 현장)은 샘플 인메모리 컴퓨팅 프로젝트 생성을 단계별로 진행하면서 지속적이고 순수한 인메모리 스토리지의 기본 원칙을 배우고자 하는 개발자를 대상으로 합니다.
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- 인메모리, 온디스크 지속성 및 순수 분산 인메모리 데이터베이스를 위해 Ignite를 사용하세요. 데이터를 관계형 데이터베이스에 다시 동기화하지 않고도 지속성을 확보할 수 있습니다. Ignite를 사용하여 SQL 및 분산 조인을 수행합니다. RAM을 스토리지로 사용하여 데이터를 CPU에 더 가깝게 이동하여 성능을 향상시킵니다. 수평적 확장성을 달성하기 위해 클러스터 전체에 데이터 세트를 분산시킵니다. Ignite를 RDBMS, NoSQL, Hadoop 및 기계 학습 프로세서와 통합합니다.
Unified Batch and Stream Processing with Apache Beam
14 HoursApache Apex: Processing Big Data-in-Motion
21 HoursApache Apex 는 스트림 및 일괄 처리를 통합하는 YARN 기본 플랫폼입니다. 확장 성, 성능, 내결함성, 상태 저장, 보안, 분산 및 간편한 작동 방식으로 큰 데이터 이동을 처리합니다.
강사가 진행하는이 실시간 교육에서는 Apache Apex 의 통합 스트림 처리 아키텍처를 소개하고 Hadoop Apex를 사용하여 분산 응용 프로그램을 만드는 과정을 안내합니다.
이 훈련이 끝나면 참가자는 다음을 할 수 있습니다.
- 원본 및 싱크 커넥터, 일반적인 데이터 변환 등과 같은 데이터 처리 파이프 라인 개념을 이해합니다.
- Apex 애플리케이션 구축, 확장 및 최적화
- 최소한의 대기 시간으로 안정적으로 실시간 데이터 스트림을 처리합니다.
- Apex Core 및 Apex Malhar 라이브러리를 사용하여 신속한 응용 프로그램 개발 가능
- Apex API를 사용하여 기존 Java 코드 작성 및 재사용
- Apex를 처리 엔진으로 다른 응용 프로그램에 통합
- Apex 애플리케이션 조정, 테스트 및 확장
코스 형식
- 대화 형 강의 및 토론.
- 많은 연습과 연습.
- 라이브 랩 환경에서 실제 구현.
코스 사용자 정의 옵션
- 이 과정에 대한 맞춤 교육을 요청하려면 Google에 문의하여 준비하십시오.
Apache Storm
28 HoursApache Storm 실시간 비즈니스 지식을 가능하게 하는 데 사용되는 분산된 실시간 컴퓨팅 엔진입니다. 그것은 응용 프로그램이 무제한 데이터 흐름을 신뢰할 수 있게 처리할 수 있도록 해줍니다 (예 : 흐름 처리)
"Storm은 실제 시간 처리에 관한 것입니다 Hadoop 배치 처리에 관한 것입니다!"
이 강사가 이끄는 라이브 훈련에서 참가자들은 Apache Storm 설치 및 구성 방법을 배우고 실시간으로 큰 데이터를 처리하기위한 Apache Storm 애플리케이션을 개발하고 배치합니다.
이 훈련에 포함 된 주제 중 일부는 다음과 같습니다 :
- [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고]
- 무제한 데이터를 사용하는 방법
- 지속적인 계산
- 실시간 분석
- 분산 RPC 및 ETL 처리
이 코스를 지금 요청하십시오!
관객
- 소프트웨어 및 ETL 개발자
- 메인 프레임 전문가
- 데이터 과학자
- Big Data 분석가
- [ 0 ] 전문가
코스의 형식
- 부분 강의, 부분 토론, 연습 및 무거운 연습
Apache NiFi for Administrators
21 Hours이 강사가 진행하는 실시간 교육인 대한민국(현장 또는 원격)에서 참가자는 실시간 랩 환경에서 Apache NiFi을(를) 배포하고 관리하는 방법을 배우게 됩니다.
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- Apache NiFi를 설치하고 구성합니다.
- 데이터베이스 및 빅 데이터 레이크를 포함하여 서로 다른 분산 데이터 소스에서 데이터를 소싱, 변환 및 관리합니다.
- 데이터 흐름을 자동화합니다.
- 스트리밍 분석을 활성화합니다.
- 데이터 수집을 위해 다양한 접근 방식을 적용합니다.
- Big Data을 비즈니스 통찰력으로 전환하세요.
Apache NiFi for Developers
7 Hours대한민국의 강사가 진행하는 실시간 교육에서 참가자는 Apache NiFi을 사용하여 다양한 데모 확장, 구성 요소 및 프로세서를 개발하면서 흐름 기반 프로그래밍의 기본 사항을 배우게 됩니다.
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- NiFi의 아키텍처 및 데이터 흐름 개념을 이해합니다.
- NiFi 및 타사 API를 사용하여 확장 기능을 개발합니다.
- 자체 Apache Nifi 프로세서를 맞춤 개발합니다.
- 서로 다르고 일반적이지 않은 파일 형식과 데이터 소스에서 실시간 데이터를 수집하고 처리합니다.
Apache Flink Fundamentals
28 Hours대한민국(온라인 또는 현장)에서 진행되는 이 강사 주도 라이브 교육은 분산 스트림 및 일괄 데이터 처리 뒤에 있는 원칙과 접근 방식을 소개하고 Apache Flink에서 실시간 데이터 스트리밍 애플리케이션을 만드는 과정을 참가자에게 안내합니다.
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- 데이터 분석 애플리케이션 개발을 위한 환경을 설정합니다. Apache Flink의 그래프 처리 라이브러리(Gelly) 작동 방식을 이해합니다. Flink 기반의 내결함성 데이터 스트리밍 애플리케이션을 패키징, 실행 및 모니터링합니다. 다양한 워크로드를 관리하세요. 고급 분석을 수행합니다. 다중 노드 Flink 클러스터를 설정합니다. 성능을 측정하고 최적화합니다. Flink를 다양한 Big Data 시스템과 통합합니다. Flink 기능을 다른 빅데이터 처리 프레임워크의 기능과 비교해 보세요.
Python and Spark for Big Data (PySpark)
21 Hours이 강사가 진행하는 대한민국 실시간 교육에서 참가자는 실습을 하면서 Python와 Spark를 함께 사용하여 빅 데이터를 분석하는 방법을 배웁니다.
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- Python와 함께 Spark를 사용하여 빅 데이터를 분석하는 방법을 알아보세요.
- 실제 사례를 모방한 연습을 해보세요.
- PySpark를 사용하여 빅데이터 분석을 위한 다양한 도구와 기술을 사용하세요.
Introduction to Graph Computing
28 Hours대한민국의 강사가 진행하는 실시간 교육에서 참가자는 그래프 데이터 처리를 위한 기술 제공 및 구현 접근 방식에 대해 배우게 됩니다. 목표는 실제 개체와 그 특성 및 관계를 식별한 다음 이러한 관계를 모델링하고 Graph Computing(그래프 분석이라고도 함) 접근 방식을 사용하여 데이터로 처리하는 것입니다. 광범위한 개요부터 시작하여 일련의 사례 연구, 실습 및 라이브 배포를 단계별로 진행하면서 특정 도구에 대한 범위를 좁힙니다.
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- 그래프 데이터가 유지되고 탐색되는 방식을 이해합니다.
- 주어진 작업에 가장 적합한 프레임워크를 선택하세요(그래프 데이터베이스부터 일괄 처리 프레임워크까지).
- Hadoop, Spark, GraphX 및 Pregel을 구현하여 여러 시스템에서 병렬로 그래프 컴퓨팅을 수행합니다.
- 그래프, 프로세스, 순회 측면에서 실제 빅데이터 문제를 확인하세요.
Apache Spark MLlib
35 HoursMLlib는 Spark의 기계 학습 (ML) 라이브러리입니다. 그 목표는 실용적인 기계 학습을 확장 가능하고 쉽게 만들어주는 것입니다. 분류, 회귀, 클러스터링, 협업 필터링, 차원 감소, 하위 레벨 최적화 프리미티브 및 상위 레벨 파이프 라인 API 등 일반적인 학습 알고리즘과 유틸리티로 구성됩니다.
두 개의 패키지로 나뉩니다.
spark.mllib는 RDD 위에 구축 된 원래 API를 포함합니다.
spark.ml은 ML 파이프 라인을 구성하기 위해 DataFrames 위에 구축 된 고급 API를 제공합니다.
청중
이 과정은 Apache Spark 용 내장 라이브러리를 활용하고자하는 엔지니어 및 개발자를 대상으로합니다.