빅 데이터 교육 | Big Data 교육

빅 데이터 교육

현지의 강사 라이브 빅 데이터 교육 과정은 빅 데이터의 기본 개념에 대한 소개부터 시작하여 데이터 분석을 수행하는 데 사용되는 프로그래밍 언어 및 방법론으로 진행됩니다 빅 데이터 저장소, 분산 처리 및 확장 성을 구현하기위한 도구와 인프라는 데모 연습 세션에서 논의되고 비교 및 ​​구현됩니다 Big Data 교육은 "현장 실습"또는 "원격 실습"으로 제공됩니다 현장 실습은 고객 구내에서 현지에서 실시 할 수 있습니다 대한민국 또는 NobleProg 기업 교육 센터에서 대한민국 원격 라이브 교육은 대화 형 원격 데스크톱을 통해 수행됩니다 NobleProg 지역 교육 제공자.

Machine Translated

회원 평가

★★★★★
★★★★★

빅 데이터코스 개요

Course Name
Duration
Overview
Course Name
Duration
Overview
21 시간
Overview
Apache Accumulo 는 강력하고 확장 가능한 데이터 스토리지 및 검색을 제공하는 정렬 된 분산 키 / 값 저장소입니다. Go ogle의 BigTable 디자인을 기반으로하며 Apache Hadoop , Apache Zookeeper 및 Apache Thrift 의해 구동됩니다.

이 강사 주도 라이브 코스는 Accumulo의 기본 원리를 다루고 Apache Accumulo 의 샘플 애플리케이션 개발 과정을 참가자에게 안내합니다.

코스의 형식

- 강의, 강의, 실습 개발 및 구현, 이해도 측정을위한 테스트
21 시간
Overview
정의로 말하면 IoT는 전체 소비자, B2B 및 정부 산업을 오버레이하는 장치, 센서 및 컴퓨팅 성능의 통합되고 확산 된 계층이기 때문에 Internet of Things 또는 IoT 시장 가치에 대한 견적은 엄청납니다. IoT는 오늘날 19 억 개의 장치와 20 억 개의 장치로 구성된 9 억 개의 장치를 고려할 예정입니다. 그 해에는 스마트 폰, 스마트 TV, 태블릿, 웨어러블 컴퓨터 및 PC를 결합한 수와 거의 같습니다. & nbsp ; 소비재 분야에서는 주방 및 가전 제품, 주차, RFID, 조명 및 난방 제품 및 산업용 인터넷 분야의 다양한 응용 프로그램을 포함하여 많은 제품과 서비스가 IoT로 이미 넘어갔습니다. & nbsp; 그러나 IoT의 기본 기술은 인터넷이 탄생 한 이래로 M2M 통신이 존재하기 때문에 새로운 것이 아닙니다. 그러나 지난 몇 년 동안 변화 한 것은 모든 가정에서 스마트 폰과 태블릿의 압도적 인 적응에 의해 추가 된 값싼 무선 기술의 출현입니다. 모바일 장치의 폭발적인 성장으로 인해 IoT의 수요가 발생했습니다. & nbsp; IoT 비즈니스의 무한한 기회로 인해 많은 수의 중소 ​​기업가가 IoT 골드 러시의 시류로 뛰어 들었습니다. 또한 오픈 소스 전자 장치 및 IoT 플랫폼의 출현으로 인해 IoT 시스템의 개발 비용과 대규모 생산 관리가 점점 더 저렴 해졌습니다. 기존 전자 제품 소유자는 기기를 인터넷 또는 모바일 앱과 통합해야한다는 압력을 받고 있습니다. & nbsp; 이 교육은 IoT 애호가 / 기업가가 IoT 기술 및 비즈니스의 기본을 파악할 수 있도록 신흥 산업의 기술 및 비즈니스 검토를위한 것입니다. 코스 목표 & nbsp; 이 코스의 주 목적은 새로운 기술 옵션, 플랫폼 및 사례 연구를 도입하는 것입니다. 도시 자동화 (스마트 홈 및 도시), 산업용 인터넷, 의료, 정부, 모바일 휴대 전화 및 기타 분야에 적합합니다. & nbsp; & nbsp; IoT-Mechanical, 전자 / 센서 플랫폼, 무선 및 유선 프로토콜, 모바일에서 전자로의 통합, 모바일에서 엔터프라이즈로의 통합, 데이터 분석 및 종합 제어 평면의 모든 요소에 대한 기본적인 소개. & nbsp; IoT-WiFi, Zigbee / Zwave, Bluetooth, ANT + 용 M2M 무선 프로토콜 : 언제 어디서 사용할 수 있습니까? & nbsp; 모바일 / 데스크톱 / 웹 앱 등록, 데이터 수집 및 제어 & nbsp; IoT 용 & nbsp; Xively, Omega 및 NovoTech 등의 M2M 데이터 수집 플랫폼 사용 가능 IoT 보안 문제 및 보안 솔루션 IoT-Rasberry Pi, Adruino, ArmMbedLPC 등의 오픈 소스 / 상업용 전자 장치 플랫폼입니다. IoT-Ayla, iO Bridge, Libellium, Axeda, Cisco frog cloud 용 오픈 소스 / 상용 엔터프라이즈 클라우드 플랫폼 가정 자동화, 연기 경보기, 차량, 군대, 가정 건강 등과 같은 일반적인 IoT 장치의 비즈니스 및 기술 연구 대상 잠재 고객 & nbsp; 투자자 및 투자 기업가 & nbsp; 회사가 IoT 공간으로 모험하고있는 관리자 및 엔지니어 & nbsp; 비즈니스 분석가 & amp; 투자자
21 시간
Overview
MATLAB 은 MathWorks에서 개발 한 수치 연산 환경 및 프로그래밍 언어입니다.
7 시간
Overview
이 강사가 진행하는 실시간 교육에서 참가자는 실시간 스트리밍 응용 프로그램을 개발할 때 MapR Stream Architecture의 핵심 개념을 학습합니다.

이 교육이 끝나면 참가자는 실시간 스트림 데이터 처리를 위해 제작자 및 소비자 응용 프로그램을 만들 수 있습니다.

청중

- 개발자
- 관리자

과정 형식

- 파트 강의, 파트 토론, 연습 및 무거운 실무 연습

노트

- 이 과정에 대한 맞춤 교육을 요청하려면 Google에 문의하여 준비하십시오.
14 시간
Overview
Magellan은 대용량 데이터에서 지형 공간 분석을위한 오픈 소스 분산 실행 엔진입니다. Apache Spark 위에 구현 된 Spark SQL 확장하고 지형 공간 분석을위한 관계형 추상화를 제공합니다.

이 강사 주도의 실습 교육에서는 지형 공간 분석을 구현하기위한 개념과 접근 방식을 소개하고 Magellan on Spark를 사용하여 예측 분석 응용 프로그램을 작성하여 참가자들을 안내합니다.

이 훈련이 끝나면 참가자는 다음을 할 수 있습니다.

- 규모의 지형 공간 데이터 세트를 효율적으로 쿼리, 구문 분석 및 결합
- 비즈니스 인텔리전스 및 예측 분석 응용 프로그램에서 지형 공간 데이터 구현
- 공간 컨텍스트를 사용하여 모바일 장치, 센서, 로그 및 웨어러블의 기능을 확장하십시오.

코스 형식

- 대화 형 강의 및 토론.
- 많은 연습과 연습.
- 라이브 랩 환경에서 실제 구현.

코스 사용자 정의 옵션

- 이 과정에 대한 맞춤 교육을 요청하려면 Google에 문의하여 준비하십시오.
14 시간
Overview
Apache Kylin 은 대용량 데이터를위한 극한의 분산 분석 엔진입니다.

강사가 진행하는이 실시간 교육에서 참가자는 Apache Kylin 을 사용하여 실시간 데이터웨어 하우스를 설정하는 방법을 배웁니다.

이 훈련이 끝나면 참가자는 다음을 할 수 있습니다.

- Kylin을 사용하여 실시간 스트리밍 데이터 사용
- Apache Kylin 의 강력한 기능, 풍부한 SQL 인터페이스, 큐브 및 초 단위 쿼리 대기 시간 사용

노트

- 우리는 Kylin의 최신 버전을 사용합니다 (이 글을 쓰는 시점에서 Apache Kylin v2.0)

청중

- 빅 데이터 엔지니어
- Big Data 분석가

과정 형식

- 파트 강의, 파트 토론, 연습 및 무거운 실무 연습
7 시간
Overview
Confluent KSQL is a stream processing framework built on top of Apache Kafka. It enables real-time data processing using SQL operations.

This instructor-led, live training (onsite or remote) is aimed at developers who wish to implement Apache Kafka stream processing without writing code.

By the end of this training, participants will be able to:

- Install and configure Confluent KSQL.
- Set up a stream processing pipeline using only SQL commands (no Java or Python coding).
- Carry out data filtering, transformations, aggregations, joins, windowing, and sessionization entirely in SQL.
- Design and deploy interactive, continuous queries for streaming ETL and real-time analytics.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
35 시간
Overview
KNIME is a free and open-source data analytics, reporting and integration platform. KNIME integrates various components for machine learning and data mining through its modular data pipelining concept. A graphical user interface and use of JDBC allows assembly of nodes blending different data sources, including preprocessing (ETL: Extraction, Transformation, Loading), for modeling, data analysis and visualization without, or with only minimal, programming. To some extent as advanced analytics tool KNIME can be considered as a SAS alternative.

Since 2006, KNIME has been used in pharmaceutical research, it also used in other areas like CRM customer data analysis, business intelligence and financial data analysis.
21 시간
Overview
KNIME Analytics Platform은 데이터 중심 혁신을위한 최고의 오픈 소스 옵션으로, 데이터에 숨겨져있는 잠재력을 발견하고 새로운 통찰력을 얻거나 새로운 미래를 예측할 수 있도록 도와줍니다. KNIME Analytics Platform은 1000 개가 넘는 모듈, 즉시 실행 가능한 수백 개의 예제, 포괄적 인 범위의 통합 도구 및 가장 다양한 고급 알고리즘을 제공하므로 모든 데이터 과학자 및 비즈니스 분석가에게 완벽한 도구 상자입니다.

이 과정 KNIME 분석 플랫폼은 초보자, 고급 사용자 및 이상적인 기회 KNIME 소개 할 전문가 KNIME 에 따라 명확하고 포괄적 인 보고서 작성을 더 효과적으로 사용하는 방법과 방법을 배울 수있는, KNIME 워크 플로우를
21 시간
Overview
데이터베이스 내 지식 발견 (KDD)은 데이터 수집에서 유용한 지식을 발견하는 프로세스입니다. 이 데이터 마이닝 기술의 실제 응용 프로그램에는 마케팅, 사기 탐지, 통신 및 제조가 포함됩니다.

강사가 진행하는이 강좌에서는 KDD와 관련된 프로세스를 소개하고 이러한 프로세스의 구현을 연습하기위한 일련의 연습을 수행합니다.

청중

- 데이터 분석가 또는 문제 해결을 위해 데이터를 해석하는 방법을 배우는 데 관심이있는 모든 사람

코스 형식

- KDD에 대한 이론적 인 토론 후 강사는 문제를 해결하기 위해 KDD 응용 프로그램을 요구하는 실제 사례를 제시합니다. 참가자는 샘플 데이터 세트를 준비, 선택 및 정리하고 데이터에 대한 사전 지식을 사용하여 관측 결과를 기반으로 솔루션을 제안합니다.
7 시간
Overview
Kafka Streams는 카프카 (Cafka) 메시징 시스템으로 데이터를주고받는 마이크로 애플리케이션을 구축하기위한 클라이언트 측 라이브러리입니다. 전통적으로 Apache Kafka 는 메시지 생성자와 소비자 간의 데이터를 처리하기 위해 Apache Spark 또는 Apache Storm 에 의존했습니다. 응용 프로그램 내에서 Kafka Streams API를 호출하면 Kafka 내에서 직접 데이터를 처리 할 수 있으므로 처리를 위해 별도의 클러스터로 데이터를 전송할 필요가 없습니다.

강사가 진행하는이 실습에서는 Kafka Streams를 스트림 처리를 위해 Apache Kafka 와 데이터를주고받는 샘플 Java 응용 프로그램 세트에 Kafka Streams를 통합하는 방법을 배우게됩니다.

이 훈련이 끝나면 참가자는 다음을 할 수 있습니다.

- 다른 스트림 처리 프레임 워크에 비해 Kafka Streams 기능 및 이점 이해
- 카프카 클러스터 내에서 스트림 데이터를 직접 처리합니다.
- Kafka 및 Kafka Streams와 통합되는 Java 또는 Scala 응용 프로그램 또는 마이크로 서비스 작성
- 입력 카프카 항목을 출력 카프카 항목으로 변환하는 간결한 코드 작성
- 응용 프로그램 빌드, 패키지 및 배포

청중

- 개발자

과정 형식

- 파트 강의, 파트 토론, 연습 및 무거운 실무 연습

노트

- 이 과정에 대한 맞춤식 교육을 요청하려면 Google에 문의하여 협의하십시오.
21 시간
Overview
Stream Processing 은 "동작중인 데이터"의 실시간 처리, 즉 수신되는 데이터에 대한 계산을 수행하는 것을 의미합니다. 이러한 데이터는 센서 이벤트, 웹 사이트 사용자 활동, 금융 거래, 신용 카드 스 와이프, 클릭 스트림 등과 같은 데이터 소스에서 연속 스트림으로 읽습니다. Stream Processing 프레임 워크는 많은 양의 들어오는 데이터를 읽고 거의 즉시 귀중한 통찰력을 제공합니다.

이 강사가 진행하는 실시간 교육 (현장 또는 원격)에서 참가자는 기존의 대용량 데이터 저장 시스템 및 관련 소프트웨어 응용 프로그램 및 마이크로 서비스와 서로 다른 Stream Processing 프레임 워크를 설정하고 통합하는 방법을 배우게됩니다.

이 훈련이 끝나면 참가자는 다음을 할 수 있습니다.

- Spark Streaming 및 Kafka Streaming과 같은 다양한 Stream Processing 프레임 워크를 설치하고 구성하십시오.
- 작업에 가장 적합한 프레임 워크를 이해하고 선택하십시오.
- 연속적으로, 동시에, 그리고 레코드별로 프로세스.
- Stream Processing 솔루션을 기존 데이터베이스, 데이터웨어 하우스, 데이터 레이크 등과 통합합니다.
- 가장 적합한 스트림 처리 라이브러리를 엔터프라이즈 응용 프로그램 및 마이크로 서비스와 통합하십시오.

청중

- 개발자
- 소프트웨어 아키텍트

코스 형식

- 파트 강의, 파트 토론, 연습 및 무거운 실무 연습

노트

- 이 과정에 대한 맞춤 교육을 요청하려면 Google에 문의하여 준비하십시오.
28 시간
Overview
Mem SQL 은 클라우드 및 온 - 프레미스 (in-premises)를위한 메모리 내 분산 SQL 데이터베이스 관리 시스템입니다. 라이브 및 히스토리 데이터로부터 즉시 통찰력을 제공하는 실시간 데이터웨어 하우스입니다.

이 강사가 진행하는 실제 교육에서 참가자는 개발 및 관리를 위해 Mem SQL 의 핵심 사항을 학습합니다.

이 훈련이 끝나면 참가자는 다음을 할 수 있습니다.

- Mem SQL 의 주요 개념 및 특징 이해
- Mem SQL 설치, 설계, 유지 보수 및 작동
- Mem SQL 에서 스키마 최적화
- Mem SQL 에서 쿼리 개선
- Mem SQL 벤치 마크 성능
- Mem SQL 사용하여 실시간 데이터 애플리케이션 구축

청중

- 개발자
- 관리자
- 운영 엔지니어

과정 형식

- 파트 강의, 파트 토론, 연습 및 무거운 실무 연습
14 시간
Overview
청중

- 개발자
코스의

형식

- 강의, 실습, 작은 테스트를 통해 이해를 측정 하는
21 시간
Overview
Cloudera Impala 는 Apache Hadoop 클러스터 용 오픈 소스 대규모 병렬 처리 (MPP) SQL 쿼리 엔진입니다.

Impala 는 사용자가 데이터 이동이나 변환없이 Hadoop Distributed File System 및 Apache Hbase에 저장된 데이터에 지연이 적은 SQL 쿼리를 SQL 수 있도록합니다.

청중

이 과정은 Business Intelligence 또는 SQL 도구를 통해 Hadoop 저장된 데이터를 분석하는 분석가 및 데이터 과학자를 대상으로합니다.

이 과정이 끝나면 대표단은

- Impala 로 Hadoop 클러스터에서 의미있는 정보를 추출합니다.
- Impala SQL Dialect에서 Business Intelligence 를 용이하게하는 특정 프로그램을 작성하십시오.
- Impala 문제를 해결하십시오.
7 시간
Overview
이 과정은 사용하는 방법에 대해 설명 Hive SQL 언어를 (일명 : Hive HQL, SQL 에 Hive , Hive QL)에서 데이터를 추출하는 사람들을위한 Hive
21 시간
Overview
Hortonworks Data Platform (HDP) 은 오픈 소스 Apache Hadoop 지원 플랫폼으로 Apache Hadoop 에코 시스템에서 큰 데이터 솔루션을 개발하기위한 안정적인 토대를 제공합니다.

이 강사가 진행하는 실시간 교육 (현장 또는 원격)은 Hortonworks Data Platform (HDP) 소개하고 Spark + Hadoop 솔루션의 배포를 통해 참가자들을 안내합니다.

이 훈련이 끝나면 참가자는 다음을 할 수 있습니다.

- Hortonworks를 사용하면 대규모로 Hadoop 을 안정적으로 실행할 수 있습니다.
- Spark의 민첩한 분석 워크 플로우로 Hadoop 의 보안, 거버넌스 및 운영 기능을 통합하십시오.
- Hortonworks를 사용하여 Spark 프로젝트의 각 구성 요소를 조사, 검증, 인증 및 지원하십시오.
- 구조화 된, 구조화되지 않은, 동작중인, at-rest 등 다양한 유형의 데이터를 처리합니다.

코스 형식

- 대화 형 강의 및 토론.
- 많은 연습과 연습.
- 라이브 랩 환경에서 실제 구현.

코스 사용자 정의 옵션

- 이 과정에 대한 맞춤 교육을 요청하려면 Google에 문의하여 준비하십시오.
21 시간
Overview
이 과정에서는 Hadoop 위에 SQL Store가없는 HBase를 소개합니다. 이 과정은 HBase를 사용하여 응용 프로그램을 개발할 개발자와 HBase 클러스터를 관리 할 관리자를 대상으로합니다.

우리는 HBase에서 HBase 아키텍처와 데이터 모델링 및 애플리케이션 개발을 통해 개발자를 안내 할 것입니다. 또한 HBase와 함께 MapReduce를 사용하는 방법과 성능 최적화와 관련된 몇 가지 관리 항목에 대해서도 설명합니다. 이 과정은 실습을 통해 많은 실습을 제공합니다.

소요 시간 : 3 일

대상 : 개발자 및 관리자
28 시간
Overview
Hadoop은 널리 사용되는 Big Data 프로세싱 프레임 워크입니다 파이썬은 명확한 구문 및 코드 가독성으로 유명한 고 레벨 프로그래밍 언어입니다 강사가되어 실습을하면서 Hadoop, MapReduce, Pig 및 Spark를 Python을 사용하여 여러 가지 예제와 사용 사례로 단계별로 작업하는 방법을 배우게됩니다 이 훈련이 끝나면 참가자는 다음을 할 수 있습니다 Hadoop, MapReduce, Pig 및 Spark의 기본 개념 이해 Hadoop 분산 파일 시스템 (HDFS), MapReduce, Pig 및 Spark에서 Python 사용 Snakebite를 사용하여 Python 내에서 HDFS에 프로그래밍 방식으로 액세스합니다 mrjob을 사용하여 파이썬에서 MapReduce 작업 작성하기 파이썬으로 스파크 프로그램 작성하기 Python UDF를 사용하여 돼지의 기능을 확장하십시오 Luigi를 사용하여 MapReduce 작업 및 돼지 스크립트 관리 청중 개발자 IT 전문가 코스 형식 파트 강의, 파트 토론, 연습 및 무거운 핸드 슨 연습 .
28 시간
Overview
청중:

이 과정은 거대한 데이터 / 해프 기술을 신비화하고 이해하기 어렵지 않다는 것을 보여주기위한 것입니다.
14 시간
Overview
점점 더 많은 소프트웨어 및 IT 프로젝트가 로컬 처리 및 데이터 관리에서 분산 처리 및 대용량 데이터 저장으로 마이그레이션함에 따라 프로젝트 관리자는 빅 데이터 프로젝트 및 기회와 관련된 개념 및 사례를 파악하기 위해 지식과 기술을 업그레이드해야 할 필요성을 느끼고 있습니다 이 과정에서는 가장 널리 사용되는 Big Data 프로세싱 프레임 워크 인 Hadoop에 대한 프로젝트 관리자를 소개합니다 이 강습 교육에서는 참가자가 Hadoop 생태계의 핵심 구성 요소와 이러한 기술을 사용하여 대용량 문제를 해결하는 방법을 학습합니다 이 기초를 배우는 과정에서 참가자는 또한 많은 IT 프로젝트가 참여하는 데이터 과학자 및 분석가뿐만 아니라이 시스템의 개발자 및 구현 자와 의사 소통하는 능력을 향상시킬 것입니다 청중 Hadoop을 기존 개발 또는 IT 인프라에 구현하려는 프로젝트 관리자 대형 데이터 엔지니어, 데이터 과학자 및 비즈니스 분석가를 포함하는 교차 기능 팀과 의사 소통해야하는 프로젝트 관리자 코스 형식 파트 강의, 파트 토론, 연습 및 무거운 핸드 슨 연습 .
21 시간
Overview
Hadoop은 가장 널리 사용되는 Big Data 프로세싱 프레임 워크입니다 .
21 시간
Overview
예측 분석은 데이터 분석을 사용하여 미래에 대한 예측을하는 프로세스입니다 이 프로세스는 데이터 마이닝, 통계 및 기계 학습 기술과 함께 데이터를 사용하여 미래의 이벤트를 예측하기위한 예측 모델을 생성합니다 강사진과 실습을 통해 참가자들은 Matlab을 사용하여 예측 모델을 작성하고이를 대용량 샘플 데이터 세트에 적용하여 데이터를 기반으로 향후 이벤트를 예측하는 방법을 배웁니다 이 훈련이 끝나면 참가자는 다음을 할 수 있습니다 히스토리 및 트랜잭션 데이터의 패턴을 분석하기위한 예측 모델 생성 예측 모델링을 사용하여 위험 및 기회 파악 중요한 경향을 포착하는 수학적 모델 구축 장치 및 비즈니스 시스템의 데이터를 사용하여 낭비를 줄이거 나 시간을 절약하거나 비용을 절감하십시오 청중 개발자 엔지니어 도메인 전문가 코스 형식 파트 강의, 파트 토론, 연습 및 무거운 핸드 슨 연습 .
7 시간
Overview
This instructor-led, live training (onsite or remote) is aimed at technical persons who wish to learn how to implement a machine learning strategy while maximizing the use of big data.

By the end of this training, participants will:

- Understand the evolution and trends for machine learning.
- Know how machine learning is being used across different industries.
- Become familiar with the tools, skills and services available to implement machine learning within an organization.
- Understand how machine learning can be used to enhance data mining and analysis.
- Learn what a data middle backend is, and how it is being used by businesses.
- Understand the role that big data and intelligent applications are playing across industries.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
14 시간
Overview
Teradata is a popular Relational Database Management System for building large scale data warehousing applications. Teradata achieves this by way of parallelism.

This instructor-led, live training (onsite or remote) is aimed at application developers and engineers who wish to master more sophisticated usages of the Teradata database.

By the end of this training, participants will be able to:

- Manage Teradata space.
- Protect and distribute data in Teradata.
- Read Explain Plan.
- Improve SQL proficiency.
- Use main utilities of Teradata.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
7 시간
Overview
Spark SQL 은 구조화 된 데이터와 구조화되지 않은 데이터로 작업하는 Apache Spark 의 모듈입니다. Spark SQL 은 수행되는 계산뿐 아니라 데이터의 구조에 대한 정보를 제공합니다. 이 정보는 최적화를 수행하는 데 사용될 수 있습니다. Spark SQL 두 가지 일반적인 용도는 다음과 같습니다.
- SQL 쿼리를 실행합니다.
- 기존 Hive 설치에서 데이터를 읽습니다.

이 강사가 진행하는 실습 (현장 또는 원격)에서 참가자는 Spark SQL 사용하여 다양한 유형의 데이터 세트를 분석하는 방법을 학습합니다.

이 훈련이 끝나면 참가자는 다음을 할 수 있습니다.

- Spark SQL 설치하고 구성하십시오.
- Spark SQL 사용하여 데이터 분석을 수행하십시오.
- 서로 다른 형식의 데이터 집합을 쿼리합니다.
- 데이터 및 쿼리 결과를 시각화합니다.

코스 형식

- 대화 형 강의 및 토론.
- 많은 연습과 연습.
- 라이브 랩 환경에서 실제 구현.

코스 사용자 정의 옵션

- 이 과정에 대한 맞춤 교육을 요청하려면 Google에 문의하여 준비하십시오.
14 시간
Overview
Apache Zeppelin은 Hadoop 및 Spark 기반 데이터를 캡처, 탐색, 시각화 및 공유하기위한 웹 기반 노트북입니다 이 강사진 라이브 교육은 대화 형 데이터 분석의 개념을 소개하고 단일 사용자 또는 다중 사용자 환경에서 Zeppelin을 배포하고 사용하는 방법을 통해 참가자들을 안내합니다 이 훈련이 끝나면 참가자는 다음을 할 수 있습니다 Zeppelin 설치 및 구성 브라우저 기반 인터페이스로 데이터 개발, 구성, 실행 및 공유 명령 줄 또는 클러스터 세부 정보를 참조하지 않고 결과를 시각화합니다 긴 워크 플로우를 실행하고 협업합니다 Scala (Apache Spark 포함), Python (Apache Spark 포함), Spark SQL, JDBC, Markdown 및 Shell과 같은 여러 플러그인 언어 / 데이터 처리 백엔드 중 하나를 사용하십시오 Zeppelin과 Spark, Flink 및 Map Reduce 통합 Apache Shiro로 Zeppelin의 다중 사용자 인스턴스 보안 청중 데이터 엔지니어 데이터 분석가 데이터 과학자 소프트웨어 개발자 코스 형식 파트 강의, 파트 토론, 연습 및 무거운 핸드 슨 연습 .
14 시간
Overview
Vespa는 야후가 만든 오픈 소스의 대용량 데이터 처리 및 검색 엔진입니다 사용자 쿼리에 응답하고, 권장 사항을 작성하고, 개인화 된 컨텐트 및 광고를 실시간으로 제공하는 데 사용됩니다 이 강사진 라이브 교육은 대형 데이터를 제공하는 데 따른 어려움을 소개하고 실시간으로 대용량 데이터 세트를 통해 사용자 요청에 대한 응답을 계산할 수있는 응용 프로그램을 작성하여 참가자들을 안내합니다 이 훈련이 끝나면 참가자는 다음을 할 수 있습니다 Vespa를 사용하여 사용자가 대기하는 동안 제공 시간에 데이터를 신속하게 계산 (저장, 검색, 순위 지정, 구성) 기능 검색, 권장 사항 및 개인화와 관련된 기존 응용 프로그램에 Vespa 구현 Vespa를 Hadoop 및 Storm과 같은 기존의 대형 데이터 시스템과 통합 및 배치하십시오 청중 개발자 코스 형식 파트 강의, 파트 토론, 연습 및 무거운 핸드 슨 연습 .
14 시간
Overview
Tigon은 HDFS 및 HBase를 기반으로 지속성을 위해 실시간, 저음역, 고화질, 원시 YARN, 스트림 처리 프레임 워크 인 오픈 소스입니다 Tigon 응용 프로그램은 네트워크 침입 탐지 및 분석, 소셜 미디어 시장 분석, 위치 분석 및 사용자에게 실시간 추천과 같은 사용 사례를 다룹니다 이 강사진 라이브 교육에서는 샘플 응용 프로그램 작성을 통해 참가자를 안내하면서 실시간 및 일괄 처리 혼합에 대한 Tigon의 접근 방식을 소개합니다 이 훈련이 끝나면 참가자는 다음을 할 수 있습니다 대용량 데이터를 처리하기위한 강력한 스트림 처리 응용 프로그램 작성 트위터 및 웹 서버 로그와 같은 스트림 소스 처리 신속한 합류, 필터링 및 스트림 집계에 Tigon 사용 청중 개발자 코스 형식 파트 강의, 파트 토론, 연습 및 무거운 핸드 슨 연습 .
21 시간
Overview
Teradata 는 널리 사용되는 관계형 Database Management 시스템 중 하나입니다. 주로 대규모 데이터웨어 하우징 응용 프로그램을 작성하는 데 적합합니다. Teradata 는 이것을 병렬 처리의 개념으로 구현합니다.

이 과정에서는 Teradata 의 대표자를 소개합니다.
주말빅 데이터코스, 밤의빅 데이터트레이닝, 빅 데이터부트 캠프, 빅 데이터 강사가 가르치는, 주말빅 데이터교육, 밤의빅 데이터과정, 빅 데이터코칭, 빅 데이터강사, 빅 데이터트레이너, 빅 데이터교육 과정, 빅 데이터클래스, 빅 데이터현장, 빅 데이터개인 강좌, 빅 데이터1 대 1 교육주말Big Data코스, 밤의Big Data트레이닝, Big Data부트 캠프, Big Data 강사가 가르치는, 주말Big Data교육, 밤의Big Data과정, Big Data코칭, Big Data강사, Big Data트레이너, Big Data교육 과정, Big Data클래스, Big Data현장, Big Data개인 강좌, Big Data1 대 1 교육

코스 프로모션

고객 회사

is growing fast!

We are looking to expand our presence in South Korea!

As a Business Development Manager you will:

  • expand business in South Korea
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!