
강사가 진행하는 온라인 또는 현장 라이브 Apache Spark 교육 과정은 Spark가 빅 데이터 에코시스템에 어떻게 적용되는지, 데이터 분석을 위해 Spark를 사용하는 방법을 실습을 통해 보여줍니다. Apache Spark 교육은 "온라인 라이브 교육" 또는 "현장 라이브 교육"으로 제공됩니다. 온라인 라이브 교육(일명 "원격 라이브 교육")은 대화형 원격 데스크톱을 통해 수행됩니다. 현장 라이브 교육은 대한민국의 고객 구내 또는 대한민국의 NobleProg 기업 교육 센터에서 로컬로 수행할 수 있습니다. NobleProg -- 지역 교육 제공자
Machine Translated
회원 평가
논의된 솔루션을 색칠하지 않고 부정적인 의미를 도입하지 않는 트레이너의 실제 경험. 나는 트레이너가 도구를 실제적이고 실용적으로 사용할 수 있도록 준비시키고 있다고 생각합니다. 이러한 귀중한 세부 사항은 일반적으로 책에서 찾을 수 없습니다.
Krzysztof Miodek - Beata Szylhabel, Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.
Course: Apache Spark Fundamentals
Machine Translated
- 실제 사례를 활용하여 교육합니다. - 독립적인 운동을 위한 매우 잘 준비된 자료 및 환경 - 트레이너의 실습에서 얻은 빈번한 제안/조언.
Beata Szylhabel, Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.
Course: Apache Spark Fundamentals
Machine Translated
훈련 실시에 대한 엄격한 접근 방식이 없습니다. 유연성. 불필요한 형식 없이 "Mr.", "Mrs.", "ą", "ę"를 사용하세요.
Beata Szylhabel, Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.
Course: Apache Spark Fundamentals
Machine Translated
Apache Spark Subcategories
Apache Spark Course Outlines
-
Spark, Hadoop, 및 Python을 사용하여 대형 데이터 처리를 시작하는 데 필요한 환경을 설정합니다.
Spark의 특징, 핵심 구성 요소 및 아키텍처를 이해하고 Hadoop.
Spark, Hadoop 및 Python을 대형 데이터 처리에 통합하는 방법을 배우십시오.
Spark 생태계 (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka 및 Flume)의 도구를 탐험하십시오.
Netflix, YouTube, Amazon, Spotify 및 Google와 유사한 공동 필터링 권장 시스템을 구축합니다.
Apache Mahout를 사용하여 기계 학습 알고리즘을 확장합니다.
-
인터랙티브 강의 및 토론
많은 연습과 연습이 있습니다.
라이브 실험실 환경에서 핸드-온 구현.
-
이 과정에 대한 사용자 지정 훈련을 요청하려면 저희에게 연락하여 배치하십시오.
- Spark with Python 을 사용하여 Big Data 를 분석하는 방법을 배웁니다.
- 실제 상황을 모방 한 연습 문제를 해결하십시오.
- PySpark 사용하여 큰 데이터 분석을 위해 다양한 툴과 기술을 사용 PySpark .
- 파트 강의, 파트 토론, 연습 및 무거운 실무 연습
-
응용 프로그램을 개발하십시오 Alluxio
하나의 이름 공간을 유지하면서 대형 데이터 시스템 및 응용 프로그램을 연결합니다.
효율적으로 모든 스토리지 형식에서 큰 데이터에서 가치를 추출
작업 부하 성능 향상
배치 및 관리 Alluxio 스탠다드 또는 클러스터
-
데이터 과학자
개발자
시스템 관리자
-
부분 강의, 부분 토론, 연습 및 무거운 연습
- Hadoop MapReduce 및 Spark와 같은 대규모 데이터 분석 도구 설치 및 구성
- 의료 데이터의 특성 이해
- 큰 데이터 기술을 적용하여 의료 데이터 처리
- 건강 응용 프로그램의 맥락에서 큰 데이터 시스템과 알고리즘 연구
- 개발자
- 데이터 과학자
- 파트 강의, 파트 토론, 연습 및 무거운 실습.
- 이 과정에 대한 맞춤 교육을 요청하려면 Google에 문의하여 준비하십시오.
-
Apache를 설치하고 설정하십시오 Hadoop
Hadoop 생태계의 네 가지 주요 구성 요소를 이해하십시오 : HDFS, MapReduce, YARN 및 Hadoop Common.
Hadoop 분산 파일 시스템 (HDFS)을 사용하여 클러스터를 수백 또는 수천 개의 노드로 확장합니다.   ·
HDFS를 설치하여 사전 Spark 배포를 위한 스토리지 엔진으로 작동합니다.
Spark를 설정하여 Amazon S3 및 NoSQL 데이터베이스 시스템과 같은 대체 저장 솔루션에 액세스할 수 있습니다 Redis, Elasticsearch, Couchbase, Aerospike 등.
Apache Hadoop 클러스터의 공급, 관리, 모니터링 및 보안과 같은 관리 작업을 수행합니다.
-
인터랙티브 강의 및 토론
많은 연습과 연습이 있습니다.
라이브 실험실 환경에서 핸드-온 구현.
-
이 과정에 대한 사용자 지정 훈련을 요청하려면 저희에게 연락하여 배치하십시오.
- Hortonworks를 사용하면 대규모로 Hadoop 을 안정적으로 실행할 수 있습니다.
- Spark의 민첩한 분석 워크 플로우로 Hadoop 의 보안, 거버넌스 및 운영 기능을 통합하십시오.
- Hortonworks를 사용하여 Spark 프로젝트의 각 구성 요소를 조사, 검증, 인증 및 지원하십시오.
- 구조화 된, 구조화되지 않은, 동작중인, at-rest 등 다양한 유형의 데이터를 처리합니다.
- 대화 형 강의 및 토론.
- 많은 연습과 연습.
- 라이브 랩 환경에서 실제 구현.
- 이 과정에 대한 맞춤 교육을 요청하려면 Google에 문의하여 준비하십시오.
- Spark Streaming 및 Kafka Streaming과 같은 다양한 Stream Processing 프레임 워크를 설치하고 구성하십시오.
- 작업에 가장 적합한 프레임 워크를 이해하고 선택하십시오.
- 연속적으로, 동시에, 그리고 레코드별로 프로세스.
- Stream Processing 솔루션을 기존 데이터베이스, 데이터웨어 하우스, 데이터 레이크 등과 통합합니다.
- 가장 적합한 스트림 처리 라이브러리를 엔터프라이즈 응용 프로그램 및 마이크로 서비스와 통합하십시오.
- 개발자
- 소프트웨어 아키텍트
- 파트 강의, 파트 토론, 연습 및 무거운 실무 연습
- 이 과정에 대한 맞춤 교육을 요청하려면 Google에 문의하여 준비하십시오.
-
효율적으로 쿼리, 퍼스 및 스케일에 지리 공간 데이터 세트에 합류
비즈니스 인텔리전스 및 예측 분석 응용 프로그램에서 지구 공간 데이터 구현
공간 컨텍스트를 사용하여 모바일 장치, 센서, 로그 및 노트북의 능력을 확장합니다.
-
인터랙티브 강의 및 토론
많은 연습과 연습이 있습니다.
라이브 실험실 환경에서 핸드-온 구현.
-
이 과정에 대한 사용자 지정 훈련을 요청하려면 저희에게 연락하여 배치하십시오.
-
설치 및 설정 Apache Spark
.NET이 Spark API를 실행하는 방법을 이해하여.NET 응용 프로그램에서 액세스할 수 있습니다.
C# 또는 F#를 사용하여 데이터 처리 응용 프로그램을 개발하여 테라비트 및 페다비트로 측정되는 데이터 세트를 처리 할 수 있습니다.
Apache Spark 기능을 사용하여.NET 응용 프로그램을위한 기계 학습 기능을 개발합니다.
큰 데이터 세트에 대한 SQL 쿼리를 사용하여 탐험 분석을 수행합니다.
-
인터랙티브 강의 및 토론
많은 연습과 연습이 있습니다.
라이브 실험실 환경에서 핸드-온 구현.
-
이 과정에 대한 사용자 지정 훈련을 요청하려면 저희에게 연락하여 배치하십시오.
-
큰 데이터를 처리하기위한 데이터 파이프 라인 아키텍처를 구현합니다.
[중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고]
Spark 및 Scala로 데이터를 분석합니다.
Apache를 사용하여 구조화되지 않은 데이터를 관리합니다 Cassandra.
-
인터랙티브 강의 및 토론
많은 연습과 연습이 있습니다.
라이브 실험실 환경에서 핸드-온 구현.
-
이 과정에 대한 사용자 지정 훈련을 요청하려면 저희에게 연락하여 배치하십시오.
-
설치 및 설정 Apache Spark.
[중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고]
빠르게 읽고 매우 큰 데이터 세트를 분석합니다.
Apache Spark 다른 기계 학습 도구와 통합하십시오.
-
인터랙티브 강의 및 토론
많은 연습과 연습이 있습니다.
라이브 실험실 환경에서 핸드-온 구현.
-
이 과정에 대한 사용자 지정 훈련을 요청하려면 저희에게 연락하여 배치하십시오.
- Set up the necessary development environment to start building NLP pipelines with Spark NLP.
- Understand the features, architecture, and benefits of using Spark NLP.
- Use the pre-trained models available in Spark NLP to implement text processing.
- Learn how to build, train, and scale Spark NLP models for production-grade projects.
- Apply classification, inference, and sentiment analysis on real-world use cases (clinical data, customer behavior insights, etc.).
- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.
- To request a customized training for this course, please contact us to arrange.
- Scala 프로그래밍 언어로 Spark 응용 프로그램을 만듭니다.
- Spark Streaming을 사용하여 연속적인 데이터 스트림을 처리하십시오.
- Spark Streaming으로 실시간 데이터 스트림을 처리합니다.
- 대화식 강의 및 토론.
- 많은 연습과 연습.
- 라이브 랩 환경에서 실습 구현.
- 이 과정에 대한 맞춤형 교육을 요청하려면 저희에게 연락하여 준비하십시오.
- SQL 쿼리를 실행합니다.
- 기존 Hive 설치에서 데이터를 읽습니다. 이 강사가 진행하는 실습 (현장 또는 원격)에서 참가자는 Spark SQL 사용하여 다양한 유형의 데이터 세트를 분석하는 방법을 학습합니다. 이 훈련이 끝나면 참가자는 다음을 할 수 있습니다.
- Spark SQL 설치하고 구성하십시오.
- Spark SQL 사용하여 데이터 분석을 수행하십시오.
- 서로 다른 형식의 데이터 집합을 쿼리합니다.
- 데이터 및 쿼리 결과를 시각화합니다.
- 대화 형 강의 및 토론.
- 많은 연습과 연습.
- 라이브 랩 환경에서 실제 구현.
- 이 과정에 대한 맞춤 교육을 요청하려면 Google에 문의하여 준비하십시오.
- spark.mllib는 RDD 위에 구축 된 원래 API를 포함합니다.
- spark.ml은 ML 파이프 라인을 구성하기 위해 DataFrames 위에 구축 된 고급 API를 제공합니다.
- 그래프 데이터가 유지되고 통과하는 방법을 이해합니다.
- 그래프 데이터베이스에서 배치 처리 프레임 워크에 이르기까지 주어진 작업에 가장 적합한 프레임 워크를 선택하십시오.
- Hadoop , Spark, GraphX 및 Pregel을 구현하여 여러 컴퓨터에서 동시에 그래프 컴퓨팅을 수행합니다.
- 그래프, 프로세스 및 순회 측면에서 실제 빅 데이터 문제를 봅니다.
- 강의, 강의, 연습 및 실습
Last Updated: