Apache Spark 교육

Apache Spark 교육

강사가 진행하는 온라인 또는 현장 라이브 Apache Spark 교육 과정은 Spark가 빅 데이터 에코시스템에 어떻게 적용되는지, 데이터 분석을 위해 Spark를 사용하는 방법을 실습을 통해 보여줍니다. Apache Spark 교육은 "온라인 라이브 교육" 또는 "현장 라이브 교육"으로 제공됩니다. 온라인 라이브 교육(일명 "원격 라이브 교육")은 대화형 원격 데스크톱을 통해 수행됩니다. 현장 라이브 교육은 대한민국의 고객 구내 또는 대한민국의 NobleProg 기업 교육 센터에서 로컬로 수행할 수 있습니다. NobleProg -- 지역 교육 제공자

Machine Translated

회원 평가

★★★★★
★★★★★

Apache Spark Subcategories

Apache Spark Course Outlines

코스 이름
Duration
Overview
코스 이름
Duration
Overview
21 시간
Python 데이터 과학 및 기계 학습을위한 규모, 유연하고 널리 사용되는 프로그래밍 언어입니다. Spark는 대형 데이터를 검색, 분석 및 변환하는 데 사용되는 데이터 처리 엔진이지만 Hadoop는 대형 데이터 저장 및 처리에 대한 소프트웨어 라이브러리 프레임 워크입니다. 이 강사가 이끄는 라이브 훈련 (온라인 또는 온라인)은 Spark, Hadoop 및 Python를 사용하고 통합하여, 분석하고, 대규모 및 복잡한 데이터 세트를 변환하고자하는 개발자를 대상으로합니다. 이 훈련이 끝나면 참가자는 다음을 할 수 있습니다 :
    Spark, Hadoop, 및 Python을 사용하여 대형 데이터 처리를 시작하는 데 필요한 환경을 설정합니다. Spark의 특징, 핵심 구성 요소 및 아키텍처를 이해하고 Hadoop. Spark, Hadoop 및 Python을 대형 데이터 처리에 통합하는 방법을 배우십시오. Spark 생태계 (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka 및 Flume)의 도구를 탐험하십시오. Netflix, YouTube, Amazon, Spotify 및 Google와 유사한 공동 필터링 권장 시스템을 구축합니다. Apache Mahout를 사용하여 기계 학습 알고리즘을 확장합니다.
코스의 형식
    인터랙티브 강의 및 토론 많은 연습과 연습이 있습니다. 라이브 실험실 환경에서 핸드-온 구현.
코스 Customization 옵션
    이 과정에 대한 사용자 지정 훈련을 요청하려면 저희에게 연락하여 배치하십시오.
21 시간
Python 은 명확한 구문 및 코드 가독성으로 유명한 고수준 프로그래밍 언어입니다. Spark는 큰 데이터를 쿼리, 분석 및 변환하는 데 사용되는 데이터 처리 엔진입니다. PySpark 는 사용자가 Spark을 Python 과 인터페이스 할 수있게합니다. 강사가 진행하는이 실제 교육에서 참가자는 실습을 통해 큰 데이터를 분석하기 위해 Python 과 Spark를 함께 사용하는 방법을 배웁니다. 이 훈련이 끝나면 참가자는 다음을 할 수 있습니다.
  • Spark with Python 을 사용하여 Big Data 를 분석하는 방법을 배웁니다.
  • 실제 상황을 모방 한 연습 문제를 해결하십시오.
  • PySpark 사용하여 큰 데이터 분석을 위해 다양한 툴과 기술을 사용 PySpark .
과정 형식
  • 파트 강의, 파트 토론, 연습 및 무거운 실무 연습
7 시간
Alluxio 오픈소스 가상 배포 스토리지 시스템은 다양한 스토리지 시스템을 통합하고 응용 프로그램이 메모리 속도로 데이터와 상호 작용 할 수 있습니다. 그것은 Intel, Baidu 및 Alibaba와 같은 회사에 의해 사용됩니다. 이 강사가 이끄는 라이브 훈련에서 참가자들은 Alluxio를 사용하여 다양한 컴퓨팅 프레임 워크를 저장 시스템과 다중 페타바이트 스케일 데이터를 효율적으로 관리하는 방법을 배우게 될 것입니다. 이 훈련이 끝나면 참가자는 다음을 할 수 있습니다 :
    응용 프로그램을 개발하십시오 Alluxio 하나의 이름 공간을 유지하면서 대형 데이터 시스템 및 응용 프로그램을 연결합니다. 효율적으로 모든 스토리지 형식에서 큰 데이터에서 가치를 추출 작업 부하 성능 향상 배치 및 관리 Alluxio 스탠다드 또는 클러스터
관객
    데이터 과학자 개발자 시스템 관리자
코스의 형식
    부분 강의, 부분 토론, 연습 및 무거운 연습
21 시간
빅 데이터 분석은 상관 관계, 숨겨진 패턴 및 기타 유용한 통찰력을 발굴하기 위해 대량의 다양한 데이터 세트를 검사하는 프로세스를 필요로합니다. 보건 산업은 복잡한 이기종 의학 및 임상 데이터를 가지고 있습니다. 건강 데이터에 큰 데이터 분석을 적용하면 건강 관리 제공 개선에 대한 통찰력을 얻는 데 큰 잠재력이 있습니다. 그러나 이러한 데이터 세트의 엄청난 양은 임상 환경에 대한 분석 및 실제 응용에 큰 문제를 제기합니다. 이 강사 주도의 실시간 교육 (원격)에서는 참가자가 실습 랩 연습을 단계별로 수행하면서 건강에 큰 데이터 분석을 수행하는 방법을 배웁니다. 이 훈련이 끝나면 참가자는 다음을 할 수 있습니다.
  • Hadoop MapReduce 및 Spark와 같은 대규모 데이터 분석 도구 설치 및 구성
  • 의료 데이터의 특성 이해
  • 큰 데이터 기술을 적용하여 의료 데이터 처리
  • 건강 응용 프로그램의 맥락에서 큰 데이터 시스템과 알고리즘 연구
청중
  • 개발자
  • 데이터 과학자
코스 형식
  • 파트 강의, 파트 토론, 연습 및 무거운 실습.
노트
  • 이 과정에 대한 맞춤 교육을 요청하려면 Google에 문의하여 준비하십시오.
35 시간
Apache Hadoop는 많은 컴퓨터를 통해 큰 데이터 세트를 처리하기위한 인기있는 데이터 처리 프레임 워크입니다. 이 강사가 이끄는 라이브 훈련 (온라인 또는 온라인)은 조직 내에서 Hadoop 클러스터를 설정, 배치 및 관리하는 방법을 배우고자하는 시스템 관리자를 대상으로합니다. 이 훈련이 끝나면 참가자는 다음을 할 수 있습니다 :
    Apache를 설치하고 설정하십시오 Hadoop Hadoop 생태계의 네 가지 주요 구성 요소를 이해하십시오 : HDFS, MapReduce, YARN 및 Hadoop Common. Hadoop 분산 파일 시스템 (HDFS)을 사용하여 클러스터를 수백 또는 수천 개의 노드로 확장합니다.   · HDFS를 설치하여 사전 Spark 배포를 위한 스토리지 엔진으로 작동합니다. Spark를 설정하여 Amazon S3 및 NoSQL 데이터베이스 시스템과 같은 대체 저장 솔루션에 액세스할 수 있습니다 Redis, Elasticsearch, Couchbase, Aerospike 등. Apache Hadoop 클러스터의 공급, 관리, 모니터링 및 보안과 같은 관리 작업을 수행합니다.
코스의 형식
    인터랙티브 강의 및 토론 많은 연습과 연습이 있습니다. 라이브 실험실 환경에서 핸드-온 구현.
코스 Customization 옵션
    이 과정에 대한 사용자 지정 훈련을 요청하려면 저희에게 연락하여 배치하십시오.
21 시간
Hortonworks Data Platform (HDP) 은 오픈 소스 Apache Hadoop 지원 플랫폼으로 Apache Hadoop 에코 시스템에서 큰 데이터 솔루션을 개발하기위한 안정적인 토대를 제공합니다. 이 강사가 진행하는 실시간 교육 (현장 또는 원격)은 Hortonworks Data Platform (HDP) 소개하고 Spark + Hadoop 솔루션의 배포를 통해 참가자들을 안내합니다. 이 훈련이 끝나면 참가자는 다음을 할 수 있습니다.
  • Hortonworks를 사용하면 대규모로 Hadoop 을 안정적으로 실행할 수 있습니다.
  • Spark의 민첩한 분석 워크 플로우로 Hadoop 의 보안, 거버넌스 및 운영 기능을 통합하십시오.
  • Hortonworks를 사용하여 Spark 프로젝트의 각 구성 요소를 조사, 검증, 인증 및 지원하십시오.
  • 구조화 된, 구조화되지 않은, 동작중인, at-rest 등 다양한 유형의 데이터를 처리합니다.
코스 형식
  • 대화 형 강의 및 토론.
  • 많은 연습과 연습.
  • 라이브 랩 환경에서 실제 구현.
코스 사용자 정의 옵션
  • 이 과정에 대한 맞춤 교육을 요청하려면 Google에 문의하여 준비하십시오.
21 시간
Stream Processing 은 "동작중인 데이터"의 실시간 처리, 즉 수신되는 데이터에 대한 계산을 수행하는 것을 의미합니다. 이러한 데이터는 센서 이벤트, 웹 사이트 사용자 활동, 금융 거래, 신용 카드 스 와이프, 클릭 스트림 등과 같은 데이터 소스에서 연속 스트림으로 읽습니다. Stream Processing 프레임 워크는 많은 양의 들어오는 데이터를 읽고 거의 즉시 귀중한 통찰력을 제공합니다. 이 강사가 진행하는 실시간 교육 (현장 또는 원격)에서 참가자는 기존의 대용량 데이터 저장 시스템 및 관련 소프트웨어 응용 프로그램 및 마이크로 서비스와 서로 다른 Stream Processing 프레임 워크를 설정하고 통합하는 방법을 배우게됩니다. 이 훈련이 끝나면 참가자는 다음을 할 수 있습니다.
  • Spark Streaming 및 Kafka Streaming과 같은 다양한 Stream Processing 프레임 워크를 설치하고 구성하십시오.
  • 작업에 가장 적합한 프레임 워크를 이해하고 선택하십시오.
  • 연속적으로, 동시에, 그리고 레코드별로 프로세스.
  • Stream Processing 솔루션을 기존 데이터베이스, 데이터웨어 하우스, 데이터 레이크 등과 통합합니다.
  • 가장 적합한 스트림 처리 라이브러리를 엔터프라이즈 응용 프로그램 및 마이크로 서비스와 통합하십시오.
청중
  • 개발자
  • 소프트웨어 아키텍트
코스 형식
  • 파트 강의, 파트 토론, 연습 및 무거운 실무 연습
노트
  • 이 과정에 대한 맞춤 교육을 요청하려면 Google에 문의하여 준비하십시오.
14 시간
Magellan은 대규모 데이터에 대한 지리 공간 분석을 위한 오픈 소스 배포 실행 엔진입니다. Apache Spark 위에서 구현, 그것은 Spark SQL를 확장하고 지리 공간 분석에 대한 상대적 추상력을 제공합니다. 이 강사가 이끄는 라이브 훈련은 지질 공간 분석을 구현하기위한 개념과 접근 방식을 소개하고 참가자들은 Spark에서 Magellan을 사용하여 예측 분석 응용 프로그램을 만들 수 있습니다. 이 훈련이 끝나면 참가자는 다음을 할 수 있습니다 :
    효율적으로 쿼리, 퍼스 및 스케일에 지리 공간 데이터 세트에 합류 비즈니스 인텔리전스 및 예측 분석 응용 프로그램에서 지구 공간 데이터 구현 공간 컨텍스트를 사용하여 모바일 장치, 센서, 로그 및 노트북의 능력을 확장합니다.
코스의 형식
    인터랙티브 강의 및 토론 많은 연습과 연습이 있습니다. 라이브 실험실 환경에서 핸드-온 구현.
코스 Customization 옵션
    이 과정에 대한 사용자 지정 훈련을 요청하려면 저희에게 연락하여 배치하십시오.
21 시간
Apache Spark 매우 큰 데이터 세트를 분석하기위한 분산 처리 엔진입니다. 그것은 배치 및 실시간으로 데이터를 처리 할 수 있으며, 기계 학습, ad-hoc 쿼리 및 그래픽 처리를 수행 할 수 있습니다. .NET for Apache Spark은 C# 또는 F#로 작성된 응용 프로그램을 지원하는 무료, 오픈 소스 및 크로스 플랫폼 대형 데이터 분석 프레임 워크입니다. 이 강사가 이끄는 라이브 훈련 (온라인 또는 온라인)은.NET 애플리케이션에서 Apache Spark 사용하여 큰 데이터 분석을 수행하고자하는 개발자를 대상으로합니다. 이 훈련이 끝나면 참가자는 다음을 할 수 있습니다 :
    설치 및 설정 Apache Spark .NET이 Spark API를 실행하는 방법을 이해하여.NET 응용 프로그램에서 액세스할 수 있습니다. C# 또는 F#를 사용하여 데이터 처리 응용 프로그램을 개발하여 테라비트 및 페다비트로 측정되는 데이터 세트를 처리 할 수 있습니다. Apache Spark 기능을 사용하여.NET 응용 프로그램을위한 기계 학습 기능을 개발합니다. 큰 데이터 세트에 대한 SQL 쿼리를 사용하여 탐험 분석을 수행합니다.
코스의 형식
    인터랙티브 강의 및 토론 많은 연습과 연습이 있습니다. 라이브 실험실 환경에서 핸드-온 구현.
코스 Customization 옵션
    이 과정에 대한 사용자 지정 훈련을 요청하려면 저희에게 연락하여 배치하십시오.
14 시간
SMACK는 데이터 플랫폼 소프트웨어의 컬렉션입니다, 즉 Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra, 및 Apache Kafka. SMACK 스택을 사용하면 사용자가 데이터 처리 플랫폼을 만들고 확장할 수 있습니다. 이 강사가 이끄는, 라이브 훈련 (온라인 또는 온라인)은 큰 데이터 솔루션을위한 데이터 처리 플랫폼을 구축하기 위해 SMACK 스택을 사용하고자하는 데이터 과학자를 대상으로합니다. 이 훈련이 끝나면 참가자는 다음을 할 수 있습니다 :
    큰 데이터를 처리하기위한 데이터 파이프 라인 아키텍처를 구현합니다. [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] Spark 및 Scala로 데이터를 분석합니다. Apache를 사용하여 구조화되지 않은 데이터를 관리합니다 Cassandra.
코스의 형식
    인터랙티브 강의 및 토론 많은 연습과 연습이 있습니다. 라이브 실험실 환경에서 핸드-온 구현.
코스 Customization 옵션
    이 과정에 대한 사용자 지정 훈련을 요청하려면 저희에게 연락하여 배치하십시오.
21 시간
Apache Spark는 동시에 처리하기 위해 클러스터를 통해 데이터를 분배하도록 설계된 분석 엔진입니다. 그것은 스트리밍을위한 모듈을 포함, SQL, 기계 학습 및 그래픽 처리. 이 강사가 이끄는 라이브 훈련 (온라인 또는 온라인)은 매우 큰 양의 데이터를 처리하기 위해 Apache Spark 시스템을 배치하고자하는 엔지니어를 대상으로합니다. 이 훈련이 끝나면 참가자는 다음을 할 수 있습니다 :
    설치 및 설정 Apache Spark. [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] [중고] 빠르게 읽고 매우 큰 데이터 세트를 분석합니다. Apache Spark 다른 기계 학습 도구와 통합하십시오.
코스의 형식
    인터랙티브 강의 및 토론 많은 연습과 연습이 있습니다. 라이브 실험실 환경에서 핸드-온 구현.
코스 Customization 옵션
    이 과정에 대한 사용자 지정 훈련을 요청하려면 저희에게 연락하여 배치하십시오.
21 시간
Apache Spark 의 학습 곡선은 처음에 천천히 증가하고 있습니다. 첫 번째 수익을 얻으려면 많은 노력이 필요합니다. 이 과정은 첫 힘든 부분을 뛰어 넘는 것을 목표로합니다. 이 과정을 수강 한 참가자는 Apache Spark 의 기본 사항을 이해하고, RDD를 DataFrame과 명확하게 구분하고, Python 및 Scala API를 배우며, 실행 프로그램 및 작업 등을 이해합니다. 또한 우수 사례에 따라 강의에 중점을 둡니다. 클라우드 배포, Databricks 및 AWS. 학생들은 또한 AWS의 최신 Spark 서비스 중 하나 인 AWS EMR과 AWS Glue의 차이점을 이해합니다. 청중: 데이터 엔지니어, DevOps , 데이터 과학자
21 시간
목표: 이 과정은 Apache Spark 를 소개합니다. 학생들은 Spark가 Big Data 생태계에 어떻게 적용되는지, 그리고 데이터 분석에 Spark를 사용하는 방법을 배우게됩니다. 이 과정은 대화식 데이터 분석, Spark 내부, Spark API, Spark SQL , Spark 스트리밍, 기계 학습 및 graphX를위한 Spark 셸을 다룹니다. 오디언스 : 개발자 / 데이터 분석가
14 시간
Spark NLP is an open source library, built on Apache Spark, for natural language processing with Python, Java, and Scala. It is widely used for enterprise and industry verticals, such as healthcare, finance, life science, and recruiting. This instructor-led, live training (online or onsite) is aimed at data scientists and developers who wish to use Spark NLP, built on top of Apache Spark, to develop, implement, and scale natural language text processing models and pipelines. By the end of this training, participants will be able to:
  • Set up the necessary development environment to start building NLP pipelines with Spark NLP.
  • Understand the features, architecture, and benefits of using Spark NLP.
  • Use the pre-trained models available in Spark NLP to implement text processing.
  • Learn how to build, train, and scale Spark NLP models for production-grade projects.
  • Apply classification, inference, and sentiment analysis on real-world use cases (clinical data, customer behavior insights, etc.).
Format of the Course
  • Interactive lecture and discussion.
  • Lots of exercises and practice.
  • Hands-on implementation in a live-lab environment.
Course Customization Options
  • To request a customized training for this course, please contact us to arrange.
21 시간
Scala 는 대규모 기능 및 객체 지향 프로그래밍을위한 압축 버전의 Java 입니다. Apache Spark Streaming은 빅 데이터 세트를 실시간 스트림으로 처리하기위한 Spark API의 확장 구성 요소입니다. Spark Streaming과 Scala 함께 사용하면 빅 데이터를 스트리밍 할 수 있습니다. 이 강사 주도형 라이브 교육 (현장 또는 원격)은 Spark Streaming 및 Scala 빅 데이터를 스트리밍하려는 소프트웨어 엔지니어를 대상으로합니다. 이 교육이 끝나면 참가자는 다음을 수행 할 수 있습니다.
  • Scala 프로그래밍 언어로 Spark 응용 프로그램을 만듭니다.
  • Spark Streaming을 사용하여 연속적인 데이터 스트림을 처리하십시오.
  • Spark Streaming으로 실시간 데이터 스트림을 처리합니다.
코스의 형식
  • 대화식 강의 및 토론.
  • 많은 연습과 연습.
  • 라이브 랩 환경에서 실습 구현.
코스 사용자 정의 옵션
  • 이 과정에 대한 맞춤형 교육을 요청하려면 저희에게 연락하여 준비하십시오.
7 시간
Spark SQL 은 구조화 된 데이터와 구조화되지 않은 데이터로 작업하는 Apache Spark 의 모듈입니다. Spark SQL 은 수행되는 계산뿐 아니라 데이터의 구조에 대한 정보를 제공합니다. 이 정보는 최적화를 수행하는 데 사용될 수 있습니다. Spark SQL 두 가지 일반적인 용도는 다음과 같습니다.
- SQL 쿼리를 실행합니다.
- 기존 Hive 설치에서 데이터를 읽습니다. 이 강사가 진행하는 실습 (현장 또는 원격)에서 참가자는 Spark SQL 사용하여 다양한 유형의 데이터 세트를 분석하는 방법을 학습합니다. 이 훈련이 끝나면 참가자는 다음을 할 수 있습니다.
  • Spark SQL 설치하고 구성하십시오.
  • Spark SQL 사용하여 데이터 분석을 수행하십시오.
  • 서로 다른 형식의 데이터 집합을 쿼리합니다.
  • 데이터 및 쿼리 결과를 시각화합니다.
코스 형식
  • 대화 형 강의 및 토론.
  • 많은 연습과 연습.
  • 라이브 랩 환경에서 실제 구현.
코스 사용자 정의 옵션
  • 이 과정에 대한 맞춤 교육을 요청하려면 Google에 문의하여 준비하십시오.
21 시간
This course is aimed at developers and data scientists who wish to understand and implement AI within their applications. Special focus is given to Data Analysis, Distributed AI and NLP.
35 시간
MLlib는 Spark의 기계 학습 (ML) 라이브러리입니다. 그 목표는 실용적인 기계 학습을 확장 가능하고 쉽게 만들어주는 것입니다. 분류, 회귀, 클러스터링, 협업 필터링, 차원 감소, 하위 레벨 최적화 프리미티브 및 상위 레벨 파이프 라인 API 등 일반적인 학습 알고리즘과 유틸리티로 구성됩니다. 두 개의 패키지로 나뉩니다.
  • spark.mllib는 RDD 위에 구축 된 원래 API를 포함합니다.
  • spark.ml은 ML 파이프 라인을 구성하기 위해 DataFrames 위에 구축 된 고급 API를 제공합니다.
청중 이 과정은 Apache Spark 용 내장 라이브러리를 활용하고자하는 엔지니어 및 개발자를 대상으로합니다.
28 시간
많은 실제 문제는 그래프로 설명 할 수 있습니다. 예를 들어, 웹 그래프, 소셜 네트워크 그래프, 기차 네트워크 그래프 및 언어 그래프가 있습니다. 이 그래프는 매우 큰 경향이 있습니다. 이를 처리하려면 특수한 도구와 프로세스 세트가 필요합니다. 이러한 도구와 프로세스를 Graph Computing (그래프 분석이라고도 함)이라고합니다. 이 강사 주도형 라이브 교육에서 참가자는 그래프 데이터 처리를위한 기술 제공 및 구현 방법에 대해 배우게됩니다. 목표는 실제 객체, 해당 특성 및 관계를 식별 한 다음 Graph Computing 관계 (그래프 분석이라고도 함) 접근 방식을 사용하여 이러한 관계를 모델링하고 데이터로 처리하는 것입니다. 광범위한 사례부터 시작하여 일련의 사례 연구, 실습 및 라이브 배포를 통해 특정 도구를 좁 힙니다. 이 교육이 끝나면 참가자는 다음을 수행 할 수 있습니다.
  • 그래프 데이터가 유지되고 통과하는 방법을 이해합니다.
  • 그래프 데이터베이스에서 배치 처리 프레임 워크에 이르기까지 주어진 작업에 가장 적합한 프레임 워크를 선택하십시오.
  • Hadoop , Spark, GraphX 및 Pregel을 구현하여 여러 컴퓨터에서 동시에 그래프 컴퓨팅을 수행합니다.
  • 그래프, 프로세스 및 순회 측면에서 실제 빅 데이터 문제를 봅니다.
과정의 형식
  • 강의, 강의, 연습 및 실습

Last Updated:

주말Spark코스, 밤의Spark트레이닝, Spark부트 캠프, Spark 강사가 가르치는, 주말Apache Spark교육, 밤의Apache Spark과정, Spark코칭, Spark강사, Spark트레이너, Apache Spark교육 과정, Apache Spark클래스, Apache Spark현장, Apache Spark개인 강좌, Spark1 대 1 교육

코스 프로모션

No course discounts for now.

Course Discounts Newsletter

We respect the privacy of your email address. We will not pass on or sell your address to others.
You can always change your preferences or unsubscribe completely.

고객 회사

is growing fast!

We are looking to expand our presence in South Korea!

As a Business Development Manager you will:

  • expand business in South Korea
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!

This site in other countries/regions