홈
빅 데이터 트레이닝
Hadoop 트레이닝
Hadoop for Developers (4 days) 교육 과정

Hadoop for Developers (4 days) 교육 과정

Apache Hadoop은 서버 클러스터에서 Big Data를 처리하는 가장 인기 있는 프레임워크입니다. 이 강좌는 개발자를 위해 Hadoop 생태계의 다양한 구성 요소(HDFS, MapReduce, Pig, Hive 및 HBase)에 대해 소개합니다.

문의를 보내주셔서 감사합니다! 팀원이 곧 연락드리겠습니다.

예약을 보내주셔서 감사합니다! 저희 팀 멤버 중 한 분이 곧 연락드리겠습니다.

코스 개요

섹션 1: Hadoop 소개

Hadoop의 역사, 개념
생태계
배포
고수준 아키텍처
Hadoop 신화
Hadoop의 도전 과제
하드웨어/소프트웨어
실습 : Hadoop 첫 번째 경험

섹션 2: HDFS

디자인과 아키텍처
개념(수평 확장, 복제, 데이터 로케일리티, 랙 인식)
데몬 : 네임노드, 세컨더리 네임노드, 데이터 노드
통신/하트비트
데이터 무결성
읽기/쓰기 경로
네임노드 고가용성(HA), 연합
실습 : HDFS와 상호작용하기

섹션 3: MapReduce

개념과 아키텍처
데몬(MRV1) : 잡트래커, 태스크트래커
단계 : 드라이버, 맵퍼, 셔플/정렬, 리듀서
MapReduce 버전 1과 버전 2(YARN)
MapReduce 내부 구조
Java MapReduce 프로그램 소개
실습 : 샘플 MapReduce 프로그램 실행

섹션 4: Pig

Pig vs Java MapReduce
Pig 작업 흐름
Pig Latin 언어
Pig를 사용한 ETL
변환 및 조인
사용자 정의 함수(UDF)
실습 : 데이터 분석을 위한 Pig 스크립트 작성

섹션 5: Hive

아키텍처와 디자인
데이터 유형
Hive에서의 SQL 지원
Hive 테이블 생성 및 쿼리 실행
파티션
조인
텍스트 처리
실습 : Hive를 사용한 데이터 처리 실습

섹션 6: HBase

개념과 아키텍처
HBase vs RDBMS vs Cassandra
HBase Java API
HBase에서의 시간 시리즈 데이터
스키마 디자인
실습 : HBase 쉘을 사용한 상호작용; HBase Java API를 사용한 프로그래밍; 스키마 디자인 실습

요건

Java 프로그래밍 언어에 익숙해야 합니다(대부분의 프로그래밍 실습은 Java로 진행됩니다)
Linux 환경에 익숙해야 합니다(Linux 명령 줄을 탐색하고, vi 또는 nano를 사용하여 파일을 편집할 수 있어야 합니다)

실습 환경

설치 필요 없음 : 학생들의 컴퓨터에 Hadoop 소프트웨어를 설치할 필요가 없습니다! 학생들을 위해 작동하는 Hadoop 클러스터가 제공됩니다.

학생들은 다음과 같은 것을 준비해야 합니다

SSH 클라이언트(Linux와 Mac은 이미 ssh 클라이언트를 가지고 있으며, Windows의 경우 Putty가 추천됩니다)
클러스터에 액세스하기 위한 브라우저, Firefox가 추천됩니다

28 시간

참가자 수

온라인

강의실

위치 선택

venues를 선택하세요

참가자별 가격

오픈 트레이닝 코스는 5명 이상의 참가자가 필요합니다.

Hadoop for Developers (4 days) 교육 과정 - 예약

�r� 네임 *

이메일 *

전화번호 *

직무명

회사명

주소 1 *

도시 *

주/성

국가 *

우편번호 *

시작 날짜

세금 번호

날짜는 이용 가능성을 기준으로 10:00과 17:00 사이에 진행됩니다.

결제 *

은행 이체 (청구서, 구매 주문서)

직불 / 신용 카드

의견

이용 약관 *

저는 위에 명시된 고객의 공식 대표자이며, NobleProg 이용 약관 및 개인 정보 보호 정책에 따라 위 코스 또는 서비스를 예약하려 합니다.

할인 및 프로모션 정보를 받아보세요

개인정보 보호정책을 읽어보세요. 개인정보 보호정책 에서 데이터 사용 방법을 확인하실 수 있습니다.

Hadoop for Developers (4 days) 교육 과정 - 문의

�r� 네임 *

이메일 *

전화번호 *

참가자 수

회사명

회사 주소

코스를 어떻게 수강하시겠습니까?

고객 사무실

(온라인)

강의실

의견

할인 및 프로모션 정보를 받아보세요

개인정보 보호정책을 읽어보세요. 개인정보 보호정책 에서 데이터 사용 방법을 확인하실 수 있습니다.

Hadoop for Developers (4 days) - 컨설팅 문의

�r� 네임 *

전화번호 *

이메일 *

회사명

컨설팅 주제 *

컨설팅 목표

컨설턴트가 누구와 함께 일할까요?

컨설팅 시급성 *

의견

할인 및 프로모션 정보를 받아보세요

개인정보 보호정책을 읽어보세요. 개인정보 보호정책 에서 데이터 사용 방법을 확인하실 수 있습니다.

회원 평가 (1)

실습 연습. 이 클래스는 본래 5일 동안 진행되었어야 하지만, 3일간의 수업으로도 이미 NiFi를 사용하면서 가졌던 많은 질문들을 해결할 수 있었습니다.

James - BHG Financial

코스 - Apache NiFi for Administrators

₩ 10000000 ((온라인))

₩ 20000000 (강의실)

Apache 관리자 교육 Hadoop

35 시간

대상:

이 코스는 분산 시스템 환경에서 대규모 데이터를 저장하고 처리하는 솔루션을 찾고 있는 IT 전문가를 대상으로 합니다.

전제 조건:

Hadoop 클러스터 관리에 대한 심도 있는 지식이 필요합니다.

건강 분야의 빅데이터 분석

21 시간

빅데이터 분석은 대량의 다양한 데이터 세트를 검토하여 상관 관계, 숨겨진 패턴 및 기타 유용한 통찰력을 발견하는 과정을 포함합니다.

의료 산업은 복잡하고 이질적인 의학적 및 임상 데이터가 대량으로 존재합니다. 건강 데이터에 빅데이터 분석을 적용하면 의료 서비스 제공 개선을 위한 통찰력을 도출하는 큰 잠재력이 있습니다. 그러나 이러한 데이터셋의 크기는 분석과 임상 환경에서의 실제 응용에 큰 도전을 제시합니다.

이 강사 주도형 실시간 교육(원격)에서는 참가자들이 빅데이터 분석 기술을 건강 분야에 적용하는 방법을 배우면서 일련의 실습 실습을 진행하게 됩니다.

본 교육을 마치면 참가자는 다음과 같은 능력을 갖추게 될 것입니다:

Hadoop MapReduce와 Spark 등 빅데이터 분석 도구를 설치하고 구성할 수 있습니다.
의료 데이터의 특성을 이해합니다.
의료 데이터를 처리하기 위한 빅데이터 기술을 적용할 수 있습니다.
건강 관련 응용 프로그램의 문맥에서 빅데이터 시스템과 알고리즘을 연구합니다.

대상군

개발자
데이터 과학자

코스 형식

강의, 토론, 연습 및 실습을 병행합니다.

참고사항

본 과정에 대한 맞춤형 교육을 요청하려면 문의하여 일정을 조율해 주세요.

아파치 하둡은 서버 클러스터에서 데이터를 처리하는 가장 인기 있는 프레임워크입니다. 이 3일(선택 사항으로 4일) 과정에서는 하둡과 그 생태계의 비즈니스 이점과 사용 사례, 클러스터 배포 및 확장을 계획하는 방법, 하둡을 설치, 유지, 모니터링, 문제 해결 및 최적화하는 방법에 대해 배우게 됩니다. 또한 클러스터 대량 데이터 로드 연습, 다양한 하둡 배포판에 대한 이해, 하둡 생태계 도구를 설치 및 관리하는 연습을 할 수 있습니다. 이 과정은 커버로스를 사용하여 클러스터를 보호하는 논의로 마무리됩니다.

“… 자료는 매우 잘 준비되어 있었고 철저히 다루어졌습니다. 라보는 매우 도움이 되고 잘 조직되어 있었습니다.”
— 앤드류 응우옌, 프린시팔 통합 DW 엔지니어, 온라인

대상

하둡 관리자

형식

강의와 실습 라보, 강의 약 60%, 라보 약 40%.

고급 하둡 개발자 과정

21 시간

Apache Hadoop은 서버 클러스터에서 빅 데이터를 처리하는 가장 인기 있는 프레임워크 중 하나입니다. 이 강좌는 HDFS에서의 데이터 관리, 고급 Pig, Hive, 그리고 HBase에 대해 깊게 다룹니다. 이러한 고급 프로그래밍 기술은 경험이 풍부한 하둡 개발자들에게 유용할 것입니다.

대상: 개발자

기간: 3일

형식: 강의 (50%), 실습 (50%).

MapR의 Hadoop 관리

28 시간

대상:

이 코스는 빅 데이터/하둡 기술의 신비를 해제하고 이해하기 어렵지 않다는 것을 보여주기 위한 것입니다.

해돕과 스파크 관리자를 위한

35 시간

대한민국에서 진행되는 이 실시간 교육(온라인 또는 현장)은 조직 내에서 Hadoop 클러스터를 설정, 배포 및 관리하는 방법을 배우려는 시스템 관리자를 대상으로 합니다.

이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.

Apache Hadoop을 설치하고 구성합니다.
Hadoop 생태계의 네 가지 주요 구성 요소인 HDFS, MapReduce, YARN 및 Hadoop Common을 이해합니다.
HDFS(Hadoop 분산 파일 시스템)를 사용하여 클러스터를 수백 또는 수천 개의 노드로 확장합니다.
온프레미스 Spark 배포를 위한 스토리지 엔진으로 작동하도록 HDFS를 설정합니다.
Redis, Elasticsearch, Couchbase, Aerospike 등과 같은 Amazon S3 및 NoSQL 데이터베이스 시스템과 같은 대체 스토리지 솔루션에 액세스하도록 Spark를 설정하십시오.
Apache Hadoop 클러스터 프로비저닝, 관리, 모니터링 및 보안과 같은 관리 작업을 수행합니다.

HBase 개발자를 위한 강의

21 시간

이 강좌는 Hadoop 위에서 동작하는 NoSQL 저장소인 HBase를 소개합니다. 이 강좌는 HBase를 사용하여 애플리케이션을 개발할 개발자들과 HBase 클러스터를 관리할 관리자들을 대상으로 합니다.

이 강좌에서는 HBase의 아키텍처와 데이터 모델링, 그리고 HBase 기반 애플리케이션 개발을 개발자를 위한 단계별로 안내합니다. 또한 HBase와 MapReduce를 함께 사용하는 방법과 성능 최적화와 관련된 관리 주제를 다룹니다. 이 강좌는 많은 실습을 포함하여 매우 실습 중심입니다.

기간 : 3일

대상 : 개발자 & 관리자

Apache NiFi for Administrators

21 시간

Apache NiFi는 오픈 소스, 흐름 기반 데이터 통합 및 이벤트 처리 플랫폼입니다. 이 플랫폼은 다양한 시스템 간에 자동화된 실시간 데이터 라우팅, 변환, 시스템 중재를 제공하며, 웹 기반 UI와 세부적인 제어 기능을 포함하고 있습니다.

이 강사 주도의 실시간 교육(현장 또는 원격)은 중급 수준의 관리자 및 엔지니어를 대상으로 하며, NiFi 데이터플로우를 실제 환경에서 배포, 관리, 보안, 최적화하는 방법을 배울 것입니다.

이 교육을 마친 후 참가자는 다음과 같은 능력을 갖추게 됩니다:

Apache NiFi 클러스터를 설치, 구성, 유지할 수 있습니다.
다양한 소스와 싱크에서 데이터플로우를 설계하고 관리할 수 있습니다.
흐름 자동화, 라우팅, 변환 논리를 구현할 수 있습니다.
성능을 최적화하고, 운영 상태를 모니터링하며, 문제를 해결할 수 있습니다.

강의 형식

실제 아키텍처 논의를 포함한 상호작용형 강연
데이터플로우를 구축, 배포, 관리하는 실습
실시간 랩 환경에서 시나리오 기반 연습

강의 맞춤형 옵션

이 강의에 대한 맞춤형 교육을 요청하려면 저희에게 문의해 주십시오.

Apache NiFi 개발자를 위한

7 시간

대한민국에서 강사가 진행하는 이 실시간 교육에서 참가자는 Apache NiFi을 사용하여 다양한 데모 확장, 구성 요소 및 프로세서를 개발하면서 흐름 기반 프로그래밍의 기본 사항을 학습하게 됩니다.

이 교육을 마치면 참가자는 다음을 수행할 수 있습니다.

NiFi의 아키텍처와 데이터 흐름 개념을 이해합니다.
NiFi와 타사 API를 사용하여 확장 기능을 개발합니다.
Apache Nifi 프로세서를 자체적으로 맞춤 개발합니다.
다양하고 흔하지 않은 파일 형식과 데이터 소스에서 실시간 데이터를 수집하고 처리합니다.

Python, Spark, and Hadoop for Big Data

21 시간

대한민국에서 진행되는 이 실시간 교육(온라인 또는 현장)은 Spark Hadoop 및 Python를 사용하고 통합하여 크고 복잡한 데이터 세트를 처리, 분석 및 변환하려는 개발자를 대상으로 합니다.

이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.

Spark, Hadoop, Python를 사용하여 빅데이터 처리를 시작하는 데 필요한 환경을 설정합니다.
Spark 및 Hadoop의 기능, 핵심 구성 요소 및 아키텍처를 이해합니다.
빅 데이터 처리를 위해 Spark, Hadoop 및 Python를 통합하는 방법을 알아보세요.
Spark 에코시스템(Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka 및 Flume)의 도구를 살펴보세요.
Netflix, YouTube, Amazon, Spotify 및 Google과 유사한 협업 필터링 추천 시스템을 구축하세요.
Apache Mahout을 사용하여 기계 학습 알고리즘을 확장합니다.

Hadoop for Developers (4 days) 교육 과정

코스 개요

섹션 1: Hadoop 소개

섹션 2: HDFS

섹션 3: MapReduce

섹션 4: Pig

섹션 5: Hive

섹션 6: HBase

요건

실습 환경

회원 평가 (1)

James - BHG Financial

코스 - Apache NiFi for Administrators

예정된 코스

Hadoop for Developers (4 days)

Hadoop for Developers (4 days)

Hadoop for Developers (4 days)

Hadoop for Developers (4 days)

Hadoop for Developers (4 days)

관련 카테고리

다른 국가/지역의 사이트

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Hadoop for Developers (4 days) 교육 과정

코스 개요

섹션 1: Hadoop 소개

섹션 2: HDFS

섹션 3: MapReduce

섹션 4: Pig

섹션 5: Hive

섹션 6: HBase

요건

실습 환경

회원 평가 (1)

James - BHG Financial

코스 - Apache NiFi for Administrators

예정된 코스

Hadoop for Developers (4 days)

Hadoop for Developers (4 days)

Hadoop for Developers (4 days)

Hadoop for Developers (4 days)

Hadoop for Developers (4 days)

관련 코스

Apache 관리자 교육 Hadoop

대상:

전제 조건:

건강 분야의 빅데이터 분석

관리자를 위한 Hadoop

대상

형식

고급 하둡 개발자 과정

MapR의 Hadoop 관리

대상:

해돕과 스파크 관리자를 위한

HBase 개발자를 위한 강의

Apache NiFi for Administrators

Apache NiFi 개발자를 위한

Python, Spark, and Hadoop for Big Data

관련 카테고리

Hadoop

다른 국가/지역의 사이트

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites