Course Outline

소개

Spark Streaming 기능 및 아키텍처 개요

  • 지원되는 데이터 소스
  • 핵심 API

환경 준비

  • 종속성
  • Spark 및 스트리밍 컨텍스트
  • 카프카에 연결하기

메시지 처리

  • 인바운드 메시지를 JSON으로 구문 분석
  • ETL 프로세스
  • 스트리밍 컨텍스트 시작

창 모드 수행 Stream Processing

  • 슬라이드 간격
  • 체크포인트 전달 구성
  • 환경 시작

처리 코드 프로토타입화

  • Kafka 주제에 연결
  • Paw를 사용하여 데이터 소스에서 JSON 검색
  • 변형 및 추가 처리

코드 스트리밍

  • 작업 제어 변수
  • 일치시킬 값 정의
  • 기능 및 조건

스트림 출력 획득

  • 카운터
  • Kafka 출력(일치 및 비일치)

문제 해결

요약 및 결론

Requirements

  • Python 및 Apache Kafka 사용 경험
  • 스트림 처리 플랫폼에 대한 지식

청중

  • 데이터 엔지니어
  • 데이터 과학자
  • 프로그래머
 7 Hours

Number of participants



Price per participant

회원 평가 (5)

Related Courses

Related Categories