Course Outline

Stratio 플랫폼 소개

  • Stratio 아키텍처 및 핵심 모듈 개요
  • 데이터 라이프사이클에서 Rocket과 Intelligence의 역할
  • Stratio UI에 로그인하고 탐색하는 방법

Rocket 모듈 사용하기

  • 데이터 인제스트 및 파이프라인 생성
  • 데이터 소스 연결 및 변환 구성
  • Rocket에서 PySpark를 사용하여 사전 처리 작업 수행

Stratio 사용자를 위한 PySpark 기본

  • PySpark 데이터 구조 및 작업
  • 반복 구조: for, while, if/else 사용법
  • def를 사용하여 사용자 정의 함수를 작성하고 적용

PySpark를 사용한 Rocket의 고급 사용법

  • 스트리밍 인제스트 및 변환
  • 배치 및 실시간 시나리오에서 루프 및 함수 사용
  • PySpark 파이프라인에서 성능을 위한 모범 사례

Intelligence 모듈 탐색

  • 데이터 모델링 및 분석 기능 개요
  • 피처 선택, 변환 및 탐색
  • PySpark가 사용자 정의 분석 및 통찰력에 미치는 역할

고급 분석 워크플로우 구축

  • Intelligence에서 사용자 정의 함수(UDF) 생성
  • 데이터 로직을 위한 조건문 및 루프 적용
  • 사용 사례: 세분화, 집계 및 예측

배포 및 Collaboration

  • 워크플로우 저장, 내보내기 및 재사용
  • Stratio에서 다른 팀원들과 협업
  • 출력을 검토하고 다운스트림 도구와 통합

요약 및 다음 단계

Requirements

  • Python 프로그래밍 경험
  • 데이터 분석 또는 빅데이터 처리 개념 이해
  • Apache Spark와 분산 컴퓨팅에 대한 기본 지식

대상

  • Stratio 기반 플랫폼에서 작업하는 데이터 엔지니어
  • Rocket 및 Intelligence 모듈을 사용하는 분석가 또는 개발자
  • Stratio 내에서 PySpark 워크플로우로 전환하는 기술 팀
 14 Hours

Number of participants


Price per participant

회원 평가 (5)

Upcoming Courses

Related Categories