Course Outline
Stratio 플랫폼 소개
- Stratio 아키텍처 및 핵심 모듈 개요
- 데이터 라이프사이클에서 Rocket과 Intelligence의 역할
- Stratio UI에 로그인하고 탐색하는 방법
Rocket 모듈 사용하기
- 데이터 인제스트 및 파이프라인 생성
- 데이터 소스 연결 및 변환 구성
- Rocket에서 PySpark를 사용하여 사전 처리 작업 수행
Stratio 사용자를 위한 PySpark 기본
- PySpark 데이터 구조 및 작업
- 반복 구조: for, while, if/else 사용법
- def를 사용하여 사용자 정의 함수를 작성하고 적용
PySpark를 사용한 Rocket의 고급 사용법
- 스트리밍 인제스트 및 변환
- 배치 및 실시간 시나리오에서 루프 및 함수 사용
- PySpark 파이프라인에서 성능을 위한 모범 사례
Intelligence 모듈 탐색
- 데이터 모델링 및 분석 기능 개요
- 피처 선택, 변환 및 탐색
- PySpark가 사용자 정의 분석 및 통찰력에 미치는 역할
고급 분석 워크플로우 구축
- Intelligence에서 사용자 정의 함수(UDF) 생성
- 데이터 로직을 위한 조건문 및 루프 적용
- 사용 사례: 세분화, 집계 및 예측
배포 및 Collaboration
- 워크플로우 저장, 내보내기 및 재사용
- Stratio에서 다른 팀원들과 협업
- 출력을 검토하고 다운스트림 도구와 통합
요약 및 다음 단계
Requirements
- Python 프로그래밍 경험
- 데이터 분석 또는 빅데이터 처리 개념 이해
- Apache Spark와 분산 컴퓨팅에 대한 기본 지식
대상
- Stratio 기반 플랫폼에서 작업하는 데이터 엔지니어
- Rocket 및 Intelligence 모듈을 사용하는 분석가 또는 개발자
- Stratio 내에서 PySpark 워크플로우로 전환하는 기술 팀
회원 평가 (5)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Course - ArcGIS Fundamentals
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
Course - QGIS for Geographic Information System
저는 Pablo의 스타일이 마음에 들었습니다. 그가 보고서 디자인, HTML을 사용한 사용자 정의, 간단한 ML 알고리즘 구현에 이르기까지 많은 주제를 다루었다는 점입니다. Go이론적 정보/연습의 균형을 유지합니다. 파블로는 제가 관심을 갖고 있는 모든 주제를 다루었고 제 질문에 포괄적인 답변을 해주었습니다.
Cristian Tudose - SC Automobile Dacia SA
Course - Advanced Data Analysis with TIBCO Spotfire
Machine Translated
Actual application of spotfire and all basic functions.
Michael Capili - STMicroelectronics, Inc.
Course - Introduction to Spotfire
The thing I liked the most about the training was the organization and the location