코스 개요
Stratio 플랫폼 소개
- Stratio 아키텍처 및 핵심 모듈 개요
- 데이터 라이프사이클에서 Rocket과 Intelligence의 역할
- Stratio UI에 로그인하고 탐색하는 방법
Rocket 모듈 사용하기
- 데이터 인제스트 및 파이프라인 생성
- 데이터 소스 연결 및 변환 구성
- Rocket에서 PySpark를 사용하여 사전 처리 작업 수행
Stratio 사용자를 위한 PySpark 기본
- PySpark 데이터 구조 및 작업
- 반복 구조: for, while, if/else 사용법
- def를 사용하여 사용자 정의 함수를 작성하고 적용
PySpark를 사용한 Rocket의 고급 사용법
- 스트리밍 인제스트 및 변환
- 배치 및 실시간 시나리오에서 루프 및 함수 사용
- PySpark 파이프라인에서 성능을 위한 모범 사례
Intelligence 모듈 탐색
- 데이터 모델링 및 분석 기능 개요
- 피처 선택, 변환 및 탐색
- PySpark가 사용자 정의 분석 및 통찰력에 미치는 역할
고급 분석 워크플로우 구축
- Intelligence에서 사용자 정의 함수(UDF) 생성
- 데이터 로직을 위한 조건문 및 루프 적용
- 사용 사례: 세분화, 집계 및 예측
배포 및 Collaboration
- 워크플로우 저장, 내보내기 및 재사용
- Stratio에서 다른 팀원들과 협업
- 출력을 검토하고 다운스트림 도구와 통합
요약 및 다음 단계
요건
- Python 프로그래밍 경험
- 데이터 분석 또는 빅데이터 처리 개념 이해
- Apache Spark와 분산 컴퓨팅에 대한 기본 지식
대상
- Stratio 기반 플랫폼에서 작업하는 데이터 엔지니어
- Rocket 및 Intelligence 모듈을 사용하는 분석가 또는 개발자
- Stratio 내에서 PySpark 워크플로우로 전환하는 기술 팀
회원 평가 (4)
The thing I liked the most about the training was the organization and the location
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
코스 - ArcGIS for Spatial Analysis
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
코스 - ArcGIS Fundamentals
I really enjoyed the training. I found all modules to be applicable to problems that I am trying to solve at work. The integration of the training with jupyter notebooks was really impressive.
Mark Firmin - Environment and Climate Change Canada
코스 - Python for Geographic Information System (GIS)
All the topics which he covered including examples. And also explained how they are helpful in our daily job.