온라인 또는 현장 강사 주도 라이브 Databricks 교육 과정은 대화형 실습을 통해 Azure Databricks를 사용하여 데이터 분석 솔루션을 설정, 배포 및 관리하는 방법을 보여줍니다. Databricks 교육은 "온라인 라이브 교육" 또는 "현장 라이브 교육"으로 제공됩니다. 온라인 라이브 교육(일명 "원격 라이브 교육")은 대화형 원격 데스크톱을 통해 수행됩니다. 현장 라이브 교육은 대한민국의 고객 구내 또는 대한민국의 NobleProg 기업 교육 센터에서 로컬로 수행할 수 있습니다. NobleProg -- 지역 교육 제공자
Databricks는 Spark, Delta Lake 및 거버넌스(Unity Catalog)를 결합한 통합된 Lakehouse 플랫폼으로, 확장 가능한 데이터 엔지니어링과 분석 워크플로를 지원합니다.
이 강사 주도의 실시간 트레이닝(온라인 또는 현장)은 데이터 엔지니어링 배경을 가진 중급 수준의 기술 관리자를 대상으로, Databricks, Spark, Delta Lake, Unity Catalog 및 원시 워크플로를 사용하여 복잡한 절차형 OLAP 논리를 Lakehouse 아키텍처로 마이그레이션하는 방법을 학습할 수 있습니다.
이 트레이닝을 완료하면 참가자는 다음과 같이 할 수 있게 됩니다:
Lakehouse 아키텍처와 Bronze→Silver→Gold (Medallion) 패턴을 설명할 수 있습니다.
저장 프로시저 논리를 Spark DataFrame 및 노트북 구현으로 변환할 수 있습니다.
Delta Lake를 사용하여 증분 흡수, 병합, 최적화 루틴을 설계하고 구현할 수 있습니다.
Databricks 워크플로, 버전 관리, 테스트 및 거버넌스를 사용하여 전체적인 파이프라인을 구축할 수 있습니다.
강의 형식
집중적으로 진행되는 강사 주도 세션으로, 구체적인 설명과 시연이 포함됩니다.
대표적인 데이터셋과 마이그레이션 연습을 사용한 매일의 실습.
안내된 코드 리뷰, 성능 최적화 클리닉 및 워크플로 오케스트레이션 연습.
강의 맞춤 옵션
이 강의는 귀사의 환경, 데이터셋 및 거버넌스 요구 사항에 맞게 조정될 수 있습니다. 맞춤 설정을 원하시면 저희에게 문의해 주세요.
Databricks Lakehouse는 데이터 엔지니어링, 데이터 과학, 분석을 단일 확장 가능한 기반에서 결합한 통합 데이터 및 AI 플랫폼입니다.
이 강사는 데이터 엔지니어링을 사용하여 Databricks, Apache Spark, 오케스트레이션, 그리고 하류 시각화에서 중간 수준부터 고급 수준까지의 데이터 엔지니어와 분석 전문가들이 참여할 수 있는 온라인 또는 오프라인 라이브 교육 과정입니다. 생산 환경에서 사용할 수 있는 종합적인 기술력을 갖추기 위함입니다.
이 교육을 마치면 참가자들이 할 수 있는 것들은 다음과 같습니다:
Databricks Lakehouse 플랫폼에서 확장 가능한 ETL/ELT 파이프라인을 설계하고 구현합니다.
대규모 데이터 처리와 최적화에 Spark와 고급 SQL을 효과적으로 사용합니다.
Big Data ML 패턴과 Databricks 도구를 사용하여 모델을 구축, 학습, 배포합니다.
분석 및 보고 요구 사항에 맞게 데이터 모델링 및 수집 패턴을 구현합니다.
Airflow/Astronomer를 사용하여 워크플로우를 자동화하고 Git 기반 CI/CD로 운영합니다.
Databricks에 연결된 Tableau를 사용하여 생산급 대시보드와 시각화를 만듭니다.