Jupyter for Data Science Teams 교육 과정
Jupyter는 오픈 소스, 웹 기반 대화형 IDE 및 컴퓨팅 환경입니다.
이 강사가 진행하는 실시간 교육(온라인 또는 현장)에서는 데이터 과학의 공동 개발 아이디어를 소개하고 Jupyter를 사용하여 "컴퓨팅 아이디어의 수명 주기"에서 팀으로 추적하고 참여하는 방법을 보여줍니다. Jupyter 생태계를 기반으로 샘플 데이터 과학 프로젝트를 생성하는 과정을 참가자에게 안내합니다.
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- Git에서 팀 저장소 생성 및 통합을 포함하여 Jupyter를 설치하고 구성합니다.
- 확장 프로그램, 대화형 위젯, 다중 사용자 모드 등과 같은 Jupyter 기능을 사용하여 프로젝트 협업을 활성화하세요.
- 팀 구성원과 함께 Jupyter Notebook을 생성, 공유 및 구성합니다.
- Scala, Python, R 중에서 선택하여 Jupyter 인터페이스를 통해 Apache Spark과 같은 빅 데이터 시스템에 대한 코드를 작성하고 실행합니다.
코스의 형식
- 대화형 강의 및 토론.
- 많은 연습과 연습.
- 라이브 랩 환경에서 직접 구현합니다.
코스 맞춤화 옵션
- Jupyter Notebook은 R, Python, Scala, Julia 등을 포함하여 40개 이상의 언어를 지원합니다. 선택한 언어에 맞게 이 과정을 사용자 정의하려면 당사에 문의하여 예약하세요.
코스 개요
Jupyter 소개
- Jupyter와 그 생태계 개요
- 설치 및 설정
- 팀 협업을 위한 Jupyter 구성
협업 기능
- 버전 제어를 위해 Git 사용
- 확장 및 대화형 위젯
- 멀티유저 모드
노트북 만들기 및 관리
- 노트북 구조 및 기능
- 노트북 공유 및 구성
- 협업을 위한 모범 사례
Programming Jupyter를 사용하여
- 프로그래밍 언어 선택 및 사용 (Python, R, Scala)
- 코드 작성 및 실행
- 빅데이터 시스템과의 통합 (Apache Spark)
고급 Jupyter 기능
- Jupyter 환경 사용자 지정
- Jupyter를 사용하여 워크플로 자동화
- 고급 사용 사례 탐색
실습 세션
- 핸즈온 랩
- 실제 데이터 과학 프로젝트
- 그룹 연습 및 동료 평가
요약 및 다음 단계
요건
- Python, R, Scala 등과 같은 언어에 대한 Programming 경험.
- 데이터 과학 배경
청중
- 데이터 과학 팀
오픈 트레이닝 코스는 5명 이상의 참가자가 필요합니다.
Jupyter for Data Science Teams 교육 과정 - 예약
Jupyter for Data Science Teams 교육 과정 - 문의
Jupyter for Data Science Teams - 컨설팅 문의
회원 평가 (1)
이 강좌가 사전 설문지에서 제가 강조한 주요 영역에 맞춤화되어 있어 정말 좋습니다. 이는 제 질문을 해결하고 학습 목표와 일치시키는 데 큰 도움이 됩니다.
Winnie Chan - Statistics Canada
코스 - Jupyter for Data Science Teams
기계 번역됨
예정된 코스
관련 코스
Python을 이용한 데이터 과학 및 인공 지능 입문
35 시간이 강좌는 데이터 과학과 인공 지능(AI)에 대한 5일간의 소개입니다.
Python을 사용한 예제와 연습으로 진행됩니다.
Apache Airflow를 활용한 Machine Learning 자동화
21 시간이 강사는 온라인 또는 현장에서 진행하는 실시간 교육과정으로, 중간 수준의 참여자들을 대상으로 합니다. 이 과정은 Apache Airflow를 사용하여 머신러닝 워크플로우를 자동화하고 관리하는 데 중점을 둡니다. 모델 학습, 검증, 그리고 배포가 포함됩니다.
이 교육을 마친 후, 참가자들은 다음을 할 수 있게 됩니다:
- 머신러닝 워크플로우 오케스트레이션을 위해 Apache Airflow를 설정합니다.
- 데이터 전처리, 모델 학습, 그리고 검증 작업을 자동화합니다.
- Airflow를 머신러닝 프레임워크와 도구에 통합합니다.
- 자동화된 파이프라인을 사용하여 머신러닝 모델을 배포합니다.
- 생산 환경에서 머신러닝 워크플로우를 모니터링하고 최적화합니다.
Anaconda 데이터 과학자를 위한 에코시스템
14 시간대한민국에서 강사가 진행하는 이 라이브 교육(온라인 또는 현장)은 단일 플랫폼에서 패키지 및 데이터 분석 워크플로를 캡처, 관리, 배포하기 위해 Anaconda 에코시스템을 사용하려는 데이터 과학자를 대상으로 합니다.
이 교육을 마치면 참가자는 다음을 수행할 수 있습니다.
- Anaconda개의 구성 요소와 라이브러리를 설치하고 구성합니다.
- Anaconda의 핵심 개념, 기능 및 이점을 이해하세요.
- Anaconda Navigator를 사용하여 패키지, 환경 및 채널을 관리하세요.
- 데이터 과학 및 머신 러닝에는 Conda, R 및 Python 패키지를 사용합니다.
- 여러 데이터 환경을 관리하기 위한 몇 가지 실제 사용 사례와 기술을 알아보세요.
AWS Cloud9를 위한 Data Science
28 시간이 온라인 또는 오프라인 강의는 중급 수준의 데이터 과학자 및 분석가들이 AWS Cloud9를 활용하여 데이터 과학 워크플로우를 간소화하고자 하는 사람들을 대상으로 합니다.
이 교육을 마친 후 참가자는 다음을 수행할 수 있게 됩니다.
- AWS Cloud9에서 데이터 과학 환경을 설정합니다.
- Cloud9에서 Python, R, 그리고 Jupyter Notebook을 사용하여 데이터 분석을 수행합니다.
- AWS Cloud9를 S3, RDS, 그리고 Redshift와 같은 AWS 데이터 서비스와 통합합니다.
- AWS Cloud9를 활용하여 머신러닝 모델 개발 및 배포를 수행합니다.
- 데이터 분석 및 처리 위한 클라우드 기반 워크플로우를 최적화합니다.
GoData Science에 대한 ogle Colab 소개
14 시간이 강사 지도형 라이브 교육 과정은 Google Colab을 사용하여 데이터 과학의 기본을 배우고자 하는 초보 데이터 과학자 및 IT 전문가를 대상으로 합니다.
이 교육 과정을 마친 후, 참가자들은 다음을 할 수 있게 됩니다:
- Google Colab 설정 및 탐색.
- 기본 Python 코드 작성 및 실행.
- 데이터셋 가져오기 및 처리.
- Python 라이브러리를 사용하여 시각화 생성.
데이터 과학의 실용적인 소개
35 시간이 교육을 마친 참가자들은 데이터 과학과 관련 기술, 방법론, 도구에 대한 실제 세계의 이해를 얻게 됩니다.
참가자들은 실습을 통해 이 지식을 직접 활용할 수 있는 기회를 갖습니다. 그룹 상호작용과 강사의 피드백은 수업의 중요한 부분을 구성합니다.
교육은 데이터 과학의 기본 개념 소개로 시작하여, 데이터 과학에서 사용하는 도구와 방법론으로 진행됩니다.
대상자
- 개발자
- 기술 분석가
- IT 컨설턴트
교육 형식
- 강의와 토론, 실습을 병행하며, 실제 연습에 중점을 둡니다.
참고사항
- 이 과정의 맞춤형 교육을 요청하시려면 저희에게 문의하여 예약하세요.
데이터 사이언스 프로그램
245 시간오늘날 세계에서 정보와 데이터의 폭발적인 증가는 비교할 수 없을 만큼 증가하고 있으며, 혁신하고 가능성의 경계를 넓히는 우리의 능력은 그 어느 때보다 빠르게 성장하고 있습니다. 데이터 과학자의 역할은 오늘날 업계 전반에 걸쳐 가장 수요가 많은 기술 중 하나입니다.
우리는 이론을 통한 학습 이상의 것을 제공합니다. 우리는 학계와 산업계의 요구 사이의 격차를 해소하는 실용적이고 시장성이 있는 기술을 제공합니다.
이 7주 커리큘럼은 귀하의 특정 산업 요구 사항에 맞게 맞춤화될 수 있습니다. 자세한 내용은 당사에 문의하거나 Nobleprog Institute 웹사이트를 방문하십시오.
청중:
이 프로그램은 졸업 후 졸업생뿐만 아니라 평가와 인터뷰를 통해 결정되는 필수 사전 필수 기술을 갖춘 모든 사람을 대상으로 합니다.
배달:
이 과정은 강사가 진행하는 강의실과 강사가 진행하는 온라인이 혼합되어 제공됩니다. 일반적으로 첫 번째 주는 '교실 주도', 2~6주차는 '가상 교실', 7주차는 다시 '교실 주도'입니다.
빅 데이터 분석을 위한 데이터 사이언스
35 시간빅 데이터는 너무 방대하고 복잡한 데이터 세트로 전통적인 데이터 처리 응용 프로그램 소프트웨어가 처리하기에 부적합합니다. 큰 데이터 문제로는 데이터 캡처, 데이터 저장, 데이터 분석, 검색, 공유, 전송, 시각화, 쿼리, 업데이트 및 정보 프라이버시가 있습니다.
데이터 사이언스: 마케팅/판매 전문가를 위한 필수 요소
21 시간이 코스는 마케팅 및 판매 전문가가 데이터 사이언스 기술을 마케팅/판매에 적용하는 방법을 깊이 있게 이해하고자 하는 사람들에게 맞춤화되었습니다. 이 코스는 “업셀”, “크로스셀”, 시장 세분화, 브랜드 전략 및 CLV에 사용되는 다양한 데이터 사이언스 기법을 상세히 다루며,
마케팅과 판매의 차이점 - 판매와 마케팅은 어떻게 다른가요?
간단히 말하면, 판매는 개인을 대상으로 하는 과정입니다. 반면 마케팅은 더 넓은 그룹 또는 일반 대중을 대상으로 합니다. 마케팅에는 고객의 요구를 파악하는 연구, 혁신적인 제품을 생산하는 제품 개발, 광고를 통해 제품 홍보하고 소비자들에게 제품에 대한 인지도를 높이는 과정이 포함됩니다. 따라서 마케팅은 잠재 고객을 생성하는 것을 의미합니다. 제품이 시장에 출시되면 판매자의 역할은 고객이 제품을 구매하도록 설득하는 것입니다. 판매는 잠재 고객을 실제 구매로 전환하는 것을 의미하며, 마케팅은 장기적인 목표를, 판매는 단기적인 목표를 목표로 합니다.
데이터 과학 입문
35 시간이 강사 주도의 실시간 교육(온라인 또는 현장)은 데이터 과학 분야에서 경력을 시작하려는 전문가들을 대상으로 합니다.
본 교육이 끝나면 참가자들은 다음과 같은 능력을 갖추게 됩니다:
- Python과 MySql을 설치하고 구성할 수 있습니다.
- 데이터 과학이 무엇인지, 그리고 어떤 비즈니스에도 가치를 추가할 수 있는 방법을 이해합니다.
- Python에서 코딩의 기초를 배웁니다.
- 지도 학습과 비지도 학습 기술을 배우고 이를 구현하며 결과를 해석하는 방법을 알아봅니다.
교육 형식
- 상호 작용형 강의 및 토론.
- 많은 연습과 실습.
- 실시간 실험 환경에서 직접 구현.
교육 맞춤 옵션
- 이 교육을 맞춤화하여 요청하시려면 저희에게 연락해 주세요.
Kaggle
14 시간대한민국에서 강사가 진행하는 이 실시간 교육(온라인 또는 현장)은 Kaggle을 사용하여 Data Science에서 학습하고 경력을 쌓고자 하는 데이터 과학자와 개발자를 대상으로 합니다.
이 교육을 마치면 참가자는 다음을 수행할 수 있습니다.
- 데이터 과학과 머신러닝에 대해 알아보세요.
- 데이터 분석을 살펴보세요.
- Kaggle에 대해 알아보고 작동 방식을 알아보세요.
KNIME 분석 플랫폼을 활용한 데이터 과학
21 시간KNIME 분석 플랫폼은 데이터 기반 혁신을 위한 선두 오픈 소스 옵션으로, 데이터에 숨겨진 잠재력을 발견하거나 새로운 통찰력을 발굴하거나 미래를 예측하는 데 도움을 줍니다. 1000개 이상의 모듈, 수백 개의 준비된 사례, 포괄적인 통합 도구와 가장 다양한 고급 알고리즘을 제공하여 KNIME 분석 플랫폼은 모든 데이터 과학자와 비즈니스 분석가에게 완벽한 도구 상자가 됩니다.
이 KNIME 분석 플랫폼 코스는 초보자, 중급 사용자, KNIME 전문가들에게 KNIME를 소개하고 이를 더욱 효과적으로 활용하며, KNIME 워크플로우를 기반으로 명확하고 포괄적인 보고서를 작성하는 방법을 배울 수 있는 이상적인 기회입니다.
이 강사 주도의 실시간 교육(온라인 또는 현장)은 KNIME를 사용하여 복잡한 비즈니스 요구사항을 해결하려는 데이터 전문가들을 대상으로 합니다.
프로그래밍에 익숙하지 않지만 최신 도구를 사용하여 분석 시나리오를 구현하고자 하는 사람들을 위한 프로그램입니다.
이 교육이 끝날 때 참가자들은 다음과 같은 능력을 갖추게 됩니다:
- KNIME를 설치하고 구성합니다.
- 데이터 과학 시나리오를 구축합니다.
- 모델을 훈련, 테스트 및 검증합니다.
- 데이터 과학 모델의 end-to-end 가치 사슬을 구현합니다.
코스 형식
- 대화형 강의 및 토론.
- 많은 실습과 연습.
- 실시간 랩 환경에서 직접 구현합니다.
코스 커스터마이징 옵션
- 이 코스의 맞춤형 교육을 요청하거나 프로그램에 대한 자세한 정보를 원하시면 연락주시기 바랍니다.
MATLAB 기초, 데이터 과학 및 보고서 생성
35 시간이 교육의 첫 번째 부분에서는 MATLAB의 기본 사항과 언어 및 플랫폼으로서의 기능을 다룹니다. 이 토론에는 MATLAB 구문, 배열 및 행렬, 데이터 시각화, 스크립트 개발 및 객체 지향 원칙에 대한 소개가 포함되어 있습니다.
두 번째 부분에서는 데이터 마이닝, 기계 학습 및 예측 분석에 MATLAB을 사용하는 방법을 보여줍니다. 참가자들에게 MATLAB의 접근 방식과 성능에 대한 명확하고 실용적인 관점을 제공하기 위해 MATLAB을 사용하는 것과 스프레드시트, C, C++ 및 Visual Basic과 같은 다른 도구를 사용하는 것을 비교합니다.
교육의 세 번째 부분에서 참가자는 데이터 처리 및 보고서 생성을 자동화하여 작업을 간소화하는 방법을 배웁니다.
과정 전반에 걸쳐 참가자들은 실습을 통해 배운 아이디어를 실험실 환경에서 실습하게 됩니다. 교육이 끝나면 참가자는 MATLAB의 기능을 철저하게 파악하고 이를 실제 데이터 과학 문제를 해결하고 자동화를 통해 작업을 간소화하는 데 사용할 수 있습니다.
진행 상황을 측정하기 위해 과정 전반에 걸쳐 평가가 실시됩니다.
코스의 형식
- 이 과정에는 사례 토론, 샘플 코드 검사 및 실습 구현을 포함한 이론 및 실습이 포함됩니다.
메모
- 연습 세션은 미리 준비된 샘플 데이터 보고서 템플릿을 기반으로 진행됩니다. 특정 요구 사항이 있는 경우 당사에 문의하여 준비하십시오.
파이썬 판다스 워크플로우를 모딘으로 가속화
14 시간대한민국에서 강사가 진행하는 이 실시간 교육(온라인 또는 현장)은 Modin을 사용하여 Pandas를 통해 더 빠른 데이터 분석을 위한 병렬 계산을 구축하고 구현하려는 데이터 과학자와 개발자를 대상으로 합니다.
이 교육을 마치면 참가자는 다음을 수행할 수 있습니다.
- Modin을 사용하여 대규모로 Pandas 워크플로 개발을 시작하는 데 필요한 환경을 설정하세요.
- Modin의 기능, 아키텍처 및 장점을 이해하세요.
- Modin, Dask, Ray의 차이점을 알아보세요.
- Modin을 사용하여 Pandas개의 작업을 더 빠르게 수행하십시오.
- 전체 Pandas API 및 기능을 구현합니다.
NVIDIA RAPIDS를 이용한 GPU 데이터 과학
14 시간이 인스트럭터-리드 라이브 트레이닝은 대한민국 (온라인 또는 오프라인) 에서 데이터 과학자 및 개발자가 GPU 가속 데이터 파이프라인, 워크플로우, 시각화, 그리고 XGBoost, cuML 등의 머신러닝 알고리즘을 사용하여 RAPIDS를 활용할 수 있도록 지원합니다.
이 트레이닝을 마친 후, 참가자는 다음을 할 수 있게 됩니다:
- NVIDIA RAPIDS로 데이터 모델을 구축하기 위한 개발 환경을 설정합니다.
- RAPIDS의 기능, 구성 요소, 그리고 장점을 이해합니다.
- GPU를 활용하여 데이터 및 분석 파이프라인을 가속화합니다.
- cuDF와 Apache Arrow를 사용하여 GPU 가속 데이터 준비 및 ETL을 구현합니다.
- XGBoost 및 cuML 알고리즘을 사용하여 머신러닝 작업을 수행하는 방법을 학습합니다.
- cuXfilter와 cuGraph를 사용하여 데이터 시각화 및 그래프 분석을 구축합니다.