Jupyter for Data Science Teams 교육 과정
Jupyter는 오픈 소스, 웹 기반 대화형 IDE 및 컴퓨팅 환경입니다.
이 강사가 진행하는 실시간 교육(온라인 또는 현장)에서는 데이터 과학의 공동 개발 아이디어를 소개하고 Jupyter를 사용하여 "컴퓨팅 아이디어의 수명 주기"에서 팀으로 추적하고 참여하는 방법을 보여줍니다. Jupyter 생태계를 기반으로 샘플 데이터 과학 프로젝트를 생성하는 과정을 참가자에게 안내합니다.
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- Git에서 팀 저장소 생성 및 통합을 포함하여 Jupyter를 설치하고 구성합니다.
- 확장 프로그램, 대화형 위젯, 다중 사용자 모드 등과 같은 Jupyter 기능을 사용하여 프로젝트 협업을 활성화하세요.
- 팀 구성원과 함께 Jupyter Notebook을 생성, 공유 및 구성합니다.
- Scala, Python, R 중에서 선택하여 Jupyter 인터페이스를 통해 Apache Spark과 같은 빅 데이터 시스템에 대한 코드를 작성하고 실행합니다.
코스의 형식
- 대화형 강의 및 토론.
- 많은 연습과 연습.
- 라이브 랩 환경에서 직접 구현합니다.
코스 맞춤화 옵션
- Jupyter Notebook은 R, Python, Scala, Julia 등을 포함하여 40개 이상의 언어를 지원합니다. 선택한 언어에 맞게 이 과정을 사용자 정의하려면 당사에 문의하여 예약하세요.
코스 개요
Jupyter 소개
- Jupyter와 그 생태계 개요
- 설치 및 설정
- 팀 협업을 위한 Jupyter 구성
협업 기능
- 버전 제어를 위해 Git 사용
- 확장 및 대화형 위젯
- 멀티유저 모드
노트북 만들기 및 관리
- 노트북 구조 및 기능
- 노트북 공유 및 구성
- 협업을 위한 모범 사례
Programming Jupyter를 사용하여
- 프로그래밍 언어 선택 및 사용 (Python, R, Scala)
- 코드 작성 및 실행
- 빅데이터 시스템과의 통합 (Apache Spark)
고급 Jupyter 기능
- Jupyter 환경 사용자 지정
- Jupyter를 사용하여 워크플로 자동화
- 고급 사용 사례 탐색
실습 세션
- 핸즈온 랩
- 실제 데이터 과학 프로젝트
- 그룹 연습 및 동료 평가
요약 및 다음 단계
요건
- Python, R, Scala 등과 같은 언어에 대한 Programming 경험.
- 데이터 과학 배경
청중
- 데이터 과학 팀
오픈 트레이닝 코스는 5명 이상의 참가자가 필요합니다.
Jupyter for Data Science Teams 교육 과정 - 예약
Jupyter for Data Science Teams 교육 과정 - 문의
Jupyter for Data Science Teams - 컨설팅 문의
컨설팅 문의
회원 평가 (1)
It is great to have the course custom made to the key areas that I have highlighted in the pre-course questionnaire. This really helps to address the questions that I have with the subject matter and to align with my learning goals.
Winnie Chan - Statistics Canada
코스 - Jupyter for Data Science Teams
예정된 코스
관련 코스
데이터 사이언스와 인공지능(AI) Python을 이용한 소개
35 시간데이터 과학과 인공지능(AI) 소개 5일 과정입니다.
이 과정은 Python을 사용하여 예제와 연습을 통해 제공됩니다.
Anaconda 데이터 과학자를 위한 에코시스템
14 시간대한민국에서 강사가 진행하는 이 라이브 교육(온라인 또는 현장)은 단일 플랫폼에서 패키지 및 데이터 분석 워크플로를 캡처, 관리, 배포하기 위해 Anaconda 에코시스템을 사용하려는 데이터 과학자를 대상으로 합니다.
이 교육을 마치면 참가자는 다음을 수행할 수 있습니다.
- Anaconda개의 구성 요소와 라이브러리를 설치하고 구성합니다.
- Anaconda의 핵심 개념, 기능 및 이점을 이해하세요.
- Anaconda Navigator를 사용하여 패키지, 환경 및 채널을 관리하세요.
- 데이터 과학 및 머신 러닝에는 Conda, R 및 Python 패키지를 사용합니다.
- 여러 데이터 환경을 관리하기 위한 몇 가지 실제 사용 사례와 기술을 알아보세요.
Big Data Business Intelligence for Telecom and Communication 서비스 제공업체
35 시간리뷰 보기
Communication의 서비스 제공 업체 (CSP)는 비용을 줄이고 사용자당 평균 수입 (ARPU)을 최대화하는 데 압박을 받고 있으며, 동시에 훌륭한 고객 경험을 보장하지만 데이터 볼륨은 계속 증가합니다. 글로벌 모바일 데이터 트래픽은 2016 년에 합성 연간 성장률 (CAGR)으로 성장하여 매월 10.8 exabytes에 도달 할 것입니다.
한편, CSP는 전화 세부 사항 기록 (CDR), 네트워크 데이터 및 고객 데이터를 포함하여 큰 양의 데이터를 생성하고 있습니다. 이 데이터를 완전히 활용하는 회사는 경쟁력있는 경계를 얻습니다. The Economist Intelligence Unit의 최근 설문 조사에 따르면 데이터 지향적 인 의사 결정을 사용하는 회사는 생산성 증가 5-6 %를 누리고 있습니다. 그럼에도 불구하고 회사의 53 %는 귀중한 데이터의 절반만 사용하고 있으며 응답자의 4 분의 1은 유용한 데이터의 엄청난 양이 실패한다고 지적했습니다. 데이터 볼륨은 너무 높아서 수동 분석은 불가능하며 대부분의 유산 소프트웨어 시스템은 유지할 수 없으며 귀중한 데이터가 무시되거나 무시됩니다.
Big Data & Analytics’ 고속, 확장 가능한 대형 데이터 소프트웨어로, CSP는 더 적은 시간 내에 더 나은 의사 결정을 위해 모든 데이터를 광산 할 수 있습니다. 다른 Big Data 제품 및 기술은 대형 데이터에 대한 인식을 수집, 준비, 분석 및 제시하기위한 최종 소프트웨어 플랫폼을 제공합니다. 응용 분야에는 네트워크 성과 모니터링, 사기 탐지, 고객 탐지 및 신용 위험 분석이 포함됩니다. Big Data & 분석 제품 스케일 데이터 테라비트를 처리하지만 이러한 도구의 구현은 클라우드 기반 데이터베이스 시스템의 새로운 유형을 필요로 Hadoop 또는 대규모 스케일 병렬 컴퓨팅 프로세서 (KPU 등)
이 과정은 Telco를위한 Big Data BI에서 작동하며 CSP가 생산성을 향상시키고 새로운 비즈니스 수입 흐름을 열기 위해 투자하는 모든 새로 나타나는 영역을 다루고 있습니다. 이 과정은 Telco에서 Big Data BI의 전체 360 학점을 제공하여 의사 결정자와 관리자가 생산성과 수익을 위해 Telco에서 Big Data BI의 가능성에 대한 매우 광범위하고 포괄적 인 통찰력을 가질 수 있도록합니다.
코스 목표
이 과정의 주요 목적은 Telecom Business의 4 분야에서 새로운 Big Data 비즈니스 인텔리전스 기술을 소개하는 것입니다 (Marketing/판매, 네트워크 운영, 금융 운영 및 고객 관계 Management). 학생들은 다음과 같이 소개됩니다 :
- 소개 Big Data-어떻게 4Vs (량, 속도, 다양성 및 진실성)에서 Big Data- 텔코 관점에서 생성, 추출 및 관리
- 어떻게 Big Data 분석은 유산 데이터 분석과 다릅니다
- 내부 정당화 Big Data -Telco 관점
- Hadoop 생태계에 대한 소개 - Hive, 돼지, SPARC와 같은 모든 Hadoop 도구에 대한 인식, 언제 그리고 어떻게 그들이 문제를 해결하는 데 사용되는지 Big Data
- 어떻게 Big Data 분석을 위해 추출되는 분석 도구-어떻게 Business Analysis’s 통증 포인트 수집 및 데이터 분석을 통합 Hadoop 다이어트 접근 방식을 통해 줄일 수 있는지
- Telco에 대한 Insight 분석, 시각화 분석 및 예측 분석의 기본 소개
- 고객 Churn 분석 및 Big Data-how Big Data 분석은 Telco 사례 연구에서 고객 Churn 및 고객 불만을 줄일 수 있습니다.
- 네트워크 실패 및 서비스 실패 분석 네트워크 메타 데이터 및 IPDR
- 금융 분석 - 사기, 납치 및 판매 및 운영 데이터에서 ROI 추정
- 고객 인수 문제-목표 마케팅, 고객 분류 및 판매 데이터의 크로스 판매
- 소개 및 모든 Big Data 분석 제품의 요약 및 그들이 Telco 분석 공간에 적합한 곳
- 결론 - 조직에 소개하기 위해 단계별 접근 방식을 취하는 방법 Big Data Business Intelligence
목표 관객
- 네트워크 운영, 금융 관리자, CRM 관리자 및 Telco CIO 사무실의 최고 IT 관리자.
- Business 텔코의 분석가
- CFO 사무실 관리자 / 분석가
- 운영 관리자
- QA 관리자
실용적인 데이터 과학 소개
35 시간이 교육을 완료한 참가자는 Data Science 및 관련 기술, 방법론, 도구에 대한 실제적이고 현실적인 이해를 얻게 됩니다.
참가자들은 실습을 통해 이 지식을 실천할 기회를 갖게 됩니다. 그룹 상호작용과 강사 피드백은 수업의 중요한 구성 요소를 구성합니다.
이 과정은 Data Science의 기본 개념 소개로 시작하여 Data Science에서 사용되는 도구와 방법론으로 진행됩니다.
청중
- 개발자
- 기술 분석가
- IT 컨설턴트
과정 형식
- 일부 강의, 일부 토론, 연습 및 집중적인 실습
메모
- 이 과정에 대한 맞춤형 교육을 요청하려면 당사에 연락하여 준비하세요.
데이터 사이언스 프로그램
245 시간오늘날 세계에서 정보와 데이터의 폭발적인 증가는 비교할 수 없을 만큼 증가하고 있으며, 혁신하고 가능성의 경계를 넓히는 우리의 능력은 그 어느 때보다 빠르게 성장하고 있습니다. 데이터 과학자의 역할은 오늘날 업계 전반에 걸쳐 가장 수요가 많은 기술 중 하나입니다.
우리는 이론을 통한 학습 이상의 것을 제공합니다. 우리는 학계와 산업계의 요구 사이의 격차를 해소하는 실용적이고 시장성이 있는 기술을 제공합니다.
이 7주 커리큘럼은 귀하의 특정 산업 요구 사항에 맞게 맞춤화될 수 있습니다. 자세한 내용은 당사에 문의하거나 Nobleprog Institute 웹사이트를 방문하십시오.
청중:
이 프로그램은 졸업 후 졸업생뿐만 아니라 평가와 인터뷰를 통해 결정되는 필수 사전 필수 기술을 갖춘 모든 사람을 대상으로 합니다.
배달:
이 과정은 강사가 진행하는 강의실과 강사가 진행하는 온라인이 혼합되어 제공됩니다. 일반적으로 첫 번째 주는 '교실 주도', 2~6주차는 '가상 교실', 7주차는 다시 '교실 주도'입니다.
빅 데이터 분석을 위한 데이터 사이언스
35 시간빅 데이터는 너무 방대하고 복잡한 데이터 세트로 전통적인 데이터 처리 응용 프로그램 소프트웨어가 처리하기에 부적합합니다. 큰 데이터 문제로는 데이터 캡처, 데이터 저장, 데이터 분석, 검색, 공유, 전송, 시각화, 쿼리, 업데이트 및 정보 프라이버시가 있습니다.
데이터 사이언스: 마케팅/판매 전문가를 위한 필수 요소
21 시간이 코스는 마케팅 및 판매 전문가가 데이터 사이언스 기술을 마케팅/판매에 적용하는 방법을 깊이 있게 이해하고자 하는 사람들에게 맞춤화되었습니다. 이 코스는 “업셀”, “크로스셀”, 시장 세분화, 브랜드 전략 및 CLV에 사용되는 다양한 데이터 사이언스 기법을 상세히 다루며,
마케팅과 판매의 차이점 - 판매와 마케팅은 어떻게 다른가요?
간단히 말하면, 판매는 개인을 대상으로 하는 과정입니다. 반면 마케팅은 더 넓은 그룹 또는 일반 대중을 대상으로 합니다. 마케팅에는 고객의 요구를 파악하는 연구, 혁신적인 제품을 생산하는 제품 개발, 광고를 통해 제품 홍보하고 소비자들에게 제품에 대한 인지도를 높이는 과정이 포함됩니다. 따라서 마케팅은 잠재 고객을 생성하는 것을 의미합니다. 제품이 시장에 출시되면 판매자의 역할은 고객이 제품을 구매하도록 설득하는 것입니다. 판매는 잠재 고객을 실제 구매로 전환하는 것을 의미하며, 마케팅은 장기적인 목표를, 판매는 단기적인 목표를 목표로 합니다.
데이터 사이언스 소개
35 시간이 강사는 온라인 또는 현장 강의로 제공되는 실시간 교육으로, 데이터 사이언스 분야에서 경력을 시작하고자 하는 전문가를 대상으로 합니다.
이 교육을 마친 후, 참가자들은 다음을 할 수 있게 됩니다:
- Python과 MySql을 설치하고 구성합니다.
- 데이터 사이언스가 무엇인지 이해하고, 이를 통해 거의 모든 비즈니스에 가치를 더할 수 있습니다.
- Python으로 코딩하는 기본 개념을 학습합니다.
- 감독 학습과 비감독 학습 기법을 배우고, 이를 구현하고 결과를 해석하는 방법을 학습합니다.
강좌 형식
- 상호작용적인 강의와 토론입니다.
- 많은 연습과 실습이 있습니다.
- 라이브 랩 환경에서 직접 구현합니다.
강좌 커스터마이징 옵션
- 이 강좌를 위한 맞춤형 교육을 요청하려면, 커스터마이징을 위한 연락처를 문의하세요.
Kaggle
14 시간대한민국에서 강사가 진행하는 이 실시간 교육(온라인 또는 현장)은 Kaggle을 사용하여 Data Science에서 학습하고 경력을 쌓고자 하는 데이터 과학자와 개발자를 대상으로 합니다.
이 교육을 마치면 참가자는 다음을 수행할 수 있습니다.
- 데이터 과학과 머신러닝에 대해 알아보세요.
- 데이터 분석을 살펴보세요.
- Kaggle에 대해 알아보고 작동 방식을 알아보세요.
MATLAB 기초, 데이터 과학 및 보고서 생성
35 시간이 교육의 첫 번째 부분에서는 MATLAB의 기본 사항과 언어 및 플랫폼으로서의 기능을 다룹니다. 이 토론에는 MATLAB 구문, 배열 및 행렬, 데이터 시각화, 스크립트 개발 및 객체 지향 원칙에 대한 소개가 포함되어 있습니다.
두 번째 부분에서는 데이터 마이닝, 기계 학습 및 예측 분석에 MATLAB을 사용하는 방법을 보여줍니다. 참가자들에게 MATLAB의 접근 방식과 성능에 대한 명확하고 실용적인 관점을 제공하기 위해 MATLAB을 사용하는 것과 스프레드시트, C, C++ 및 Visual Basic과 같은 다른 도구를 사용하는 것을 비교합니다.
교육의 세 번째 부분에서 참가자는 데이터 처리 및 보고서 생성을 자동화하여 작업을 간소화하는 방법을 배웁니다.
과정 전반에 걸쳐 참가자들은 실습을 통해 배운 아이디어를 실험실 환경에서 실습하게 됩니다. 교육이 끝나면 참가자는 MATLAB의 기능을 철저하게 파악하고 이를 실제 데이터 과학 문제를 해결하고 자동화를 통해 작업을 간소화하는 데 사용할 수 있습니다.
진행 상황을 측정하기 위해 과정 전반에 걸쳐 평가가 실시됩니다.
코스의 형식
- 이 과정에는 사례 토론, 샘플 코드 검사 및 실습 구현을 포함한 이론 및 실습이 포함됩니다.
메모
- 연습 세션은 미리 준비된 샘플 데이터 보고서 템플릿을 기반으로 진행됩니다. 특정 요구 사항이 있는 경우 당사에 문의하여 준비하십시오.
Machine Learning for Data Science with Python
21 시간이 강사 주도형, 실시간 교육은 온라인 또는 현장에서 진행되며, 중간 수준의 데이터 분석가, 개발자 또는 머신러닝 기법을 활용하여 통찰력을 얻고, 예측을 내리고, 데이터 기반의 결정을 자동화하고자 하는 잠재적인 데이터 과학자에게 적합합니다.
이 과정의 끝까지 참가자들은 다음과 같은 능력을 갖출 것입니다:
- 주요 머신러닝 패러다임을 이해하고 구별할 수 있습니다.
- 데이터 전처리 기술과 모델 평가 지표를 탐색할 수 있습니다.
- 머신러닝 알고리즘을 사용하여 실세계 데이터 문제를 해결할 수 있습니다.
- 핸즈온 개발을 위해 Python 라이브러리와 Jupyter 노트북을 사용할 수 있습니다.
- 예측, 분류, 추천 및 클러스터링을 위한 모델을 구축할 수 있습니다.
파이썬 판다스 워크플로우를 모딘으로 가속화
14 시간대한민국에서 강사가 진행하는 이 실시간 교육(온라인 또는 현장)은 Modin을 사용하여 Pandas를 통해 더 빠른 데이터 분석을 위한 병렬 계산을 구축하고 구현하려는 데이터 과학자와 개발자를 대상으로 합니다.
이 교육을 마치면 참가자는 다음을 수행할 수 있습니다.
- Modin을 사용하여 대규모로 Pandas 워크플로 개발을 시작하는 데 필요한 환경을 설정하세요.
- Modin의 기능, 아키텍처 및 장점을 이해하세요.
- Modin, Dask, Ray의 차이점을 알아보세요.
- Modin을 사용하여 Pandas개의 작업을 더 빠르게 수행하십시오.
- 전체 Pandas API 및 기능을 구현합니다.
금융을 위한 Python 프로그래밍
35 시간Python은 금융 업계에서 막대한 인기를 얻은 프로그래밍 언어입니다. 가장 큰 투자 은행과 헤지펀드들에 의해 채택되어, 주식 거래 프로그램부터 위험 관리 시스템까지 다양한 금융 애플리케이션을 구축하는 데 사용되고 있습니다.
이 강사 주도의 실시간 교육에서 참가자들은 Python을 사용하여 금융 관련 문제를 해결하기 위한 실제적인 애플리케이션을 개발하는 방법을 배우게 됩니다.
이 교육을 마치면 참가자들은 다음과 같은 능력을 갖추게 됩니다:
- Python 프로그래밍 언어의 기초를 이해하기
- Python으로 금융 애플리케이션을 개발하기 위한 최적의 개발 도구를 다운로드, 설치 및 유지보수하기
- 다양한 출처(CSV, Excel, 데이터베이스, 웹 등)에서 금융 데이터를 정리, 시각화, 분석하기 위해 가장 적합한 Python 패키지와 프로그래밍 기법을 선택하고 활용하기
- 자산 할당, 위험 분석, 투자 성과 등 다양한 문제를 해결하는 애플리케이션을 구축하기
- Python 애플리케이션의 오류 수정, 통합, 배포 및 최적화하기
대상
- 개발자들
- 분석가들
- 퀀트들
강의 형식
- 강의와 토론, 연습, 그리고 실전 프로그래밍을 병행
참고사항
- 이 교육은 금융 전문가들이 직면하는 주요 문제에 대한 해결책을 제공하기 위한 것입니다. 그러나 특정 주제, 도구, 또는 기법에 대해 추가하거나 더 깊게 다루기를 원하시다면, 연락주시기 바랍니다.
데이터 사이언스에서 Python 사용
35 시간이 교육 과정은 파이썬 프로그래밍을 활용한 웹 애플리케이션 개발과 데이터 분석을 위한 데이터 시각화 도구를 사용하여 참가자들이 준비할 수 있도록 돕습니다. 이러한 데이터 시각화는 의사 결정 과정에서 상급 관리진에게 매우 유용한 도구가 됩니다.
NVIDIA RAPIDS를 이용한 GPU 데이터 과학
14 시간이 인스트럭터-리드 라이브 트레이닝은 대한민국 (온라인 또는 오프라인) 에서 데이터 과학자 및 개발자가 GPU 가속 데이터 파이프라인, 워크플로우, 시각화, 그리고 XGBoost, cuML 등의 머신러닝 알고리즘을 사용하여 RAPIDS를 활용할 수 있도록 지원합니다.
이 트레이닝을 마친 후, 참가자는 다음을 할 수 있게 됩니다:
- NVIDIA RAPIDS로 데이터 모델을 구축하기 위한 개발 환경을 설정합니다.
- RAPIDS의 기능, 구성 요소, 그리고 장점을 이해합니다.
- GPU를 활용하여 데이터 및 분석 파이프라인을 가속화합니다.
- cuDF와 Apache Arrow를 사용하여 GPU 가속 데이터 준비 및 ETL을 구현합니다.
- XGBoost 및 cuML 알고리즘을 사용하여 머신러닝 작업을 수행하는 방법을 학습합니다.
- cuXfilter와 cuGraph를 사용하여 데이터 시각화 및 그래프 분석을 구축합니다.
