Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
일별 주제 분류: (각 세션은 2시간입니다.)
1일차: 세션 -1: Business 이유 개요 Big Data Business Telco의 인텔리전스.
- T-Mobile, Verizon 등의 사례 연구
- Big Data 북미 통신사의 적응 비율 및 이들이 미래 비즈니스 모델과 운영을 어떻게 조정하고 있는지 Big Data BI
- 광범위한 응용 분야
- 네트워크 및 서비스 관리
- 고객 이탈 Management
- Data Integration 및 대시보드 시각화
- 사기 관리
- Business 규칙 생성
- 고객 프로파일링
- 현지화된 광고 푸시
Day-1: Session-2 : Big Data-1 소개
- Big Data의 주요 특징 - 볼륨, 다양성, 속도 및 진실성. 볼륨을 위한 MPP 아키텍처.
- Data Warehouses – 정적 스키마, 천천히 진화하는 데이터 세트
- Greenplum, Exadata, Teradata, Netezza, Vertica 등과 같은 MPP Database
- Hadoop 기반 솔루션 – 데이터 세트 구조에 대한 조건이 없습니다.
- 일반적인 패턴: HDFS, MapReduce(크런치), HDFS에서 검색
- 분석적/비대화형에 적합한 배치
- 볼륨 : CEP 스트리밍 데이터
- 일반적인 선택 - CEP 제품(예: Infostreams, Apama, MarkLogic 등)
- 적은 생산 준비 – Storm/S4
- NoSQL Databases – (열 및 키-값): 데이터 웨어하우스/데이터베이스에 대한 분석 보조물로 가장 적합합니다.
Day-1 : 세션 -3 : Big Data-2 소개
NoSQL 솔루션
- KV 스토어 - Keyspace, Flare, SchemaFree, RAMCloud, Oracle NoSQL Database (OnDB)
- KV 스토어 - Dynamo, Voldemort, Dynomite, SubRecord, Mo8onDb, DovetailDB
- KV 스토어(계층적) - GT.m, 캐시
- KV 스토어(주문) - TokyoTyrant, Lightcloud, NMDB, Luxio, MemcacheDB, Actord
- KV 캐시 - Memcached, Repcached, Coherence, Infinispan, EXtremeScale, JBoss캐시, Velocity, Terracoqua
- 튜플 저장소 - Gigaspaces, Coord, Apache River
- 객체 Database - ZopeDB, DB40, Shoal
- 문서 저장소 - CouchDB, Cloudant, Couchbase, MongoDB, Jackrabbit, XML-Databases, ThruDB, CloudKit, Prsevere, Riak-Basho, Scalaris
- 넓은 컬럼형 저장소 - BigTable, HBase, Apache Cassandra, Hypertable, KAI, OpenNeptune, Qbase, KDI
다양한 데이터: Big Data의 Data Cleaning 문제 소개
- RDBMS – 정적 구조/스키마는 민첩한 탐색 환경을 촉진하지 않습니다.
- NoSQL – 데이터를 저장하기 전에 정확한 스키마 없이 데이터를 저장하기에 충분한 반구조적 구조
- 데이터 정리 문제
Day-1 : 세션-4 : Big Data 소개-3 : Hadoop
- 언제 Hadoop를 선택하나요?
- 구조화 - 엔터프라이즈 데이터 웨어하우스/데이터베이스는 대규모 데이터를 저장할 수 있지만(유료) 구조를 부과합니다(활성 탐색에는 적합하지 않음)
- SEMI 구조화된 데이터 – 기존 솔루션(DW/DB)으로는 처리하기 어려움
- 데이터 보관 = 막대한 노력과 구현 후에도 정체됨
- 데이터의 다양성과 볼륨을 위해 상용 하드웨어에서 처리 – HADOOP
- Hadoop 클러스터를 생성하는 데 필요한 상용 하드웨어
맵 축소/HDFS 소개
- MapReduce – 여러 서버에 컴퓨팅 분산
- HDFS – 컴퓨팅 프로세스를 위해 로컬에서 데이터를 사용할 수 있도록 합니다(중복성 포함).
- 데이터 – 구조화되지 않거나 스키마가 없을 수 있습니다(RDBMS와 다름).
- 데이터를 이해하는 데 대한 개발자의 책임
- Programming MapReduce = Java 작업(장점/단점), 수동으로 HDFS에 데이터 로드
Day-2: 세션-1.1: Spark: In Memory 분산 데이터베이스
- "메모리 내" 처리란 무엇입니까?
- 스파크 SQL
- 스파크 SDK
- 스파크 API
- RDD
- 스파크 라이브러리
- 한나
- 기존 Hadoop 시스템을 Spark로 마이그레이션하는 방법
2일차 세션 -1.2: 폭풍 -Big Data의 실시간 처리
- 스트림
- 콩나물
- 볼트
- 토폴로지
2일차: 세션 2: Big Data Management 시스템
- 움직이는 부품, 컴퓨팅 노드 시작/실패 : ZooKeeper - 구성/조정/이름 지정 서비스용
- 복잡한 파이프라인/워크플로: Oozie – 워크플로, 종속성, 데이지 체인 관리
- 배포, 구성, 클러스터 관리, 업그레이드 등(sys admin) :Ambari
- 인 클라우드 : 윙윙
- 추적을 위한 진화하는 Big Data 플랫폼 도구
- ETL 계층 애플리케이션 문제
2일 차: 세션 3: Business Intelligence의 예측 분석 -1: 기본 기술 및 머신 러닝 기반 BI:
- 머신러닝 소개
- 분류 기술 학습
- 베이지안 예측 준비 훈련 파일
- 마르코프 랜덤 필드
- 감독 및 비지도 학습
- 특징 추출
- 서포트 벡터 머신
- 신경망
- 강화 학습
- Big Data 대규모 변수 문제 - 랜덤 포레스트(RF)
- 표현 학습
- 딥러닝
- Big Data 자동화 문제 – 다중 모델 앙상블 RF
- Soft10-M을 통한 자동화
- LDA 및 주제 모델링
- Agile 학습
- 에이전트 기반 학습 - Telco 운영의 예
- 분산 학습 – Telco 운영의 예
- 예측 분석을 위한 오픈 소스 도구 소개: R, Rapidminer, Mahut
- 더욱 확장성이 뛰어난 Analytic-Apache Hama, Spark 및 CMU 그래프 연구실
2일차: 세션 4 예측 분석 생태계-2: Telecom의 일반적인 예측 분석 문제
- 통찰력 분석
- 시각화 분석
- 구조화된 예측 분석
- 비정형 예측 분석
- 고객 프로파일링
- 추천 엔진
- 패턴 감지
- 규칙/시나리오 발견 – 실패, 사기, 최적화
- 근본 원인 발견
- 감성분석
- CRM 분석
- 네트워크 분석
- 텍스트 분석
- 기술 지원 검토
- 사기 분석
- 실시간 분석
Day-3: 세션-1: 네트워크 운영 분석 - 네트워크 오류의 근본 원인 분석, 메타데이터로 인한 서비스 중단, IPDR 및 CRM:
- CPU 사용량
- 메모리 사용량
- QoS 대기열 사용량
- 장치 온도
- 인터페이스 오류
- iOS 버전
- 라우팅 이벤트
- 지연 시간 변화
- Syslog 분석
- 패킷 손실
- 부하 시뮬레이션
- 토폴로지 추론
- 성능 임계값
- 장치 트랩
- IPDR(IP 상세기록) 수집 및 처리
- 가입자 대역폭 소비, 네트워크 인터페이스 활용, 모뎀 상태 및 진단을 위한 IPDR 데이터 사용
- HFC 정보
3일차: 세션 2: 네트워크 서비스 오류 분석 도구:
- 네트워크 요약 대시보드: 전체 네트워크 배포를 모니터링하고 조직의 핵심 성과 지표를 추적합니다.
- 피크 기간 분석 대시보드: 위치별 세분성을 통해 피크 활용도를 높이는 애플리케이션 및 가입자 추세를 이해합니다.
- 라우팅 효율성 대시보드: 상호 연결 및 전송 관계를 완벽하게 이해하여 네트워크 비용을 제어하고 자본 프로젝트에 대한 비즈니스 사례를 구축합니다.
- 실시간 엔터테인먼트 대시보드: 비디오 조회수, 지속 시간, 비디오 경험 품질(QoE) 등 중요한 지표에 액세스합니다.
- IPv6 전환 대시보드: 네트워크에서 진행 중인 IPv6 채택을 조사하고 추세를 주도하는 애플리케이션 및 장치에 대한 통찰력을 얻습니다.
- 사례 연구-1: Alcatel-Lucent Big Network Analytics(BNA) 데이터 마이너
- 다차원 모바일 지능(m.IQ6)
3일차: 세션 3: Big Data Marketing/영업을 위한 BI – 영업 데이터에서 영업/마케팅 이해: (모두 실시간 예측 분석 데모와 함께 표시됩니다.)
- 속도가 가장 빠른 클라이언트를 식별하려면
- 특정 제품에 대한 고객을 식별하기 위해
- 고객에게 적합한 제품 세트를 식별하기 위해(추천 엔진)
- 시장 세분화 기법
- 교차 판매 및 상향 판매 기술
- 클라이언트 세분화 기술
- 매출수익 예측기법
3일 차: 세션 4: Telco CFO 사무실에 필요한 BI:
- Business CFO 사무실에 필요한 분석 업무 개요
- 신규 투자에 대한 리스크 분석
- 매출, 이익예측
- 신규 고객 확보 예측
- 손실 예측
- 재정 사기 분석(자세한 내용은 다음 세션)
4일차: 세션 1: Telco-Fraud 분석에서 Big Data의 사기 예방 BI:
- 대역폭 누출/대역폭 사기
- 공급업체 사기/프로젝트에 대한 과다 청구
- 고객 환불/청구 사기
- 여행비 상환 사기
Day-4: 세션-2: 이탈 예측부터 이탈 방지까지:
- 이탈의 3가지 유형: 능동적/고의적, 순환적/부수적, 수동적 비자발적
- 이탈 고객의 3가지 분류: 전체, 숨김, 부분
- 이탈에 대한 CRM 변수 이해
- 고객 행동 데이터 수집
- 고객 인식 데이터 수집
- 고객 인구통계 데이터 수집
- CRM 데이터 정리
- 비정형 CRM 데이터(고객 통화, 티켓, 이메일) 및 이탈 분석을 위해 정형 데이터로 변환
- Social Media CRM - 고객 만족도 지수를 추출하는 새로운 방법
- 사례 연구-1 : T-Mobile USA: 고객 이탈률 50% 감소
Day-4 : 세션-3: 고객 불만족의 근본 원인 분석을 위한 예측 분석 활용 방법 :
- 사례 연구 -1 : 불만을 문제로 연결 – 회계, 서비스 중단과 같은 엔지니어링 실패, 대역폭 서비스 불량
- 사례 연구-2: Big Data 통화 에스컬레이션, 문제의 심각도, 보류 중인 서비스 중단 이벤트 등과 같은 다양한 매개변수에서 고객 만족도 지수를 추적하는 QA 대시보드.
Day-4: Session-4: Big Data 다양한 데이터 및 디스플레이에 대한 빠른 접근을 위한 대시보드 :
- Big Data 대시보드와 기존 애플리케이션 플랫폼의 통합
- Big Data 관리
- Big Data 대시보드 사례 연구: Tableau 및 Pentaho
- Big Data 앱을 사용하여 위치 기반 광고를 푸시하세요.
- 추적 시스템 및 관리
5일차: 세션 1: 조직 내에서 Big Data BI 구현을 정당화하는 방법:
- Big Data 구현을 위한 ROI 정의
- 분석가의 데이터 수집 및 준비 시간 절약에 대한 사례 연구 – 생산성 향상
- 고객 이탈로 인한 수익 증대 사례 연구
- 위치 기반 및 기타 타겟 광고를 통한 수익 창출
- 대략적인 계산을 위한 통합 스프레드시트 접근 방식입니다. Big Data 구현으로 인한 비용 대 수익 이득/절감.
Day-5: 세션-2: 레거시 데이터 시스템을 Big Data 시스템으로 교체하기 위한 단계별 절차:
- 실무 이해 Big Data 마이그레이션 로드맵
- Big Data 구현을 설계하기 전에 필요한 중요한 정보는 무엇입니까?
- 데이터의 양, 속도, 다양성 및 진실성을 계산하는 다양한 방법은 무엇입니까?
- 데이터 증가를 예측하는 방법
- 2 통신사 사례 연구
5일차: 세션 3 & 4: Big Data 공급업체 검토 및 해당 제품 검토. Q/A 세션:
- AccentureAlcatel-Lucent
- 아마존 –A9
- APTEAN(이전의 CDC 소프트웨어)
- Cisco 시스템
- 클라우데라
- 작은 골짜기
- EMC
- Go오드데이터 코퍼레이션
- 구아부스
- 히타치 데이터 시스템즈
- 호튼웍스
- 화웨이
- HP
- IBM
- 인포매티카
- 인텔
- 재스퍼소프트
- Microsoft
- MongoDB (이전의 10Gen)
- MU 시그마
- 넷앱
- 오페라 솔루션
- Oracle
- Pentaho
- 플라포라
- 클릭텍
- 양자
- 랙 공간
- 혁명 분석
- Salesforce
- SAP
- SAS 연구소
- 시스센스
- 소프트웨어 AG/테라코타
- Soft10 자동화
- Splunk
- Sqrrl
- 슈퍼마이크로
- Tableau 소프트웨어
- Teradata
- 빅 분석을 생각하세요
- 타이드마크 시스템
- VMware (EMC의 일부)
Requirements
- 해당 분야의 Telecom 사업 운영 및 데이터 시스템에 대한 기본 지식이 있어야 합니다.
- SQL/Oracle 또는 관계형 데이터베이스에 대한 기본적인 이해가 있어야 합니다.
- 통계에 대한 기본 이해(Excel 수준)
35 Hours
회원 평가 (3)
All the examples used and the lecturing style was on point even for a begginer i was able to understand and the training was so patient and always willing to go extra mile when in need of assistance.
Mathipa Chepape - Vodacom
Course - Big Data Business Intelligence for Telecom and Communication Service Providers
All the examples used and the lecturing style was on point even for a begginer i was able to understand and the training was so patient and always willing to go extra mile when in need of assistance.
Mathipa Chepape - Vodacom
Course - Big Data Business Intelligence for Telecom and Communication Service Providers
Understanding big data beter