문의를 보내주셔서 감사합니다! 팀원이 곧 연락드리겠습니다.
예약을 보내주셔서 감사합니다! 저희 팀 멤버 중 한 분이 곧 연락드리겠습니다.
코스 개요
일별 주제 분류: (각 세션은 2시간입니다.)
1일차: 세션 -1: Business 이유 개요 Big Data Business Telco의 인텔리전스.
- T-Mobile, Verizon 등의 사례 연구
- Big Data 북미 통신사의 적응 비율 및 이들이 미래 비즈니스 모델과 운영을 어떻게 조정하고 있는지 Big Data BI
- 광범위한 응용 분야
- 네트워크 및 서비스 관리
- 고객 이탈 Management
- Data Integration 및 대시보드 시각화
- 사기 관리
- Business 규칙 생성
- 고객 프로파일링
- 현지화된 광고 푸시
Day-1: Session-2 : Big Data-1 소개
- Big Data의 주요 특징 - 볼륨, 다양성, 속도 및 진실성. 볼륨을 위한 MPP 아키텍처.
- Data Warehouses – 정적 스키마, 천천히 진화하는 데이터 세트
- Greenplum, Exadata, Teradata, Netezza, Vertica 등과 같은 MPP Database
- Hadoop 기반 솔루션 – 데이터 세트 구조에 대한 조건이 없습니다.
- 일반적인 패턴: HDFS, MapReduce(크런치), HDFS에서 검색
- 분석적/비대화형에 적합한 배치
- 볼륨 : CEP 스트리밍 데이터
- 일반적인 선택 - CEP 제품(예: Infostreams, Apama, MarkLogic 등)
- 적은 생산 준비 – Storm/S4
- NoSQL Databases – (열 및 키-값): 데이터 웨어하우스/데이터베이스에 대한 분석 보조물로 가장 적합합니다.
Day-1 : 세션 -3 : Big Data-2 소개
NoSQL 솔루션
- KV 스토어 - Keyspace, Flare, SchemaFree, RAMCloud, Oracle NoSQL Database (OnDB)
- KV 스토어 - Dynamo, Voldemort, Dynomite, SubRecord, Mo8onDb, DovetailDB
- KV 스토어(계층적) - GT.m, 캐시
- KV 스토어(주문) - TokyoTyrant, Lightcloud, NMDB, Luxio, MemcacheDB, Actord
- KV 캐시 - Memcached, Repcached, Coherence, Infinispan, EXtremeScale, JBoss캐시, Velocity, Terracoqua
- 튜플 저장소 - Gigaspaces, Coord, Apache River
- 객체 Database - ZopeDB, DB40, Shoal
- 문서 저장소 - CouchDB, Cloudant, Couchbase, MongoDB, Jackrabbit, XML-Databases, ThruDB, CloudKit, Prsevere, Riak-Basho, Scalaris
- 넓은 컬럼형 저장소 - BigTable, HBase, Apache Cassandra, Hypertable, KAI, OpenNeptune, Qbase, KDI
다양한 데이터: Big Data의 Data Cleaning 문제 소개
- RDBMS – 정적 구조/스키마는 민첩한 탐색 환경을 촉진하지 않습니다.
- NoSQL – 데이터를 저장하기 전에 정확한 스키마 없이 데이터를 저장하기에 충분한 반구조적 구조
- 데이터 정리 문제
Day-1 : 세션-4 : Big Data 소개-3 : Hadoop
- 언제 Hadoop를 선택하나요?
- 구조화 - 엔터프라이즈 데이터 웨어하우스/데이터베이스는 대규모 데이터를 저장할 수 있지만(유료) 구조를 부과합니다(활성 탐색에는 적합하지 않음)
- SEMI 구조화된 데이터 – 기존 솔루션(DW/DB)으로는 처리하기 어려움
- 데이터 보관 = 막대한 노력과 구현 후에도 정체됨
- 데이터의 다양성과 볼륨을 위해 상용 하드웨어에서 처리 – HADOOP
- Hadoop 클러스터를 생성하는 데 필요한 상용 하드웨어
맵 축소/HDFS 소개
- MapReduce – 여러 서버에 컴퓨팅 분산
- HDFS – 컴퓨팅 프로세스를 위해 로컬에서 데이터를 사용할 수 있도록 합니다(중복성 포함).
- 데이터 – 구조화되지 않거나 스키마가 없을 수 있습니다(RDBMS와 다름).
- 데이터를 이해하는 데 대한 개발자의 책임
- Programming MapReduce = Java 작업(장점/단점), 수동으로 HDFS에 데이터 로드
Day-2: 세션-1.1: Spark: In Memory 분산 데이터베이스
- "메모리 내" 처리란 무엇입니까?
- 스파크 SQL
- 스파크 SDK
- 스파크 API
- RDD
- 스파크 라이브러리
- 한나
- 기존 Hadoop 시스템을 Spark로 마이그레이션하는 방법
2일차 세션 -1.2: 폭풍 -Big Data의 실시간 처리
- 스트림
- 콩나물
- 볼트
- 토폴로지
2일차: 세션 2: Big Data Management 시스템
- 움직이는 부품, 컴퓨팅 노드 시작/실패 : ZooKeeper - 구성/조정/이름 지정 서비스용
- 복잡한 파이프라인/워크플로: Oozie – 워크플로, 종속성, 데이지 체인 관리
- 배포, 구성, 클러스터 관리, 업그레이드 등(sys admin) :Ambari
- 인 클라우드 : 윙윙
- 추적을 위한 진화하는 Big Data 플랫폼 도구
- ETL 계층 애플리케이션 문제
2일 차: 세션 3: Business Intelligence의 예측 분석 -1: 기본 기술 및 머신 러닝 기반 BI:
- 머신러닝 소개
- 분류 기술 학습
- 베이지안 예측 준비 훈련 파일
- 마르코프 랜덤 필드
- 감독 및 비지도 학습
- 특징 추출
- 서포트 벡터 머신
- 신경망
- 강화 학습
- Big Data 대규모 변수 문제 - 랜덤 포레스트(RF)
- 표현 학습
- 딥러닝
- Big Data 자동화 문제 – 다중 모델 앙상블 RF
- Soft10-M을 통한 자동화
- LDA 및 주제 모델링
- Agile 학습
- 에이전트 기반 학습 - Telco 운영의 예
- 분산 학습 – Telco 운영의 예
- 예측 분석을 위한 오픈 소스 도구 소개: R, Rapidminer, Mahut
- 더욱 확장성이 뛰어난 Analytic-Apache Hama, Spark 및 CMU 그래프 연구실
2일차: 세션 4 예측 분석 생태계-2: Telecom의 일반적인 예측 분석 문제
- 통찰력 분석
- 시각화 분석
- 구조화된 예측 분석
- 비정형 예측 분석
- 고객 프로파일링
- 추천 엔진
- 패턴 감지
- 규칙/시나리오 발견 – 실패, 사기, 최적화
- 근본 원인 발견
- 감성분석
- CRM 분석
- 네트워크 분석
- 텍스트 분석
- 기술 지원 검토
- 사기 분석
- 실시간 분석
Day-3: 세션-1: 네트워크 운영 분석 - 네트워크 오류의 근본 원인 분석, 메타데이터로 인한 서비스 중단, IPDR 및 CRM:
- CPU 사용량
- 메모리 사용량
- QoS 대기열 사용량
- 장치 온도
- 인터페이스 오류
- iOS 버전
- 라우팅 이벤트
- 지연 시간 변화
- Syslog 분석
- 패킷 손실
- 부하 시뮬레이션
- 토폴로지 추론
- 성능 임계값
- 장치 트랩
- IPDR(IP 상세기록) 수집 및 처리
- 가입자 대역폭 소비, 네트워크 인터페이스 활용, 모뎀 상태 및 진단을 위한 IPDR 데이터 사용
- HFC 정보
3일차: 세션 2: 네트워크 서비스 오류 분석 도구:
- 네트워크 요약 대시보드: 전체 네트워크 배포를 모니터링하고 조직의 핵심 성과 지표를 추적합니다.
- 피크 기간 분석 대시보드: 위치별 세분성을 통해 피크 활용도를 높이는 애플리케이션 및 가입자 추세를 이해합니다.
- 라우팅 효율성 대시보드: 상호 연결 및 전송 관계를 완벽하게 이해하여 네트워크 비용을 제어하고 자본 프로젝트에 대한 비즈니스 사례를 구축합니다.
- 실시간 엔터테인먼트 대시보드: 비디오 조회수, 지속 시간, 비디오 경험 품질(QoE) 등 중요한 지표에 액세스합니다.
- IPv6 전환 대시보드: 네트워크에서 진행 중인 IPv6 채택을 조사하고 추세를 주도하는 애플리케이션 및 장치에 대한 통찰력을 얻습니다.
- 사례 연구-1: Alcatel-Lucent Big Network Analytics(BNA) 데이터 마이너
- 다차원 모바일 지능(m.IQ6)
3일차: 세션 3: Big Data Marketing/영업을 위한 BI – 영업 데이터에서 영업/마케팅 이해: (모두 실시간 예측 분석 데모와 함께 표시됩니다.)
- 속도가 가장 빠른 클라이언트를 식별하려면
- 특정 제품에 대한 고객을 식별하기 위해
- 고객에게 적합한 제품 세트를 식별하기 위해(추천 엔진)
- 시장 세분화 기법
- 교차 판매 및 상향 판매 기술
- 클라이언트 세분화 기술
- 매출수익 예측기법
3일 차: 세션 4: Telco CFO 사무실에 필요한 BI:
- Business CFO 사무실에 필요한 분석 업무 개요
- 신규 투자에 대한 리스크 분석
- 매출, 이익예측
- 신규 고객 확보 예측
- 손실 예측
- 재정 사기 분석(자세한 내용은 다음 세션)
4일차: 세션 1: Telco-Fraud 분석에서 Big Data의 사기 예방 BI:
- 대역폭 누출/대역폭 사기
- 공급업체 사기/프로젝트에 대한 과다 청구
- 고객 환불/청구 사기
- 여행비 상환 사기
Day-4: 세션-2: 이탈 예측부터 이탈 방지까지:
- 이탈의 3가지 유형: 능동적/고의적, 순환적/부수적, 수동적 비자발적
- 이탈 고객의 3가지 분류: 전체, 숨김, 부분
- 이탈에 대한 CRM 변수 이해
- 고객 행동 데이터 수집
- 고객 인식 데이터 수집
- 고객 인구통계 데이터 수집
- CRM 데이터 정리
- 비정형 CRM 데이터(고객 통화, 티켓, 이메일) 및 이탈 분석을 위해 정형 데이터로 변환
- Social Media CRM - 고객 만족도 지수를 추출하는 새로운 방법
- 사례 연구-1 : T-Mobile USA: 고객 이탈률 50% 감소
Day-4 : 세션-3: 고객 불만족의 근본 원인 분석을 위한 예측 분석 활용 방법 :
- 사례 연구 -1 : 불만을 문제로 연결 – 회계, 서비스 중단과 같은 엔지니어링 실패, 대역폭 서비스 불량
- 사례 연구-2: Big Data 통화 에스컬레이션, 문제의 심각도, 보류 중인 서비스 중단 이벤트 등과 같은 다양한 매개변수에서 고객 만족도 지수를 추적하는 QA 대시보드.
Day-4: Session-4: Big Data 다양한 데이터 및 디스플레이에 대한 빠른 접근을 위한 대시보드 :
- Big Data 대시보드와 기존 애플리케이션 플랫폼의 통합
- Big Data 관리
- Big Data 대시보드 사례 연구: Tableau 및 Pentaho
- Big Data 앱을 사용하여 위치 기반 광고를 푸시하세요.
- 추적 시스템 및 관리
5일차: 세션 1: 조직 내에서 Big Data BI 구현을 정당화하는 방법:
- Big Data 구현을 위한 ROI 정의
- 분석가의 데이터 수집 및 준비 시간 절약에 대한 사례 연구 – 생산성 향상
- 고객 이탈로 인한 수익 증대 사례 연구
- 위치 기반 및 기타 타겟 광고를 통한 수익 창출
- 대략적인 계산을 위한 통합 스프레드시트 접근 방식입니다. Big Data 구현으로 인한 비용 대 수익 이득/절감.
Day-5: 세션-2: 레거시 데이터 시스템을 Big Data 시스템으로 교체하기 위한 단계별 절차:
- 실무 이해 Big Data 마이그레이션 로드맵
- Big Data 구현을 설계하기 전에 필요한 중요한 정보는 무엇입니까?
- 데이터의 양, 속도, 다양성 및 진실성을 계산하는 다양한 방법은 무엇입니까?
- 데이터 증가를 예측하는 방법
- 2 통신사 사례 연구
5일차: 세션 3 & 4: Big Data 공급업체 검토 및 해당 제품 검토. Q/A 세션:
- AccentureAlcatel-Lucent
- 아마존 –A9
- APTEAN(이전의 CDC 소프트웨어)
- Cisco 시스템
- 클라우데라
- 작은 골짜기
- EMC
- Go오드데이터 코퍼레이션
- 구아부스
- 히타치 데이터 시스템즈
- 호튼웍스
- 화웨이
- HP
- IBM
- 인포매티카
- 인텔
- 재스퍼소프트
- Microsoft
- MongoDB (이전의 10Gen)
- MU 시그마
- 넷앱
- 오페라 솔루션
- Oracle
- Pentaho
- 플라포라
- 클릭텍
- 양자
- 랙 공간
- 혁명 분석
- Salesforce
- SAP
- SAS 연구소
- 시스센스
- 소프트웨어 AG/테라코타
- Soft10 자동화
- Splunk
- Sqrrl
- 슈퍼마이크로
- Tableau 소프트웨어
- Teradata
- 빅 분석을 생각하세요
- 타이드마크 시스템
- VMware (EMC의 일부)
요건
- 해당 분야의 Telecom 사업 운영 및 데이터 시스템에 대한 기본 지식이 있어야 합니다.
- SQL/Oracle 또는 관계형 데이터베이스에 대한 기본적인 이해가 있어야 합니다.
- 통계에 대한 기본 이해(Excel 수준)
35 시간
회원 평가 (3)
All the examples used and the lecturing style was on point even for a begginer i was able to understand and the training was so patient and always willing to go extra mile when in need of assistance.
Mathipa Chepape - Vodacom
코스 - Big Data Business Intelligence for Telecom and Communication Service Providers
All the examples used and the lecturing style was on point even for a begginer i was able to understand and the training was so patient and always willing to go extra mile when in need of assistance.
Mathipa Chepape - Vodacom
코스 - Big Data Business Intelligence for Telecom and Communication Service Providers
Understanding big data beter