Course Outline

일별 주제 분류: (각 세션은 2시간입니다.)

1일차: 세션 -1: Business 이유 개요 Big Data Business Telco의 인텔리전스.

  • T-Mobile, Verizon 등의 사례 연구
  • Big Data 북미 통신사의 적응 비율 및 이들이 미래 비즈니스 모델과 운영을 어떻게 조정하고 있는지 Big Data BI
  • 광범위한 응용 분야
  • 네트워크 및 서비스 관리
  • 고객 이탈 Management
  • Data Integration 및 대시보드 시각화
  • 사기 관리
  • Business 규칙 생성
  • 고객 프로파일링
  • 현지화된 광고 푸시

Day-1: Session-2 : Big Data-1 소개

  • Big Data의 주요 특징 - 볼륨, 다양성, 속도 및 진실성. 볼륨을 위한 MPP 아키텍처.
  • Data Warehouses – 정적 스키마, 천천히 진화하는 데이터 세트
  • Greenplum, Exadata, Teradata, Netezza, Vertica 등과 같은 MPP Database
  • Hadoop 기반 솔루션 – 데이터 세트 구조에 대한 조건이 없습니다.
  • 일반적인 패턴: HDFS, MapReduce(크런치), HDFS에서 검색
  • 분석적/비대화형에 적합한 배치
  • 볼륨 : CEP 스트리밍 데이터
  • 일반적인 선택 - CEP 제품(예: Infostreams, Apama, MarkLogic 등)
  • 적은 생산 준비 – Storm/S4
  • NoSQL Databases – (열 및 키-값): 데이터 웨어하우스/데이터베이스에 대한 분석 보조물로 가장 적합합니다.

Day-1 : 세션 -3 : Big Data-2 소개

NoSQL 솔루션

  • KV 스토어 - Keyspace, Flare, SchemaFree, RAMCloud, Oracle NoSQL Database (OnDB)
  • KV 스토어 - Dynamo, Voldemort, Dynomite, SubRecord, Mo8onDb, DovetailDB
  • KV 스토어(계층적) - GT.m, 캐시
  • KV 스토어(주문) - TokyoTyrant, Lightcloud, NMDB, Luxio, MemcacheDB, Actord
  • KV 캐시 - Memcached, Repcached, Coherence, Infinispan, EXtremeScale, JBoss캐시, Velocity, Terracoqua
  • 튜플 저장소 - Gigaspaces, Coord, Apache River
  • 객체 Database - ZopeDB, DB40, Shoal
  • 문서 저장소 - CouchDB, Cloudant, Couchbase, MongoDB, Jackrabbit, XML-Databases, ThruDB, CloudKit, Prsevere, Riak-Basho, Scalaris
  • 넓은 컬럼형 저장소 - BigTable, HBase, Apache Cassandra, Hypertable, KAI, OpenNeptune, Qbase, KDI

다양한 데이터: Big Data의 Data Cleaning 문제 소개

  • RDBMS – 정적 구조/스키마는 민첩한 탐색 환경을 촉진하지 않습니다.
  • NoSQL – 데이터를 저장하기 전에 정확한 스키마 없이 데이터를 저장하기에 충분한 반구조적 구조
  • 데이터 정리 문제

Day-1 : 세션-4 : Big Data 소개-3 : Hadoop

  • 언제 Hadoop를 선택하나요?
  • 구조화 - 엔터프라이즈 데이터 웨어하우스/데이터베이스는 대규모 데이터를 저장할 수 있지만(유료) 구조를 부과합니다(활성 탐색에는 적합하지 않음)
  • SEMI 구조화된 데이터 – 기존 솔루션(DW/DB)으로는 처리하기 어려움
  • 데이터 보관 = 막대한 노력과 구현 후에도 정체됨
  • 데이터의 다양성과 볼륨을 위해 상용 하드웨어에서 처리 – HADOOP
  • Hadoop 클러스터를 생성하는 데 필요한 상용 하드웨어

맵 축소/HDFS 소개

  • MapReduce – 여러 서버에 컴퓨팅 분산
  • HDFS – 컴퓨팅 프로세스를 위해 로컬에서 데이터를 사용할 수 있도록 합니다(중복성 포함).
  • 데이터 – 구조화되지 않거나 스키마가 없을 수 있습니다(RDBMS와 다름).
  • 데이터를 이해하는 데 대한 개발자의 책임
  • Programming MapReduce = Java 작업(장점/단점), 수동으로 HDFS에 데이터 로드

Day-2: 세션-1.1: Spark: In Memory 분산 데이터베이스

  • "메모리 내" 처리란 무엇입니까?
  • 스파크 SQL
  • 스파크 SDK
  • 스파크 API
  • RDD
  • 스파크 라이브러리
  • 한나
  • 기존 Hadoop 시스템을 Spark로 마이그레이션하는 방법

2일차 세션 -1.2: 폭풍 -Big Data의 실시간 처리

  • 스트림
  • 콩나물
  • 볼트
  • 토폴로지

2일차: 세션 2: Big Data Management 시스템

  • 움직이는 부품, 컴퓨팅 노드 시작/실패 : ZooKeeper - 구성/조정/이름 지정 서비스용
  • 복잡한 파이프라인/워크플로: Oozie – 워크플로, 종속성, 데이지 체인 관리
  • 배포, 구성, 클러스터 관리, 업그레이드 등(sys admin) :Ambari
  • 인 클라우드 : 윙윙
  • 추적을 위한 진화하는 Big Data 플랫폼 도구
  • ETL 계층 애플리케이션 문제

2일 차: 세션 3: Business Intelligence의 예측 분석 -1: 기본 기술 및 머신 러닝 기반 BI:

  • 머신러닝 소개
  • 분류 기술 학습
  • 베이지안 예측 준비 훈련 파일
  • 마르코프 랜덤 필드
  • 감독 및 비지도 학습
  • 특징 추출
  • 서포트 벡터 머신
  • 신경망
  • 강화 학습
  • Big Data 대규모 변수 문제 - 랜덤 포레스트(RF)
  • 표현 학습
  • 딥러닝
  • Big Data 자동화 문제 – 다중 모델 앙상블 RF
  • Soft10-M을 통한 자동화
  • LDA 및 주제 모델링
  • Agile 학습
  • 에이전트 기반 학습 - Telco 운영의 예
  • 분산 학습 – Telco 운영의 예
  • 예측 분석을 위한 오픈 소스 도구 소개: R, Rapidminer, Mahut
  • 더욱 확장성이 뛰어난 Analytic-Apache Hama, Spark 및 CMU 그래프 연구실

2일차: 세션 4 예측 분석 생태계-2: Telecom의 일반적인 예측 분석 문제

  • 통찰력 분석
  • 시각화 분석
  • 구조화된 예측 분석
  • 비정형 예측 분석
  • 고객 프로파일링
  • 추천 엔진
  • 패턴 감지
  • 규칙/시나리오 발견 – 실패, 사기, 최적화
  • 근본 원인 발견
  • 감성분석
  • CRM 분석
  • 네트워크 분석
  • 텍스트 분석
  • 기술 지원 검토
  • 사기 분석
  • 실시간 분석

Day-3: 세션-1: 네트워크 운영 분석 - 네트워크 오류의 근본 원인 분석, 메타데이터로 인한 서비스 중단, IPDR 및 CRM:

  • CPU 사용량
  • 메모리 사용량
  • QoS 대기열 사용량
  • 장치 온도
  • 인터페이스 오류
  • iOS 버전
  • 라우팅 이벤트
  • 지연 시간 변화
  • Syslog 분석
  • 패킷 손실
  • 부하 시뮬레이션
  • 토폴로지 추론
  • 성능 임계값
  • 장치 트랩
  • IPDR(IP 상세기록) 수집 및 처리
  • 가입자 대역폭 소비, 네트워크 인터페이스 활용, 모뎀 상태 및 진단을 위한 IPDR 데이터 사용
  • HFC 정보

3일차: 세션 2: 네트워크 서비스 오류 분석 도구:

  • 네트워크 요약 대시보드: 전체 네트워크 배포를 모니터링하고 조직의 핵심 성과 지표를 추적합니다.
  • 피크 기간 분석 대시보드: 위치별 세분성을 통해 피크 활용도를 높이는 애플리케이션 및 가입자 추세를 이해합니다.
  • 라우팅 효율성 대시보드: 상호 연결 및 전송 관계를 완벽하게 이해하여 네트워크 비용을 제어하고 자본 프로젝트에 대한 비즈니스 사례를 구축합니다.
  • 실시간 엔터테인먼트 대시보드: 비디오 조회수, 지속 시간, 비디오 경험 품질(QoE) 등 중요한 지표에 액세스합니다.
  • IPv6 전환 대시보드: 네트워크에서 진행 중인 IPv6 채택을 조사하고 추세를 주도하는 애플리케이션 및 장치에 대한 통찰력을 얻습니다.
  • 사례 연구-1: Alcatel-Lucent Big Network Analytics(BNA) 데이터 마이너
  • 다차원 모바일 지능(m.IQ6)

3일차: 세션 3: Big Data Marketing/영업을 위한 BI – 영업 데이터에서 영업/마케팅 이해: (모두 실시간 예측 분석 데모와 함께 표시됩니다.)

  • 속도가 가장 빠른 클라이언트를 식별하려면
  • 특정 제품에 대한 고객을 식별하기 위해
  • 고객에게 적합한 제품 세트를 식별하기 위해(추천 엔진)
  • 시장 세분화 기법
  • 교차 판매 및 상향 판매 기술
  • 클라이언트 세분화 기술
  • 매출수익 예측기법

3일 차: 세션 4: Telco CFO 사무실에 필요한 BI:

  • Business CFO 사무실에 필요한 분석 업무 개요
  • 신규 투자에 대한 리스크 분석
  • 매출, 이익예측
  • 신규 고객 확보 예측
  • 손실 예측
  • 재정 사기 분석(자세한 내용은 다음 세션)

4일차: 세션 1: Telco-Fraud 분석에서 Big Data의 사기 예방 BI:

  • 대역폭 누출/대역폭 사기
  • 공급업체 사기/프로젝트에 대한 과다 청구
  • 고객 환불/청구 사기
  • 여행비 상환 사기

Day-4: 세션-2: 이탈 예측부터 이탈 방지까지:

  • 이탈의 3가지 유형: 능동적/고의적, 순환적/부수적, 수동적 비자발적
  • 이탈 고객의 3가지 분류: 전체, 숨김, 부분
  • 이탈에 대한 CRM 변수 이해
  • 고객 행동 데이터 수집
  • 고객 인식 데이터 수집
  • 고객 인구통계 데이터 수집
  • CRM 데이터 정리
  • 비정형 CRM 데이터(고객 통화, 티켓, 이메일) 및 이탈 분석을 위해 정형 데이터로 변환
  • Social Media CRM - 고객 만족도 지수를 추출하는 새로운 방법
  • 사례 연구-1 : T-Mobile USA: 고객 이탈률 50% 감소

Day-4 : 세션-3: 고객 불만족의 근본 원인 분석을 위한 예측 분석 활용 방법 :

  • 사례 연구 -1 : 불만을 문제로 연결 – 회계, 서비스 중단과 같은 엔지니어링 실패, 대역폭 서비스 불량
  • 사례 연구-2: Big Data 통화 에스컬레이션, 문제의 심각도, 보류 중인 서비스 중단 이벤트 등과 같은 다양한 매개변수에서 고객 만족도 지수를 추적하는 QA 대시보드.

Day-4: Session-4: Big Data 다양한 데이터 및 디스플레이에 대한 빠른 접근을 위한 대시보드 :

  • Big Data 대시보드와 기존 애플리케이션 플랫폼의 통합
  • Big Data 관리
  • Big Data 대시보드 사례 연구: Tableau 및 Pentaho
  • Big Data 앱을 사용하여 위치 기반 광고를 푸시하세요.
  • 추적 시스템 및 관리

5일차: 세션 1: 조직 내에서 Big Data BI 구현을 정당화하는 방법:

  • Big Data 구현을 위한 ROI 정의
  • 분석가의 데이터 수집 및 준비 시간 절약에 대한 사례 연구 – 생산성 향상
  • 고객 이탈로 인한 수익 증대 사례 연구
  • 위치 기반 및 기타 타겟 광고를 통한 수익 창출
  • 대략적인 계산을 위한 통합 스프레드시트 접근 방식입니다. Big Data 구현으로 인한 비용 대 수익 이득/절감.

Day-5: 세션-2: 레거시 데이터 시스템을 Big Data 시스템으로 교체하기 위한 단계별 절차:

  • 실무 이해 Big Data 마이그레이션 로드맵
  • Big Data 구현을 설계하기 전에 필요한 중요한 정보는 무엇입니까?
  • 데이터의 양, 속도, 다양성 및 진실성을 계산하는 다양한 방법은 무엇입니까?
  • 데이터 증가를 예측하는 방법
  • 2 통신사 사례 연구

5일차: 세션 3 & 4: Big Data 공급업체 검토 및 해당 제품 검토. Q/A 세션:

  • AccentureAlcatel-Lucent
  • 아마존 –A9
  • APTEAN(이전의 CDC 소프트웨어)
  • Cisco 시스템
  • 클라우데라
  • 작은 골짜기
  • EMC
  • Go오드데이터 코퍼레이션
  • 구아부스
  • 히타치 데이터 시스템즈
  • 호튼웍스
  • 화웨이
  • HP
  • IBM
  • 인포매티카
  • 인텔
  • 재스퍼소프트
  • Microsoft
  • MongoDB (이전의 10Gen)
  • MU 시그마
  • 넷앱
  • 오페라 솔루션
  • Oracle
  • Pentaho
  • 플라포라
  • 클릭텍
  • 양자
  • 랙 공간
  • 혁명 분석
  • Salesforce
  • SAP
  • SAS 연구소
  • 시스센스
  • 소프트웨어 AG/테라코타
  • Soft10 자동화
  • Splunk
  • Sqrrl
  • 슈퍼마이크로
  • Tableau 소프트웨어
  • Teradata
  • 빅 분석을 생각하세요
  • 타이드마크 시스템
  • VMware (EMC의 일부)

Requirements

  • 해당 분야의 Telecom 사업 운영 및 데이터 시스템에 대한 기본 지식이 있어야 합니다.
  • SQL/Oracle 또는 관계형 데이터베이스에 대한 기본적인 이해가 있어야 합니다.
  • 통계에 대한 기본 이해(Excel 수준)
 35 Hours

Number of participants


Price per participant

회원 평가 (3)

Upcoming Courses

Related Categories