
소장정보
위치 | 등록번호 | 청구기호 / 출력 | 상태 | 반납예정일 |
---|---|---|---|---|
이용 가능 (1) | ||||
자료실 | E205389 | 대출가능 | - |
이용 가능 (1)
- 등록번호
- E205389
- 상태/반납예정일
- 대출가능
- -
- 위치/청구기호(출력)
- 자료실
책 소개
윤곽을 파악하고 업무에 활용한다! - 데이터 과학자와 분석가가 알아야 할 데이터 분석의 기초와 활용
요즘 IT 관련 매체뿐만 아니라 일반 미디어에서도 「빅데이터」라는 말이 거론되고 있다. 다만, 빅데이터의 존재 자체가 중요해서 일반 미디어에서도 거론되는 것은 아니다. 빅데이터가 이 정도로 주목 받게 된 배경에는 이를 분석해서 얻어지는 새로운 지식, 그리고 이를 기반으로 고안된 새로운 서비스가 앞으로의 사회를 변화시키지 않을까라는 기대감 때문이다. 즉, 빅데이터가 분석되어 이제 갓 도움이 되고 있는 것이다.
그렇다면 빅데이터를 분석하기 위기 위한 방법, 분석 시스템의 기반이 되는 기술이 최근에야 등장했는가라고 생각할 수 있지만, 결코 그렇지는 않다. 대부분은 빅데이터의 등장 이전부터 존재해서 활용되어온 것들이다.
그리고 빅데이터 분석이나 분석 시스템 구축에 직접적으로 관련이 없는 사람들에게도 이러한 방법이나 기술은 업무 또는 경영을 수행하면서 앞으로 더욱 중요해질 것이다. 반대로 말하면, 데이터 분석이나 데이터 분석 시스템의 내용에 대한 이해는 이미 일반적인 지식이 되어가고 있다는 것이다.
이 책은 이러한 데이터 분석 방법과 분석 시스템의 기반기술을 일반인도 이해할 수 있게 설명하는 것을 목적으로 집필되었다.
1장에서는 데이터 분석 방법과 분석 시스템의 기반기술의 전체 모습을, 2장에서는 데이터 분석의 기초지식을, 3~6장은 데이터 분석의 기본적인 방법을, 7~9장은 분석 시스템의 기반기술을 IT 전문지식이나 통계분석에 대한 지식이 없는 사람도 이해할 수 있도록 설명하고 있다. 또한 마지막으로 10장에서는 현재 크게 주목 받고 있는 빅데이터의 개념과 그 분석을 뒷받침하는 최신 시스템 기반기술을 다루고 있다.
독자대상
초중급
저자들은 데이터 분석 방법과 분석 시스템의 기반 기술을 일반인도 이해할 수 있게 설명하는 것을 목적으로 이 책을 집필했다.
이 책의 구성
1장. 데이터 분석의 개요
정보시스템이 보급, 발전되면서 비즈니스 환경에 따라 방대한 데이터를 얻을 수 있게 되고 이러한 데이터를 활용하기 위해 다양한 데이터 분석 방법이 사용되고 있다.
2장. 데이터 분석의 기초지식
데이터 분석에는 기하평균, 조화평균, 가중평균 등 다양한 평균이나 도수분포, 정규분포, 표준편차 등의 분포·편차를 사용한다. 이 장에서는 이들에 대한 이론을 예제와 함께 설명한다.
3장. 상관관계와 회귀 분석
이 장에서는 데이터 또는 속성값 사이의 다양한 상관관계를 수치화하고 분석하는 툴을 소개한다.
4장. 시계열 분석
이 장에서는 시간 경과에 따른 실적이나 경향의 변화를 분석하는 데 사용하는 툴과 방법론을 소개한다.
5장. 다차원 분석
이 장에서는 분석 대상이 되는 수치를 복수의 단면으로 분석하는 다차원 분석의 개요와 이용 방법을 소개한다.
6장. 시뮬레이션
이 장에서는 데이터의 속성이나 값을 시뮬레이션하는 What-If 분석, 선형 계획법 등을 소개한다.
7장. 데이터 마이닝
이 장에서는 대량의 데이터에서 보이지 않는 관련성이나 경향을 찾아내는 데이터 마이닝을 소개한다.
8장. 비즈니스 인텔리전스
BI에서는 기업의 업무를 PDCA 사이클의 단계별로 분석하고 활용하기 쉬운 형태로 제공한다.
9장. 데이터 웨어하우스
BI 툴을 이용한 분석에서는 이용 가능한 데이터를 저장하는 데이터 웨어하우스를 이용한다.
10장. 데이터 분석의 미래
현재, 데이터 분석이 예전보다 더 주목 받고 있는 배경에는 SNS, 휴대전화, 스마트폰, IC 카드의 보급에 따라 활용되기 시작한 빅데이터라는 존재가 있다.
요즘 IT 관련 매체뿐만 아니라 일반 미디어에서도 「빅데이터」라는 말이 거론되고 있다. 다만, 빅데이터의 존재 자체가 중요해서 일반 미디어에서도 거론되는 것은 아니다. 빅데이터가 이 정도로 주목 받게 된 배경에는 이를 분석해서 얻어지는 새로운 지식, 그리고 이를 기반으로 고안된 새로운 서비스가 앞으로의 사회를 변화시키지 않을까라는 기대감 때문이다. 즉, 빅데이터가 분석되어 이제 갓 도움이 되고 있는 것이다.
그렇다면 빅데이터를 분석하기 위기 위한 방법, 분석 시스템의 기반이 되는 기술이 최근에야 등장했는가라고 생각할 수 있지만, 결코 그렇지는 않다. 대부분은 빅데이터의 등장 이전부터 존재해서 활용되어온 것들이다.
그리고 빅데이터 분석이나 분석 시스템 구축에 직접적으로 관련이 없는 사람들에게도 이러한 방법이나 기술은 업무 또는 경영을 수행하면서 앞으로 더욱 중요해질 것이다. 반대로 말하면, 데이터 분석이나 데이터 분석 시스템의 내용에 대한 이해는 이미 일반적인 지식이 되어가고 있다는 것이다.
이 책은 이러한 데이터 분석 방법과 분석 시스템의 기반기술을 일반인도 이해할 수 있게 설명하는 것을 목적으로 집필되었다.
1장에서는 데이터 분석 방법과 분석 시스템의 기반기술의 전체 모습을, 2장에서는 데이터 분석의 기초지식을, 3~6장은 데이터 분석의 기본적인 방법을, 7~9장은 분석 시스템의 기반기술을 IT 전문지식이나 통계분석에 대한 지식이 없는 사람도 이해할 수 있도록 설명하고 있다. 또한 마지막으로 10장에서는 현재 크게 주목 받고 있는 빅데이터의 개념과 그 분석을 뒷받침하는 최신 시스템 기반기술을 다루고 있다.
독자대상
초중급
저자들은 데이터 분석 방법과 분석 시스템의 기반 기술을 일반인도 이해할 수 있게 설명하는 것을 목적으로 이 책을 집필했다.
이 책의 구성
1장. 데이터 분석의 개요
정보시스템이 보급, 발전되면서 비즈니스 환경에 따라 방대한 데이터를 얻을 수 있게 되고 이러한 데이터를 활용하기 위해 다양한 데이터 분석 방법이 사용되고 있다.
2장. 데이터 분석의 기초지식
데이터 분석에는 기하평균, 조화평균, 가중평균 등 다양한 평균이나 도수분포, 정규분포, 표준편차 등의 분포·편차를 사용한다. 이 장에서는 이들에 대한 이론을 예제와 함께 설명한다.
3장. 상관관계와 회귀 분석
이 장에서는 데이터 또는 속성값 사이의 다양한 상관관계를 수치화하고 분석하는 툴을 소개한다.
4장. 시계열 분석
이 장에서는 시간 경과에 따른 실적이나 경향의 변화를 분석하는 데 사용하는 툴과 방법론을 소개한다.
5장. 다차원 분석
이 장에서는 분석 대상이 되는 수치를 복수의 단면으로 분석하는 다차원 분석의 개요와 이용 방법을 소개한다.
6장. 시뮬레이션
이 장에서는 데이터의 속성이나 값을 시뮬레이션하는 What-If 분석, 선형 계획법 등을 소개한다.
7장. 데이터 마이닝
이 장에서는 대량의 데이터에서 보이지 않는 관련성이나 경향을 찾아내는 데이터 마이닝을 소개한다.
8장. 비즈니스 인텔리전스
BI에서는 기업의 업무를 PDCA 사이클의 단계별로 분석하고 활용하기 쉬운 형태로 제공한다.
9장. 데이터 웨어하우스
BI 툴을 이용한 분석에서는 이용 가능한 데이터를 저장하는 데이터 웨어하우스를 이용한다.
10장. 데이터 분석의 미래
현재, 데이터 분석이 예전보다 더 주목 받고 있는 배경에는 SNS, 휴대전화, 스마트폰, IC 카드의 보급에 따라 활용되기 시작한 빅데이터라는 존재가 있다.
목차
1장. 데이터 분석의 개요
1.1 데이터 분석의 개념
데이터 분석이란 무엇인가?
1.2 데이터 분석 시스템의 구성 요소
데이터 분석을 실현하는 다양한 IT 기술
2장. 데이터 분석의 기초 지식
2.1 기하평균
기업의 성장성 분석
2.2 조화평균
프로그램 개발 생산성 분석
2.3 가중평균
주식의 기대수익률 분석
2.4 도수분포와 히스토그램
점포 방문객수 분석
2.5 분산과 표준편차
생산 리드타임 분석
2.6 정규분포와 표준정규분포
재고의 발주점 계산
3장. 상관관계와 회귀 분석
3.1 산포도와 버블차트
재고의 편향을 분석한다
3.2 상관계수
추천상품을 분석한다
3.3 회귀 분석
가격탄력성을 분석한다
3.4 결정계수
앙케이트 결과에서 반복구매 고객을 찾는다
4장. 시계열 분석
4.1 Z 차트
사업부별 매출경향을 분석한다
4.2 팬 차트
성장률이 높은 상품을 분석한다
4.3 지수평활법
재고 수요를 예측한다
4.4 이동평균법
장래 유망한 사업 찾기
5장. 다차원 분석
5.1 다차원 분석
매출전망을 확실도 관점에서 분석한다
5.2 RFM 분석
고객을 그룹화해서 분석한다
5.3 세그먼트그룹별 손익분석
기업의 업적을 다각적으로 분석한다
6장. 시뮬레이션
6.1 What-If 분석
손익분기점을 시뮬레이션한다
6.2 선형 계획법
매출을 최대로 하는 생산계획을 세운다
6.3 주성분 분석
앙케이트 응답을 분류한다
7장. 데이터 마이닝
7.1 데이터 마이닝이란?
손익분기점을 시뮬레이션한다
7.2 어소시에이션 룰
동시에 발생하는 현상을 분석한다
7.3 시퀀스
다음 행동을 예측한다
7.4 클러스터
카테고리를 검출한다
7.5 디시전 트리
주요한 영향원을 분석한다
8장. 비즈니스 인텔리전스
8.1 PDCA 사이클과 BI
단계별로 다른 BI의 목적
8.2 PLAN 단계에서의 BI
계획의 근거를 얻는다
8.3 DO 단계에서의 BI
문제의 조짐을 발견한다
8.4 CHECK 단계에서의 BI
문제의 요인을 검증한다
8.5 ACT 단계에서의 BI
대처방안에 대한 힌트를 얻는다
8.6 마케팅 믹스와 BI
앙케이트 분석에서 프로모션 효과 측정까지
9장. 데이터 웨어하우스
9.1 데이터 웨어하우스란?
데이터 웨어하우스의 아키텍처
9.2 데이터 스테이징 영역
ETL 처리를 수행하는 데이터 영역
9.3 스타 스키마
데이터 웨어하우스의 표준 스키마
9.4 다차원 데이터베이스
OLAP 툴의 기반 데이터베이스
10장. 데이터 분석의 미래
10.1 빅데이터란?
보다 대량으로, 보다 실시간으로
10.2 빅데이터와 BI
사람의 손을 거치지 않고 자동화되는 BI
10.3 Hadoop MapReduce
빅데이터를 일괄적으로 고속 처리하는 구조
10.4 CEP
빅데이터를 실시간으로 처리하는 구조
10.5 빅데이터와 데이터 웨어하우스
빅데이터에 대응하는 3가지 접근방법
10.6 NoSQL 데이터베이스
비관계형 데이터베이스
10.7 컬럼형 데이터베이스
컬럼 단위 저장방식으로 고속 처리 실현
10.8 데이터 웨어하우스?어플라이언스
하드웨어 레벨의 고속화 기술