
소장정보
위치 | 등록번호 | 청구기호 / 출력 | 상태 | 반납예정일 |
---|---|---|---|---|
이용 가능 (1) | ||||
자료실 | E205638 | 대출가능 | - |
- 등록번호
- E205638
- 상태/반납예정일
- 대출가능
- -
- 위치/청구기호(출력)
- 자료실
책 소개
빅데이터 시대이다. 이것을 부정하는 사람은 거의 없을 것이다. 정보의 교류는 빨라졌고 정보의 양은 방대해졌다. 불과 몇 년전만 해도 아주 큰 IT기업에서만 전유물이였던 빅데이터를 다루는 기술들이 이제는 누구나 쉽게 다룰 수 있는 기술이 되어버렸다. 이런 시대 정 가운데는 강력하면서 무료툴인 "R"이 있다.
[R은 강력하다]
검색엔진 사이트의 검색어 단어 하나하나는 엄청난 가치를 부여되어 있다. 자신이 그 검색어 하나에 대한 지속적인 모니터링이 필요하다면 그것을 위한 비용과 시스템이 굉장히 많이 필요하다. 하지만 R이라면 자사와 관련된 검색어에 대한 모니터링을 할 수 있는 시스템을 쉽게 구성할 수 있다. 이것은 R이 가지고 있는 데이터형식을 제한 받지 않는 특성과 굉장히 빠른 속도로 데이터를 분석하는 능력 때문이다. 검색엔진의 검색결과 페이지이든 인터넷 게시판과 같은 비정형 데이터와 엑셀, 오라클과 같이 정형데이터도 그대로 불러들여 데이터를 분석하고 다양한 차트로 결과를 빠르게 보여줄 수 있다. 뿐만 아니라 구글맵과 연동하며 결과를 맵에 표시할 수 있기도 하다. 이 모두 이 책의 예제로 수록 되어 있다.
[R은 무료이다]
데이터 분석을 위해 많은 기업들은 엄청난 액수의 예산을 잡아야만 했다. 정보화 시대 그리고 빅데이터 시대에 이 비용은 불가피하며 꾸준한 예산 편성이 반드시 필요하다. 하지만 R은 그 비용을 거의 제로로 만들고 있다. 그 이유는 툴에 대한 사용 비용이 없고 유지관리를 위한 비용이 최소한이며 구축을 위한 비용이 다른 데이터 분석툴에 비해 현격히 적기 때문이다. 이렇게 된 이유는 R이 쉽게 누구나 사용할 수 있도록 만들어져 있고 무료툴이기 때문이다. 누구에게나 쉽다는것은 시스템을 구축하기에 비용이 많이 들지 않는다는 얘기이며 유지관리 또한 용이하며 비용이 많이 발생하지 않는다는 이유이다. 또한 누구나 쉽게 만들어 쉽게 분석하고 쉽게 보여줄 수 있어 데이터를 기반으로 경영이나 회의가 필요한 모든 분야에 탁월한 도구가 된다.
[프로그래머가 아닌 사람도 배우기 쉽다]
R도 프로그래밍 언어 중 하나이다. 하지만 프로그래밍을 전문적으로 배우지 않은 사람도 쉽게 배우고 이해할 수 있도록 되어 있다. 때문에 이 책의 예제를 따라 하다 보면 자연스럽게 R를 사용할 수 있게 될 것이다. 재밌게도 이 책은 예제를 먼저 배우고 나중에 문법을 배울 수 있도록 구성하였다. 예제를 통해 R에 대해 전체그림으로써 이해하고 나중에 디테일하게 문법을 배우는 방식이다. 때문에 질리지 않고 재밌게 공부할 수 있다.
목차
준비하기 14
1. 무엇을 왜 분석할 것인가? 14
2. 빅데이터(Big Data)와 R 18
3. R 프로그램 설치 하기 (윈도용 설치) 22
4. R 패키지 관리 28
R을 활용하여 실전 분석하기 32
1-1 비정형 데이터 35
1-1-1 Level1 비정형 데이터를 분석하여 Word Cloud 생성하기 35
예제1 제주도 여행코스를 검색하여 분석 후 Word Cloud 생성하기 35
예제2 프로포즈 선물을 검색하여 분석 후 Word Cloud 생성하기 50
미션1 연설문 분석 후 Word Cloud 생성하기 - 1 54
미션2 연설문을 분석해서 Word Cloud 생성하기-2 58
미션3 연설문을 분석해서 Word Cloud 생성하기-3 61
미션4 에러 로그를 분석하여 Word Cloud로 표현하기 64
미션5 에러 로그에서 특정 에러들만 골라내서 분석하기 67
미션6 공동구매 요청 테이블 분석해서 가장 인기있는 아이템 찾기 71
미션7 고객 불만 게시판 분석해서 불만 요인 파악하기 74
미션8 데이터베이스 관련 인터넷 카페의 질문사항 분석하기 78
미션9 서울시 홈페이지에서 시민참여 게시판 분석하기 82
1-1-2 Level 2 비정형 데이터로 다양한 그래프 그리기 86
예제3 제주도 여행코스를 검색하여 분석 후 그래프로 표시하기 86
예제4 프로포즈 선물을 검색하여 분석 후 그래프로 표시 하기 100
예제5 고객 불만 게시판 분석 후 그래프로 표시하기 108
미션10 대통령 당선 소감 발표문 분석 후 그래프로 표시하기 115
미션11 에러 로그에서 특정 에러들만 골라낸 후 그래프로 표시하기 119
1-2 정형 데이터 분석하기 122
1-2-1 Level 3 각종 정형 데이터를 분석하여 그래프로 표현하기 122
예제6 나라별 면적별 인구밀도 분석하여 차트로 표현하기 122
미션12 대중교통 수단별 이용현황을 분석하여 챠트로 표현하기 128
미션13 서울지하철 2호선 역별 이용인원수 현황을 분석후 챠트로 출력하기 131
미션14 라면가격 상승률과 소비자 물가 상승률 비교하기 133
미션15 Bar Chart 로 출력 135
미션16 Line Chart 로 출력하기 137
1-2-2 Level 4 구간 데이터(범위 데이터) 분석하기 139
예제7 서울의 온도변화 차트 그리기- Boxplot 사용 139
미션17 직원별 실적현황 분석 145
미션18 학생들의 성적 분석하기 149
미션19 실적 성취도 출력하기 151
미션20 Bar Chart 를 사용한 실적 성취도 출력하기 157
1-2-3 Level 5 지도 데이터 활용하기 160
예제8 서울 지역별 장애인도서관 위치 표시하기 160
예제9 지도상에 버블차트로 현황 표시하기 164
미션21 서울시 구청 위치 정보 표시하기 171
미션22 서울시 장난감 도서관 위치 지도에 출력하기 174
미션23 서울시 장난감 도서관 위치 지도에 출력하기 177
미션24 지도상의 각 위치를 선으로 연결하기 179
미션25 서울 지하철 3호선 경로 표시하기 181
1-2-4 Level 6: 움직이는 챠트 생성하기 184
예제10 google Motion Chart 사용하기 184
미션26 서울 지하철 1,2,3,4 호선 이용승객현황 출력하기 187
미션27 서울 지하철 2호선 강남역 시간대별 이용현황수 표현하기 190
1-2-5 Level 7 : 기존 RDBMS 와 연동하여 데이터 분석하기 192
예제11 Oracle 에 접속해서 데이터 가져오기 192
미션28 MySQL DBMS와 연동하기 196
R 기초 문법을 차근차근 203
2-1 R 에서 사용하는 기본 데이터 형 205
2-1-1 숫자형과 주요 산술연산자 205
2-1-2 문자형 206
2-1-3 TRUE / FALSE 값 (진리값) 206
2-1-4 NA 형 207
2-1-5 Factor 형 208
2-1-6 날짜와 시간 209
2-1-7 주석 214
2-2 변수와 함수 사용 하기 214
2-2-1 변수 214
2-2-2 함수 사용하기 216
2-2-3 벡터로 데이터 관리하기 220
2-2-4 행렬로 데이터 관리하기 - Matrix( ) 함수 사용 227
2-2-5 list로 데이터 관리하기 231
2-2-6 데이터 프레임을 사용하여 데이터 제어 하기 234
2-3 조건문과 반복문 사용하기 250
2-3-1 비교 조건에 사용되는 연산자 250
2-3-2 if 조건문 250
2-3-3 if ~ else if 문 사용하기 ( 조건이 3개 이상일 경우 ) 252
2-3-4 ifelse 문 252
2-3-5 for 반복문 255
2-3-6 여러 가지 조건 지정하기 256
2-4 입력과 출력 관리 256
2-4-1 scan( ) 함수로 텍스트 읽어 들이기 257
2-4-2 readline( )함수로 한 줄 읽어 들이기 258
2-4-3 readLines( ) 함수로 파일 읽어 들이기 259
2-4-4 read.table( ) / read.csv ( ) / read.delim( ) 함수로 파일 읽어 들이기 259
2-4-5 write.table( ) 함수로 파일에 저장하기 261
2-4-6 excel 파일 형식으로 저장하기 261
2-5 문자열 처리하기와 정규식 사용하기 262
2-5-1 grep( pattern,a) 262
2-5-2 nchar(a) 264
2-5-3 paste("a","b","c") 264
2-5-4 substr("a",시작위치,끝나는위치) 264
2-5-5 strsplit("문자열",split="기준문자") 265
2-5-6 regexpr("pattern",text) 265
2-6 R을 활용한 그래프 작성 입문하기 267
2-6-1 고수준 작도 함수 268
2-6-2 저 수준 작도 함수 사용하기 327
*동영상 자료 331