에너지경제연구원 전자도서관

로그인

에너지경제연구원 전자도서관

자료검색

  1. 메인
  2. 자료검색
  3. 신착자료

신착자료

단행본

(다양한 예제로 쉽게 배우는 R) R까기

저자
서진수
발행사항
서울 : 느린생각(Slow Thinking), 2014
형태사항
332 p. : 삽화 ; 26 cm
소장정보
위치등록번호청구기호 / 출력상태반납예정일
이용 가능 (1)
자료실E205638대출가능-
이용 가능 (1)
  • 등록번호
    E205638
    상태/반납예정일
    대출가능
    -
    위치/청구기호(출력)
    자료실
책 소개
이 책은 이 세상에 다양한 형태로 존재하는 빅데이터를 쉽고 빠르게 분석하고 각종 그래프나 워드 클라우드 등의 다양한 형태로 보여주는 강력한 무료 툴인 R 에 대해서 기술한 책이다. 지금까지의 대부분의 R 책들은 문법위주이거나 시각화 위주로 편중되어 있어서 어렵거나 실전에 활용하는 부분이 많이 부족했다. 그러나 이 책은 기초 문법과 시각화를 골고루 익힐 수 있도록 구성되어 있다. 특히 통계에 대한 전문 지식이나 자바에 대한 지식이 없어도 아주 쉽고 빠르게 배울 수 있게 되어 있으며 다양한 실전 예제와 미션들로 구성되어 있어서 각 단계를 따라 가다 보면 스스로 실력이 많이 늘어가는 것을 느낄 수 있을 것이다. R에 대한 재미와 실전 기술이라는 두 마리 토끼를 한번에 잡을 수 있는 책이다.

빅데이터 시대이다. 이것을 부정하는 사람은 거의 없을 것이다. 정보의 교류는 빨라졌고 정보의 양은 방대해졌다. 불과 몇 년전만 해도 아주 큰 IT기업에서만 전유물이였던 빅데이터를 다루는 기술들이 이제는 누구나 쉽게 다룰 수 있는 기술이 되어버렸다. 이런 시대 정 가운데는 강력하면서 무료툴인 "R"이 있다.

[R은 강력하다]
검색엔진 사이트의 검색어 단어 하나하나는 엄청난 가치를 부여되어 있다. 자신이 그 검색어 하나에 대한 지속적인 모니터링이 필요하다면 그것을 위한 비용과 시스템이 굉장히 많이 필요하다. 하지만 R이라면 자사와 관련된 검색어에 대한 모니터링을 할 수 있는 시스템을 쉽게 구성할 수 있다. 이것은 R이 가지고 있는 데이터형식을 제한 받지 않는 특성과 굉장히 빠른 속도로 데이터를 분석하는 능력 때문이다. 검색엔진의 검색결과 페이지이든 인터넷 게시판과 같은 비정형 데이터와 엑셀, 오라클과 같이 정형데이터도 그대로 불러들여 데이터를 분석하고 다양한 차트로 결과를 빠르게 보여줄 수 있다. 뿐만 아니라 구글맵과 연동하며 결과를 맵에 표시할 수 있기도 하다. 이 모두 이 책의 예제로 수록 되어 있다.

[R은 무료이다]
데이터 분석을 위해 많은 기업들은 엄청난 액수의 예산을 잡아야만 했다. 정보화 시대 그리고 빅데이터 시대에 이 비용은 불가피하며 꾸준한 예산 편성이 반드시 필요하다. 하지만 R은 그 비용을 거의 제로로 만들고 있다. 그 이유는 툴에 대한 사용 비용이 없고 유지관리를 위한 비용이 최소한이며 구축을 위한 비용이 다른 데이터 분석툴에 비해 현격히 적기 때문이다. 이렇게 된 이유는 R이 쉽게 누구나 사용할 수 있도록 만들어져 있고 무료툴이기 때문이다. 누구에게나 쉽다는것은 시스템을 구축하기에 비용이 많이 들지 않는다는 얘기이며 유지관리 또한 용이하며 비용이 많이 발생하지 않는다는 이유이다. 또한 누구나 쉽게 만들어 쉽게 분석하고 쉽게 보여줄 수 있어 데이터를 기반으로 경영이나 회의가 필요한 모든 분야에 탁월한 도구가 된다.

[프로그래머가 아닌 사람도 배우기 쉽다]
R도 프로그래밍 언어 중 하나이다. 하지만 프로그래밍을 전문적으로 배우지 않은 사람도 쉽게 배우고 이해할 수 있도록 되어 있다. 때문에 이 책의 예제를 따라 하다 보면 자연스럽게 R를 사용할 수 있게 될 것이다. 재밌게도 이 책은 예제를 먼저 배우고 나중에 문법을 배울 수 있도록 구성하였다. 예제를 통해 R에 대해 전체그림으로써 이해하고 나중에 디테일하게 문법을 배우는 방식이다. 때문에 질리지 않고 재밌게 공부할 수 있다.
목차

준비하기 14
1. 무엇을 왜 분석할 것인가? 14
2. 빅데이터(Big Data)와 R 18
3. R 프로그램 설치 하기 (윈도용 설치) 22
4. R 패키지 관리 28
R을 활용하여 실전 분석하기 32
1-1 비정형 데이터 35
1-1-1 Level1 비정형 데이터를 분석하여 Word Cloud 생성하기 35
예제1 제주도 여행코스를 검색하여 분석 후 Word Cloud 생성하기 35
예제2 프로포즈 선물을 검색하여 분석 후 Word Cloud 생성하기 50
미션1 연설문 분석 후 Word Cloud 생성하기 - 1 54
미션2 연설문을 분석해서 Word Cloud 생성하기-2 58
미션3 연설문을 분석해서 Word Cloud 생성하기-3 61
미션4 에러 로그를 분석하여 Word Cloud로 표현하기 64
미션5 에러 로그에서 특정 에러들만 골라내서 분석하기 67
미션6 공동구매 요청 테이블 분석해서 가장 인기있는 아이템 찾기 71
미션7 고객 불만 게시판 분석해서 불만 요인 파악하기 74
미션8 데이터베이스 관련 인터넷 카페의 질문사항 분석하기 78
미션9 서울시 홈페이지에서 시민참여 게시판 분석하기 82
1-1-2 Level 2 비정형 데이터로 다양한 그래프 그리기 86
예제3 제주도 여행코스를 검색하여 분석 후 그래프로 표시하기 86
예제4 프로포즈 선물을 검색하여 분석 후 그래프로 표시 하기 100
예제5 고객 불만 게시판 분석 후 그래프로 표시하기 108
미션10 대통령 당선 소감 발표문 분석 후 그래프로 표시하기 115
미션11 에러 로그에서 특정 에러들만 골라낸 후 그래프로 표시하기 119
1-2 정형 데이터 분석하기 122
1-2-1 Level 3 각종 정형 데이터를 분석하여 그래프로 표현하기 122
예제6 나라별 면적별 인구밀도 분석하여 차트로 표현하기 122
미션12 대중교통 수단별 이용현황을 분석하여 챠트로 표현하기 128
미션13 서울지하철 2호선 역별 이용인원수 현황을 분석후 챠트로 출력하기 131
미션14 라면가격 상승률과 소비자 물가 상승률 비교하기 133
미션15 Bar Chart 로 출력 135
미션16 Line Chart 로 출력하기 137
1-2-2 Level 4 구간 데이터(범위 데이터) 분석하기 139
예제7 서울의 온도변화 차트 그리기- Boxplot 사용 139
미션17 직원별 실적현황 분석 145
미션18 학생들의 성적 분석하기 149
미션19 실적 성취도 출력하기 151
미션20 Bar Chart 를 사용한 실적 성취도 출력하기 157
1-2-3 Level 5 지도 데이터 활용하기 160
예제8 서울 지역별 장애인도서관 위치 표시하기 160
예제9 지도상에 버블차트로 현황 표시하기 164
미션21 서울시 구청 위치 정보 표시하기 171
미션22 서울시 장난감 도서관 위치 지도에 출력하기 174
미션23 서울시 장난감 도서관 위치 지도에 출력하기 177
미션24 지도상의 각 위치를 선으로 연결하기 179
미션25 서울 지하철 3호선 경로 표시하기 181
1-2-4 Level 6: 움직이는 챠트 생성하기 184
예제10 google Motion Chart 사용하기 184
미션26 서울 지하철 1,2,3,4 호선 이용승객현황 출력하기 187
미션27 서울 지하철 2호선 강남역 시간대별 이용현황수 표현하기 190
1-2-5 Level 7 : 기존 RDBMS 와 연동하여 데이터 분석하기 192
예제11 Oracle 에 접속해서 데이터 가져오기 192
미션28 MySQL DBMS와 연동하기 196
R 기초 문법을 차근차근 203
2-1 R 에서 사용하는 기본 데이터 형 205
2-1-1 숫자형과 주요 산술연산자 205
2-1-2 문자형 206
2-1-3 TRUE / FALSE 값 (진리값) 206
2-1-4 NA 형 207
2-1-5 Factor 형 208
2-1-6 날짜와 시간 209
2-1-7 주석 214
2-2 변수와 함수 사용 하기 214
2-2-1 변수 214
2-2-2 함수 사용하기 216
2-2-3 벡터로 데이터 관리하기 220
2-2-4 행렬로 데이터 관리하기 - Matrix( ) 함수 사용 227
2-2-5 list로 데이터 관리하기 231
2-2-6 데이터 프레임을 사용하여 데이터 제어 하기 234
2-3 조건문과 반복문 사용하기 250
2-3-1 비교 조건에 사용되는 연산자 250
2-3-2 if 조건문 250
2-3-3 if ~ else if 문 사용하기 ( 조건이 3개 이상일 경우 ) 252
2-3-4 ifelse 문 252
2-3-5 for 반복문 255
2-3-6 여러 가지 조건 지정하기 256
2-4 입력과 출력 관리 256
2-4-1 scan( ) 함수로 텍스트 읽어 들이기 257
2-4-2 readline( )함수로 한 줄 읽어 들이기 258
2-4-3 readLines( ) 함수로 파일 읽어 들이기 259
2-4-4 read.table( ) / read.csv ( ) / read.delim( ) 함수로 파일 읽어 들이기 259
2-4-5 write.table( ) 함수로 파일에 저장하기 261
2-4-6 excel 파일 형식으로 저장하기 261
2-5 문자열 처리하기와 정규식 사용하기 262
2-5-1 grep( pattern,a) 262
2-5-2 nchar(a) 264
2-5-3 paste("a","b","c") 264
2-5-4 substr("a",시작위치,끝나는위치) 264
2-5-5 strsplit("문자열",split="기준문자") 265
2-5-6 regexpr("pattern",text) 265
2-6 R을 활용한 그래프 작성 입문하기 267
2-6-1 고수준 작도 함수 268
2-6-2 저 수준 작도 함수 사용하기 327
*동영상 자료 331