길벗·이지톡

도서 IT 전문서 프로그래밍/오픈소스
r

빅데이터 시대! 통계 프로그래밍 표준으로 떠오르는 R 언어를 배워보자!

강력하고 유연한 오픈 소스 R 언어
R은 강력하고 유연한 통계 프로그래밍 언어로 무료로 사용가능하다. 맥이나 윈도우, 리눅스 시스템에서 모두 동작하며 전문 통계학 종사자나 연구자들이 다양한 분야에서 사용하고 있는 표준이나 다름없는 언어이다. 또한 R은 SPSS나 SAS, Minitab과 같은 상용 통계 프로그램만큼 기능이 탄탄하고 통계와 그래픽에 관련된 기능을 확장할 수 있다. R은 고유한 언어 내장 프로그램 기능과 더 불어 수백 가지의 내장 통계 함수를 제공하며 패키지 대부분 무료로 사용할 수 있다. 더불어 최근 IT 업계에서 핫 이슈인 빅데이터 분석 도구로도 더욱 각광받고 있다!

R에 대한 최고의 내용을 최고의 전문가가 알려준다. 
현재 Keiser 대학의 대학원에서 연구 교수로 재직 중이며 통계학 박사 과정 학생들을 지도하고 있는 저자가 R 통계학 언어의 초급자 및 중급자를 위해 상세하고 친절한 설명을 곁들이고 있다. 어떻게 R을 구하고 설치하는지부터 명령어 기반 인터프리터 언어로 사용하는 방법과 프로그램 및 함수 작성법 그리고 다양한 통계학 분야에서 R을 적용하고 사용하는 방법에 대해 살펴본다. 또한 R 패키지를 만드는 방법에 대해서도 살펴본다. 그리고 부트스트래핑과 같은 새로운 통계학 기법과 더불어 R에서 어떻게 시뮬레이션을 수행하는지를 배워본다. 아울러 R 그래픽 사용자 인터페이스(R Gui)나 RStudio, RCommander와 같은 툴 사용법 역시 알아본다. 

이 책을 통해 배울 수 있는 것들 
R을 구해서 설치하는 방법
데이터나 스크립트를 가져오거나 내보내는 방법
기본적인 통계학 기능 사용 방법과 그래프 생성 방법
R 언어를 사용한 여러분만의 함수 작성 방법
데이터에 대한 여러 가지 통계학적 분석 및 해석 방법
시뮬레이션 구현과 그 외 여러 가지 고급 기법

목차

Chapter 01 R 시작하기

1-1 R을 설치하고 사용하기
1-2 R 입문
1-3 R 파고들기
1-4 R에서 데이터 처리하기
1-5 R에서 누락된 데이터 처리하기
1-6 결론


Chapter 02 R 프로그래밍

2-1 프로그래밍이란
2-2 프로그램 작성 준비
2-3 프로그래밍을 배우기 위한 요구 조건
2-4 프로그램의 실행 흐름 제어
2-5 R 프로그래밍의 핵심
2-6 처음으로 작성하는 R 프로그램
2-7 왜 R이 객체 지향 언어인가?
2-8 결론


Chapter 03 함수 만들기

3-1 기본적인 R 함수 코드를 이용하여 R 함수 만들기
3-2 함수 만들기
3-3 평균에 대한 신뢰 구간 계산
3-4 벡터화 연산을 통한 반복 구문 사용 피하기
3-5 ifelse() 함수를 사용하여 if-else 구문을 벡터화하기
3-6 좀 더 강력한 함수 만들기
3-7 Any, All, Which
3-8 좀 더 유용한 함수 만들기
3-9 신뢰 구간에 대한 고찰
3-10 결론


Chapter 04 요약 통계

4-1 중심성향(Central tendency) 측정
4-2 변동 측정
4-3 공분산과 상관
4-4 대칭도 측정(혹은 비대칭도 측정)
4-5 결론


Chapter 05 표와 그래프 만들기

5-1 도수 분포와 표
5-2 원형 도표와 막대 도표
5-3 박스 도표
5-4 히스토그램
5-5 선 그래프
5-6 산점도(혹은 산포도)
5-7 그래프 저장하고 사용하기
5-8 결론


Chapter 06 이산 확률 분포

6-1 이산 확률 분포
6-2 베르누이 프로세스
6-3 이항 분포 : 성공 횟수가 하나의 변수가 됨
6-4 포아송 분포
6-5 이산 확률을 정규 확률과 연결하기
6-6 결론


Chapter 07 정규 확률 계산

7-1 정규 분포의 특성
dnorm 함수를 사용해서 정규 밀도 구하기
7-2 정규 분포를 표준 정규 분포로 변환하기
7-3 pnorm 함수를 통한 확률 계산
7-4 qnorm 함수를 사용한 기각값 찾기
7-5 rnorm 함수를 사용하여 임의의 표본 구하기
7-6 표본 평균 분포
7-7 단일 표본 z 검증
7-8 결론


Chapter 08 신뢰 구간 만들기

8-1 평균에 대한 신뢰 구간
8-2 비율에 대한 신뢰 구간 계산
8-3 카이-제곱 분포 이해하기
8-4 분산과 표준 편차에 대한 신뢰 구간
8-5 평균 간의 차이에 대한 신뢰 구간
8-6 stats 패키지를 사용해서 신뢰 구간 구하기
8-7 결론


Chapter 09 t 검증

9-1 가설 검증에 대한 간략한 소개
9-2 t 분포 이해하기
9-3 단일 표본 t 검증
9-4 짝 표본 t 검증
9-5 두 표본 t 검증
9-6 t 검증에 있어서 효과 크기
9-7 결론


Chapter 10 일원 분산 분석

10-1 F 분포 이해하기
10-2 F 분포를 사용해서 분산 검증하기
10-3 Alpha와 사후 비교 조합
10-4 일원 분산 분석
10-5 anova 함수 사용하기
10-6 결론


Chapter 11 좀 더 복잡한 분산 분석

11-1 이원 분산 분석
11-2 반복 측정 분산 분석(Repeated-Measures ANOVA)
11-3 혼합 요인 분산 분석
11-4 결론


Chapter 12 상관과 회귀

12-1 공분산과 상관
12-2 회귀
12-3 예제 : 휘발유 가격 예측
12-4 신뢰와 예측 구간 결정
12-5 결론


Chapter 13 다중 회귀

13-1 다중 회귀 방정식
13-2 다중 회귀 예제 : 직업 만족도 예측
13-3 행렬 대수를 사용해서 회귀 방정식 풀기
13-4 일반 선형 모델에 대한 간략한 소개
13-5 다중 회귀 분석에 대한 더 많은 것
13-6 결론


Chapter 14 로지스틱 회귀 분석(Logistic regression)

14-1 로지스틱 회귀 분석이란 무엇인가?
14-2 양분된 하나의 독립 변수를 사용하는 로지스틱 회귀 분석
14-3 단일 연속 독립 변수를 사용하는 로지스틱 회귀 분석
14-4 여러 독립 변수를 사용한 로지스틱 회귀 분석
14-5 로지스틱 회귀와 다중 회귀의 차이
14-6 로지스틱 회귀 분석의 대안
14-7 결론


Chapter 15 카이-제곱(Chi-Square) 검증

15-1 카이-제곱 검증을 통한 적합도 검사
15-2 독립성에 대한 카이-제곱 검증
15-3 2×2 분할표(Contingency table)
15-4 카이-제곱과 표준 정규 분포의 관계
15-5 카이-제곱 검증에서 효과 크기
15-6 파이 계수와 상관 계수 사이의 연관성
15-7 결론


Chapter 16 비모수적 검증(Nonparametric Tests)

16-1 t 검증의 대안으로 사용될 수 있는 비모수적 기법
16-2 분산 분석의 대안으로 사용되는 비모수적 기법
16-3 상관 대안으로 사용할 수 있는 비모수적 기법
16-4 결론


Chapter 17 R에서 시뮬레이션 해보기

17-1 통계학적 시뮬레이션의 정의
17-2 임의의 수
17-3 샘플링과 리샘플링(Sampling and Resampling)
17-4 R에서 제공하는 수학적 기능 되짚어 보기
17-5 R의 시뮬레이션
17-6 결론


Chapter 18 새로운 통계 : 리샘플링과 부트스프래핑(Resampling and Bootstrapping)

18-1 가설 검증의 위험성
18-2 부트스트랩(Bootstrap)
18-3 Jackknifing
18-4 순열 검증(Permutation tests)
18-5 최근 제시되고 있는 강력한 통계학 기법들
18-6 결론


Chapter 19 R 패키지 만들기

19-1 패키지의 컨셉
19-2 윈도우 설정
19-3 R 패키지의 골격 만들기
19-4 R 문서 편집
19-5 패키지 만들고 검사하기
19-6 패키지 설치하기
19-7 패키지가 올바르게 동작하는지 검사하기
19-8 R 패키지 유지 보수
19-9 결론


Chapter 20 R Commander 패키지

20-1 R Commander 인터페이스
20-2 데이터 분석을 위한 R Commander 사용 예제
20-3 결론
더보기접기

저자

ㆍ지은이 Larry Pace

저자소개

통계학 관련 저자이자 교육자 그리고 컨설턴트로 활약하고 있다. 캐롤라이나 남쪽 앤더슨 타운에 살고 있다. 조지아 대학 심리측정(응용 통계학)에서 산업 및 조직 정신학으로 박사 학위를 받았으며, 책이나 기고문, 컬럼 등에 100편이 넘는 글을 기재하였다. 35년에 걸친 연구 경력 외에도 심리 상담자이자 제록스의 조직 효율성 매니저, 개인 컨설팅 회사의 조직 개발 컨설턴트로서 일했다. FORTRAN-IV, 베이직, APL, C++, 자바스크립트, 비주얼 베이직, PSP, ASP 등 다양한 언어의 프로그래밍 능력을 갖추고 있다. 교육이나 연구, 서비스에 관련된 수상 내역이 많으며, 현재 Keiser 대학의 대학원에서 통계학 및 연구에 관련하여 박사 과정 학생들을 지도하고 있다. 더불어 Clemson 대학에서도 수업을 진행하고 있다. 그 외 시간에는 통계학 분석을 돕거나 통계학을 가르치고 연구한다.  다양한 통계학 분석에 관련된 모델을 스프레드시트로 작성하기도 하고, 텃밭을 가꾸거나 기타를 치거나 요리를 하며 시간을 보낸다.

ㆍ그림 박수현

저자소개

홍익대학교에서 컴퓨터 공학을 전공하였으며 게임이나 웹 프로그래밍, 이진 프로그램 변환, 시스템 보안 등 다양한 분야에서의 개발 경험을 보유하고 있다. 최근에는 안드로이드 시스템 관련 연구 분야에 큰 흥미를 가지고 있으며 관련 연구를 진행 중이다. 또한 대학에서 XML, ASP등의 과목을 가르치고 있다. 현재 홍익대학교 컴퓨터공학과에서 박사 과정을 밟고 있으며 연구 주제는 모바일 및 클라우드 컴퓨팅 시스템 보안이다.

연관 프로그램

아래 프로그램은 길벗출판사가 제공하는 것이 아닙니다.
무료로 사용할 수 있는 정보를 안내해 드리니, 지원이 필요하면 해당 프로그렘 제작사로 문의해 주세요.