저자 해들리 위컴,개럿 그롤문드

ISBN 978-89-6626-354-7

정가 27,200원

관련 페이지 https://blog.insightbook.co...


R을 활용한 데이터 과학

Programming

R을 활용하여 원 데이터로부터 지식과 통찰을 끌어내는, 데이터 과학의 분석 기법을 알려주는 책이다. R, RStudio와 R 패키지 모음인 tidyverse를 중심으로, 데이터 분석을 빠르고 능숙하고 재미있게 작업할 수 있도록 설명한다. 또한 데이터 과학의 전반적인 과정을 다루는 동시에 R의 주요 도구들의 사용법도 상세히 설명하고 있어, 처음R을 접하는 독자들도 이 도구들을 사용해, 데이터 과학을 빠르게 수행할 수 있도록 이끌어준다.

지은이 | 해들리 위컴 (Hadley Wickham)
RStudio의 수석 과학자로서 30개가 넘는 R 패키지를 작성하였으며, 데이터 변형과 시각화에 관련된 도구를 개발하여 ‘John Chambers Award for Statistical Computing’을 수상하기도 하였다. 또한, 데이터 과학 분야에서 R 사용을 장려하는 작가이자 교육자인 동시에 영향력 높은 R 커뮤니티의 핵심 인물이기도 하다. 지은 책으로는 《해들리 위컴의 Advanced R》, 《R을 활용한 데이터 과학》, 《ggplot2》 등이 있다.

지은이 | 개럿 그롤문드 (Garrett Grolemund)
통계학자이면서 가르치는 일도 하고 있는 RStudio의 R 개발자다. 그는 데이터과학 분야야말로 산업 분야와 학계 전반에 기여할 큰 가능성이 잠재되어 있다고 말한다. 가렛은 라이스 대학교의 해들리 위크햄 연구실에서 박사학위를 받았다. 인식론적 과정을 통해 데이터과학의 근원적인 부분에 대해 연구했고, 주의적이고 인식론적인 관심사가 어떻게 데이터분석에 영향을 주는지 알아보았다.
데이터과학을 공부하면서 그가 맛보았던 좌절감과 불필요한 과정을 다른 사람들이 겪지 않도록 돕는 일에 매우 열심이다. 박사학위 논문을 마치기도 전에 벌써 레볼루션 애널리틱스에서 잘나가는 기업들을 대상으로 R과 데이터분석을 교육하는 일을 시작했다. 그는 구글, 이베이, 로슈를 비롯한 다른 많은 기업에서 교육을 진행해왔고, 현재 RStudio를 사용하는 유용한 노하우를 더 이해하기 쉽도록 교육 커리큘럼을 개발하는 일을 한다.
교육과 관련된 일 외에도, 가렛은 임상 실험 연구, 법률 연구, 재무 분석을 하며 시간을 보낸다. 물론 R 소프트웨어도 개발 중이다. 날짜/시간 값을 파싱하고, 쉽게 다루고, 산술 연산까지 가능하게 하는 R 패키지 lubridate를 공동 개발했다. 그리고 ggplot2의 확장 패키지인 ggsubplot을 개발했다.

옮긴이 | 김설기
서울대학교 통계학과에서 학부와 석사를 마치고 미국 케이스웨스턴 대학에서 생물통계 전공으로 박사학위를 받았다. 현재는 네이버에서 데이터 과학 업무를 하고 있으며, 일할 때 R과 다른 도구를 활용하고 있다.

옮긴이 | 최혜민
통계학을 전공하며 자연스레 R을 활용한 시각화와 프로그래밍에 관심을 두게 되었다. 현재는 SK텔레콤에서 데이터 분석 업무를 담당하고 있으며, 데이터에서 가치 있는 정보를 발굴하고 이를 활용할 수 있는 방안에 대해 고민하고 연구하고 있다.