May 29, 2022
평소 데이터 분석과 시각화에 관심이 있다.
다만 관심만 있고, 아직 시작해본 것은 시각화에 대한 강의를 들어본 것이 끝이어서 더 공부해야할 필요를 느끼고 있었다.
또한 엑셀을 업무에서 많이 사용하는데, 이 책에서는 엑셀과 R을, 엑셀과 파이썬을 연관지어 어떻게 이용할 수 있는지에 대해 설명하는 것이 흥미로워서 읽게 되었다.
업무에서는 전달 받은 엑셀파일을 기반으로 코드 작업을 하는 것이어서, 엑셀 자체 내의 기능에 대해서는 자주 다루지 않았다.
그래서 데이터 분석을 위해서는 무언가 별도의 툴을 사용해야하는 줄 알았다.
하지만 위의 이미지와 같이 엑셀 자체 내의 기능만으로 피봇 테이블, 다중 그룹 히스토그램 등을 만들 수 있어서 흥미로웠다.
데이터 분석을 공부해보고 싶은 막연한 마음만 있을 뿐, 어디서부터 시작해야하는지에 대해 잘 생각을 안 해봤던 것 같다.
이 책에서는 엑셀, R, 파이썬을 사용하는 방법만 알려주는 것이 아닌, 데이터 분석을 하려면 알아야하는 각종 용어들(양측검증, p-값, 표준오차, 회귀 분석 등등)에 대해서도 자세히 알려주어서 좋았다.
엑셀 자체 내에서 데이터 분석도 가능하지만, 더 효율적인 분석을 위해서 R을 사용한다.
이 책에서는 R을 왜, 어떻게 사용하는지와 사용으로 얻을 수 있는 장점 들에 대해 자세히 다뤄져 있다.
데이터를 원하는 형태로 조작하고, 시각화를 할 수 있는 방법을 알려주는 것이 흥미로웠다.
또한 한 챕터를 마무리하는 과정에서 연습문제에 대한 데이터를 제공하고, 그에 대한 답까지 알려주었다.
보통 연습문제만 제공하고, 답은 주지 않는 경우도 많다는 점에서 이 책은 확실히 마무리를 할 수 있도록 도와주는 느낌을 받았다.
파이썬의 이용을 위해 기초적인 사용방법, 자료 구조에 대해 먼저 다룬다.
그 다음에는 파이썬으로 데이터 시각화와 분석을 하는 방법과 자세한 코드가 나온다.
이 부분 역시 R에서처럼 연습문제와 해답에 대해 자세히 다뤄져 있다.
데이터분석, 시각화를 하고 싶은데 어디서부터, 어떤 툴을 사용해서 시작할지가 막막한 분에게 추천한다.
이 책을 통해 기초적인 지식을 쌓고, 책의 내용을 충실히 따라간다면 이 책의 마지막에 나오는 것처럼 ‘지금쯤이면 여러분은 이 분석 단계에 꽤 익숙해져 있을 것입니다’ 처럼 될 것이다.
한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.