본문 바로가기

독서/자기계발

데이터 과학자의 사고법_김용대

출처 : http://www.yes24.com/Product/Goods/97696838

 


 어느덧 우리 귀에는 ‘4차 산업혁명’이라는 말이 익숙해졌다. 더 나아가 인공지능, 빅데이터, 3D 프린팅, 블록체인 등 새로운 단어들이 상식처럼 여겨진다.  4차 산업혁명 기술은 모두 데이터를 기반으로 운용되기 때문에 데이터는 핵심적인 부분이다.

 하지만 4차 산업혁명 속 ‘나’ 같은 일반인은 이미 전문가가 만들어놓은 데이터와 이 데이터를 이용해 만든 자료를 사용한다. 물론 이것으로도 충분할 수 있다. 그렇지만 과연 ‘이 자료를 무조건적으로 신뢰할 수 있을까?’에 대한 답은 물음표다. 

 과학기술이 발전할 수록 우리는 데이터의 홍수를 넘어 데이터의 바닷속을 헤엄치게 될 것이다. 도움이 되는 데이터도 있겠지만, 합리적인 판단을 방해하는 데이터도 있을 것이다.  그것을 구별하는 능력이 앞으로 미래사회에서 일반인들에게도 요구하는 능력이 아닐까 사려된다. 

 그런 의미에서 ‘데이터 과학자의 사고법’ 은 기초적인 통계 지식과 다양한 사례를 통해 데이터 사용의 중요성을 알려준다.  더하여 개인적으로 이 책에 흥미를 가졌던 이유는 데이터 과학을 이용해 미래를 예측하는 것이 재밌어 보였기 때문이다. 

 이 책은 현대 및 미래 사회의 핵심인 데이터를 총 3부에 걸쳐 소개한다. 

1부. 데이터 리터러시 : 숫자 없는 통계학

2부. 데이터의 활약상 : 세상만사의 데이터과학

3부. 인공지능 : 데이터과학의 새로운 도전

각 목차 별로 간단하게 요약하면 다음과 같다.

 1부는 통계학의 기초용어들을 실제 사례를 통해 알려준다. 그 예시로 ‘변호사의 오류’  사례와 거짓말 탐지기 정확도를 통해 조건부 확률이 무엇인지 알려준다.  이외에도 중심극한정리를 이야기하며 정규분포, 히스토그램의 역사를 얘기한다. 단순히 용어들의 정의를 서술하지 않고, 모든 것에 적용될 것이라 생각했던 중심극한정리가 왜 어떤 것은 적용이 안되는지에 대해서도 알려준다.

 1부가 비교적 과거에 데이터와 통계를 어떻게 사용했는지 얘기했다면,  2부는 현대가 중심이된다. 2부에서 데이터 과학은 분야를 가리지 않고 모든 곳에 쓰임을 알 수 있다. 책에서는 자연과학, 의료과학, 국가 통계, 선거, 금융, 마케팅, 제조업에서 왜 그리고 어떻게 데이터 과학이 쓰이는지 예시와 함께 친절히 설명해준다.

 3부는 데이터 과학의 꽃인 인공지능을 중심으로 얘기한다. 인공지능의 역사와 현재 인공지능이 얼마나 발전했는지를 알 수 있다. 이세돌을 이겼던 알파고는 이미 더 진화하여 인간의 도움을 전혀 받지 않고 규칙만으로 모든 기술을 스스로 학습하는 단계에 이르렀다고 한다. 
 
 너무 극도로 요약한 감이 있지만, 그만큼 재미있고 흥미로운 내용을 담고 있다.

 정보가 넘쳐나는 환경에 살고 있는 우리에게 생각치 못한 통찰을 주는 책이라고 생각한다. 주관적인 마음과 달리 감정이 없는 객관적인 데이터는 우리의 편견을 지워 새로운 열쇠를 쥐어준다. 
 물론 이것이 무조건 옳다고는 할 수 없을 것이다. 하지만 적어도 우리가 내린 결정에 대해 합리적이라고는 할 수 있을 것이다.

“ 데이터 과학은 옳은 의사결정을 해주는 학문이 아닙니다. 합리적인 의사결정에 대한 학문입니다. 옳은 의사결정을 알려주는 학문이나 기술은 단언컨대 없습니다.”