길벗·이지톡

도서 경제/경영 마케팅/세일즈

사람들이 말하는 것이 아니라 그들이 ‘하는’ 것을 믿어라!

구글 트렌드로 잡아낸 인간의 진짜 속마음

“사람의 생각을 연구하는 완전히 새로운 방법!”

_스티븐 핑커, 《우리 본성의 착한 천사》 저자

 

 

 

“모든 것이 데이터가 된다. 특히 거짓말이.”

숨겨진 세상을 읽는 아주 뜻밖의 방법

하버드대학교에서 경제학 박사 과정에서 세스 스티븐스 다비도위츠는 특정 검색어의 추세를 보여주는 ‘구글 트렌드’를 연구했다. 버락 오바마가 미국 대통령으로 당선되며 많은 전문가가 “이제 인종주의는 사라졌다”고 말하던 시절이었다. 그런데 데이터가 포착한 현실은 전혀 달랐다. 오바마가 대통령으로 당선된 날, 몇몇 주에서는 ‘최초의 흑인 대통령’보다 ‘깜둥이 대통령’을 더 많이 검색했고, 백인 우월주의 사이트는 검색과 가입이 열 배 늘었다. 그가 구글 데이터를 활용해 만든 ‘은밀한 인종주의’ 지도는 2008년 말 오바마의 경선 결과를 정확하게 재평가하고, 2016년 미국 대선에서 트럼프의 정치적 성공을 설명하는 데 매우 중요한 근거가 되었다.

 

 

그 많은 트럼프 지지자가 왜 선거 전까지 드러나지 않았을까? 유권자가 ‘실제로’ 누구에게 투표할지를 아는 건 왜 그렇게 어려울까? 그 이유는 바로, 사람들이 거짓말을 하기 때문이다.

 

 

 

사람의 생각을 연구하는 완전히 새로운 방법!

빅데이터 시대의 여명을 밝힌 슈퍼베스트셀러

사람들은 거짓말을 자주 한다. 의사, 친구, 연인, 설문조사원은 물론 자기 자신에게도 거짓말을 한다. 기업 엔지니어의 40퍼센트 이상이 자신의 실력이 상위 5퍼센트 안에 든다고 말하고, 대학교수의 90퍼센트 이상이 자신은 평균 이상의 성과를 낸다고 말한다. 고등학교 졸업생의 4분의 1은 자신의 사교성이 상위 1퍼센트에 든다고 여긴다. 이렇듯 사람들은 친구, 연인, 의사, 설문조사뿐 아니라 자기 자신에게도 거짓말을 한다.

 

 

《모두 거짓말을 한다》에서 전 구글 데이터과학자 세스 스티븐스 다비도위츠는 검색 데이터를 이용해 사람들의 숨겨진 진짜 욕망과 생각을 탐사한다. 이 책은 2018년 출간 즉시 《뉴욕타임스》 베스트셀러가 되었고 그해 아마존닷컴, 《이코노미스트》, ‘PBS 뉴스아워’ 등에서 ‘올해의 책’으로 선정되었다. 이 책은 인종주의뿐 아니라 정신질환, 성생활, 아동학대, 낙태, 광고, 종교, 건강 등 다양한 주제에 걸쳐 인간의 충격적인 본성을 거침없이 보여준다. 그리고 우리가 지금까지 알았던 인간과 사회에 관한 지식 대부분이 자기 자신마저 속이는 거짓말로 왜곡되어 있다는 것을 알려준다.

 

• 사람들은 섹스를 얼마나 많이 할까?

• 미국인 중 인종차별주의자는 실제로 얼마나 될까?

• 개인이 주식 시장을 조종할 수 있을까?

• 폭력적인 영화가 폭력 범죄 비율을 높일까?

• 부모들은 실제로 아들과 딸을 다르게 대할까?

• 남성 중 동성애자는 얼마나 많은가?

• 어떤 사람이 탈세를 하는가?

• 사는 곳에 따라 수명이 달라지는가?

• 광고는 효과가 있는가?


 

구글 검색이 그토록 귀중한 이유는 데이터가 많아서가 아니다. 사람들이 솔직한 생각을 내놓기 때문이다. 사람들은 다른 사람에게는 하지 않을 이야기를 구글, 네이버, 다음과 같은 거대 검색엔진에는 한다. 겉으로 드러나지 않을수록 밝혀지는 것도 많은데 대표적인 주제가 성생활이다. 구글에 드러난 결혼생활의 가장 큰 불만이 뭔지 아는가? 섹스를 하지 않는 것이다. ‘섹스 없는 결혼생활’이 ‘불행한 결혼생활’보다 3.5배 많이 검색되고 ‘사랑 없는 결혼생활’보다 8배 많이 검색된다. 그리고 대화하지 않는 배우자에 대한 불만보다 성관계를 원하지 않는 배우자에 대한 불만이 16배 많다. 결혼하지 않은 커플도 마찬가지다. 문자메시지에 답을 하지 않는 애인보다 성관계를 원하지 않는 애인에 대한 불만이 5.5배 많다. 그리고 그 불만은 놀랍게도 남자친구보다 여자친구 쪽에서 두 배 많다. ‘게이 포르노’와 ‘게이 테스트’를 번갈아 검색하며 자신의 성정체성에 혼란을 보이는 사람들도 구글에 포착된다. 모두 전통적 설문조사에서는 감춰졌던 모습이다.

 

 

모든 것이 데이터가 된다. 특히 거짓말이.

이 데이터다. 클릭이 데이터다. 링크가 데이터다. 오타가 데이터다.

꿈속 바나나가 데이터다. 어조가 데이터다. 숨소리가 데이터다.

심박이 데이터다. 비장의 크기가 데이터다. 사진 역시 데이터다.

그리고 검색어는 그 무엇보다 많은 것을 드러내주는 데이터다.

 

 

 

계속 속을 것인가, 진실을 볼 것인가?

검색창에 드러난 가장 사적인 욕망

사회과학 연구의 많은 부분이 사람들의 부정확한 보고 위에 세워진다. 실제로 많은 사람이 물리학, 생물학, 화학이 진정한 과학이고 심리학, 경제학, 사회학은 그렇지 않다고 생각한다.

 

 

데이터과학이 앞으로 무궁무진하게 활용될 수 있는 분야가 바로 사회과학이다. 데이터과학은 사회과학 이론을 검증 가능하게 만들어준다. 한 예로 2장 〈프로이트가 옳았을까?〉는 무의식적 욕구(특히 성적인 욕구)가 말실수로 드러난다는 ‘프로이트의 말실수’가 진짜인지 확인한다. 프로이트의 이론은 귀에 걸면 귀걸이, 코에 걸면 코걸이라는 비판을 받아왔다. 성적 욕구가 말실수로 새어 나온다는 ‘프로이트의 말실수’를 검증하기 위해 마이크로소프트 연구자들은 오타 데이터세트 4만 개를 모아 성적인 의미로 볼 수 있는 오타가 불균형적으로 많이 나타나는지 확인했다. 그 데이터세트에는 ‘rock’을 ‘cock(음경)’으로 ‘security’를 ‘sex(섹스)urity’라고 쓴 것도 있었지만 ‘window’를 ‘pindow’라고 쓴 것처럼 아무 의미 없는 실수도 있었다. 연구팀은 사람들과 똑같은 빈도로 문자를 바꿔 쓰는 로봇을 만들어 수많은 오타를 내보게 했고, 그 결과 성적으로 해석되는 실수는 우연으로 볼 수 있는 수준을 넘어서지 않음을 확인했다.

 

 

사회과학의 질문은 연구하기가 까다롭다. 폭력적인 영화가 개봉하면 범죄가 늘어날까? 광고는 효과가 있을까? 언론은 진보나 보수 쪽으로 편향되었을까? 거의 모든 주제에 관해 빅데이터를 모을 수 있게 된 지금은 데이터과학을 조금만 첨가하면 그 해답을 찾을 수 있다. 이제 더는 사람들이 ‘말하는’ 것에 의존할 필요가 없다. 새로운 데이터, 곧 수십억 명이 구글, 소셜미디어, 데이트 앱, 심지어 포르노 사이트에 남긴 정보의 흔적이 마침내 진실을 드러낸다. 이 디지털 광맥을 분석해 사람들이 정말로 무엇을 생각하고, 무엇을 원하는지, 그리고 그들이 정말로 무엇을 ‘하는지’ 알 수 있다.

 

목차

서문 사람의 생각을 연구하는 완전히 새로운 방법_스티븐 핑커

서론 빅데이터 혁명의 개요

 

1부 빅데이터와 스몰데이터

1장. 직감은 불완전하다

 

2부 빅데이터의 힘

2장. 프로이트가 옳았을까?

3장. 데이터를 보는 새로운 눈

신체 데이터 / 단어 데이터 / 사진 데이터

4장. 디지털 자백약

섹스에 관한 진실 / 증오와 편견에 관한 진실 / 인터넷에 관한 진실 / 아동학대와 낙태에 관한 진실 / 페이스북 친구에 관한 진실 / 고객에 관한 진실 / 진실을 어떻게 다뤄야 할 것인가?

5장. 클로즈업

우리 지역, 시, 마을에서는 정말로 어떤 일이 벌어지고 있나? / 우리는 시간을 어떻게 보내는가 / 도플갱어 찾기 / 데이터에는 이야기가 있다

6장. 온 세상이 실험실

A/B 테스트의 기초 / 잔인하지만 큰 깨달음을 주는 자연 실험

 

3부 빅데이터: 취급 주의

7장. 빅데이터로도 할 수 없는 일

차원의 저주 / 측정 가능한 것에 대한 지나친 집중

8장. 빅데이터로 하지 말아야 할 것

권력화된 기업에서 생기는 위험 / 권한을 부여받은 정부에서 비롯하는 위험

 

결론 얼마나 많은 사람이 책을 끝까지 읽을까?

 

더보기접기

저자

ㆍ지은이 세스스티븐스다비도위츠

지은이 소개
인터넷, 특히 구글 검색 데이터를 활용해 인간의 정신에 대한 새로운 통찰력을 보여준 전 구글 데이터과학자 출신 경제학자이자 저술가. 스탠퍼드대학교에서 철학 석사를 수석으로 졸업한 뒤 하버드대학교에서 경제학 박사 학위를 받았다. 박사과정에서 특정 검색어의 추세를 보여주는 ‘구글 트렌드’를 연구했다. 버락 오바마가 미국 대통령으로 당선되며 많은 전문가가 ‘이제 인종주의는 사라졌다’고 말하던 때였다. 그런데 데이터가 포착한 현실은 전혀 달랐다. 오바마가 대통령으로 당선된 날, 몇몇 주에서는 ‘최초의 흑인 대통령’보다 ‘깜둥이 대통령’을 더 많이 검색했고, 백인 우월주의 사이트는 검색과 가입이 열 배 늘었다. 세스 스티븐스 다비도위츠가 이 내용을 《퍼블릭이코노믹스저널》에 소개하자, 이를 본 구글은 그를 데이터과학자로 채용했다. 이후 그는 구글에서 커리어를 쌓으면서 펜실베이니아대학교 와튼스쿨의 객원 강사로 활동했으며, 인종차별, 낙태, 아들 선호, 우울증, 불안, 아동학대, 혐오, 유머, 성적 선호도, 성적 불안감 등에 관한 데이터를 측정해왔다. 2017년에 출간된 《모두 거짓말을 한다Everybody Lies》는 《뉴욕타임스》 베스트셀러이자 PBS ‘뉴스아워’ 올해의 책, 《이코노미스트》 올해의 책으로 선정되었으며, 전 세계적으로 크게 화제가 되었다. 2022년에는 ‘데이터가 어떻게 삶의 주요 결정을 내리는 방식을 바꾸는지’ 보여주는 후속작 《데이터는 어떻게 인생의 무기가 되는가Don’t Trust Your Gut》로 특유의 유머를 곁들인 분석력과 통찰을 다시 한번 선보였다. 뉴욕 브루클린에 살고 있으며, 《뉴욕타임스》에 기명 칼럼을 기고하고 있다. 메츠, 닉스, 제츠, 레너드 코언의 열렬한 팬이다.

ㆍ옮긴이 이영래

옮긴이 소개
이화여자대학교 법학과를 졸업하고 리츠칼튼 서울에서 리셉셔니스트로, 이수그룹 비서팀에서 비서로 근무했으며, 현재 번역에이전시 엔터스코리아에서 전문 번역가로 활동하고 있다. 주요 역서로 《파타고니아, 파도가 칠 때는 서핑을》 《움직임의 뇌과학》 《사업을 한다는 것》 《세대 감각》 등이 있다.

연관 프로그램

아래 프로그램은 길벗출판사가 제공하는 것이 아닙니다.
무료로 사용할 수 있는 정보를 안내해 드리니, 지원이 필요하면 해당 프로그렘 제작사로 문의해 주세요.