이데일리 TV 통합검색 검색

사업배너영역

뉴스

'검색창'만 안다 내가 오늘 누굴 찍을지

입력시간 | 2018.06.13 00:12 | 오현주 부장 euanoh@

누구에게도 절대 꺼내지 못할 속내를 검색창에는 털어놓는다. 미국 데이터과학자인 세스 스티븐스 다비도위츠는 “검색어 수백만 개를 모았더니 한 개인의 심오한 대서사가 되더라”며 사람들은 밥 먹듯 거짓말을 해대는데 그것을 모은 여론조사에만 의존하는 사회과학의 현실을 꼬집는다(사진=이데일리 디자인팀).



[이데일리 오현주 문화전문기자] ‘지난여름 당신이 한 일’ 정도가 아니다. 짧게는 하루, 길게는 몇 십년치가 될 거다. 정작 당사자는 기억조차 못하는 그것을 알고 있단다. 누가? 어떻게? 작고 길고 허옇게 구멍이 뚫린 네모막대, ‘검색창’이다.

‘키보드로 얻은 익명성 덕분’이라고 했다. 사람들은 이 네모막대에 대고 대단히 정치적이고 사적인 고백을 해대는 거다. 어디가 아픈지, 누구를 좋아하는지, 오늘 무엇을 살지, 주말에 어디를 갈지, 뭘 먹을 건지. 이뿐인가. 어느 학교로 진학할 거며, 얼마짜리 셋방에서 살고 있는지. 그러다가 종국엔 이번 선거에서 누구를 찍을지까지.

일기처럼 써대기야 하겠는가. 뚝뚝 끊어지는 검색어뿐이다. 그런데 이것을 수백만 개 모아놨더니 장구하고 심오한 대서사가 되더란 거다. 누구에게도 절대 꺼내놓지 못할 속내를 검색엔진에는 죄다 털어놓고 있지 않은가. 이보다 솔직할 수 없다. 두려움도 없고 수치심도 없고.

웹에서 화산재처럼 뿜어나오는 빅데이터. 다들 그러려니 넘겼을 이것에 유독 관심을 가진 이가 있다. 데이터과학자이자 인터넷데이터전문가인 저자다. 그는 늘 사람의 뒤를 캔다. 웹에서다. 그들이 종횡무진 휘젓고 다니며 남긴 디지털발자국을 좇는 것이다. 그러곤 그렇게 쌓은 빅데이터야말로 사람심리를 엿보는 아주 신선한 방법이라고 했다.

예상은 적중했다. 가령 세세한 개인사를 잔뜩 들추는 질문지가 턱밑에 놓였다고 치자. 어느 바보가 진정성을 실어 대답하겠는가. 그런데 웹 세상에선 부탁도 받지 않은 그 일을 스스로 까놓는 진짜 바보가 된다는 거다. 그러니 21세기 사회과학이 나아갈 새로운 길을 열었다고 호언할 만도 하다. 다만 남은 문제는 ‘설마’를 뒷받침할 ‘얼마나’가 될 터. 책은 그에 관한 적나라한 결과물이다. 엄청 흥미롭지만 참으로 참담한.

△‘날씨’보다 더 검색하는 ‘포르노’

오늘의 날씨, 내일의 날씨. 이만큼 수시로 찾고 들여다보는 내용이 있겠나. 그런데 ‘날씨’보다 더 많이 검색하는 게 있다는데, ‘포르노’란다. 검색엔진 중 압도적으로 구글을 이용하는 미국인 얘기다. 남성 25%, 여성 8%만이 포르노를 본다고 인정한 설문조사와는 완전히 다른 결과다. 사실 저자가 ‘심혈을 기울인’ 분야가 ‘섹스’다. 개인적 취향? 아니다. 구글 검색창에 가장 많이 오르내리는 주제어기 때문이란다. 일관되게 ‘섹스 횟수’를 부풀리지만 돌아서선 ‘섹스 없는 결혼생활’에 연연한다. 남성 동성애자 수가 설문조사보다 2∼3% 많고, 성관계를 원하지 않는 연인에 대한 불만이 문자메시지에 답하지 않는 연인에 대한 불만보다 5.5배 많다. 빅데이터가 알려주기 전엔 몰랐던 것들이다.

저자가 연구에 동원한 프레임은 검색정보 수집프로그램인 ‘구글 트렌드’. 이 툴을 통해 저자가 인터넷데이터전문가로 우뚝 선 사연도 책 내용만큼이나 호기심을 돋운다. 대통령선거였단다. 미국사상 첫 흑인대통령을 배출한 2008년. 당시 여론조사는 ‘아름다운’ 조사결과를 자주 내놓곤 했다. “나는 버락 오바마가 흑인이란 점을 신경쓰지 않는다”는 것. 그것도 압도적인 다수의견으로. 그런데 웬걸. 오바마가 당선된 직후 세상이 온통 흑인대통령 탄생으로 떠들썩할 때 몇몇 주(켄터키·애리조나·노스캐롤라이나·루아지애나)의 검색창은 이렇게 떠들썩했다. ‘깜둥이 대통령’!

실제 ‘흑인후보가 인종 때문에 손해 본 표’가 얼마인지도 알아냈다는데. 오바마의 경우 노골적인 인종주의만으로 4%의 유권자를 잃었다는 거다. 과연 대선 전에는 몰랐을까. 아무리 날고뛴다는 여론조사기관이라도 어찌 알아내겠나. 자신이 인종주의자라고 아무도 말하질 않는데. 설문조사에선 아닌 척했지만 사적 공간에선 흑인을 조롱하는 마음을 다 드러내고 있었단 얘기다.

그렇게 저자는 남들과 다른 연구로 눈에 띄었지만 결국 이 때문에 인정받기도 어려웠던 모양이다. 게재를 거부한 학술지마다 들고 나온, 한 가지 이유 때문이다. ‘미국인 인종주의자가 이렇게나 많을 리 없다’는 의심. 하지만 결국 도널드 트럼프가 해결해줬다. 저자가 작성한 인종주의지도가 2016년 대선에서 트럼프 지지율을 표시한 지도와 일치한다는 사실이 알려지면서다. 트럼프 지지층이 오바마를 밀쳐낸 그 은밀한 인종주의자였던 거다.

저자가 속한 사회과학 연구기반을 따질 땐 무엇보다 선거가 관건이다. ‘과학’까지 들먹이며 미리 알고 싶어 안달이 난 여론조사는 흔치 않으니까. 저자에 따르면 그 상당 부분을 구글 데이터가 해결해줄 수 있다. 몇 가지만 보자. 우선 누가 실제로 투표를 하러 나올지 구글은 파악한다고 했다. 특정 장소에서 ‘투표하는 법’ ‘투표장소’ 등이 얼마나 검색됐는지 알 수 있다면 그 지역의 투표율을 가늠할 수 있다는 거다. 투표하지 않을 사람 절반이 “난 투표할 거야”라고 해 예측부터 왜곡되는 폐단을 해결할 수 있단 소리다.

‘누구를 찍을 건가’에도 근접한다. 후보자 검색만으론 부족하다. 좋아하는 후보만큼이나 싫어하는 후보도 검색하니까. 다만 후보자를 둘 이상으로 묶어 검색했다면 얘기가 달라진다. 둘 중 지지후보의 이름을 앞에 두는 경향이 뚜렷하다니. 더 많이 먼저 등장한 후보라면 당선에 근접하다고 봐도 무방하단 뜻이다.

△사적 욕망 꿰뚫은 ‘뇌시경’ 어찌 활용할 건가

저자가 구글 검색을 애지중지한 이유는 명확해 보인다. 데이터가 많아서가 아니라 데이터가 솔직해서다. 이른바 ‘뇌시경’이라고 할까. 이보다 더 확실한 ‘원석’ ‘날것’이 어디 있겠나. 여기에 데이터과학을 조금만 첨가하면 모두가 그토록 찾아 헤매던 수많은 이론에 대한 해답을 얻을 것으로 본 것이다. 축적도 분석도 쉽다. 게다가 자발적이지 않나. 피실험자들은 바로 지금도 열심히 데이터를 입력 중이니까.

몇 개의 ‘숫자’만 잡혀도 전체의 일반화로 뻥튀기하는 사회과학 연구풍토에 대한 도전처럼도 읽힌다. 사실 일반화에 얼마나 많은 데이터가 필요한지 정확히 아는 사람도 없지 않나. 특히나 인간 본성을 긁어내는 작업이라면 더더욱. 책제목 ‘모두 거짓말을 한다’(Everybody Lies)는 이 같은 행태를 꼬집는 저자의 비아냥이 깔려 있다. 사람들은 진짜 거짓말을 하니까. 상대가 의사든 친구든 연인이든 가족이든. 하다못해 자신도 속이는데 설문조사원이라고 봐주겠나. 그럼에도 사회과학 연구의 상당 부분이 부정확한 조사결과에 의존한다고. 사람들은 밥 먹듯 거짓말을 해대는데 그것을 모은 여론조사의 신빙성을 따지고 있다고.

저자의 똘똘한 활동 덕분에 ‘구글 트렌드’의 주가도 뛰어오를 전망이다. 학계는 앞으로 전개될 굵직한 활약상까지 기대하는 모양이니. 개인사에서 나아가 국제사에 걸친 미제사건을 뚫어낼 것으로. 하지만 뒤집어도 사정이 같을까. 신의 영역인 판도라의 상자가 열려 속은 시원해졌다지만 디지털 흔적에 전전긍긍할 건 결국 인간이 될 텐데.
XML
  • 전종목시세판
  • 증시캘린더
  • 해외증시
  • 특징주
KOSPI1
KOSDAQ1
FUTURES
이데일리TV SNS
트위터 페이스북 YouTube