카테고리 없음

[Deep Thinking]다양한 관점에서 집요하게 솔루션을 찾아라(데이터의 함정에 빠지지 않으려면)

jjangguard-1 2024. 11. 27. 09:58

 

직관과 영감을 키워주는 재료

      데이터 리터러시가 중요한 역량이라고 강조했지만,
데이터는 그 자체로 우리에게 답을 주기보다 우리가 답을 찾아가는 데 도움을 주는 도구라는 것이다.
즉, 데이터에 너무 맹신하지 말고 때로는 사람의 직관을 더 정확하게 하고
영감을 더욱 풍성하게 하는 데 데이터를 재료로 사용해야 한다는 의미다.

 

     몇 년 전 남북정상회담이 열린 날마침 미세먼지 수치도 굉장히 높았다. 이 대 어떤 키워드 검색량이 높을까 의문이 들어 확인해 보니 미세먼지가 2만 건, 남북정상회담이 5만 건이었다. 이 두 데이터만 보면 '사람들이 남북정상회담에 더 관심이 높구나'라는 결론을 내리게 된다. 그런데 흥미로운 것은 이날 '치킨' 키워드 검색량도 5만 건이었다는 점이다. 이렇게 되면 두 데이터를 비교해서 얻은 결과를 확신할 수 없게 된다.

 

     키워드 검색량이라는 데이터를 통해서 본 것까지는 잘한 일이지만 데이터 리터러시가 높은 사람은 여기서 '다른 검색 키워드는?'하고 물을 것이다. 그러면 치킨 키워드를 발견하게 된다. 또 '전체 분석량은?'이라는 질문을 통해 전체 데이터가 7,500만 건이는 사실과 여기서 2만, 5만이 나온 것이라면 그 수치를 의미 있는 해석으로 연결할 수 있는가라는 의문이 제기될 수 있다.

 

     데이터를 분석할 때 주의할 점은 데이터는 한 가지만 말하지 않는다는 점이다. 예를 들어 예전에 인기 가수를 뽑는 가요 프로그램에서 시청자들을 ARS를 통해 투표에 참여시켰다. 이때 1 등과 2등의 ARS 집계 숫자가 보였는데, 집계 숫자를 절대수로 보여줄 때와 퍼센트로 보여줄 때 상황이 조금은 달라진다.

 

     두 가수의 격차가 1만 표 이상이라는 걸 알게 되면 아직 순위가 발표되기 전인 상황인데도 결과가 이미 확정된 것처럼 느껴진다. 그런데 퍼센트로 환산해 보여주면 격차가 크게 벌어진 것처럼 느껴지지 않는다. 절대수는 1만 표 차이가 나지만 퍼센트로 표시하면 5%가 되니 체감 정도가 확연히 달라져 긴장감과 박진감을 더해 빨리 자신이 좋아하는 가수에게 투표해야겠다는 생각을 하게 되는 것이다.

 

     이러한 함점에 빠지지 않으려면 주어진 데이터를 맹목적으로 흡수하는 것이 아니라 한 번 더 뜯어보는 자세가 필요하다. 데이터 리터러시에는 데이터가 가진 함정을 꿰뚫어 볼 수 있는 통찰력도 포함된다.

 

▣ 데이터 프라이밍의 함정

     우리는 시각이든 청각이든 특정 브랜드에 지속적으로 노출될 경우 무의식적으로 각인되어 소비 행동을 할 때 큰 영향을 받는데 이를 '프라이밍 효과'라 한다. 즉, 앞서 발생한 현상이나 경험이 다음의 상황에 영향을 끼치는 것을 의미한다. 심리학에서는 '점화 효과'라는 표현을 쓰기도 한다.

 

     이를 잘 설명해 주는 실험이 있다. 사람들에게 피자, 라쟈냐 등의 사진을 보여주고 '스파'로 시작되는 단어를 물어봤더니 대다수가 '스파게티'를 말했다. 로마, 군인 등의 사진을 보여주고 '스파'로 시작되는 단어를 말해달라고 하니 이번에는 대부분 '스파르타'를 떠올렸다. 어떤 연예인이 출연하는 프로그램이 끝난 뒤에 바로 그 연예인이 나오는 광고가 나오는 것도 이런 프라이밍 효과를 노린 전략이다.

 

     기업의 중요한 의사결정 구조에도 '데이터 프라이밍'을 적용하는 사례가 있다. 자신들의 이익에 부합하는 데이터들만 조합해 제시함으로써 유리한 결론을 이끌어내는 방식으로 의사결정권자를 프라이밍 하는 것이다. 여기서 교훈은 눈앞에 보이는 데이터에 함몰되면 커다란 실수를 범할 수 있다는 것이다.

 

     데이터를 믿어야 하지만 한편으로는 믿지 말아야 한다.
어떤 데이터를 믿고 믿지 말아야 할지는 여러 가지 관점에서 한 번 더 의심하고,
한 번 더 고민해 보는 딥씽킹 과정을 통해 알 수 있다.

 

▣ 내가 틀릴 수 있다는 가능성 열어두기

     'EBS 다큐프라임'이라는 방송 프로그램에서 한 실험을 통해 '우리의 행동이 얼마나 많은 착각 속에서 선택되는지'를 보여준 적이 있다. 엘리베이터 안에서 피실험자에게 차가운 커피를 들어달라고 부탁한다. 피실험자는 면접실에 도착할 때까지 차가운 커피를 들고 있고, 곧바로 한 남자를 면접한다. 이번에는 다른 피실험자에게 따뜻한 커피를 들어달라고 부탁하고 역시 뜨거운 커피를 들고 면접실에 도착해서 한 남자를 면접한다. 차가운 커피를 들었던 실험자는 면접을 본 남자를 탈락시켰고, 뜨거운 커피를 들었던 실험자는 면접을 본 남자를 합격시켰다. 실험이 끝나고 인터뷰에서 전자의 피실험자는 남자가 냉정하고 차가운 느낌이 들었다고 말했고, 후자의 피실험자는 남자가 따뜻하고 좋은 사람으로 느껴졌다고 말했다. 하지만 두 사람에게 면접을 본 남자는 사실 같은 남자였다.

 

     이렇듯 오감마저도 우리의 심리에 영향을 미처 착각을 일으킨다. 우리는 많은 경우에 착각을 하고 또 인지적 오류를 범한다. 또 다른 실험에서는 환자와 이야기를 나누던 의사가 바닥에 펜을 떨어뜨리고 이걸 줍기 위해 책상 아래로 몸을 숨긴 다음, 다른 의사가 몸을 일으켜 의자에 앉는다. 하지만 환자는 이를 알아채지 못했다. 이러한 동작을 세 번이나 반복되었는데도 환자는 끝까지 의사가 바뀌었다는 것을 알아채지 못했다.

 

     이 실험을 통해 인간의 인지 체계나 심리적 경향성은 우리에게 언제나 오픈마인드를 유지하고
겸손해야 한다는 점을 가르쳐준다.
인지적 한계를 의심하지 않고 자신의 주관적인 잣대를 들이대는 건 굉장히 경계해야 한다.
결론을 내리기 전까지 다양한 가능성을 열어두고 면밀하게 들여다봐야 한다. 

 

     누군가 '꼰대'가 되지 않으려면 어떻게 해야 하느냐고 질문하면 나는 '과거 경험을 토대로 인과관계를 해석하고 현상을 보려는 태도를 버리면 된다'라고 대답할 것이다. 물론 그런 분석도 필요하지만 그건 수많은 가능성 가운데 하나일 뿐이라는 점을 절대 잊어서는 안 된다.

 

▣ 당연한 것에 의문을 제기하기

     우리는 권위가 부여된 정보를 받아들일 때 별다른 의심 없이 믿어버리는 경향이 있다. 이와 관련해 스웨딘의 의사이자 통계학자인 한스 로슬링은 유작 <팩트풀니스>에서 자신의 신념과 일치하는 정보는 받아들이고 그렇지 않은 정보는 무시하는 '확증편향'의 위험성을 경고한다. 그러면서 인간에게는 '느낌'을 '사실'로 인식하는 비합리적 본능이 있다는 점을 지적한다. 한 가지 예가 '단일관점 본능'이다. 단일관점에서 세상을 보면 그 관점에 맞지 않는 정보를 볼 수가 없기 때문에 틀린 판단을 하게 된다는 것이다. 한스 로슬링은 똑똑하고 현명하다고 생각하는 사람일수록 세상의 참모습을 정확하게 알지 못할 가능성이 큰데, 그 이유는 바로 그런 사람일수록 확증편향이나 비합리적 본능이 크게 작용하기 때문이라고 설명한다. 

      

     실제로 우린 '맞다'라고 생각한 것이 알고 보면 틀린 것으로 판명될 때가 의외로 많다는 점을 경험으로 알고 있다. 특히 자신이 잘 알고 있다고 자신하는 분야에서는 전문성의 한계를 의식하고 확증편향에 빠져 중요한 데이터를 놓치지 않도록 늘 경계하는 태도를 견지해야 한다.

 

▣ 다수결과 평균의 함정을 경계하라

     경제학 이론 가운데 '콩도르세의 역설'이라는 것이 있다. 다수결의 결정이 반드시 그 사회가 진정으로 원하는 것을 반영하지 못할 수도 있다는 의미로 '투표의 역설'이라고도 불린다. 즉, 선거에서 후보가 난립할 경우 가장 많은 표를 얻는 다수결 투표는 오히려 다수가 싫어하는 사람이 당선되는 역설적인 결과를 낳을 수 있다. 

 

     다수결 투표의 숨어있는 함정을 처음 지적한 사람은 18세기 후반의 프랑스 수학자 <마르키 드 콩도르세>였다. 이러한 다수결의 함정을 피하기 위한 방안으로 제시된 것이 '보르다 산출법'인데 18세기 프랑스의 수학자 <장 샤를 드 보르다가>가 제안한 것이다. 이 산출법은 투표권자는 모든 후자의 순위를 매기는데 각 순위에는 가점이 차등 적용된다. 후보자가 5명이면 1위부터 5위까지 순위를 매기고, 1위는 5점 5위는 1점을 가점으로 부여하는 방식으로 각 후보자가 받은 가점을 합산하여 최종 점수를 산출하고 당선자를 결정한다.

 

     구글에서도 투표를 통해 의사결정을 하게 될 때 모든 의견에 가중치를 두어 신중하게 의사결정을 하려고 한다. 소수의견에도 매우 중요한 정보가 숨어 있을 수 있기 때문이다. 또한 성과가 낮은 사람도 주목하는데 그것은 다양성이 보장되기 때문이다.

 

대개는 최고와 최저 성과자의 평균을 내서 기준을 삼아 평균 이상은 인센티브를 주고, 평균 이하는 페널티를 주는 방식으로 성과관리가 이루어지는 곳이 많다. 다수의 '공정함'을 위해서는 맞을 수 있지만 한편으로는 평균은 현실을 왜곡할 수 있는 폭력적인 방법이 될 수 있다.

     한스 로슬링은 말했다. '정보를 단순화하다 보면 오판하기 쉬운데, 평균도 예외가 아니다. 평균은 분산(서로 다른 숫자가 흩어진 정도)을 하나의 숫자에 숨김으로써 오판을 불러온다.'

 

        성과가 낮은 패턴의 분석에서도 배울 것이 있다.
무엇을 잘못했는가를 분석하는 것이 아니라.
조직의 어떤 점을 개선해야 그들이 더 높은 성과를 내도록 도울 수 있는가를 분석해야 한다.