공리주의 비판

by Dongeun Paeng
Aug 08, 2024 · 만 34세

들어가며


공리주의는 백분율(%)을 기반으로 하는 철학이다.

공리주의자의 시각에서 보면, 통계적 또는 확률적으로 발생할 수밖에 없는 일은 발생할 수밖에 없다.

즉 불행한 일은 반드시 일어난다. 소수의 불행은 통계적/확률적으로 발생할 수밖에 없음을 인정한다.

그렇기 때문에 공리주의자의 우월 전략은 불행 제거가 아니라, 최대 다수의 최대 행복이 된다.


당연하게도 공리주의는 세상을 바라보는 한 가지 관점일 뿐, 정답이 아니다.

그런데 공리주의는 오늘날 가장 인기 있는 사고 방식으로 남았다. 의사결정을 할 때 명확하고 쉬운 기준이 되기 때문이다.

도덕적 딜레마의 상황, 골치아픈 상황에서 공리주의는 단순 명쾌한 답을 준다.

그리고 단순화, 추상화는 (이건희 회장이 강조한) 정신적 몸살에 걸릴 여유가 없는 사람에게는 달콤한 유혹이다.

공리주의는 이런 이유로 전쟁, 정치, 병원, 학교 등에서 아직도 지배적인 사상의 입지를 굳건히 하고 있다.

특히 통계치가 넘쳐나는 요즘에는, 사람을 숫자로 표현하기가 편해지면서 사람의 ‘생사고락’이 더 추상화되었다.


공리주의에는 여러 비판이 있어왔다. 공리주의는 대충 생각해도 왠지 매몰차고 비인간적으로 보인다.

하지만 공리주의가 왜 정답이 아닌지, 근거를 논리적으로 구성함으로써 우리의 멘탈 모델을 굳건하게 만들어보자.


공리주의자는 %와 사랑에 빠지기 쉽다. 소수와 다수를 구분짓기 위해서는 전체에서 차지하는 비중을 반드시 알아야 하기 때문이다. 이 비중을 표시하는 가장 쉬운 방법 중 하나가 백분율(%)이다.

백분율에 의존하여 소수와 다수를 구분짓다 보니 자연스럽게 소수를 나타내는 낮은 백분율(예를 들어 0.1%)은 무시하게 되고, 다수를 나타내는 높은 백분율(예를 들어 80%)은 중요하게 생각하게 된다.


그런데 이 때 사용된 “%”는 인간이 양(quantity)을 표시하기 위해 만들어낸 하나의 기호이다.

기호는 표현하고자 하는 대상을 추상화하는데, 모든 추상화는 그 과정에서 어떠한 것들을 잃어버리고 만다.

우리가 %로 나타내는 다양한 양은 그 안의 진실 중 많은 부분을 잃은 상태로 표현되는 텍스트인 것이다.


그래서 공리주의는 다음의 질문에 제대로 답하지 못한다.

숫자로 표현되는 비중이, 각 표본, 예를 들어 우리의 삶을 설명하는 가장 좋은 표기법이 맞는가?

확률상 자연스럽게 벌어져야 하는 일이 벌어졌을 때, 그것은 이미 정당화되어 있는가?

결과로 이어지지 않은 의도는 (%에 합산되지 않으므로) 버려지는가?


즉 공리주의는 %에 지나치게 의존하고, %에 무지하다는 이유로 무신경한 사고방식이다.

%에 대해 조금 이야기해보자. 그러다 보면 공리주의를 받아들일 때 주의할 점을 자연스럽게 느낄 것이다.



1. 소수 vs. 다수


어떤 설문조사에서 100명 중 3명은 A안을 찬성하고, 97명은 B안을 찬성한다고 해보자.

현재 상황을 스냅샷으로 찍었을 때 3%와 97%로 갈린 것이다.


공리주의는 필연적으로 스냅샷을 받아들이고, 소수와 다수를 상호 배타적인 집단으로 취급한다.

그래야만 다수와 소수를 구분할 수 있기 때문이다.

공리주의는 소수와 다수 중 양자택일을 해야만 하고, 이 때 다수를 선택하는 사고방식이다.


그런데 현실에서는 소수와 다수가 끊임없이 상호작용하는 두 집단인 경우가 더 많다.

즉 3과 97이 서로 영향을 주기 때문에, 3:97이라는 배분 비율은 시시각각 변화한다.


상호작용하는 두 집단은 스냅샷으로 파악해선 안 된다.

이것은 체스를 두는 도중에 체스판을 사진으로 찍고 그것으로 승패를 결정짓는 셈이다.


상호작용하는 두 집단은 스냅샷처럼 상황을 묘사하는 방식이 아니라, 각자의 생각, 서로 주고받는 영향과 관계를 도식화하는 게 더 결과 예측에 도움이 된다.


예를 들어 100명이 지나가는 길거리에서 하늘을 가리키는 사람이 2명이라고 하자.

하늘을 가리키는 사람이 2명, 지나가는 사람이 98명이다.



우리는 이 상황을 어떻게 해석해야 할까? 2%만 하늘을 가리키므로 '하늘에 별 일 없다'고 해석해도 될까?

아니다. 잠시 후 한 명이 더 하늘을 가리키면 지나가는 수십 명의 사람들이 다같이 하늘을 보기 시작한다. 이것이 3의 법칙이다.


소수가 다수의 행동을 유도하는 것이다. 꼬리가 몸통을 흔드는 일이 심심찮게 발생하는 이유이다.


하인리히 법칙도 비슷한 맥락에서 설명이 가능하다.

하인리히 법칙은 소수가 다수에게 영향을 주는 영향인자는 아니지만, 다수가 곧 소수를 뒤따를 것임을 보여주는 예후로 소수가 작용하는 경우를 보여준다.


쉽게 말해 1:29:300의 법칙이라고도 하는데, 어떤 대형 사고가 발생하기 전에는 그와 관련된 수십 차례의 경미한 사고와 수백 번의 징후들이 등장한다는 뜻이다.


기업 입장에선, 겨우 한 번 등장한 VOC라고 해서 의미가 없는 게 아니라, 그것이 앞으로 등장할 수많은 VOC의 예후인지 아닌지에 따라 의미가 크게 달라진다는 것이다.


공리주의는 이런 상황에 해결책을 내주지 못한다. 당장 당면한 절대 다수의 VOC를 해결하는 것이 최대 다수의 최대 행복에 더 크게 기여하는지, 아니면 오늘 이 한 건의 VOC에 집중하는 것이 장기적으로는 최대 다수의 최대 행복에 더 기여하는지, 그 크기를 계산하는 것이 불가능하기 때문이다.


그 크기를 계산하려면 소수가 갖는 힘을 먼저 계산해야 하고, 그러면 “오늘은 소수일지라도 그 힘이 다수보다 클 수도 있고 아닐 수도 있다”라는 결론에 이른다. 그러면 최대 다수의 최대 행복을 추구하는 공리주의는 자기 모순에 빠지게 된다.


소수보다 다수가 중요해서, 다수를 위해 소수의 의견을 주의 깊게 들어야 하니까 말이다.



2. 확률 vs. 통계


공리주의가 의존하는 %는 흔히 통계량의 형태로 돌아다닌다.

그런데 통계량은 가연성 기체처럼 조심히 다루지 않으면 매우 위험하다. 특히 의사결정에 활용할 때 그렇다.


크게 두 가지 이유가 있는데, 우선 미미한 이유부터 알아보자. 통계량은 보여주는 방식에 따라 의미가 많이 달라진다.

아래 그림을 보자.



위 그래프들은 모두 같은 통계량을 갖는다.

x의 평균은 54.02이고, 표준편차는 14.52이다.


즉 통계량은 숫자로 표시될 때 ‘지나친 추상화’가 되어버린다는 것이다.

실제 상황을 표현할 수 있는 추상화 수준은 다양하다.


예를 들어 100명의 사람이 갖고 있는 의견이 궁금하다면, 다양한 추상화 수준을 이용해 정보를 수집할 수 있다.

각자의 생각이 담긴 내러티브, 위와 같은 그래프, 인과관계가 상자와 화살표로 표현되는 다이어그램, 단 하나의 숫자.

이 중에서 통계량은 단 하나의 숫자로 표현한다는 점에서 가장 불완전하다.

위의 그래프는 숫자보다 좀 더 풍부한 표현 방식이라고 볼 수 있다.


그러나 그래프도 여전히 추상화 수준이 높은, 달리 말해 정보를 너무 많이 압축한 형태이다.

이 때 정보가 압축되면서 사라지는 세밀한 정보들은 공리주의자에게는 잡음으로 해석된다.


예를 들어 조립식 주택 건축을 허용할 것인지, 금지할 것인지 결정하는 입장에서 공리주의자는 몇 건의 큰 사고를 무시하고 전체적인 성공률을 따질 것이다.

그런 건축물이 100개 지어졌을 때 그 중 1개가 무너지고 그 안에 사는 사람이 목숨을 잃더라도, 공리주의적으로 보면 주택 가격을 안정화하는 데 도움이 된다면 조립식 건축을 적극 장려하려고 할 것이다.


이 때 ‘잡음’은 무엇일까? 극단적인 상상을 해보면, 건물에 깔려 죽은 모씨가 내 집 마련을 하기 위해 밤낮없이 일한 세월들, 모씨 아내 뱃속의 아기 같은 정보가 공리주의자에겐 잡음이 된다.


현실을 한두 개의 숫자로 추상화한다는 점에서 통계량은 위험하다. 굳이 사용할 거라면 그래프로 사용하는 것이 좋다.

책 <순서파괴>를 보면 아마존에서는 차트에 ‘일화(anecdote)’까지 추가함으로써 지나친 추상화를 방지하고 있다.


이제 둘째 이유를 살펴보자. 통계는 확률이 아니며, 확률의 역할을 할 수도 없다. 이건 무척 중요하다.

통계적으로 100명 중 1명은 A라고 해서, A의 확률을 1%로 표시해선 안 된다.


너무 많은 곳에서 자연스럽게 벌어지는 일이라서, 이를 비판하는 책도 있다.

통계는 수집된 데이터이고, 과거에 대한 측정 결과이다. 확률은 미래에 어떤 일이 벌어질 가능성이다.


즉 확률은 추정값이다. 추정을 해야 하는데 딱히 믿을 만한 근거 자료가 없으니, 많은 수를 관찰하여 얻은 통계치를 확률로 “받아들이는” 것이다.

그런데 A의 발생 확률 P(A)를, 기존 통계량으로 갈음하는 것은 위험하다.


대표적인 예가 Gate’s Law이다. 아주 큰 아웃라이어가 한 건 섞이면 전체 집단의 통계량이 크게 변하는 것이다.

1천 명의 일반인을 모아놓고 평균 소득을 잰 다음, 우연히도 빌 게이츠가 그 집단에 1,001번째 표본으로 섞이는 순간 평균 소득이 급증하는 것이 Gate's Law다. 이렇게 관측된 통계치는 오류 가능성을 내포한다.


좀 더 친근하게 설명해보겠다.


우리가 확률이라고 사용하는 어떤 수치를 통계에서 가져올 때, 그 통계가 의미하는 것이 무엇인가?

수많은 확률 사건들이 발생하여 얻어진 ‘오늘 현재의’ 수치일 뿐이다.

여기에 오늘 벌어지는 새로운 확률 사건이 더해져서 내일의 새로운 통계가 만들어질 것이다.

즉 오늘 내가 갖고 있는 통계 수치가 확률을 결정하는 게 아니라, 오늘 벌어지는 확률 사건이 통계치를 결정지을 것이다.


예를 들어 평균 수명이 110세인 어떤 유명한 일본 마을에 내가 가면 내 기대수명이 110세가 되는 게 아니라, 그 마을의 평균 수명이 살짝 내려간다는 것이다.

그 마을에 나를 제외한 100% 구성원이 한 명도 빠짐 없이 110세까지 살았다고 해서, 내가 110세까지 살 확률 P(L) = 100%가 되는 게 아니다.


과거의 통계를 미래의 확률로 받아들이는 우를 범하지 말라는 강력한 경고가 블랙 스완이다.

오늘 현재 이 세상에 존재하는 백조의 100%가 하얀색이어도, 그 통계가 새로 태어날 백조의 색깔이 검은색일 “확률”이 0%라는 데에 사용되면 위험하다는 것이다.

왜냐하면 검은 백조가 태어날지 하얀 백조가 태어날지는 ‘과거 백조들의 색깔이 무엇이었는지’에 따라 결정되는 게 아니라, 백조의 색깔을 결정짓는 어떤 유전적 요인에 의해 결정되는 것이기 때문이다.

검은 백조가 태어나면 단순히 통계량이 100%에서 99.999%로 바뀔 뿐이다.


즉 통계량 100분의 N이 확률 N%로 이어질 수 없고, 오히려 그런 통계를 만들어내는 어떤 실제 원인이야말로 확률을 보여준다는 것이다.


물론 관찰된 통계량이 신빙성 있게 확률로 사용되는 경우도 있다. 동전 던지기가 대표적이다.

그러나 동전의 앞면이 나올 확률이 50%인 것은 지난 1만 번 던졌을 때 5천 번 내외로 앞면이 나왔기 때문이 아니라, 동전의 앞면과 뒷면의 무게가 정확히 동일하기 때문이다.


즉 우리는 어떤 통계량, 즉 관측 결과를 보면서 그것이 곧 원인이라고 착각해선 안 된다.

책 <순서파괴>에서는 이것을 deep dive라고 표현하고, 수치와 더불어 그 수치의 원인도 파악할 수 있어야 함을 강조한다.



3. 수용 vs. 도전


어떤 비극적인 상황을 가정해보자. 통계에 따르면 이 상황에서 10명이 불행해지면 100만 명이 행복해진다.

공리주의자에게 있어 이런 상황은 쉬운 선택이다. 압도적으로 많은 수가 행복해지기 때문에 소수의 불행을 수용하면 된다.


그러나 이게 옳은가? 과거 통계를 수용하지 않고 도전하는 선택지도 있다.

내가 남은 10명마저도 행복하게 만드는 방법을 찾아내면, 역사가 새로 쓰이고 통계도 업데이트 된다.


이렇게 바뀐 통계는 후세에 당연하고, 쉽게 느껴질 것이다. 통계는 사람을 둔감하게 만들기 때문에.

그러나 어떤 통계가 완성되기까지는 용감한 자들의 도전과 그로 인한 통계의 꾸준한 업데이트가 있었음을 잊지 말아야 한다.


볼보가 3점식 안전벨트를 만든 이후 교통사고 사망률이 40% 감소하였다고 추정된다.

그렇게 만들어진 새로운 통계, 즉 교통사고 사망률을 우리는 자연히 수용한다.

그런데 이 통계치, 즉 교통사고 사망률은 선험적으로 주어진, 즉 우주가 시작된 이래 존재한 불변의 값이 아니다.

볼보라는 기업이 만들어낸 결과다.


따라서 우린 교통사고 사망률을 수용해선 안 되고, 0%가 될 때까지 끊임없이 도전해야 한다.


주어진 %를 확률이 아니라 통계로 인식하고, 통계에 새로운 변화를 주는 용기는 anti-공리주의 정신에 기댄다.

그렇게 아웃라이어가 되면, 즉 빌 게이츠가 되면 평균이 크게 움직인다.

아마 그 아웃라이어는 애초에 평균에는 관심도 없었을 것이다. 평균은 관찰 결과를 저장해놓은 스냅샷이지, 그 안에 원인과 결과에 관한 정보를 담고 있지 않기 때문이다.


이런 관점으로 공리주의를 비판한 위대한 사상가들이 많다. 특히 “이성이 전부가 아니다”라는 낭만주의가 19세기에 등장했고 이들이 공리주의를 많이 비판했다. 그 중에서도 천재 중의 천재 문학가로 알려진 찰스 디킨스가 대표적이다.


찰스 디킨스의 ‘어려운 시절’이라는 소설에는 “토머스 그래드 그라인드”라는 주인공이 나온다. 이 사람은 이성을 강조하고, 주변에 벌어지는 일들을 통계적으로 해석했다.

작중에서 토머스의 아들은 반항적으로 자라 끝내 은행 강도가 된다. 그러면서 아버지에게 이렇게 얘기한다.


“수많은 사람들 중 범죄자가 있는 것은 통계적으로 자연스러운 일입니다. 그런데 제가 어떻게 자연스러운 일을 거스를 수 있겠습니까? 벌어질 수밖에 없는 확률 사건이 아버지에게 벌어진 것 뿐이니, 자연스럽게 받아들이십시오.”


통계가 곧 확률이고, 그렇기 때문에 통계 범위에 있는 사건은 ‘자연스러운 것이다’라고 생각하는 주인공을 비판하는 작품이다.


비슷한 관점에서 정치 철학가 존 롤스는 공리주의를 비판하면서, ‘무지의 장막’을 강조하며 내가 소수가 될지도 모르는 상황을 가정해야 정의가 실현된다고 했다.


애초에 확률은 불변값이 아니다. 확률은 그 확률을 계산하는 상황에 종속적으로 변한다.

다르게 얘기해서, 이 세상에 ‘객관적인 확률’이란 존재하지 않는다.



확률 바르게 이해하기


확률이란 무엇인가?

확률은 Probability의 우리말이며, 확률론에서는 어떤 사건 A가 발생할 확률을 P(A)로 표기한다.


자, 이제 간단한 실험을 해보자.


직관이 기가 막히게 뛰어나 보이는 친구가 있는데, 이 친구가 하는 말 100개 중에 99개는 맞는 것으로 결론이 난다.

이 친구가 대학 졸업 후 거시 경제 분석 전문가가 되었다고 하자.


어느 날 이 친구가 3개월 이내 미국의 국가 부도가 올 것을 예측했다고 하자.

우리는 이 주장을 어떻게 받아들여야 할까?


3개월 내 미국 부도 확률을 어림잡아 0.01%(1/10000)라고 하자. 실은 그것보다도 더 낮겠지만.

그러면, 우리가 처한 상황은 다음 중 하나이다.


A: 0.01%의 그 사건이 실제로 발생하면서, 친구가 옳은 경우

B: 99.99%로 그 사건이 실제로 발생하지 않으면서, 친구가 틀린 경우


A 상황의 확률은 0.01%×99%0.01%0.01 \% \times 99 \% \simeq 0.01 \%

B 상황의 확률은 99.99%×1%1%99.99 \% \times 1 \% \simeq 1\%


즉 친구가 틀렸을 확률이 옳을 확률보다 100배 정도 더 크다.


위와 같이 복잡하게 계산할 필요도 없다. 상식적으로 생각해보자.

아무리 적중률이 높은 친구라고 해도, 그 친구가 "태양이 내일 뜨지 않을 것"이라고 얘기하면 믿을 것인가?


자존심 강한 두 확률이 창과 방패처럼 부딪치면, 더 낮은 확률이 이기는 법이다.

즉 미국 부도 확률이 워낙 낮으므로, 적중률 높은 친구의 말이 이번에는 한 수 접어야 한다.


이게 의미하는 바가 뭘까?


“친구의 말을 믿을지 안 믿을지”는 어차피 미국 부도 확률에 달린 것이지, 그 친구의 말의 신뢰도는 중요하지 않다는 것이다.

가령 항상 거짓말을 하는 친구가 "미국은 3개월 내에 부도 나지 않을 거야"라고 말한다면, 이번에는 그 친구 말을 믿는 편이 안전하다.


결국 기저율(우리의 사례에서 미국 부도 확률), 즉 현실 내지 상식을 잘 이해하면 대~충 들어맞는다.

어떤 주장의 옳고 그름을 판별할 때 기저율을 알고 있으면 확률 계산도 안 해봐도 될 정도라는 것이다.


Bernoulli’s Fallacy라는 책은 다음과 같은 메시지를 전달한다.

“What we already know is extremely important in interpreting new information”


즉 확률은 그 확률을 계산하는 사람의 지식에 의해서 값이 크게 달라진다는 것이다.


정리해보면, 확률에 대한 감이 좋다는 것은 곧 기저율을 잘 포착하는 것을 의미한다.

그러면 기저율을 잘 포착하려면 어떻게 해야 하는가?

기초 지식이 풍부해야 하는데, 이는 많은 경우 독서, 신문 읽기, 현장 방문, 세심한 관찰 등에서 얻을 수 있다.

이 중에는 정량화가 안 되는 기저율 정보가 많다. 그래서 확률을 숫자로 정확하게 표현하긴 어렵다.

그런데 확률을 숫자로 표현 못한다고 해서 문제될 것은 없다. 미국 부도 확률을 0.1%로 놓았어도 결론은 비슷했을 것이다.

얕은 주장에 흔들리지 않는 수준 이상으로만 현실을 이해할 수 있으면 된다.


쉬운 예를 들어보자.


양궁 과녁에서 10점 원은 반지름 6.1cm, 전체 과녁 반지름은 61cm이므로, 10점 원의 면적은 전체 과녁의 1%이다.

양궁 선수가 화살을 쏘면 10점 원 안에 들어갈 확률이 몇일까? 면적 비율대로 1%일까?


그렇지 않다. 확률은 아무리 적게 잡아도 30%가 넘을 것이다. 실제 통계를 보면 1%보다 훨씬 높은 비중으로 10점 원 안에 화살이 꽂힌다.



눈을 감고 쏘았을 때 과녁 안의 화살이 10점 원 안에 들어 있을 확률 P(T) = 1%이다.

그런데 우린 기저율을 어느 정도 알고 있으므로 1%라는 수치가 엉터리라는 것을 직관적으로 아는 것이다.


비슷한 이유로, 사격 선수가 날아가는 원반을 도대체 어떻게 맞히는지 신기할 수 있다.

그리고 병아리 성별 감별사가 어떻게 미세한 느낌으로 병아리 성별을 감지하는지, 초밥 장인이 밥알의 개수를 어떻게 맞히는지 신기할 수 있다.

이것은 우리가 신기한 일을 낮은 확률 사건으로 해석하기 때문이다.

그러나 사격 선수 100명을 모아놓았을 때 원반을 못 맞히는 선수일 확률이 거꾸로 매우 낮을 것이다.

여기서 실력, 감, 경험, 짬 같은 요소들은 최종 확률에 엄청나게 영향을 많이 주면서도, 정량화가 되지 않는 요소이다.


정리하자면 결국 확률이라는 것 자체가 기저율에 수렴하는 경향이 있는데, 아이러니하게도 이 기저율 정보는 확률을 계산하는 사람의 사전 지식에 의존하며, 그가 계산하는 기저율은 정확하지 않아도 웬만해선 의사결정에 오류를 야기하지 않는다.



마치며


진실을 찾고자 하는 사람은 숫자를 마지막에 봐야 한다.

우선 사람과 시대를 읽는 게 먼저다.

좁은 시야를 가진 사람에게 숫자를 들이미는 순간, 그는 곧 그 숫자에 매몰되고 만다.

NEXT POST

닮은꼴의 운명

Aug 10, 2024 · 만 34세

침대 머리맡 사이드 테이블 위 더 보기

PREVIOUS POST

미술의 진화

Jul 27, 2024 · 만 34세

진화는 개선을 포함하므로 미술이 진화한다는 표현이 맞을지 잠시 고민해보았다. 더 보기