우리가 사는 인간세(人間世)에서는 제로섬 게임만 벌어지는 게 아니다. 오히려 비제로섬 게임(non-zero-sum game)이 일반적이다. 제로섬 게임에서는 상대의 불행이 나의 행복이 되지만 비제로섬 게임에서는 그렇지 않다. 오히려 상대의 행복이 나의 행복이 되는 경우가 대부분이다. 여기에 협력의 중요성이 있다.

단 한 번으로 끝나는 죄수의 딜레마 게임에서는 배반이 최선의 전략이다. 상대방의 행동에 관계없이 배반하는 것이 가장 이득이 크기 때문이다. 그러나 인간세에서 단 한 번으로 끝나는 게임은 거의 없다. 이성간의 교제, 거래처와의 비즈니스, 국가 간의 외교관계가 그런 것이다.

이와 같이 언제 끝날지 모르는 개인과 개인 또는 조직과 조직의 상호작용을 모형화한 것이 ‘반복적 죄수의 딜레마 게임’이다. 미시간 대학 로버트 액설로드(Robert Axelrod) 교수의 실증적 연구에 의하면 반복적 죄수의 딜레마 게임(iterated prisoner’s dilemma game)에서는 협력이 최선의 전략이다. 그러나 이기적 인간들로 구성된 게임에서 무조건적인 협력은 기대하기가 어렵다. 협력할 수 있는 조건이 갖춰져야 하고 협력하는 게 유리한 전략을 구사해야 한다.

액설로드 교수가 컴퓨터 대회라는 방법으로 두 차례에 걸쳐 ‘반복적 죄수의 딜레마 게임’을 시행했다. 첫 번째 게임에 참가한 게임이론 전문가들은 자신들이 선호하는 전략(프로그램)을 제출했다. 놀랍게도 승자는 제출된 전략 중 가장 단순한 것인 ‘팃포탯’(Tit For Tat)이었다. 이것은 첫 게임에서 협력해보고, 다음부터는 상대가 하는 대로 따라하는 전략이다.

두 번째 대회에는 훨씬 더 많은 아마추어와 전문가들이 다양한 프로그램을 제출했다. 이들은 모두 1차 대회의 결과를 잘 알고 있었다. 그런데 이번에도 팃포탯이 승리했다.

이들 대회의 데이터 분석 결과, 의사결정 규칙(협력이나 배반을 결정하는 판단원칙)을 성공으로 이끈 특성은 4가지인 것으로 나타났다. ①상대가 협력하는 한 거기에 맞춰 협력하고 불필요한 갈등을 일으키지 않는다. 다시 말하면 처음에는 무조건적으로 협력한다(협력) ②상대의 예상치 않은 배반에는 즉각 응징한다(응징) ③상대의 도발을 응징한 후에는 용서한다(용서) ④상대가 나의 행동 패턴에 적응할 수 있도록 행동을 명확하게 한다(행동패턴의 명확성).

그렇다면 팃포탯이란 어떤 전략인가. ‘tit과 tat’은 ‘가볍게 치기’를 의미한다. 그러니까  ‘tit for tat’은 ‘상대가 가볍게 치면 나도 가볍게 친다’는 뜻으로 ‘되갚음, 되받아 침, 보복’의 뜻이다. ‘눈에는 눈, 이에는 이(an eye for an eye, a tooth for a tooth)’라는 말이 이에 해당한다.

즉 상대방이 하는 대로 되갚아 주는 것이 팃포탯이다. 반복적 죄수의 딜레마 게임에서 팃포탯 전략은 맨 처음 협력으로 시작하고, 그 다음부터는 상대가 앞에서 선택한 전략을 그대로 선택하는 방법이다. 즉 상대가 협력하면 나도 협력하고 상대가 배반하면 나도 배반하는 방법이다. 국제관계, 특히 냉전시대의 동서진영 간의 경쟁에서 팃포탯 전략이 많이 사용됐다.

중요한 핵심개념은 ‘용서’
반복적 죄수의 딜레마 게임에서 성적을 결정하는 가장 중요한 핵심개념은 용서인 것으로 나타났다. 용서는 상대가 배신하면 일단 응징을 가하지만 다음 게임에서는 다시 협력하는 관용성이다. 즉 한 번의 응징으로 과거는 과거로 잊어버리는 것이다.

용서할 줄 모르는 전략은 한결같이 성적이 좋지 않았다. 단 한 번의 배반으로 복수와 재복수가 이어지는 메아리 효과(echo effect)로 인해 같이 망하는 결과를 가져왔기 때문이다.

액설로드 교수는 죄수의 딜레마 상황에 빠져 있는 사람들에게 개인의 전략 선택에 도움이 되는 다음과 같은 권고를 하고 있다. ①남의 성공을 질투하지 말라. ②먼저 배반하지 말라. ③협력이든 배반이든 그대로 되갚아라. ④너무 영악하게 굴지 말라.

반복적 죄수의 딜레마 모형은 네트워크마케팅 사업의 성공을 위한 지침으로도 손색이 없다. 팃포탯과 같은 신사적인 전략이 성공한다는 것이다. 우선 처음에는 상대방에 대해 무조건적으로 협력한다. 그러나 이를 악용하려는 상대에 대해서는 단호하게 응징한다.

하지만 응징한 다음에는 곧바로 용서한다. 그리고 자신의 행동규칙이 무엇인지를 상대가 명확하게 알게 한다. 즉 자신의 일관성 있는 행동원칙을 상대방에게 각인시키는 것이다.

만일 조직이 매우 도덕적인 사람들로만 구성돼 있는 경우에는 관용의 폭이 팃포탯보다 확대될 수 있을 것이다. 그러나 각양각색의 사람들로 구성된 조직에서 이를 가정할 수는 없는 노릇이다. 또 설사 고고한 이상을 가지고 설립된 종교단체라 하더라도 이런 가정을 바탕으로 규칙을 만들 수는 없다. 이것은 인간을 성악설적으로 본다는 의미가 아니다. 구성원들 간의 협력을 이끌어내는 데 있어 그런 가정이 효과적이지 못하기 때문이다.

황금률(Golden Rule)은 우리가 명심해야 할 최고의 도덕률이다. ‘자신이 대접받고자 하는 대로 남을 대접하라’는 명제는 모든 갈등을 해결하는 가장 강건한 격률(格率, maxim)이다. 팃포탯은 황금률보다는 덜 도덕적인 것이긴 하지만 결국 상호협력을 유도한다는 점에서 상당 수준 도덕적이다. 또 인간의 이기심을 가정한다면 매우 현실적이고 합리적인 전략이다.

 

저작권자 © NEXT ECONOMY 무단전재 및 재배포 금지