기여도를 측정하는 방법 feat. Shapley Value
회사에서 각 직원의 매출 기여도를 계산한다고 해보자. 직원이 A와 B 2명이었을 때 매출이 100만원 발생하다가 새로운 직원 C가 합류한 뒤 200만원으로 증가했다. 이때 C의 매출 기여도를 단순히 100만원으로 평가하는 사람은 없을 것이다. 여러 가능성이 있기 때문에 이 사실만으로는 판단하기 어렵기 때문이다. 그러면 추가로 무엇이 더 필요할까?
매출 증가분이 순수하게 C 혼자만의 성과인지, 아니면 다른 사람들이 각자의 몫을 끝내 둔 상태에서 그저 마지막 빈자리를 채운 것인지를 따져봐야 한다. 어쩌면 그냥 우연히 매출이 급증하기 직전에 합류했을 뿐인지도 모른다.
정량적으로 이걸 확인하려면 랜덤으로 다양한 조합을 만들어서 성과를 비교해보면 된다. 즉, C 혼자만 있을 때, 다른 한 명과 있을 때, 다른 두 명과 있을 때 등 모든 경우에 대하여, C가 있을 때와 없을 때의 매출 차이를 구해보면 좀더 신뢰할 만한 기여도를 알 수 있을 것이다. 이것이 섀플리 가치(Shapley Value)의 기본 아이디어다.
이를 수학적으로 일반화해서 다음과 같이 쓸 수 있다.
\[\varphi_{i}(v) = \frac{1}{|N|} \sum_{S \subseteq N-\{i\}} {\binom{n-1}{|S|} ^{-1}} (v(S \cup \{i\}) - v(S))\]- \(N\)은 전체 멤버의 집합이다.
- \(\varphi_{i}(v)\)는 멤버 i의 기여도로서, 우리가 알고 싶은 값이다.
- \(v(S)\) 함수는 주어진 멤버 조합(Coalition이라고 부른다) S가 만들어내는 가치를 의미한다.
- \(v(S \cup \{i\}) - v(S)\) 는 S라는 조합에 i가 있을 때와 없을 때 만들어내는 가치의 차이니까, i의 한계 기여(Marginal Contribution)라고 말할 수 있다.
전체 식의 의미를 풀어보면, 모든 가능한 멤버 조합에 대해서, 우리의 관심 멤버 i의 한계 기여를 가중평균한다는 것을 알 수 있다. 왜 가중평균이라고 하냐면, 모든 조합의 가중치가 동일하지 않기 때문이다. C의 매출 기여도 문제에 이 식을 적용하면,
\[\frac{1}{3} \cdot ( \binom{2}{0}^{-1} (v(\{C\}) - v(\{\})) + \\ \binom{2}{1}^{-1} (v(\{A, C\}) - v(\{A\}) + v(\{B, C\}) - v(\{B\})) + \\ \binom{2}{2}^{-1} (v(\{A, B, C\}) - v(\{A, B\})))\]이 된다. |S|, 즉 S의 크기 별로 먼저 평균을 낸 뒤에 다시 그 평균들의 평균을 구한다.
현실적인 한계, 그리고 의의
아쉽게도 현실의 매출 기여도 문제에 이 방법을 그대로 적용하기는 어렵다. 다양한 멤버 조합에 대한 실제 매출을 알 방법이 없기 때문이다. 그렇다 하더라도 기여도를 구하는 방법론을 알아두는 것은 의미가 있다. 실험으로 정확한 값을 구하지는 못하더라도 이러한 틀에 따라 v(S) 함수의 값을 정성적으로 추정해 보면 조금이나마 생각의 편향을 줄이는 데 도움이 된다.
게다가 실험의 어려움을 떼놓고 생각하면, 이렇게 기여도를 평가하는 방법론 자체는 합리적이고 공정한 방식이라는 생각이 든다. 그렇지 않은가? 그런 의미에서 이 문제를 한 번 생각해보자.
근로자 1명당 100만원의 이익을 낼 수 있는 회사가 있다. 그런데 안타깝게도 자본이 없어서 설립을 못하고 있다. 만약 어떤 이가 투자금을 대고 4명을 고용해 400만원의 이익을 냈다면, 투자자와 근로자에게 수익을 어떻게 배분해야 할까?
섀플리 밸류를 적용한 결과는 다음과 같다.
- 투자자: 200만원 (수익의 50%)
- 근로자(1명당): 50만뭔 (수익의 12.5%)
참고로, 이 세팅에서 투자자는 근로자의 수에 상관없이 항상 전체 수익의 절반을 자기 몫으로 가져간다.
현실을 많이 단순화하기는 했지만 오히려 그렇기 때문에 본질적인 특성을 더 잘 보여주는 측면이 있다. 어떤 결과를 얻기 위해 필수적인, 하지만 희소한 자원은 얼마 만큼의 가치를 가지는가. 섀플리 밸류와 직관과는 다소 차이가 날 수도 있다. 희소성을 바꿔서 투자자와 근로자의 숫자가 같을 때, 아니면 거꾸로 4:1일 때(돈은 넘치는데 일할 사람은 적은 경우) 이 배분이 어떻게 바뀌는지 살펴보는 것도 흥미롭다.