무의식적인 통계학자의 법칙(LOTUS)
수학팀:김정민 박형준 최웅준 구예인 김경태
확률론을 공부하다가 보면 자주이용하게 되는 법칙의 논리가 있는데 바로 '무의식적인 통계학자의 법칙'의 논리이다.
우선 이 법칙을 나타내는 수식을 살펴보도록 하자.
위의 식은 확률변수 g(X)의 기댓값을 구하는 식을 보여주고 있다.
여기서 확률변수는 말그대로 변수인데 왜 g(X)처럼 함수의 형태를 띄우고 있는지에 대해 의문점을 가질수 있는데 앞으로 설명하겠다.
다시 무의식적 통계학자의 법칙으로 돌아와서 저 식을 통해서 하고 싶은 이야기는 일반적으로 어떤 확률변수의 기댓값을 구하기 위해서는 그 확률변수의 확률분포를 알아야한다. 그러므로 위의 식에서는 g(X)의 분포를 알아야한다.
하지만 무의식적 통계학자의 법칙에 의하여 g(X)의 확률분포를 모르고 X의 확률분포만을 알고 있어도 g(X)의 기댓값을 구하는 것이 가능하다.
이를 증명하기 위해 한가지 문제를 풀어보자.
세인트 피터스버그(상테페테부르크)의 역설이라고 알려져 있는데 이 역설이 의미하는 바는 사람들이 기댓값을 의사결정의 지표로 삼는다고 생각하지만 그러한 인식에 문제가 있다라는 점을 시사한다.
문제는 이렇다. 도박장에서 동전던지기를 해서 뒷면이 나오면 계속 던지다가 앞면이 나오면 던지는 행위를 멈추고 그때까지 했던 게임의 수를 N이라고 하면 2^(N-1)제곱만큼의 돈을 따는 방식이다. 다만 이 도박은 한번 참가할때 참가비가 어마어마하게 비싸고 앞면이 나와 멈춘뒤에 다시 도박을 하고 싶으면 참가비를 한번 더 내야한다.
N번 게임을 했을때 도박에서 딸 수 있는 금액을 확률 변수 X=2^(N-1) 이라고 하고 각 금액을 딸 확률을 해당확률 P라고 하면
위의 계산 결과처럼 무한대에 수렴한다. 하지만 누구도 이 도박을 참여하지 않으려고 하는 역설이 발생하게 된다.
다시 무의식적 통계학자의 법칙으로 돌아와서 위의 문제에 법칙을 적용시켜보면
위 식에서 g(X)=2^(N-1)이고 X는 N에 해당된다. 따라서 우리는 확률변수 g(X)가 없이 N만 가지고 있더라도 E(g(X))를 구할 수 있다.
확률 변수 N은 도박을 한 판수 이므로 1,2,3...이런식으로 하나씩 증가한다.
도박을 N번할 확률과 N번 도박해서 2^(N-1)만큼의 돈을딸 확률은 같기에 기댓값은
이 주제를 공부하면서 느낀점은 역시 도박은 손도 댈 생각을 말자였다.
허접한 글 읽어주셔서 감사합니다~~(이 글 읽으시는 분들 모두 행복하기를~)