로또 당첨 번호 예측의 오류

  • #2502184
    소리네 199.***.160.10 1115

    잡담 하나…

    전에 서울에 방문했을 때,
    2013년 중간까지 1등이 17번 나왔다는 상계동의 어떤 가게에
    사람들이 매우 긴 줄을 만들어 서있는 것을 보고 놀란 적이 있는데,
    뉴스를 보니 그곳은 ‘로또 명당’으로 소문난 판매점으로
    2012년에 총168억원어치의 로또복권을 팔아
    판매수수료로 8억4376만원을 벌었다고 한다.
    이 정도면, 거기서 로또를 사는 사람들보다
    그 가게가 로또에 맞은 것이라고도 할 수 있을 것이다.

    ‘로또 명당’이라는 것이 전혀 근거가 없음에도 불구하고
    믿는 사람들이 상당히 많은데,
    이런 곳은 유명해져서 매우 많은 사람들이 로또를 구입하므로
    거기에서 당첨자가 나올 확률이 높아졌을 뿐
    내가 산 하나의 로또가 당첨될 확률이 높아지는 것이 아니다.

    예를 들어서, A라는 가게에서는 100만장의 로또가 팔렸고
    B라는 가게에서는 1만장의 로또가 팔렸다면
    당연히 A 가게에서 1등 당첨자가 나올 확률이 B 가게의 경우보다 훨씬 크게 된다.
    그렇다고 해서, 내가 A 가게에서 산 로또 1장이 당첨될 확률이 커지는 것은 아니다.

    두 가게를 비교하려면, 두 가게에서 팔린 로또의 갯수가 똑같아야 한다.
    또는 당첨자 수에서 판매된 갯수를 나눠서 비교를 해야 한다.
    만약 두 가게 모두 1년 동안 똑같이 각각 50만장씩 팔렸는데
    1등 당첨자가 A 가게에서는 10명이 나왔고 B 가게에서는 1명이 나왔다면
    뭔가 진짜 차이가 있을지도 모른다.
    하지만, 3명 대 1명 정도의 차이라면 별 의미가 없다고 생각한다.

    또한, 인테넷에 찾아보니
    로또 당첨 번호의 통계 분석을 통해
    다음 당첨 번호를 예측하는 서비스가 꽤 많아 보인다.
    생소한 용어를 써가며 과학적 분석이라고 광고하는데
    이런 서비스를 이용하는 사람들이 상당히 많은 것 같다.
    실제로 이런 website가 인기 website 순위에서 상당히 높은 등수로 나온다고 한다.

    이것은 로또 당첨 번호의 선정이 랜덤 독립사건이기 때문에
    의미가 없는 것이라는 것을 쉽게 알 수 있을텐데도
    사람들이 이런 것에 혹하기 쉬운가 보다.

    몇일전 본 기사에, 실제 1등에 당첨된 번호들을 분석해보면
    자주 발생하는 번호 패턴이 다음과 같다고 한다.

    – 6개 당첨 번호 합계 범위
    121-150: 37.27%
    151-180: 26.5%
    91-120: 19.67%
    (31-60, 211-240: 매우 적음)

    – 홀수:짝수 갯수
    3:3 = 34.1%
    4:2 = 25.73%
    2:4 = 23.85%
    (6:0, 0:6 = 거의 없음)

    그러므로, 가능성이 높은 번호 조합인
    6개 당첨 번호 합계가 121-150 이고
    홀수/짝수 갯수가 각각 3개인 번호 조합을 선택하면
    당첨확률이 높아진다는 것이다.
    (물론 이외에도 여러가지 다른 통계 조합과 규칙을 적용함.)

    하지만, 이런 주장에는 중요한 함정이 있다.
    먼저 이해하기 쉬운 간단한 경우를 살펴보면…

    만약 1-100 중에서 랜덤하게 하나의 당첨 번호를 고르는 경우,
    1-10 구간과 11-100 구간을 비교하면
    당연히 11-100 구간에서 당첨 번호가 더 자주 나온다.
    이것은 11-100 구간이 더 넓기 때문일 뿐
    11-100 사이의 번호를 하나 선택하면
    1-10 사이의 번호를 하나 선택할 때보다 당첨이 잘 되는 것은 아니다.

    위에서 각 구간의 크기를 30으로 같게 해도
    번호의 합이 121-150인 경우가 31-60인 경우보다 훨씬 자주 나온다는데…?

    이것은 각 구간의 크기가 같더라도
    각 구간별로 가능한 번호 조합의 갯수가 다르기 때문에
    (합이 121-150이 되는 번호 조합의 갯수가 31-60이 되는 것보다 훨씬 많음)
    결과적으로 위의 1-10와 11-100의 비교와 마찬가지라고 할 수 있다.

    홀수:짝수 갯수에 대해서, 예를 들어,
    동전을 4번 던져서 앞뒤가 나오거나
    주사위를 던져서 홀수/짝수가 나오는 경우
    이를 4번 시행하면, 가능한 모든 경우의 수는 다음과 같이 16가지가 된다.
    (0: 짝수 또는 뒷면, 1: 홀수 또는 앞면)

    0 0 0 0
    0 0 0 1
    0 0 1 0
    0 0 1 1
    0 1 0 0
    0 1 0 1
    0 1 1 0
    0 1 1 1
    1 0 0 0
    1 0 0 1
    1 0 1 0
    1 0 1 1
    1 1 0 0
    1 1 0 1
    1 1 1 0
    1 1 1 1

    위에 리스트한 16가지 경우는 각각 모두 똑같은 확률 (= 1/16)을 가지고 있어서
    ‘0 0 0 0’이 일어날 확률이나 ‘0 1 1 0’이 일어날 확률은 같다.

    여기에서 홀수:짝수 갯수를 비교해 보면
    2:2 = 6번
    1:3 = 4번
    3:1 = 4번
    0:4 = 1번
    4:0 = 1번

    즉, 이론적으로 홀수:짝수 갯수가 2:2일 확률은 6/16 이고
    짝수만 4번 나오는 ‘0:4’ 경우의 확률은 1/16 이다.

    이렇게 이론적으로만 보지 말고 실제로 이것을 여러번 실행해 봐도
    홀수:짝수 비율이 ‘2:2’의 경우가 ‘0:4’의 경우보다
    약 6배 정도 자주 발생하는 것을 볼 수 있다.
    (물론 아주 많이 시행하지 않으면 약간의 차이가 있을 수 있음.)

    그러므로, 이런 패턴에 맞춰서 ‘0 1 1 0’을 선택하면
    ‘0 0 0 0’을 선택하는 것보다 당첨확률이 높게 될까?

    그렇지 않다.
    이것은 11-100의 구간이 넓어서 당첨 번호가 많이 나오는 것과 마찬가지로
    홀짝 2:2인 경우의 수가 많아서 그렇게 나타나는 것일 뿐
    ‘0 0 0 0’과 ‘0 1 1 0’이 일어날 확률은 각각 1/16으로 똑같다.
    (즉, 확률이 각각 1/16과 6/16이 아니다.)

    이 예에서, 홀수:짝수 비율이 2:2의 경우가 더 자주 발생하긴 하지만
    내가 그 중에 한 번호를 선택할 때는 홀수:짝수 비율이 2:2인 6가지 경우 중에서 하나를 선택하는 것이기 때문에
    실제로 내가 선택한 번호가 당첨될 확률은
    (홀짝 2:2인 번호가 당첨될 확률)*(그런 번호 중에서 내 번호가 당첨될 확률) = (6/16)*(1/6) = 1/16 으로서
    모두 짝수인 ‘0 0 0 0’을 선택한 경우와 마찬가지가 된다.

    홀수:짝수 비율이 2:2인 경우가 많이 발생하면 무슨 소용이 있나
    그 중에서 내가 선택한 하나의 번호가 당첨될 확률은 마찬가지인데…

    어떤 번호 조합 패턴의 확률이 높다고 주장하지만
    그것은 단지 그런 패턴에 해당하는 경우의 수가 많기 때문일 뿐이고
    본인이 그 중에서 실제로 선택한 번호의 당첨확률이 높은 것은 아니다.

    결국 당첨 번호를 예측한다는 사람들은
    감춰진 규칙성을 찾는 것이 아니라
    번호 패턴들을 이런 저런 다른 크기의 그룹으로 나누어 놓고
    큰 그룹에 있는 번호를 선택하면 당첨 확률이 높아진다고 주장하는 것인데,
    이렇게 그룹의 당첨 확률과 본인이 실제로 선택한 개별 번호의 당첨 확률의 차이를
    구별하지 못하는 사람들이 상당히 많은 것 같다.

    아니, 많은 사람들은 합리적 근거에 따라 판단하기 보다는
    자기가 믿고 싶은 것을 믿는 것 같다.

    * http://www.ddanzi.com/index.php?mid=ddanziNews&document_srl=948965
    [비결] 로또 맞는 비결을 까발려주마