본문 바로가기
카테고리 없음

로또 분석 방법 공부 - 이격, 이웃수

by 요익 2021. 3. 21.

일단 쓰고 올리기 바쁘느라, 글이 가독성도 좋지않고, 정리도 안되어있으며, 사진도 없고, 두서가 없는 상태다.

 

나중에 정리할 것 같다. 언젠진 몰라도 적어도 올해 안으로는 하겠다.

(블로그 주소가 바뀔수도 있고 계정 자체를 다른곳에서 할수도 있다.)

 

***

 

이격과 이웃에 대해서 분석 방법은 아무리 구글링을 해도 정확히 나와있지 않았다.

 

근데 말 뜻대로 '이웃하냐, 이웃하지 않느냐'에 대해서 분석한 것이라 가정하고 생각해보자.

 

***

 

955회차 당첨번호는 이렇다.

 

4,9,23,26,29,33

 

이웃수는 없고, 이격만 존재한다.

 

954회? 1,9,26,28,30,41

953회? 7,9,22,27,37,42

 

대부분이 이격이 많다. 그만큼 이격의 확률이 높다는 것.

 

***

 

이격, 이웃일 경우에 대해 계산해보자.

 

이는 A+B+C+D+E+F≤40(A,B,C,D,E,F은 자연수)인 것과 같은 경우에 대해 그 경우를 따로 계산한걸 곱한 것으로 본다.

뭔말인지 모를수 있는데, 너무 길게 설명하면 수학시간이 될 것 같아 자세한건 그냥 생략한다.

 

이는 5C5+6C5+7C5+....39C5=3838380이 된다.

즉, 이격인 경우는 3838380이며, 이웃인 경우는 8145060-3838380=4306680이 된다.

 

숫자들이 이격할지, 이웃할지에 대해서는 3838380/8145060과 4306680/8145060의 확률이 되는데... 이는 4X%와 5X%정도이다. (귀찮아서 계산기를 생략했다.)

이 정도 확률이면, 분석 방법을 모르는 일반인이 때려맞춰도 맞출 수 있는 확률로 보인다.

 

***

 

이격, 이웃수 분석에 대해, 정확한 방법이 뭔지는 잘 모르지만, 고정패턴을 생각하면... 솔직히, 약간 미신적인 방법을 가지고 분석을 하지 않을까 추측해본다.

 

글들을 보면 이렇다.

 

'여태까지 이부분에서 안나왔으니 조심스레 나올것이라 볼게요.'

 

그러고 안 나온 경우가 더 많다.

이는 다른 많은 분석 방법들도 동일한 현상을 보였다.

 

그러다가 운좋게 번호 한두개 맞으면?

정확한 분석이라고 생각하고 사람들이 꼬이는 것이다.

모르는 사람이 번호 6개 찍어도 번호 한두개 맞을 확률은 지난번 포스팅에서도 얘기했듯이 62%인데 말이다.

 

그냥 그들이 미신적으로 만든 분석 방법이 선형적으로 맞는 것처럼 추정을 하는데, 학문적으로 정확한 기법도 아니었다.

(난 여태 그들의 분석 방법이 학문적으로 뭐가 있었나 생각했었는데... 그런건 없었다.)

 

***

 

필자는 이 로또 분석에 대해 적용할 학문적 예측기법을 아직도 찾는 중이다.

 

주사위를 던지나, 로또 번호가 나오나 독립시행이 아닌가? 생각할 수 있는데...

그러면 주사위를 10번 던지는데 주사위에서 눈이 1만 연속으로 10번 나왔을때, 다음에도 눈이 1이 나올확률은 1/6일까? 아니면 1만 나오게 하는 특수 주사위라서 100%일까?

주어진 조건이 적기 때문에 누구도 모른다.

 

1이 여태 운좋게 많이 나왔기 때문에, 통계적 추정상 1이 적게 나올 것이다. 또는, 1만 나오게 하는 특수 주사위일 가능성도 있다. 이에 대해서는 누구도 모른다.

 

 

 

로또도 마찬가지다.

주어진 데이터가 적은지 많은지 그 추정을 할 수가 없어서, 확률비교가 어렵다.

예를들어 번호 1이 자주 나왔으니 1이 나올확률이 다른 번호에 비해 이론값보다 약간 더 높다... 이런식으로 할수도 있고, 955회가 충분히 높은 표본이 아니기 때문에 아직 멀었다... 이런식으로도 할수 있을 것이다.

 

***

 

한국의 로또 역사를 보면 1~66회, 67~86회, 87~261회, 262~835회, 836~현재(955회).

이렇게 로또 기계는 이동을 했고, 관리하는 은행도 바뀌고, 관할 경찰서도 바뀌고, 로또게임의 비용도 바뀌었다.

(우리가 알지 못하는 시간대에 관리자들이 임의로 로또 기계를 가동시켰을 가능성도 있다. 그러면 각 경우에 대해 변인 통제가 불가능한 독립시행이 될 가능성이 더 높아진다... 이건 그냥 분석을 하는 입장에서는 끔찍한 사실이 될수도 있기 때문에, 가정하지 않겠다.)

 

분석된 것들중 하나를 말하면, 번호 1은 과거 262~835회에서 관측확률이 0.14으로 이론보다 높게 나왔지만, 836회~현재에는 0.10으로 이론보다 많이 적게 나오는 상태다.

이 기계가 이동하는 순간 변인통제가 안되기 때문에(이유; 로또 기계의 공이 기계 자체를 이동시키는 과정에서 바뀔 수 있기 때문) 나타나는 현상으로 보인다.

 

이게 사실이라고 생각하면, 우리가 적용할 수 있는 통계치는 836회 이후의 것으로 보여진다.

근데 836회부터 955회까지는 데이터가 120개로, 굉장히 작은 표본이다.

이것 가지고는 분석이 어려울 것으로 보인다...