Nox 가 이걸 해냅니다

아이폰으로 50연 하다가 안 나오길래 플롯폼을 바꿔서 PC판, 안드로이드판(Nox) 로 해봤는데…

PC판은 그냥 형편없는 결과가 나왔고, Nox 가 대박을 침.

ㅋㅇ 이것으로 이번 콜라보도 컴플리트했다. 저번 주문토끼도 한 80연 했던 것 같으니 비슷하게 든 듯. 처음에 4성이긴 하지만 원하지는 않았던 멤버(주문토끼 때는 츠무기, 이번에는 아이리)가 나왔던 것도 비슷하고… 지난번 때에는 3성인데도 거의 끝나기 직전에 겨우 먹었던 것을 생각하면 이번에는 4성이라 혹시 못 먹는 것이 아닌가 걱정을 많이 했었는데 정말 다행이다.

얼터너티브 걸즈 발렌타인 한정 가차 확률 보고서

기존에 썼던 글 데스티니 차일드 확률조작 사건 을 재활용해본 것.

결론부터 말하자면 별 소득이 없다. 일단 표본이 너무 작고… 아마 샘플을 키우면(3배 정도) 기대값으로 수렴할 것 같다.

일단 샘플 소개부터.

팔로우 중인 어느 불우한 캡틴을 대상으로 삼았다. 그리고 해당 캡틴이 목표로 했던 발렌타인 가차 한정 시온의 고지확률은 0.5%=0.005 이다.

우리가 알아야 하는 것은 이 캡틴의 시행횟수(가차를 돌린 횟수)가 몇 번이냐 하는 것인데, 문제는 쿼츠의 구입단위에 따라 가격이 다르기 때문에 같은 금액으로도 시행횟수가 달라진다는 점이다.

일단은 10연차= 3000엔 이라 두면 12만엔/3000엔=40, 40*10=400연차 가 된다.그래서 시행횟수를 400회라고 두고 검정을 해보도록 한다.

 

먼저 pdf부터.

이것만 봐도 벌써 망한 것 같다는 생각이 강하게 드는데, 일단 그래프의 좌측이 너무 많이 잘려서 정규분포 근사는 힘들 것 같고, X=0 일때 확률은 10%(0.1)을 넘는다.

값을 계산해봐도 N*P = 2 < 5 라서 정규분포 근사하기에는 적절치 않다는 결론만 나온다.

그래도 z검정을 해보면,

[h,ptest] = ztest(e1, mean, std,’Tail’,’left’)

h = 0
ptest = 0.0781

근사 자체가 적절치 않아서 별로 의미는 없지만 z검정에서도 고지확률이 거짓인지 아닌지 알 수 없다는 결론이 나온다.

보충1

실제로는 10연차=3000엔이 아니라 3200엔에 10연차 하고 과츠가 약간 남고(1/7 단차), 아마 쿼츠 증량 캠페인도 했던 거 같고, 12만이나 과금했으면 아무래도 3천엔 단위로 결제하진 않았을 것이므로 실제 횟수는 이보다 더 많을 것이다. 따라서 변수를 바꿔야 하는데…

결과가 변하는, 그러니까 유의확률 95% 수준에서 고지확률(0.005)이 실제와 다르다는 결과가 나오는 경계선을 구하면 대충 400+200=600회 정도였다. 이때도 여전히 정규분포 근사는 실패하지만 이 때 확률이 0.0494 로 5%보다는 작다.

일단 공식 트위터를 뒤져봤는데 증량 캠페인은 없었던 것 같고, 2295개 구입시 9800엔을 적용해서 12만엔으로 돌릴 수 있는 가차횟수를 구하면

>> 120000/9800 * 2295 /70

ans =

401.4577

….?????? 뭔가 이상해서 710개 단위로 다시 계산해보았다.

> 120000/3200 * 710 /70

ans =

380.3571

?????? 지금까지 10연=3000엔 이라고 생각해왔는데 최대 과금단위가 아니면 그보다도 더 손해를 보게 되있었다. 이럴 수가…

정확한 값을 적용하면 처음 추정보다 시행횟수가 더 커질 것으로 예상했는데 오히려 더 적을 가능성이 높아졌다. 아무튼 실제 시행이 600회나 될 가능성은 거의 없을 것으로 보인다.

 

보충2

가차 오픈 초기에 확률 1.5배 이벤트를 했었는데, 이 때 시온의 고지확률은 0.75% 였다. 만약 이 때 전부 돌렸던 것이라면 확률이 다르므로 결과가 달라지지 않았을까?

일단 저 캡틴을 5회 스페셜 가차 하기 전에 팔로했었는데 팔로 당시에는 10만이라고 써 있었으니 2만은 확실히 해당하지 않고, 나머지 10만이 문제인데 그러면 아래와 같이 된다.

P = 0.5/100 * 1.5; % P=0.75%

N = round(100000/9800 * 2295/70); % N=335

역시 유의미한 변화는 없었다는 점만 밝혀둔다.


지난번과 마찬가지로 매트랩 소스를 첨부한다.

alterna

데스티니 차일드 확률조작 사건

korean gacha game is cake

http://bbs.ruliweb.com/news/board/1004/read/2110154

이거 보고 재밌을 거 같아서… 가 아니라 답답해서 한번 정리해봄.

링크 글을 요약하면 공지된 당첨확률이 1.44%인 5640 회 시행에서 당첨(5성)이 42회.  그러므로 실제 확률이 0.745%다 라는 주장이다.

결론부터 말하면, 확률조작이 맞다.(유의확률 5%), 그리고 확률에 대한 MLE(Maximum Likelihood Estimation)는 0.745%, 95% 신뢰구간은 [0.54% 1.01%]이다.

일단 모집단을 분석해보자. 당첨확률 0.0144(=1.44%) 에 독립시행이라고 한다면 모집단은 Binomial Distribution 을 따른다. 즉 B(N=5640, P=0.0144)이다.

여기에는 별 논란의 여지가 없다. 컴퓨터로 계산되는 랜덤 숫자는 난수표를 사용하고 이것은 seed의 우연성만 보장된다면 이상적인 수학적 확률에 해당한다. 만일 이것이 성립하지 않는다면 그냥 처음부터 랜덤이 아니므로 별 할 말이 없다.

다음으로 pmf(확률질량함수) 를 보자. X=당첨횟수 별 확률을 도시한 것이다.

destiny-child-binomial-distribution-plot
B(5640, 0.0144)

평균(81.2)을 근처로 대칭인 그래프가 나오는데… 딱 봐도 42는 평균에서 너무 멀다. 한 3-sigma 쯤 되어보인다. 이것만 봐도 충분히 주작이라고 해도 되는데 더 나아가서 z-test 도 해보자.

z-test 란 자신의 주장을 h1 이라 하고 그것의 부정을 h0 라고 했을 때, h0가 참이라고 가정하면 관측한 사건이 불가능함(통계적으로 말하자면 해당 사건이 일어날 확률이 작음)을 보임으로서 h0가 거짓임을 보이는(즉 h0의 부정인 h1이 참임을 보이는) 테스트이다. 즉, 이 예에서는 당첨확률이 1.44%일 때 당첨횟수 42회가 일어날 확률을 계산하고, 이 값이 아주 작은 값임을 보임으로서 당첨확률이 1.44%라는 가정이 틀렸음을 보일 것이다.

먼저 z-test 를 위해서는 정규분포(normal distribution)으로의 근사가 필요하다. 일단 mean=81.2 고 std=8.946 이다. 그리고 N이 충분히 큰가 따져봐야 하는데… 몇십개도 아니고 5천개쯤 되니 따져볼 필요도 없긴 한데 통상적으로 따지는 N*P=81>=5 && N*(1-P)=5588>=5 도 만족한다.

일단 원문의, 그리고 사용자들의 주장은 P!=0.0144 이라는 것이므로 이것을 h1(대립가설) 로 놓고 P=0.0144 을 h0(귀무가설) 로 놓는다. 이렇게 두고 z-test 를 실시하면…

[h,p] = ztest(e1, mean, std) % e1=count of occured event=42
h = 1
p = 1.1694e-05

이게 의미하는 바를 해석하면… h=1 라는 것은 h0가 참일 확률이 5% 이하라는 것이다. 더 나아가서, h0가 참이라고 했을 때 이런 일이 일어날 확률은 1.2*10^-5 이하라는 뜻이다. 보통 통계적으로 설득력있다고 평가할 때 p=5% 를 쓰고 더 엄격하게 적용할때는 p=1% 를 쓰는데 이런 확률이라는 건….그냥 h0(당첨확률이 1.44%라는 가정)가 거짓이라는 것이다.

여기서 끝내도 되는데… 사실 사용자들이 진짜 주장하고 싶은 것은 P<0.0144 일 것이다.(위의 테스트는 P<0.0144 이거나 P>0.0144임을 뜻한다.) 이 때에 대해서도 z-test 을 실시해보자. h1 이 P<0.0144 가 되고 h0 는 P>=0.0144 가 된다.

[h,p] = ztest(e1, mean, std,’Tail’,’left’)

h =     1
p =   5.8472e-06

마찬가지다. 높을 리는 더더욱 없다.

그래서 1.44% 는 주작인 것을 보였는데… 그렇다면 실제 확률은 얼마일까? MLE 추정을 하면 가장 개연성이 높은 값은 0.745%, 95% 신뢰구간은 [0.54% 1.01%]이다.

[phat, pci] = binofit(e1, N)

역시 1.44% 는 신뢰구간에 들어가지도 않는다. z-test 에서 확인했으니 당연하지만… MLE에 대한 설명은 생략한다.

직접 계산해보고 싶은 사람을 위해 MATLAB 문서를 첨부한다. html 파일이므로 만일 확장자 없이 다운로드되는 문제를 겪는 경우 파일 이름을 수정하면 된다. FF에서 이런 문제가 생기는데 왜인지 모르겠다.

https://dl.dropboxusercontent.com/u/47197166/scam%20of%20destiny%20child.html