Personal analyze 諸分析 .

    (4)トップ率に関する有意差検定


 半荘 N 回やって、X回トップを取った人のトップ率 t は、t = X/N (標本値)で定義するものとします。この得られた標本値から考えて、自分の実力としての雀力T(トップ率の母集団値)がいかほどのものか知りたい場合には、以下の計算をすればよい。

帰無仮説:T=a(←証明したい数値、例えば、0.4とか0.5とかを入れる)
対立仮説:T>a(右片側検定)

          |t−a|
統計量U=−−−−−−−−−−−−−*平方根(N)
          平方根(a*(1−a))
       
 この統計量Uと標準正規分布の右片側α%点と比較し、U>u(α) であれば、有意水準αで帰無仮説を棄却します。

 有意水準1% u(α)=u(0.01)=2.326
 有意水準5% u(α)=u(0.05)=1.645 です。

 なお、適応の目安として、NT>5とします。また、統計量自身がすでに近似計算してありますので、小数第3位以下はあまり信憑性がありません。また、T<aの可能性も考慮して両側検定でやる場合は、右片側(α/2)%点と比較して、
 有意水準1% u(α/2)=u(0.005)=2.576
 有意水準5% u(α/2)=u(0.025)=1.960
で行います。

★★数値例です★★
(問題)半荘20回やって、トップ15回取りました。この人の雀力 T は、T>50% と言ってよいか、有意水準1%で検定せよ。

標本比率として、t=15/20=0.75
帰無仮説:T=0.5  (a=0.5のケース)
対立仮説:T>0.5  (右片側検定)

         (0.75−0.5)
統計量U=−−−−−−−−−−−−−−−−*平方根(20)
        平方根(0.5*(1−0.5))

     =2.236<2.326=u(0.01)

 となり、きわどく、帰無仮説T=0.5を棄却できません。
(何の結論も得られない状態になる)
(有意水準5%だと1.645より大きいので棄却できます)
(T=0.49という帰無仮説を立てると、有意水準1%で棄却できます。)
 なお、このトップ率Tは、半荘6回とか8回とかの短期決戦におけるトップ率Rであるとしても、全く同じように解けます。

 今までの8連勝の例にこだわってもいいのですが、本当は、F分布を使わなければだめだとか、勝率100%なんで、信頼区間もままならず、ちょっと例としてはよくないかなーと思って変えました。

 また、結論の解釈ですが、「有意水準5%で、T>50%と言ってよい」と言えるということは、この人の最近の20回の試合ぶりの勝率7割5分というデータから、将来を予測すると、次の半荘でトップをとる確率は、50%以上といっても構いません。
 ただし、この判断を誤る可能性は、5%存在します。すなわち同じ様な判断を100回繰り返すとそのうちの95回は判断を間違えないですが、残り5回は間違うと考えられます。

上昇曲線論の決着(?)

#3370のF分布で計算してみました。
 n=8、k=8、p=8/8=1.0
 n1=2(8−8+1)=2
 n2=2*8=16
 
 F(n1,n2,α/2)=F(2,16,0.01)=6.226
                ^^^^^^^^
                  ↑
 上限は100%だから下限だけで、1%とっていいのかな?0.005でやるべきか?
よって、
信頼下限=16÷(2*6.226+16)=0.562
  ∴ 0.562<R<1.0 (99%信頼区間)
このRで8半荘中、4勝以上する確率を計算します。

 以下の方法論は、自分は完全には同意したわけではないですが、大勢はこの方法が正しいということなので、自らの不利を顧みず計算結果を提示します。(^_^;

 Rの値が変化した場合の様子をみるために、文字のまま計算します。

8勝:8C8*R^8 =  R^8
7勝:8C7*R^7*(1−R) = 8R^7*(1−R)
6勝:8C6*R^6*(1−R)^2=28R^6*(1−R)^2
5勝:8C5*R^5*(1−R)^3=56R^5*(1−R)^3
4勝:8C4*R^4*(1−R)^4=70R^4*(1−R)^4

 全部合計して、
Σ=R^4*(70*(1−R)^4+56R*(1−R)^3+28R^2*(1−R)^2 +8R^3*(1−R)+R^4)=G(R) 

このΣをG(R)とおいて、Rに関する関数と考えます。このRの8次関数について、99%信頼区間内での最大値と最小値をだす。

まず微分して、
 G'(R)=280*R^3(1−R)^4 と意外と(?)と簡単な形になりました。

増減表を書いてみます。

    R     −無限大....0....1....+無限大
    G'(R)       − 0 + 0 +
    G(R)       下降 上昇 上昇

0<R<1 の範囲では、G'(R)>0とG(R)は単調増加を示します。

個別の値を計算してみると、
 G(0)    =0 (以下、括弧内の数字は小数第5位を四捨五入した)
 G(0.1)  =0.01   (0.0050)
 G(0.2)  =0.06   (0.0563)
 G(0.3)  =0.20   (0.1941)
 G(0.4)  =0.41   (0.4059)
 G(0.5)  =0.64   (0.6367)
 G(0.562)=0.76   (0.7627)
 G(0.6)  =0.82   (0.8263)
 G(0.7)  =0.94   (0.9420)
 G(0.8)  =0.99   (0.9896)
 G(0.9)  =1.00   (0.9996)
 G(1)    =1

とここまで計算しました。
0.562<R<1.0 (99%信頼区間)だから、単純に 0.76<G(R)<1 でいいのかな。ようわからん。。。。

8連続トップ

>8連勝=8連続トップという意味ですね?。
>記録に残っているゲーム、即ちチャット麻雀(406半荘戦)月例会(約200半荘戦)
>及び某麻雀団体における約5000一荘戦において一度もありません。

 別人28号さんほどの高打率のトップ率の方でも、一度遭遇するかどうかのレベルの発生頻度ということですね。そこで、単純に、トップ率(R)と連続トップ数(5から8まで)を変化
させて計算させてみました。
 例えば、R=0.35の8連続では、(0.35)^8=0.00023 というぐあいに単純にRの8乗を計算しています。

 R | 0.25 | 0.30 | 0.35 | 0.40 |
−−−−−−−−−−−−−−−−−−−−−−−−
8連続| 0.00002 | 0.00007 | 0.00023 | 0.00066 |
7連続| 0.00006 | 0.00022 | 0.00064 | 0.00164 |
6連続| 0.00024 | 0.00073 | 0.00184 | 0.00410 |
5連続| 0.00098 | 0.00243 | 0.00525 | 0.01024 |
4連続| 0.00391 | 0.00810 | 0.01501 | 0.02560 |

R=0.35の場合だと、5連続トップの確率は約200分の1、
8連続トップの確率は、約5000分の1、と出ました。
R=0.25の平均的プレーヤーの場合、8連続トップの確率は、約50000分の1です。うーん、やっぱり大変むずかしい。(@_@)

最終結論が見えたか

少し確率の本を読んで勉強し直しました。

 母集団の特性値(今の場合は、半荘ごとのトップ率R)が判明しても、確率変数X(試行の結果を表す変数のこと、今の場合はトップ率)の分布があるわけで、トップ率Rの結果が必ず帰って来るわけではなく、二項分布であれば、その平均E(X)=N*R、分散V(X)=平方根(N*R*(1-R))、の分布を示すことがわかりました。(当たり前か・・・)
 
 したがって、例えば、トップ率R=0.30の人の場合、半荘100回やれば、単純に30回トップを取ると考えてはだめで、
 E(X)=N*R=100×0.30=30
 V(X)=平方根(N*R*(1-R))=SQRT(100×0.30×0.70)=4.583
の二項分布B(100,0.30)に従うと考える必要があります。つまり最大の山は30回の付近にありますが、その近辺も十分ウロウロするということです。

ちょっと具体例で計算してみました。
(1)トップ数が31回以上40回以下となる確率は?
 P(31≦X≦40)=φ((40-30+0.5)/4.583)-φ((31-30-0.5)/4.583)
          =φ(2.29)-φ(0.11)
          =0.4890-0.0438=0.4452  ∴約45%
 
(2)トップ数が25回以下になる確率は?
 P(0≦X≦25)=φ((25-30+0.5)/4.583)-φ(0-30-0.5/4.583) =-φ(0.98)+φ(6.65)
   =-0.3365+0.5=0.1635  ∴約16%

 なおこの計算では2項分布の正規分布近似として、ラプラスの定理を使っています。さらに離散分布から連続分布への補正も行っています。

ラプラスの定理
P(a≦S≦b)=φ((b-E(X)+0.5)/V(X))-φ((a-E(X)-0.5)/V(X))
φは標準正規分布を表しており、φ(∞)=0.5 です。
by 多摩(ターニア)97/7/3

以前へ  以降へ  目次へ