半荘 N 回やって、X回トップを取った人のトップ率
t は、t = X/N (標本値)で定義するものとします。この得られた標本値から考えて、自分の実力としての雀力T(トップ率の母集団値)がいかほどのものか知りたい場合には、以下の計算をすればよい。
帰無仮説:T=a(←証明したい数値、例えば、0.4とか0.5とかを入れる)
対立仮説:T>a(右片側検定)
|t−a|
統計量U=−−−−−−−−−−−−−*平方根(N)
平方根(a*(1−a))
この統計量Uと標準正規分布の右片側α%点と比較し、U>u(α)
であれば、有意水準αで帰無仮説を棄却します。
有意水準1% u(α)=u(0.01)=2.326
有意水準5% u(α)=u(0.05)=1.645 です。
なお、適応の目安として、NT>5とします。また、統計量自身がすでに近似計算してありますので、小数第3位以下はあまり信憑性がありません。また、T<aの可能性も考慮して両側検定でやる場合は、右片側(α/2)%点と比較して、
有意水準1% u(α/2)=u(0.005)=2.576
有意水準5% u(α/2)=u(0.025)=1.960
で行います。
★★数値例です★★
(問題)半荘20回やって、トップ15回取りました。この人の雀力
T は、T>50% と言ってよいか、有意水準1%で検定せよ。
標本比率として、t=15/20=0.75
帰無仮説:T=0.5 (a=0.5のケース)
対立仮説:T>0.5 (右片側検定)
(0.75−0.5)
統計量U=−−−−−−−−−−−−−−−−*平方根(20)
平方根(0.5*(1−0.5))
=2.236<2.326=u(0.01)
となり、きわどく、帰無仮説T=0.5を棄却できません。
(何の結論も得られない状態になる)
(有意水準5%だと1.645より大きいので棄却できます)
(T=0.49という帰無仮説を立てると、有意水準1%で棄却できます。)
なお、このトップ率Tは、半荘6回とか8回とかの短期決戦におけるトップ率Rであるとしても、全く同じように解けます。
今までの8連勝の例にこだわってもいいのですが、本当は、F分布を使わなければだめだとか、勝率100%なんで、信頼区間もままならず、ちょっと例としてはよくないかなーと思って変えました。
また、結論の解釈ですが、「有意水準5%で、T>50%と言ってよい」と言えるということは、この人の最近の20回の試合ぶりの勝率7割5分というデータから、将来を予測すると、次の半荘でトップをとる確率は、50%以上といっても構いません。
ただし、この判断を誤る可能性は、5%存在します。すなわち同じ様な判断を100回繰り返すとそのうちの95回は判断を間違えないですが、残り5回は間違うと考えられます。
上昇曲線論の決着(?)
#3370のF分布で計算してみました。
n=8、k=8、p=8/8=1.0
n1=2(8−8+1)=2
n2=2*8=16
F(n1,n2,α/2)=F(2,16,0.01)=6.226
^^^^^^^^
↑
上限は100%だから下限だけで、1%とっていいのかな?0.005でやるべきか?
よって、
信頼下限=16÷(2*6.226+16)=0.562
∴ 0.562<R<1.0 (99%信頼区間)
このRで8半荘中、4勝以上する確率を計算します。
以下の方法論は、自分は完全には同意したわけではないですが、大勢はこの方法が正しいということなので、自らの不利を顧みず計算結果を提示します。(^_^;
Rの値が変化した場合の様子をみるために、文字のまま計算します。
8勝:8C8*R^8 = R^8
7勝:8C7*R^7*(1−R) = 8R^7*(1−R)
6勝:8C6*R^6*(1−R)^2=28R^6*(1−R)^2
5勝:8C5*R^5*(1−R)^3=56R^5*(1−R)^3
4勝:8C4*R^4*(1−R)^4=70R^4*(1−R)^4
全部合計して、
Σ=R^4*(70*(1−R)^4+56R*(1−R)^3+28R^2*(1−R)^2
+8R^3*(1−R)+R^4)=G(R)
このΣをG(R)とおいて、Rに関する関数と考えます。このRの8次関数について、99%信頼区間内での最大値と最小値をだす。
まず微分して、
G'(R)=280*R^3(1−R)^4 と意外と(?)と簡単な形になりました。
増減表を書いてみます。
R −無限大....0....1....+無限大
G'(R) − 0 + 0 +
G(R) 下降 上昇 上昇
0<R<1 の範囲では、G'(R)>0とG(R)は単調増加を示します。
個別の値を計算してみると、
G(0) =0 (以下、括弧内の数字は小数第5位を四捨五入した)
G(0.1) =0.01 (0.0050)
G(0.2) =0.06 (0.0563)
G(0.3) =0.20 (0.1941)
G(0.4) =0.41 (0.4059)
G(0.5) =0.64 (0.6367)
G(0.562)=0.76 (0.7627)
G(0.6) =0.82 (0.8263)
G(0.7) =0.94 (0.9420)
G(0.8) =0.99 (0.9896)
G(0.9) =1.00 (0.9996)
G(1) =1
とここまで計算しました。
0.562<R<1.0 (99%信頼区間)だから、単純に 0.76<G(R)<1 でいいのかな。ようわからん。。。。
8連続トップ
>8連勝=8連続トップという意味ですね?。
>記録に残っているゲーム、即ちチャット麻雀(406半荘戦)月例会(約200半荘戦)
>及び某麻雀団体における約5000一荘戦において一度もありません。
別人28号さんほどの高打率のトップ率の方でも、一度遭遇するかどうかのレベルの発生頻度ということですね。そこで、単純に、トップ率(R)と連続トップ数(5から8まで)を変化
させて計算させてみました。
例えば、R=0.35の8連続では、(0.35)^8=0.00023 というぐあいに単純にRの8乗を計算しています。
R | 0.25 | 0.30 | 0.35 | 0.40 |
−−−−−−−−−−−−−−−−−−−−−−−−
8連続| 0.00002 | 0.00007 | 0.00023 | 0.00066
|
7連続| 0.00006 | 0.00022 | 0.00064 | 0.00164
|
6連続| 0.00024 | 0.00073 | 0.00184 | 0.00410
|
5連続| 0.00098 | 0.00243 | 0.00525 | 0.01024
|
4連続| 0.00391 | 0.00810 | 0.01501 | 0.02560
|
R=0.35の場合だと、5連続トップの確率は約200分の1、
8連続トップの確率は、約5000分の1、と出ました。
R=0.25の平均的プレーヤーの場合、8連続トップの確率は、約50000分の1です。うーん、やっぱり大変むずかしい。(@_@)
最終結論が見えたか
少し確率の本を読んで勉強し直しました。
母集団の特性値(今の場合は、半荘ごとのトップ率R)が判明しても、確率変数X(試行の結果を表す変数のこと、今の場合はトップ率)の分布があるわけで、トップ率Rの結果が必ず帰って来るわけではなく、二項分布であれば、その平均E(X)=N*R、分散V(X)=平方根(N*R*(1-R))、の分布を示すことがわかりました。(当たり前か・・・)
したがって、例えば、トップ率R=0.30の人の場合、半荘100回やれば、単純に30回トップを取ると考えてはだめで、
E(X)=N*R=100×0.30=30
V(X)=平方根(N*R*(1-R))=SQRT(100×0.30×0.70)=4.583
の二項分布B(100,0.30)に従うと考える必要があります。つまり最大の山は30回の付近にありますが、その近辺も十分ウロウロするということです。
ちょっと具体例で計算してみました。
(1)トップ数が31回以上40回以下となる確率は?
P(31≦X≦40)=φ((40-30+0.5)/4.583)-φ((31-30-0.5)/4.583)
=φ(2.29)-φ(0.11)
=0.4890-0.0438=0.4452 ∴約45%
(2)トップ数が25回以下になる確率は?
P(0≦X≦25)=φ((25-30+0.5)/4.583)-φ(0-30-0.5/4.583)
=-φ(0.98)+φ(6.65)
=-0.3365+0.5=0.1635 ∴約16%
なおこの計算では2項分布の正規分布近似として、ラプラスの定理を使っています。さらに離散分布から連続分布への補正も行っています。
ラプラスの定理
P(a≦S≦b)=φ((b-E(X)+0.5)/V(X))-φ((a-E(X)-0.5)/V(X))
φは標準正規分布を表しており、φ(∞)=0.5
です。
by 多摩(ターニア)97/7/3
|