打者の調子の波のモデル化（幾何分布編）

仮説検定

Albert (2008) "Streaky Hitting in Baseball"ではベータ二項分布を用いて野球選手の調子の波を評価した。

Albert (2008) 打者の調子の波のモデル化 - 廿TT

下記はカルロス・ギーエンという選手の2005年の打撃成績のデータで、ヒットを 1、アウトを 0 とコード化してある。

GuillenC <- c(0,1,0,1,1,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,1,1,1,0,0,0,0,0,0,1,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,1,0,1,0,1,0,1,0,0,1,1,0,1,0,1,1,0,1,0,1,1,0,0,0,0,0,1,1,1,1,0,0,1,0,1,0,0,1,1,0,0,0,1,0,1,0,0,0,1,1,1,0,1,1,1,1,0,0,1,1,1,1,0,0,1,0,0,1,0,1,0,0,0,1,0,1,0,0,0,0,0,1,1,1,0,0,1,0,0,0,0,0,0,1,1,1,0,1,0,0,0,0,1,1,1,1,0,1,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,1,1,0,1,0,0,0,0,0,0,0,0,0,1,1,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,1,0,0,0,0,1,1,0,1,0,0,1,0,0,0,1,0,1,0,0,0,0,0,0,0,0,1,0,1,0,0,1,1,1,1,0,0,0,0,0,1,1,0,1,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,1,0,0,1,0,0,0,1,1,0,0,1,0,0,0,1,0,0,0,0,1,0,0,0,0,1,1,0,1,1,1,0,1,0,0,0,0,0,1,0,1,1,0,0,0,1,0,0,0,1)

調子の波が存在しない選手は、常にコンスタントな打率でヒットを出すから、その打撃成績を上記のように 0 か 1 かに符号化すると、それはベルヌーイ過程になる。

帰無仮説：
“ギーエンの0-1のプロセスがベルヌーイ過程である。”

対立仮説：
“ギーエンの0-1のプロセスがベルヌーイ過程でない。”

として、仮説検定ができないだろうか。

ベルヌーイ試行で 1 が出るまでの待ち時間の分布は幾何分布になる。

ギーエンの場合、1 が出るまでの待ち時間（打席数）の最大値は 19 だった。

Image may be NSFW.
Clik here to view. f:id:abrahamcow:20160416104815p:plain

spacings <-diff(which(c(1,GuillenC)==1))-1#1が出るまでの待ち打席数
plot(table(spacings))

幾何分布の最大値の分布を帰無分布として、ギーエンの 19 という数字が得られる確率が十分に小さければ、ギーエンには調子の波が存在すると言えそうである。

帰無仮説の下で最大値が 19 以上（18を超える）になる確率が p-値になる。

n個の標本の最大値が x以下である確率は、

Image may be NSFW.
Clik here to view. $P\{x_{1}\leq x \mbox{ and } x_{2}\leq x … \mbox{ and } x_{n}\leq x\} \\ = {F(x)} ^n$

で与えられる。

幾何分布のパラメータの最尤推定量は、

Image may be NSFW.
Clik here to view. $p(x) = p (1-p)^x\\ \sum_{i=1}^{n} log p + x_i log(1-p)\\ \frac{n}{p} - \frac{\sum_{i=1}^{n} x}{1-p} =0\\ n(1-p) - p \sum_{i=1}^{n} x =0\\ n-p(n + \sum_{i=1}^{n} x) =0\\ \hat p = n/(n + \sum_{i=1}^{n} x) =1/(1 + \bar X)$

である。

phat <-1/(1+mean(spacings))
n=length(spacings)1-pgeom(18,phat)^n

p-値は 0.067 で、通例使われる有意水準5%では、帰無仮説は棄却されず、ギーエンに調子の波が存在すると考える必要性はあまりなさそうだ。

ベータ幾何分布

ふつうの幾何分布では、ベルヌーイ試行の成功確率 pは一定だが、ベータ幾何分布は各試行ごとに pが変化すると解釈できる。

ベータ幾何分布の確率関数は、

Image may be NSFW.
Clik here to view. P(x) = B(a+1,x+b)/B(a,b)

で与えられる。ここで Bはベータ関数

これを、

Image may be NSFW.
Clik here to view. $P(x) = B(K\eta+1,x+K(1-\eta))/B(K\eta,K(1-\eta))$
Image may be NSFW.
Clik here to view. $(K>0, 0 < \eta < 1)$

と改めてパラメタライズすることで、ηは打率の中心を決めるパラメータ、Kは打率の精度を決めるパラメータと解釈できる。

Kが大きいほどばらつきが小さくなる。

最尤推定でベータ幾何分布のパラメータを推定し、ふつうの幾何分布と当てはまりを比較する。

library(VGAM)
dbetageom2 <-function(x,K,eta,log=FALSE){
  dbetageom(x,K*eta,K*(1-eta),log = log)}
points(0:19,dgeom(0:19,phat)*n,type="b",pch=4,col="red")
LL <-function(par){sum(dbetageom2(spacings,par[1],par[2],log =TRUE))}
fitbetageom <- optim(c(1,0.1),LL,control =list(fnscale=-1))
points(0:19,dbetageom2(0:19,fitbetageom$par[1],fitbetageom$par[2])*n,type="b",pch=4,col="blue")
legend("topright",legend=c("beta","beta-geometric"),pch=c(4,4),col=c("red","blue"))

Image may be NSFW.
Clik here to view. f:id:abrahamcow:20160416111412p:plain

パラメータの推定値は、それぞれ、

Image may be NSFW.
Clik here to view. $\hat K =27.96, \hat p =0.34$

だった。

AICは、

幾何分布：420.93

ベータ幾何分布：421.67

だった。

-2*sum(dgeom(spacings,phat,log =TRUE))+2-2*fitbetageom$value+2*2

わざわざベータ幾何分布を使ってモデルを複雑にしなくても、ふつうの幾何分布で間に合う。

やはり、ギーエンに調子の波が存在すると考える必要性はあまりなさそうだ。

ただし Albert (2008) "Streaky Hitting in Baseball"ではベータ二項分布を用いてベイズファクターを求め、このエントリとは逆の結論を導いている。

https://www.stat.berkeley.edu/~aldous/157/Papers/albert_streaky.pdf

打者の調子の波のモデル化（幾何分布編）

仮説検定

ベータ幾何分布

Trending Articles

モーツァルトディヴェルティメント変ホ長調 K.563 の名盤

井上貴博アナウンサー彼女や結婚の噂は？実家や親が話題？人気は？

Ke Aloha Kalikimakaの歌詞を和訳します

PaliのLepe `Ula`ulaと歌詞の和訳

2014年6月6日号　三菱東京ＵＦＪ銀行（5月14日付）

LNK2019:未解決の外部シンボルと LNK1120:外部参照 1 が未解決について

ヴァンパイア・ノーツ　攻略

大阪・泉南イオンで飛び降り自殺とみられる転落事件が発生：ネットで拡散された理由とは

メールディーラーで受信するアドレスを追加できますか？

Robocopy のエラー (戻り値) について

林要の結婚や経歴&評判とWikiプロフやLOVOT(ラボット)とグルーブエックス株価は

【極☆寒】「凍った髪」を競い合う『国際ヘア・フリージング・コンテスト』！寒〜い写真に身震いしつつ過ぎ行く冬にサヨナラだ!!

滋賀の部落（同和地区）一覧

【銃刀法違反】吉田総業組長代行恩田達志容疑者を再逮捕

和歌山県代表決まる　都道府県対抗中学バレー

大浦街道で重体事故

【世界大学ランキング】第１位にジュリアード音楽院とウィーン国立音大、日本勢は？

【対策済】「SKYSEA Client View」のアップデートに失敗する問題についてのお知らせ

Lahaina Lunaの歌詞を和訳しました

画像・写真】ららぽーと横浜で16歳男子高校生が転落死不審な動き→逃走し警備員に追いかけられ→柵越え飛び降り・12m転落窃盗・万引き？それとも盗撮？