[ggplot2]折れ線グラフを基準値の上下で塗りつぶす
library(ggplot2) ybar <- mean(lh) lh2 <- c(ybar,lh,ybar) df4plot <-data.frame(time=1:length(lh2), lh=lh2) df4plot$lower <- ifelse(lh2<=ybar,lh2,ybar) ggplot(df4plot,aes(x=time,y=lh))+...
View ArticleRF指標から平均購買頻度を求める
はじめに顧客関係管理(CRM)の現場では、RFM 分析という手法が広く使われているそうです. 顧客の購買行動の詳細を蓄積していない企業でも R(リセンシー:直近の購買からの経過時間)や F (フリクエンシー:観測期間中の購買回数)だけは把握していることがままあるようです.データセットはこんな感じです. recency frequency 1 9.089831 3 2 9.739291 6 3...
View Article窓打ち切りデータからのワイブル再生過程のパラメータ推定(RStan版)
詳細は 窓打ち切りデータからのワイブル再生過程のパラメータの最尤推定 - 廿TTを参照してください。パラメータを推定するだけなら最尤法の枠組みのなかで十分なんですが、RStan でもできるかな、という練習です。#シミュレーションでデータを生成 simu1 <-function(){#set <- numeric(0) set...
View Articleインターネット利用者数のデータにバスモデルを当てはめてみた
バスモデルのなんたるかについては バスモデル - ORWikiを参照。とりあえず閉じた形で解が求まるらしい。deSolve パッケージを使って数値的に解いた値と解析解をくらべて、この解が正しいことを一応確かめた。丸が数値解、曲線が解析解。#Rのコード Bass <-function(t,m,a,b,c){...
View Article[RStan]変曲点のある単回帰分析
豊田秀樹『マルコフ連鎖モンテカルロ法』5章8節の例題。マルコフ連鎖モンテカルロ法 (統計ライブラリー)作者:豊田秀樹出版社/メーカー:朝倉書店発売日: 2008/05メディア:単行本購入: 11人 クリック: 168回この商品を含むブログ (13件) を見る変曲点のある回帰直線、を attenu データに当てはめる。Stan のコードはこんな感じ。data {...
View ArticleRStanで自殺者数推移の変化点を調べる
日本の自殺者数は平成10年に急増して3万人を超えて以来高い水準で推移していましたが、平成24年に久しぶりに3万人を下回り、今のところ減少傾向です。このデータに変曲点のある回帰直線、を当てはめて変化点をうまく検出できるか試してみます。コードは [RStan]変曲点のある単回帰分析 - 廿TTと同じなので省略します。データはこれです。32863, 33048, 31957, 31042, 32143,...
View ArticleRStan でポアソン過程の停止時刻を推定する
問題設定n = 20人の患者さんが繰り返し訪問する病院の窓口を T = 100時間観察した。患者 iはそれぞれある時期 に達すると病院への訪問をやめる(理由は不明:病気が治ったか、遠くに引っ越したか、通院に飽きたか、死んだか)。この訪問がレート λ(全患者共通のパラメータ)のポアソン過程であるとして、各患者さんが訪問をやめた時間 を求めたい。ただし、各患者さんの訪問回数...
View Articleタンクモデルのシミュレーション
タンクモデルとは気象庁|土壌雨量指数気象庁|流域雨量指数を参照。(上記ページから引用)シンプルといえばシンプルだけどこんなモデルどうやってパラメータ推定するんだろう。都市域:1段タンクモデル#R のコードlibrary(deSolve)library(tidyr)library(ggplot2)library(pipeR) tunk1 <-function(Time, State,...
View Article一階線形常微分方程式を使った流行語のモデル
モデル化流行語は話題にする人が増えれば増えるほどさらに流行しやすくなり、ある時期を超えると忘れられていくと考えられる。このダイナミクスをなるべく簡単な微分方程式で記述したいのでこのような仮説を置いた。流行語の拡散スピードは話題にされる量に比例する単位時間経過ごとに流行語を話題にする人は減っていくこれを式で表すとこのようになる。rは流行語の伝達スピードについての係数なので「拡散係数」とよぶことにする。...
View Article独立メトロポリス・ヘイスティングス法を用いたベイズ推測の簡単な例題
なぜ MCMCが必要かベイズ統計学では母数 θ を確率変数と考える。ベイズ統計のための準備, ベイズの定理, 事前分布と事後分布 - 廿TTベイズ推測はデータ が得られたもとでの θ の確率分布 事後分布を通じて行われる。母数 θ の点推定には事後期待値(expected a posteriori ; EAP)推定量などが用いられる。θ...
View Article[R]度数分布表を作って折れ線グラフで比較する
set.seed(1234) X <- rnorm(100,1,1) Y <- rnorm(100,3,1) Z <- rnorm(100,2,0.5) breaks <-seq(-5,7,by=1) plot(table(cut(Z,breaks)),type="b",col="royalblue",ylab="frequency")...
View Article離散時間データからの指数分布のパラメータの最尤推定
尤度関数と最尤推定量イベント発生が区間 に起こったことがわかっており、イベントが発生した時間そのものはわからない状況を考える。このようなデータを区間打ち切り(interval censored)データと呼ぶ。尤度は、である。以降、指数分布を仮定して考える。区間の幅が固定されており のとき、 尤度関数は、である。対数をとって、微分して、0 と置いて解くとシミュレーション, とする。サンプルサイズを...
View Article離散時間データからのワイブル分布のパラメータの最尤推定
尤度イベント発生が区間 に起こったことがわかっており、イベントが発生した時間そのものはわからない状況を考える。このようなデータを区間打ち切り(interval censored)データと呼ぶ。尤度は、である。シミュレーションR の survival パッケージでは Turnbull...
View ArticleRStan でベイズ逆問題もどき
, という系列を考える。Aは定数。(この系列になんらかの解釈があればおもしろかったんだけど思いつかなかった。)いま、観測されるのは のみである。が既知ならば Aを推定するのはかんたん。Aが既知ならば を推定するのはかんたん。しかし、いま観測されるのは のみ。が になる組み合わせは無数にあり、と Aを同時に推定するのは困難に思える。しかし、以下の仮定を置くことで、と Aを推定することができる。は区間...
View Article超球の体積をモンテカルロシミュレーションで求める
モンテカルロ法の例題として、円周率πの値の近似はよく見る。正方形の領域に一様に点を打ち、内接する円の中に入った点の個数を全部の点の個数で割ってやると、正方形の面積と円の面積の比が出てくる。正方形の面積と円の面積の比に正方形の面積を掛けてやると、円の面積が出てくる。#Rのコード set.seed(1234) n <-1e+04 x <-runif(n,-1,1) y...
View Article最尤法を理解するためのお絵かき
黒い点が観測値線分で表した高さの積が尤度赤と青では青のほうが尤度が大きいパラメータを動かして最も尤度が大きい分布を見つけるのが最尤法最尤法の説明はむずかしくて、下手すると半端に哲学っぽくなっちゃうんだけど、ぼくの場合はこういう図を描いてみてなんとなく納得はいった。#図をかくための R のコード set.seed(1234) x =rnorm(5,5,2) dat...
View ArticleRStanで離散パラメータを含むモデルの推定(disaster model)
前置きStan のマニュアル11章の例題です。 Stan は離散パラメータをサポートしていないので、離散パラメータを含むモデルの推定では周辺化して離散パラメータを消去してやる必要があります。その練習です。解析対称はイギリスの炭鉱事故の発生件数のデータです。3. Tutorial — PyMC 2.3.6 documentationから取得しました。#R のコード dat <-...
View Article観測期間にギャップのあるワイブル過程のパラメータの最尤推定
最尤推定量ワイブル過程のパラメータの最尤推定 - 廿TTの続きです.Crow (1988) に出てくる例題をやります. を区間 でのイベントの発生時刻, を区間 でのイベントの発生時刻として,非定常ポアソン過程を区間 と ()で観測した場合の尤度関数は以下のようになります.対数をとり, ワイブル過程の強度関数 を代入して,これを微分して 0 と置いて解きます....
View Articleめったに起きないコンバージョンの成長の非定常ポアソン過程によるモデル
弱小アフィブログの成長これは当ブログのアマゾンアフィリエイトレポートの折れ線グラフです。横軸が日付, 縦軸がその日の注文数合計です。注文数合計は 0 が多く, 折れ線グラフは下に潰れて, 注文があった日だけスパイクのようにとげとげつきだしています。サイトへの訪問者に対して, CV(注文)の発生が少ないため,...
View Article変化点のあるポアソン分布のパラメータの最尤推定
モデル変化点のあるポアソン分布についてはいろんな研究がなされていますが、一番単純と思われる手法を試します。解析対称はイギリスの炭鉱事故の発生件数のデータです。3. Tutorial — PyMC 2.3.6 documentationから取得しました。#R のコード dat <-...
View Article