Rによる打ち切りデータのヒストグラム (ggplot2)

生存関数のプロットは便利だけど密度関数のプロットと比べると分布の形状を把握しにくい。

そこで打ち切りデータのヒストグラムというのが提案されている（Huzurbazar, A. V. (2005). A Censored Data Histogram. Communications in Statistics - Simulation and Computation, 34 : pp. 113-120. http://www.tandfonline.com/doi/abs/10.1081/SAC-200047089）

なんらかの方法で生存率が求まれば適当な幅 bw で生存率の差分を取り、ビンの幅で割ることで密度関数のノンパラメトリックな推定量を得ることができる。

それを関数化しました（make_df4hist · GitHub）。

シミュレーションで右打ち切りのデータを作り、密度関数のカーブと合わせてプロットすると、だいたい一致していることがわかる。

library(survival)library(tidyverse)source("https://gist.githubusercontent.com/abikoushi/b9c56028929dc0720e27e36d784a027e/raw/069dfd04ea76885b1186c93eefb75f928cdf6270/make_df4hist")
set.seed(1); x <- rweibull(10000,2,2)
d <- x<2
x2 <- ifelse(d,x,2)

sf_test <- survfit(Surv(x2,d)~1)
bw <-0.2
dfhisttest <- make_df4hist(sf_test,bw)

p_test <- ggplot(dfhisttest,aes(x=midtime,y=density))+
  geom_col(fill="white",colour="black",width = bw)+
  stat_function(fun = dweibull, args =list(shape=2,scale=2))

print(p_test)

f:id:abrahamcow:20180124103039p:plain

パラメトリックモデルの当てはまりを見るのなんかにも使えるかもしれない。

lung2 <- lung %>% 
  filter(ph.ecog!=3)%>% 
  mutate(sex=sex-1)

sf <-survfit(Surv(time,status)~sex+ph.ecog,data=lung2)
sr <-survreg(Surv(time,status)~sex+ph.ecog,data=lung2)

bw <-120
df4hist <- make_df4hist(sf,bw)

dfparam <- df4hist %>% 
  mutate(sex=as.integer(sex),ph.ecog=as.integer(ph.ecog))%>% 
  group_by(strata)%>% 
  summarise(m=1/sr$scale,eta=first(exp(sr$coefficients[1]+sr$coefficients[2]*sex+sr$coefficients[3]*ph.ecog)))

xv <- seq(0, max(sf$time), len=100)
dfdens <- do.call(rbind,lapply(1:nrow(dfparam),function(i){
  with(dfparam[i,],data.frame(strata, x=xv, y=dweibull(xv,shape = m, scale = eta),stringsAsFactors =FALSE))}))

p2<-ggplot(df4hist)+
  geom_col(aes(x=midtime,y=density),width = bw,fill="white",colour="black")+
  geom_line(data = dfdens,aes(x=x,y=y),colour="royalblue",size=1)+
  facet_wrap(~strata)+
  xlab("elapsed time")
print(p2)

f:id:abrahamcow:20180124103020p:plain

abrahamcow.hatenablog.com

Rによる打ち切りデータのヒストグラム (ggplot2)

Trending Articles

☆西荻南で６棟燃える大火事、男性が死亡

[1080p]回復術士のやり直し 11 完全《回復》ver.

2018年2月23日号　いわき信用組合（2月1日付）

【対策済】「SKYSEA Client View」のアップデートに失敗する問題についてのお知らせ

自宅警備員2　-灰原家の血族-　攻略

大阪・泉南イオンで飛び降り自殺とみられる転落事件が発生：ネットで拡散された理由とは

人気占い師・Sakkoが占う！今日のアナタの運勢と、ラッキーカラーは・・・

電子書籍だってDRM解除できるよ！

ゴールデン・スランバー　ザ・ビートルズ　歌詞　和訳

ブラックレディ変身３

福島県郡山市強姦事件

QGISでの赤色立体地図の作り方

vol.91　株式会社アバンス　平川順基社長　前編

チバットマンが事故死？素顔はこれ！バイクの車種や値段は？警察に出頭？

ホートレートより　女性ゲスト患者との　模擬手術プレイ : ピティナ＆丸太いずみの　医療プレイ研究所

生野が生んだスーパースター文政　現在、男道（刑務所）にて修行（服役）中㉙

【名古屋風俗】素人ロリ専門店らぶりぃひより素人パイパンロリ系少女とDeepなエロ体験記【風俗口コミ】

宇宙運命数「３」　ケンタウルス座

梶浦郁乃(東邦高校元マネージャー)今現在OLで彼氏(藤島健斗)とは交際は続いている?

カラオケ鉄板ネタになるの間違いなし「大塚愛から福原愛」って何！？