偏差値好きな人多い印象あるけどぼくはあんまり好きじゃなかった。
でもなんとなく Googleアナリティクスデータで偏差値出してみたら、これはこれでけっこういいかも、と思った。
次元(単位)のない量にして、複数の指標どうしを概観的に比較できる。
セッション数、新規率、直帰率、平均滞在時間、ページビュー/セッションをページごとにくらべたヒートマップ(色付きテーブル)が以下です。
セッション数上位ページでは目立った違いは少ないけど、平均滞在時間の優等生は、
だった。
上のような図をかくための R のコードを以下に記載します。
library(RGA)library(dplyr)library(tidyr)library(ggplot2) authorize() prof <-list_profiles() dat1 <-get_ga(profileId = prof$id[1], start.date ="2016-03-01", end.date ="2016-03-31", dimensions ="ga:pageTitle", metrics ="ga:sessions,ga:percentNewSessions,ga:bounceRate,ga:avgSessionDuration,ga:pageviewsPerSession") standardScore<-function(x){ mu <- mean(x) sigma <- sd(x)10*(x-mu)/sigma +50} dat2 <- dat1 %>% mutate(standardScore(sessions), standardScore(percentNewSessions), standardScore(bounceRate), standardScore(avgSessionDuration), standardScore(pageviewsPerSession)) %>% arrange(desc(sessions)) %>% select(pageTitle,sessions,starts_with("standardScore")) dat3 <-dat2 %>% gather(key,value,-c(pageTitle,sessions)) filter(dat3,sessions>=100)%>% ggplot(aes(x=key,y=reorder(paste0(substr(pageTitle,1,6),"..."),value)))+ geom_tile(aes(fill=value))+ geom_text(aes(label=round(value)))+ theme_bw(15,base_family ="HiraMaruProN-W4")+ scale_fill_continuous(low="white",high="cornflowerblue")+ ylab("")+xlab("")
偏差値のなんたるかについてはウィキペディアなどをみてください。