(R + Google アナリティクス)何ページ目でセッションから離脱するか。残存率の可視化。
生存曲線による残存率の可視化ランディングページ(LP)を評価する際は、直帰率が低く抑えられているかをチェックすることがよく行われます。Googleアナリティクスの管理画面から LP ごとの直帰率を見てみます。http://abrahamcow.hatenablog.com/entry/2015/02/10/201256にランディングした場合、直帰率は82.39%...
View Article(R + Google アナリティクス)何ページ目でセッションから離脱するか。ファンネルグラフによる可視化。
ファンネルグラフユーザーの回遊傾向を見る際、Webアクセス解析の分野では直帰率が低く抑えられているかチェックすることが多いようです。直帰率という指標は、もともとのデータを「直帰」「直帰でない」という情報に要約したものです。実際には「直帰」、「1ページ進んだ先で離脱」、「2ページ進んだ先で離脱」、……と様々なセッションがあります。数ページ進んだ先で、どれだけのセッションが途切れず継続しているかを見るに...
View ArticleA/Bテストのパラドックス(?)のシミュレーション
はじめにA/Bテストツールというものがあります。これはWebページ(内のパーツ)を出し分けて、どっちがユーザーに使われやすいかというのを調べるツールです。有名なA/Bテストツールのひとつ『オプティマイズリー』を見てみます。このツールには下図のような折れ線グラフを表示する機能があるようです。(Optimizely Increases Homepage Conversion Rate by 29% |...
View Article(R+Google アナリティクス)コロプレス図(塗り分け地図)
コロプレス図(塗り分け地図)R で地図上にデータを表示する方法はいろいろある。でもシェープファイルを用意しなきゃいけなかったりするのがめんどくさい。そんなときは choroplethr パッケージを使うのが楽でいいと思った。Googleアナリティクスでは(たぶん)IP...
View Article(R + Google アナリティクス)スパークラインからはじめる探索的アクセス解析
はじめに多くのWeb解析担当者という人たちは日々なにをやっているのでしょうか。おそらくみんな「注目すべき事象」と「その原因」を探しています。こういうとむずかしく感じるかもしれませんが、分解していくとその作業は単純です。「注目すべき事象」と「その原因」というのは言い換えると「変化」と「その内訳」です。もっというと「データを時系列でみる」→「データを層別でみる」これだけです。スパークラインではデータを時...
View Article(R + Google アナリティクス)ピボットテーブル感覚で探索的アクセス解析
課題設定「当サイトでは、セッションは増加傾向にあるものの、リピーターが若干伸び悩み、ユーザーの定着に課題を感じている」ということにします。この課題をより具体的に把握するために、品質管理の七つ道具の一つ、層別を使います。層別(スライシング)層別のためのツールとして、あんちべ『データ解析の実務プロセス入門』ではエクセルのピボットテーブル機能が紹介されています。 R では...
View Article[ggplot2]折れ線グラフを基準値の上下で塗りつぶす
library(ggplot2) ybar <- mean(lh) lh2 <- c(ybar,lh,ybar) df4plot <-data.frame(time=1:length(lh2), lh=lh2) df4plot$lower <- ifelse(lh2<=ybar,lh2,ybar) ggplot(df4plot,aes(x=time,y=lh))+...
View Article[R]度数分布表を作って折れ線グラフで比較する
set.seed(1234) X <- rnorm(100,1,1) Y <- rnorm(100,3,1) Z <- rnorm(100,2,0.5) breaks <-seq(-5,7,by=1) plot(table(cut(Z,breaks)),type="b",col="royalblue",ylab="frequency")...
View ArticleR: 複数回答のアンケートのグラフの例
経緯「新知事に優先して取り組んでほしい政策は「教育・子育て」が41・9%で最多」都知事に改憲阻止を求めている有権者などいないようである (゚⊿゚) 【東京都知事選 序盤情勢】https://t.co/TheBuRLRPVpic.twitter.com/NOWyQFxQSb— ano_ano (@ano_ano_ano) 2016年7月18日この円グラフおかしいやろ...
View Article時系列で見て安定している KPI の探し方
要約見よう見まねでぼくのブログの KPI を策定してみた。折れ線グラフでスパイクをチェック変動係数で散らばりをチェック箱ひげ図で曜日効果をチェック良き KPI とはKPI は時系列で見て安定していることが求められる。tokoroten 氏は KPI を乱高下させる要因を「スパイクノイズ」と「ホワイトノイズ」に分類した(DAUを評価指標から捨てた会社の話...
View Article(ggplot2)順位の入れ替わりプロット
なんと呼ぶのかわからないグラフlibrary(cowplot) set.seed(100) old <-data.frame(Group ="old", Rank =1:5, Text = c("一郎","次郎","三郎","四郎","五郎")) new <-data.frame(Group ="new", Rank = sample(1:5), Text =...
View ArticleR {arules} によるアソシエーション分析の結果をどうやったら見やすく表示できるか試行錯誤中
library(arules)library(cowplot) data("Adult") rules <- apriori(Adult, parameter =list(supp =0.5,conf =0.9,target ="rules",maxlen=2)) rules_lhs <-as(lhs(rules),"list")#条件部 rules_rhs...
View ArticleR {Nippon} パッケージのコロプレス図(塗り分け地図)に凡例をつける
全国最低賃金地域別最低賃金の全国一覧 |厚生労働省の表をプロットしてみる.カラーパレットには RColorBrewer パッケージを使います.library(rvest)library(dplyr) url1 <-"http://www.mhlw.go.jp/stf/seisakunitsuite/bunya/koyou_roudou/roudoukijun/minimumichiran/"...
View Articleラザニアプロット(fields パッケージの image.plot にちょっと一工夫)
このエントリは計算機統計学会第30回シンポジウムにおける兼田麻里奈、坂本亘両氏のご発表「ラザニアプロットを用いた経時データの視覚化」にインスパイアされたものです。時系列データを表現するのによく用いられるのは折れ線グラフですが、複数の系列を同時にプロットした場合、線が重なり見づらくなります。Swihart et al. (2010)...
View Article(R+Google アナリティクス)エラーバーで信頼下限をプロット
場面設定当サイトは女性の訪問者が少ないので、女性の訪問者を増やしたいと思っている。サイト作りの参考にしようと女性の新規訪問の割合が多いランディングページをリストアップしたい。そこで新規セッション率で降順にソートをかけると、セッション数10〜20くらいのページばかりが上の方にきた。分母の数が小さいときに割り算値を額面通りに受け取ってよいものか。そういうときには区間推定をして、信頼下限で判定してやろう。...
View ArticleGoogle アナリティクスのインタレストカテゴリを平行座標プロットで再クラスタリング
インタレストカテゴリとはGoogleではオンラインでの活動や購買行動からユーザーの興味・関心を推測して、ユーザーを分類しています。この分類は「インタレストカテゴリ」と呼ばれています。Googleアナリティクスでは、インタレストカテゴリには「アフィニティ カテゴリ」、「購買意向の強いセグメント」、「他のカテゴリ」の...
View Articleggplot2 で欠けた円グラフ
久しぶりに円グラフを描きたくなった。100% に満たない量を表す欠けた円グラフ。library(cowplot) dat<-data.frame(group=LETTERS[1:2],y=c(0.7,0.4)) ggplot(dat)+ geom_bar(aes(x=group,y=y*100),width=100,stat ="identity")+ ylim(c(0,100))+...
View Articleかけ算九九の表をグラフにしてみました
library(dplyr)library(cowplot) kuku <-data_frame(left=rep(1:9,each=9),right=rep(1:9,9))%>% mutate(ans=left*right) ggplot(kuku,aes(x=factor(left),y=factor(right)))+ geom_tile(aes(fill=ans))+...
View ArticleGoogle アナリティクスとサーチコンソールのデータをマージして使う
統計ソフト R から Googleアナリティクスのデータを引っぱってこれるパッケージ googleAnalyticsR の使い方は、googleAnalyticsR の使い方(Version:0.1.0) - 廿TTにざっと書いた。サーチコンソールのデータを引っぱってこれるパッケージ searchConsoleR の使い方は、[searchConsoleR]要対策キーワードをあぶり出す回帰分析 -...
View ArticleR でシミュレーションする格子の上の SIR モデル
SIR モデルは感染症の流行過程のモデルで、詳しくは 感染症のモデル(SIRモデル)に入門した - 廿TTに書いた。あたらしい人工知能の教科書 プロダクト/サービス開発に必要な基礎知識作者:多田智史,石井一夫出版社/メーカー:翔泳社発売日: 2016/12/17メディア:単行本(ソフトカバー)この商品を含むブログ (1件) を見る「あたらしい人工知能の教科書」の第 3...
View Article