R の treemapify パッケージで Google アナリティクスのデータをツリーマップに
ただパッケージ動かしてみたっていうだけなんですけど。インストール方法は GitHub - wilkox/treemapify: 🌳 ggplot2 geoms for drawing treemapsに従ってください。ggplot の記法が使えて、facet...
View Article{googleAnalyticsR} {ggplot2} 内訳をドリルダウンしていく棒グラフ
ggplot2 で左から右に内訳をドリルダウンしていく棒グラフ(ツリーマップ?)を書きました。新規ユーザーで自然検索経由訪問のデスクトップを利用している男性の25歳〜34歳のCVが多いことがわかります。ついで再訪ユーザーでソーシャル経由訪問のモバイルを利用している男性の25歳〜34歳のCVが多いようです。R...
View Article{ggplot2} 集計済みデータのヴァイオリンプロット
データがこのようにすでに集計された状態で与えられたときに、複数カテゴリ間で分布を比較したい。 value A B 111322223331ヴァイオリンプロットが使えることがわかった。library(cowplot)library(tidyr) data <-data.frame(value =1:3, A =1:3, B =3:1) data2 <-data %>%...
View Article{googleAnalyticsR} {ggplot2} Crossbar plot で滞在時間の分布を比べる
Crossbar plot は次のような図です。これがなにを表すかは場合によります。今回は箱の上の辺にデータの75%点、真ん中の線に中央値、箱の下の辺に25%点を割り当てました。いわば退化した箱ひげ図です。次の図はあるランディングページを経由した訪問の、月ごとの平均滞在時間のグラフです。直帰セッションはのぞいています。なかなか変動が激しくて、これを見ていると一喜一憂しそうです。上述の...
View Articleggplot2 で移動平均(stat_ma)
Extending ggplot2(Extending ggplot2(和訳) - Qiita)を読んで自分でも新しい stat を作ってみたくなったので、手始めに練習として移動平均を描画する関数 stat_ma を書いてみました。stat_ma.R ·...
View Articleggplot2 で二項分布の成功確率パラメータの信頼区間
ggplot2 で移動平均(stat_ma) - 廿TTに引き続き、二項分布のパラメータの信頼区間を描画する stat_binomCI を書いた。stat_binomCI.R ·...
View Articleggplot2 でラザニアプロット(ある値以上の値を合算したヒートマップ)
geom_lasagna.R · GitHubを書きました。ラザニアプロットというのは要は時系列データについてのヒートマップ(色付きテーブル)です(ラザニアプロット(fields パッケージの image.plot にちょっと一工夫) - 廿TT)。さて、Web...
View Articleggplot2 で内訳を左から右に詳細化していく棒グラフ
ggplot2 でラザニアプロット(ある値以上の値を合算したヒートマップ) - 廿TTに引き続き、新しい geom を作ってみたくて geom_drilldown.R · GitHubを書きました。ggplot2 で内訳を左から右に詳細化していく棒グラフ(ツリーマップ?)です。{googleAnalyticsR} {ggplot2} 内訳をドリルダウンしていく棒グラフ -...
View ArticleGoogle アナリティクス:マルチチャネルレポートの図示(アトリビューション分析)
googleAnalyticsR を使ってコンバージョン経路レポートを集計する関数を書いた。pathanal.R · GitHub内部で dplyr...
View Article{googleAnalyticsR} {ggplot2} 何秒でユーザが離脱したか、残存率の図示
直帰率や平均滞在時間よりも詳しくエンゲージメントを把握したい場合、次の図がおすすめです。何秒目に何パーセントのセッションが継続しているかを知ることができます。ここでは新規訪問とリピーター訪問で層別していますが、ランディングページや流入経路で分けるのもよいと思います。下の細かい線分はコンバージョンの発生した時刻を示しています。library(googleAnalyticsR)library(cowpl...
View Article[searchConsoleR]CUSUM管理図で掲載順位の変化点を半自動検出
Search Console ではページごとの平均掲載順位(position)のデータが取れるけど、順位の変動を見張るのは大変である。そこでCUSUM管理図の考え方を使って、変化点の検出を半自動化してやろう。CUSUM管理図については Google アナリティクスデータの変化を検知するための CUSUM 管理図 -...
View Articleよく状態空間モデルの説明で出てくる図を tikz で書く
¥documentclass[dvipdfmx]{standalone}¥usepackage{tikz}¥usetikzlibrary{shapes, positioning,arrows,automata}¥begin{document}¥begin{tikzpicture}[->, auto,thick]¥node[state, fill=gray, text=white] (a1)...
View Article[googleAnalyticsR]再発事象のカプラン・マイヤープロット
survrec っていうパッケージもあるらしいけど慣れてないので survival を使います。どのチャネルが再来訪しやすいのか、何日くらいの間隔で何パーセントくらい戻ってくるのかがわかります。library(googleAnalyticsR)library(tidyverse)library(survival)library(ggfortify)##### ga_auth()...
View Articleスパークライン風のカプランマイヤープロット
層分けが多くなると凡例と見比べるのが大変なのでなんとかしたいと思った。普通にプロットする。はい。スパークライン風にプロットするとこんな感じかなあ。累積イベント発生率が25%に達する点、50%に達する点、75%に達する点に赤っぽい丸、最後のイベント発生に黒い丸をうっている。また背景のグレーの帯は25%〜75%の範囲を示している。以下 R の...
View ArticleRによる打ち切りデータの箱ひげ図
右打ち切りのあるデータを視覚化するのにはカプラン・マイヤープロットが便利です。しかし層の数が多くなると判例と見比べるのが大変になる。そこである程度情報を落としてプロットしてもいいかなと思い、打ち切りデータの箱ひげ図を提案にします。make_q_df.R ·...
View ArticleRによる打ち切りデータのヒストグラム (ggplot2)
生存関数のプロットは便利だけど密度関数のプロットと比べると分布の形状を把握しにくい。そこで打ち切りデータのヒストグラムというのが提案されている(Huzurbazar, A. V. (2005). A Censored Data Histogram. Communications in Statistics - Simulation and Computation, 34 : pp. 113-120....
View Article[R+Google アナリティクス]リセンシーどこで切るチャート
アクセス解析の分野ではユーザーの離脱率や維持率を把握したいというニーズがあります。しかし、離脱するユーザーは単にサイトへの訪問を止めるだけで、わざわざ離脱を申告することはめったにありません。このような場合、例えば...
View Article色付き棒グラフ行列(ggplot2)
『StanとRでベイズ統計モデリング』12章のデータを使いますStanとRでベイズ統計モデリング (Wonderful R)作者:松浦健太郎,石田基広出版社/メーカー:共立出版発売日: 2016/10/25メディア:単行本この商品を含むブログ (9件) を見るGitHub - MatsuuraKentaro/RStanBook:...
View Article色付きミニ棒グラフ(searchConsoleR)
色付き棒グラフ行列(ggplot2) - 廿TTで書いた theme_spark でもうちょっとあそんでみる。theme_spark <-function(base_size =11, base_family =""){ theme_grey(base_size = base_size, base_family = base_family)%+replace%...
View Article