2009/10/23(金)Google Analytics vs Yahoo!アクセス解析

話は割とどうでも良い前振りから始まります。
すぐに本題を読みたい方は「続きを読む」からどうぞ。

某所で某サイトの運用をやっていたとき、非エンジニア系でY君という後輩がいました。
Y君は大変良い奴で物事に真面目に取り組む奴だったのですが……時々(しょっちゅう)妙なところで引っかかってワケワカンナクなる、という残念なところもあるやつでした。

そんなY君がある日「ウチのWebサイト(サイトP)と別のWebサイト(サイトQ)の訪問者数を比較すべし」という指令を受けた事から話が始まります。
サイトPとサイトQはどちらもそれなりにまっとう運営されているサイトで、両者ともアクセスログ解析ソフトを使って「PV」や「訪問数」を計測していました。そこでY君、特に気にせずにそれぞれのソフトが出力する「PV」「訪問数」をExcelにまとめて報告していたのですが、その報告を受けた人から「PとQのサイトの訪問数が釣り合わない」という指摘を受けたとか。
PとQは同じモノを扱っているサイトなので、訪問数も同じぐらいになるはずだ……と、いう理屈なのですが……とは言っても別サイトなので、訪問数が釣り合わなくてもおかしくないとは思うんですけどね。まあ、いろいろオトナの事情とかメンツとかあったようで……

で、Y君が困って相談にきたので、話を聞いたわけです。
話を聞くと、我々のサイトPはアクセス解析ソフトAを使っているのに、サイトQはアクセス解析ソフトBを使っているとか。
両方ともhttpdのlogを解析するタイプではあるものの、除外するリクエストの種類や訪問数の推定方法が異なっているので、集計後の数値が同じ基準かというと、そうではない。
ということで、「そもそもアクセス解析の数値は推計を含むもので、解析方法・解析ソフトによって値が異なる。どの方法で解析するのが正しいかという基準はない。*1別のソフトで解析された数値を単純に比較してもあまり意味がないよ」的な話をしたわけです。
しかし、数日後Y君がまた困った顔をしてやってきました。どうも上の人から絞られたようで、「サイトQの担当者は『自分たちの解析では正しい結果を出している』と主張している。サイトQが正しい結果を出せているというのに、サイトPで正しい結果が出せないというのは単なる怠慢だ。すぐに正しい数値を出してきなさい」という指示を受けたのだとか。で、「どうにかして『正しい数値』を出して下さい」と……。

技術的に誠実なことを正直に言ってはいけない局面もある、という教訓ですね。
ちなみにこの件は、サイトP側で解析除外するページとかUserAgentとかを諸々調整して、サイトPとサイトQの関係上相対的に「正しい」と思われる数値が出てきた辺りで何となく決着が付いた、と記憶しています。

さて、そんな壮大な前振りをしておきながら本題は別のところにあります。
小規模~中規模サイトでのアクセス解析サービスといえば、Google Analyticsが思い浮かぶことが多いでしょう。
これ以外にも「アクセスカウンターCGIレンタル」から発展したものなど、多数の解析サービスが乱立していますが、業務ユースで使えるだけの機能*2Googleブランドから来る知名度と安心感では一つ抜きんでている感じがあります。

一方、後発ではありますが、日本でも2009年5月から一般提供が開始されたYahoo!アクセス解析(USではYahoo! Web Analytics)もその対抗馬として十分な機能と性能を持っていると思います。

私はどちらかというと、Yahoo!アクセス解析の方が好きですね。
使われている用語がしっくりくる、というのと、アクセス状況が数分~数十分レベルの時間で解析されて、当日のアクセス状況がほぼリアルタイムに確認できるという圧倒的なアドバンテージが気に入っています。
Google Analyticsは一日ごとのバッチで解析しているようで、前日分の記録しか確認できません。

もともとこのblogは、blogを管理しているadiaryというツールがGoogle Analyticsの埋め込みに標準で対応していたこともあって、Google Analyticsで解析をしていました。が、今年の5月からはYahoo!アクセス解析も併用して埋め込んでいます。
前述の通り、私はYahoo!アクセス解析の方が気に入っているので最近はそちらばかりを見ていたのですが、ふと、「この両者ってどの程度違う値を出しているのだろう?」というのが気になったので、調べてみたというのがこのblogの本題です。
冒頭に書いたとおり、アクセス解析には定まった基準がないため、ツールによって異なる値が出ても全くおかしくありませんし、どちらが「正しい」とも判断できません。つまり、この比較はどちらが正しいのかを判定するのではなく、「それぞれの解析ツールがどのような傾向を持っているのか」を感じ取るという程度の意味しかないと言うことです。

一応前提条件は以下のようになっています。
・2009年6月~2009年9月の4ヶ月間を対象とした
・それぞれの集計値は、各ツールで「一ヶ月単位」として出力された値を採用した
・集計対象除外などは特に設定していない(標準状態のまま)
・それぞれの解析タグ(ビーコン)の埋め込み方法は以下の通り
 ・google: adiaryの標準機能を使用
 ・yahoo: adiaryで「埋め込みテキスト」として埋め込み

比較する集計項目は「PV」「セッション数(訪問数)」「ユニーク訪問者数」としました。
それぞれ用語が異なっている箇所がありますが、意味として出来るだけ近いものを選んでいます。

とりあえずグラフでどうぞ。
PV比較

セッション数比較

ユニーク訪問者数比較


ざっくりと見て、yahooの方がgoogleよりも1割程度大きな値を出しているように見えます。
PVYahooの方が8%~10%多い
セッション数Yahooの方が7%~9%多い
ユニーク訪問者数Yahooの方が2%~5%多い
これだけだらだと書いておいて結論なしというのも妙な感じですが、そもそも結論が出る話でもないのでねー。

一つ話の展開としてネタを振っておきましょう。

この結果は「ぱらめでぃうす」という特定のblogでの実験結果です。「ぱらめでぃうす」は、比較的新規訪問率が高い (検索からの誘導が多い) というコンテンツの特性があるわけですが、もしかするとこれ以外の特性を持ったコンテンツで実験した場合、今回の実験結果と異なった傾向が出るかも知れません。
残念ながら私はこれ以外にまともに比較に使えるコンテンツを持っていないため、これ以上の検証は不可能なわけですが、もし、どなたかGoogle AnalyticsとYahoo!アクセス解析の両方を使用しているコンテンツをお持ちの方がいらっしゃれば、是非、その比較を公開してほしいものです。

*1 : もちろん「PV」「訪問数」に提議としての「正しい基準」はあります。しかし、それを「どうやって集計すべきか」という実現手法については定まった基準はありません。

*2 : 元々この業界でのスタンダードだったUrchinを買収して作ったんですから、そりゃ機能充実してますよ