検索条件
話は割とどうでも良い前振りから始まります。
すぐに本題を読みたい方は「続きを読む」からどうぞ。
某所で某サイトの運用をやっていたとき、非エンジニア系でY君という後輩がいました。
Y君は大変良い奴で物事に真面目に取り組む奴だったのですが……時々(しょっちゅう)妙なところで引っかかってワケワカンナクなる、という残念なところもあるやつでした。
そんなY君がある日「ウチのWebサイト(サイトP)と別のWebサイト(サイトQ)の訪問者数を比較すべし」という指令を受けた事から話が始まります。
サイトPとサイトQはどちらもそれなりにまっとう運営されているサイトで、両者ともアクセスログ解析ソフトを使って「PV」や「訪問数」を計測していました。そこでY君、特に気にせずにそれぞれのソフトが出力する「PV」「訪問数」をExcelにまとめて報告していたのですが、その報告を受けた人から「PとQのサイトの訪問数が釣り合わない」という指摘を受けたとか。
PとQは同じモノを扱っているサイトなので、訪問数も同じぐらいになるはずだ……と、いう理屈なのですが……とは言っても別サイトなので、訪問数が釣り合わなくてもおかしくないとは思うんですけどね。まあ、いろいろオトナの事情とかメンツとかあったようで……
で、Y君が困って相談にきたので、話を聞いたわけです。
話を聞くと、我々のサイトPはアクセス解析ソフトAを使っているのに、サイトQはアクセス解析ソフトBを使っているとか。
両方ともhttpdのlogを解析するタイプではあるものの、除外するリクエストの種類や訪問数の推定方法が異なっているので、集計後の数値が同じ基準かというと、そうではない。
ということで、「そもそもアクセス解析の数値は推計を含むもので、解析方法・解析ソフトによって値が異なる。どの方法で解析するのが正しいかという基準はない。別のソフトで解析された数値を単純に比較してもあまり意味がないよ」的な話をしたわけです。
しかし、数日後Y君がまた困った顔をしてやってきました。どうも上の人から絞られたようで、「サイトQの担当者は『自分たちの解析では正しい結果を出している』と主張している。サイトQが正しい結果を出せているというのに、サイトPで正しい結果が出せないというのは単なる怠慢だ。すぐに正しい数値を出してきなさい」という指示を受けたのだとか。で、「どうにかして『正しい数値』を出して下さい」と……。
技術的に誠実なことを正直に言ってはいけない局面もある、という教訓ですね。
ちなみにこの件は、サイトP側で解析除外するページとかUserAgentとかを諸々調整して、サイトPとサイトQの関係上相対的に「正しい」と思われる数値が出てきた辺りで何となく決着が付いた、と記憶しています。
さて、そんな壮大な前振りをしておきながら本題は別のところにあります。
続きを読む