松村(左)

ホームページ制作業者の中にはアクセス解析を導入した後に「自社アクセス」を排除する設定をしていない残念な業者も多いのも事実です。それ以上に「離脱したページ」に関するトラフィックデータ獲得の限界を知らない業者は非常に多いといえるでしょう。そこで、最低限ではありますが、この「トラフィックデータ獲得の限界」についてGoogle Analyticsを例に挙げ解説しておきます。

少し頭の痛くなる解説になりますが、これを押さえていなければ、アクセス解析は何の役に立たないと言っても過言ではないでしょう。

Googleアナリテクスが持つ2つの時間軸

Googleアナリティクスには、2つの時間軸でサイトの滞在時間をデータ化しています。ひとつは「平均セッション時間」2つ目は「平均ページ滞在時間」です。Googleアナリティクスのデータ項目には「セッション」という、あまり耳馴染みのない項目を見かけますが「セッション」とは、一定の時間内に1人のユーザーがホームページにアクセスして、ページを移動するなどのアクションを行なったひとつの「行動の塊」を意味します。

1日の間に同じユーザーが同じサイトへの訪問を時間を開け2回、3回と再訪することがあるので、この場合のユニークユーザー数は「1」セッション数は3回訪問しているのなら「3」となります。

「平均セッション時間」とは、この1回あたりのセッション時間を意味します。
1回のセッションは、最初にアクセスしたページに設置されているトラッキングコードが読み込まれた時刻と、次にウェブサイト内のいずれかのページに移動した際にそのページのトラッキングコードが読み込まれた時刻との時間差で算出されます。

例えば、ユーザーAが、12時00分に1ページ目の閲覧を開始(トラッキングコードの読み込み発生)し、12時03分に2ページ目に移動(トラッキングコード2回目の読み込み)。その後、12時10分に3ページ目に移動(3回目の読み込み)し、12時15分にサイトを離脱したと言うセッションがあったとします。

この場合、ユニークユーザー数は「1」セッション数も「1」ページビュー数(閲覧ページ数)は、トラッキングコードが3回読み込まれていますので「3」となり、サイトの滞在時間は…

「15分」ではなく「10分」と記録されます。

 ユーザーAは12時00分にサイトに訪れ、12時15分にサイトから離脱したのですが、セッション時間は「10分」と記録されるわけです。その理由は、ユーザーAが、3ページ目に移動したことまでは、トラッキングコードの読み取り時刻の差を計算することはできるのですが、離脱した12時15分にはトラッキングコードの読み込みが行われないため、3ページ目の滞在時間は「0秒」として処理されるからです。








 さらに、ユーザーBが、13時00分に1ページ目(ユーザーAと同じページ)を13時10分まで閲覧し、13時12分まで2ページ目を閲覧した後に別サイトに移動。と言うユーザーBのセッションがあり、加えて14時00分からユーザーCが1ページ目(AとBに同じ)を14時05分まで閲覧し、ユーザーAとBと同じ2ページ目を5分間閲覧して離脱したと言うセッションがあったとします。

この場合、合計セッション数は「3」。閲覧ページ数は「3+2+2」で「7」となりサイトの滞在時間に関しては、実際にはユーザーAとユーザーB、そしてユーザーCによって15分、12分、10分滞在しているので、合計37分滞在していることになるのですが、離脱したページの滞在時間をトラッキングコードは収集できないためユーザーAが最後に閲覧したページの滞在時間「5分(300秒)」と、ユーザーBが離脱した最後のページに滞在した「2分(120秒)」、さらにユーザーCが離脱したページの滞在時間「5分(300秒)」もGoogle Analyticsでは計測できていないので差し引かれます。

そのため、Google Analyticsのデータとしては、実際の合計滞在時間「35分(2,220秒)」から離脱ページの現実滞在時間「(5分+2分+5分)」を差し引いた25分(1,500秒)となって、セッション数は3なので、平均セッション時間は500秒となります。

 これに対し平均ページ滞在時間は、離脱したページを「滞在時間=0秒」とカウントしますので「平均ページ滞在時間」の算出項目から排除されます。このことによって「平均ページ滞在時間」を算出する際には、2ページ以上閲覧されたセッションに限り離脱ページの数を含めないため、滞在時間1,500秒を3人のページビュー数から、それぞれ最後の離脱ページ数「3」を引き「1,500秒÷4」が平均ページ滞在時間となり値は375秒となります。

結果、このサイトの「平均セッション時間」は8分20秒で「平均ページ滞在時間」は6分15秒、「ページ/セッション」は2.33となります。ちなみにこの時の「直帰率」は0%です

 1ページあたりの滞在時間の平均が6分以上あって、1回のセッションで平均2ページ以上見られているのに、1セッションあたりの平均時間が12分を超えるわけでもなく、8分20秒に止まってしまっているデータの矛盾やデータのノイズは、こういったシステムの影響で起こっています。

直帰率が激しいサイトで見かける解析データの汚れ

 さらに顕著なケースを見てみましょう。

 例えば精読するのに10分が必要なセールスページがあったとします。100人のユーザーがこのページを訪問し、20人が「申し込みボタン」を押して登録フォームに移動したと仮定します。その後、この登録フォームへの入力に5分を有して登録完了ページを閲覧したユーザーが15人、登録を途中でやめたユーザーが5人いたとします。

 この場合のセッション数は100。閲覧ページ数の合計は、申し込みページに移動した人数は20人ですが、ページを移動せずに「直帰」したユーザーのページビュー数は「0秒滞在」としてカウントされるのでページビュー数も100となります。この時ページの滞在時間合計は「10分×20人+0秒×80人=200分(12,000秒)」。登録フォームのあるページは20回閲覧されていますが、5人は登録完了ページに移動せずに離脱しているため、ページビュー数は20、登録に5分かかり登録完了ページに移動しているので、このページの滞在時間は「5分×15人=75分(4,500秒)」となります。登録フォームへの入力を途中で断念した5人は「離脱」扱いとなるためカウントされません。同様に登録完了ページの閲覧数は15ですが「離脱ページ」となるため「滞在時間」の集計の際には除外されます。全体のページビュー数にはカウントされるので15ページビューをさらに加えることになります。このプロモーションの集計結果は以下の通りです。

セッション数:100セッション
合計ページビュー数:100+20+15=135ページビュー
セールスページの滞在時間合計:10分×20人+0秒×80人=200分(12,000秒)
登録ページの滞在時間合計:5分×15人=75分(4,500秒)
登録完了ページの滞在時間合計:計測不可能
合計滞在時間:275分(16,500秒)
ページ/セッション:1.35
平均セッション時間:2分45秒(165秒)
平均ページ滞在時間:7分00秒(420秒)
直帰率:80パーセント

このように1ページあたりの滞在時間が長く且つ「直帰率」が高まると平均ページ滞在時間が平均セッション時間を大幅に上回るという不思議なデータが吐き出されるようになります。

 「セッション時間」とは、1人のユーザーが1回の訪問に費やしている時間を表しているように感じさせる項目ですが、実際はそうではないわけです。1ページ目だけ閲覧して直帰するユーザーが多ければ、その1ページを10分閲覧されていても20分閲覧されても滞在時間は「0秒」となる。このため、直帰率が激しくなれば激しくなるほど、Google Analyticsの解析データは、現実から大きくかけ離れていくのです。

アクセスデータの汚れとどう向き合うか

たとえ、直帰率が激しかったとしても、それで収益が上がっていれば、Analyticsデータの精度を高めるために1セッションあたりのページビュー数を増やしたり、1ページあたりの滞在時間を調整するような改善を行う必要はないと考えています。あくまでもアクセス解析のデータで行うことは「経営改善」です。

経営状況が上向きなら、アクセスデータを整理するためのホームページ改善は、無駄な作業になるでしょうし、やもすれば、売上にマイナス影響を及ぼすかもしれません。

このようにアクセス解析は収益を合わせて見ていかなければならないのだが、Google Analyticsの設定で単価目標などを設定して管理している企業は、していない企業と比べ圧倒的に少ないと言えるでしょう。

そのためアクセス解析を使いこなせていない企業が多いと、私も思うのですが、そのような設定は実に面倒くさく、データの精度をあげるためにも解析ソフトの仕様に合わせてサイトを運営するなんてことはビジネスとしてナンセンスだと感じています。

このことをあなたは、どう考えますか。