Skip to main content

ログ取得ツール (移転先予定地)

Googleの実験?

これは、私がある雨の朝(というか今朝)気づいたことであったが、Google(google.co.jp)は運用系でなにかの実験をやっているのか、あるいはひそかにユーザの挙動を調べているようだ。というのは、

http://www.google.co.jp/url?sa=U&start=数値&q=**検索結果のURL**&e=数値

みたいなリンクになることがある。これはリダイレクト用のURLで、ユーザが気づかないうちに検索結果のURLに飛ばされるだけなのである。302(Moved Temporarily)でHTTPのLocation:ヘッダを使って飛ばされるので、たぶん気づかない人が多いだろう。実際に見たければ、例えばhttp://www.google.co.jp/url?sa=U&start=10&q=/&e=1(google.co.jp)みたいな感じでアクセスして、HTTPのヘッダを確認してもらいたい。

このリダイレクトは検索エンジンではよく使われている手法だ。ユーザがクリックしたかどうかのデータは取っときたい。

(追記) 2003-11-06 16:37

以前に書いたフィルタを使い回しているものの、集計はすごく疲れた。続きは「もっと読む…」をどうぞ。


これをスコアの算出に応用しているとすれば、なんか微妙なアクセスをしまくればスコアが上がるかもしれない。SEOとかいう検索エンジン向け最適化をやる怪しい人々には知られているんだろうな、こういう情報って。クエリの内、たぶんstart=の数値は検索結果の順位で、e=の数値はGoogle側のプログラムのIDではないかと思う。クエリごとに変化することはない。

どのくらいの頻度でこういうことが起きるのか。日記系でリファラを表示するやつがあるじゃん。こういう感じ(bomba.to)の。これで見ると、普通のGoogleの検索結果じゃなくてリダイレクトのリンクをたどった人が2/66だから、だいたい3%くらいの確率で紛れ込んでいるようである。もうちょっとサンプルを調べたいところだがまあ3%というのはなんとなく妥当なところのように思う。

そこで、Googleの検索クエリがどのくらい多いのかわからないが、仮に1億回/日とすると、クエリ1億回の内の3%は300万回である。ということは、10%のノイズをGoogleに送るには30万回/日の頻度でこのリダイレクトアクセスをしてみせればよいことになる。…けっこう苦労するな。たぶん、誰もやらないだろう。

ところで、私は今まで、Googleはそういうことをやってないと思っていたのだが、ローカルの広告フィルタ用プロキシのログを確認するとけっこうある。最初に確認されたのが2002年11月30日で「人生のために Rock Roll」で、e=747である(thanks>桑田佳佑)。全部で以下の表の通りとなった(恥ずかしい…)。プロキシのログなので、リンクをたどった場合のみがリストにある。細かい追加条件があっても取り除いて単語のみにしてあります。

Googleのリダイレクト分布 | 日付 | e | クエリ | | 2002-11-30 | 747 | 人生のために Rock Roll | | 2002-12-21 | 747 | ようこそ画面 セキュリティ | | 2002-12-25 | 747 | LHD-NAS80 | | 2003-02-17 | 747 | pthread XEmacs ハイライト | | 2003-02-24 | 747 | imap | | 2003-03-04 | 747 | TRIOLE | | 2003-03-07 | - | CLIE 吉田カバン PORTER | | 2003-03-12 | 747 | 咲いて散るにも悔いはなく | | 2003-03-13 | 747 | トンカツ レシピ | | 2003-03-16 | 747 | ジーンズ 議会 | | 2003-03-24 | 747 | Windows2000 圧縮 NTFS | | 2003-05-06 | 747 | HG-01S リモコン コード | | 2003-05-30 | 747 | 掃除ロボット | | 2003-06-03 | 747 | SR2002 | | 2003-06-04 | 747 | 郵便番号 検索 | | 2003-06-28 | 747 | 掃除ロボット | | 2003-07-05 | - | USB 扇風機 OS | | 2003-07-30 | 747 | 千代田区 | | 2003-08-03 | 747 | PHP glue_url | | 2003-08-06 | 747 | 原子爆弾 市民 | | 2003-08-21 | 42 | 肉球マウス | | 2003-08-28 | - | 世界陸上 | | 2003-09-01 | - | 特許 期間 | | 2003-09-09 | - | 三洋信販 | | 2003-09-13 | 747 | DRAG-ON DRAGOON | | 2003-09-19 | 747 | 切替器 ぷらっとホーム | | 2003-09-19 | - | GNU PayPal | | 2003-10-13 | 747 | チャド モートン 兄弟 NFL | | 2003-10-31 | 747 | $ BASIC | | 2003-11-04 | 5926 | MozillaFirebird Java Linux | | 2003-11-06 | 5926 | カレンダー関数 | | 2003-11-06 | 5926 | xmms プラグイン 歌詞 |

「-」はe=ではなくてai=でなにかをエンコードしたらしき長い文字列が指定されている。