Googleの実験?

これは、私がある雨の朝(というか今朝)気づいたことであったが、Google(google.co.jp)は運用系でなにかの実験をやっているのか、あるいはひそかにユーザの挙動を調べているようだ。というのは、

http://www.google.co.jp/url?sa=U&start=数値&q=検索結果のURL&e=数値

みたいなリンクになることがある。これはリダイレクト用のURLで、ユーザが気づかないうちに検索結果のURLに飛ばされるだけなのである。302(Moved Temporarily)でHTTPのLocation:ヘッダを使って飛ばされるので、たぶん気づかない人が多いだろう。実際に見たければ、例えばhttp://www.google.co.jp/url?sa=U&start=10&q=https://wtnb.mydns.jp/&e=1(google.co.jp)みたいな感じでアクセスして、HTTPのヘッダを確認してもらいたい。

このリダイレクトは検索エンジンではよく使われている手法だ。ユーザがクリックしたかどうかのデータは取っときたい。

(追記) 2003-11-06 16:37

以前に書いたフィルタを使い回しているものの、集計はすごく疲れた。続きは「もっと読む…」をどうぞ。


これをスコアの算出に応用しているとすれば、なんか微妙なアクセスをしまくればスコアが上がるかもしれない。SEOとかいう検索エンジン向け最適化をやる怪しい人々には知られているんだろうな、こういう情報って。クエリの内、たぶんstart=の数値は検索結果の順位で、e=の数値はGoogle側のプログラムのIDではないかと思う。クエリごとに変化することはない。

どのくらいの頻度でこういうことが起きるのか。日記系でリファラを表示するやつがあるじゃん。こういう感じ(bomba.to)の。これで見ると、普通のGoogleの検索結果じゃなくてリダイレクトのリンクをたどった人が2/66だから、だいたい3%くらいの確率で紛れ込んでいるようである。もうちょっとサンプルを調べたいところだがまあ3%というのはなんとなく妥当なところのように思う。

そこで、Googleの検索クエリがどのくらい多いのかわからないが、仮に1億回/日とすると、クエリ1億回の内の3%は300万回である。ということは、10%のノイズをGoogleに送るには30万回/日の頻度でこのリダイレクトアクセスをしてみせればよいことになる。…けっこう苦労するな。たぶん、誰もやらないだろう。

ところで、私は今まで、Googleはそういうことをやってないと思っていたのだが、ローカルの広告フィルタ用プロキシのログを確認するとけっこうある。最初に確認されたのが2002年11月30日で「人生のために Rock Roll」で、e=747である(thanks>桑田佳佑)。全部で以下の表の通りとなった(恥ずかしい…)。プロキシのログなので、リンクをたどった場合のみがリストにある。細かい追加条件があっても取り除いて単語のみにしてあります。

Googleのリダイレクト分布
日付 e クエリ
2002-11-30 747 人生のために Rock Roll
2002-12-21 747 ようこそ画面 セキュリティ
2002-12-25 747 LHD-NAS80
2003-02-17 747 pthread XEmacs ハイライト
2003-02-24 747 imap
2003-03-04 747 TRIOLE
2003-03-07 CLIE 吉田カバン PORTER
2003-03-12 747 咲いて散るにも悔いはなく
2003-03-13 747 トンカツ レシピ
2003-03-16 747 ジーンズ 議会
2003-03-24 747 Windows2000 圧縮 NTFS
2003-05-06 747 HG-01S リモコン コード
2003-05-30 747 掃除ロボット
2003-06-03 747 SR2002
2003-06-04 747 郵便番号 検索
2003-06-28 747 掃除ロボット
2003-07-05 USB 扇風機 OS
2003-07-30 747 千代田区
2003-08-03 747 PHP glue_url
2003-08-06 747 原子爆弾 市民
2003-08-21 42 肉球マウス
2003-08-28 世界陸上
2003-09-01 特許 期間
2003-09-09 三洋信販
2003-09-13 747 DRAG-ON DRAGOON
2003-09-19 747 切替器 ぷらっとホーム
2003-09-19 GNU PayPal
2003-10-13 747 チャド モートン 兄弟 NFL
2003-10-31 747 $ BASIC
2003-11-04 5926 MozillaFirebird Java Linux
2003-11-06 5926 カレンダー関数
2003-11-06 5926 xmms プラグイン 歌詞

「-」はe=ではなくてai=でなにかをエンコードしたらしき長い文字列が指定されている。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です