MySQLのデフォルトキャラクタセットをEUC-JP(ujis)にしている場合、単に普通にやるとエラーになる。MediaWikiはUTF-8だからだ。そのため、
mysql> CREATE DATABASE wikidb CHARACTER SET "utf8";
しかる後にインストール。
MySQLのデフォルトキャラクタセットをEUC-JP(ujis)にしている場合、単に普通にやるとエラーになる。MediaWikiはUTF-8だからだ。そのため、
mysql> CREATE DATABASE wikidb CHARACTER SET "utf8";
しかる後にインストール。
あの募金が目標額に達したそうですね。これからが厳しいのだと思いますけど、がんばってきてほしいです。いろいろな意見はあるでしょうが、私はJリーグ、サッカーファンの力強さを見ることができて、少し感動しました。 昔の偉い人の言葉に、賢者は言葉を贈り、そうでない者は金品を贈る、というのがあるそうです。このサイトを見ている人は少ないし、私も賢者ではないので大した言葉は重ねません。もっと力があれば、たくさんの人を救えるのかもしれません。 (追記) 2005-11-30 20:57 正しくは「富貴者送之以財 仁者送之以言」だったな。恥ずかしすぎる(笑)。慣れないことを言おうとするもんじゃないねえ。 (追記) 2005-12-09 15:49 米国に出発した(nikkansports.com)そうです。父親のコメントもなかなかいいですね。
こんなに早く出発できるとは、感謝してもしきれない。彩花はまだ3回しか外に出たことがない。帰ってきたらいろんなところに行きたい。親子3人で鹿島の試合を見たいですね
Firefoxの拡張で最近人気のあるらしい、NoScript(noscript.net)を入れてみた。JavaScriptをサイト毎に禁止/許可できる。けっこう細かい処理をしてくれるので便利そうだ。Bookmarkletが使えなくなるなんてこともないし。メッセージもちゃんと日本語になってるな。 使ってみて思ったのは、JavaScriptを使っていないサイトが非常に少ないということ。ほとんどないんじゃないか(ここもそうだが)。でも使わなくても何も不都合がないサイトも多い(ここもそうだが)。 今までは*.jsが別ファイルになっていればいちいちAdblockやjunkbusterで止めるということをやっていたけど、セキュリティ的にはNoScriptのほうが効果はあるだろう。 NoScriptの不満があるとすれば、消せない設定があること。flashgotとかgooglesyndication等は消せなくなっている。消したい人もいるだろうに。それと、初期設定ではMSNやPassportも許可に設定されている。 (追記) 2005-11-28 12:56 消せなくなっているサイトは、about:configからnoscript.permanentに羅列されているサイトを削除すると、消せるようになる。 (追記) 2005-11-28 17:42 今日1日使ってみた感じだと、自分がよく見るサイトでJavaScriptがないと何もできないサイトはBloglines(何も機能しない)、時事通信(トップページが出てこない)、bjリーグ公式サイト(あらゆるリンクが辿れない)、フロンターレの公式サイト(メニューが出ない)くらいでしょうかね。それからGoogleも許可しておかないとFirefoxのCustomizeGoogle拡張が機能しません。Ajaxを使ったサイトもあるわけだから、Googleは渋々許可しました。 それ以外のサイトはどうにか必要なものを見ることができるようです。Webmail関係とかはまた許可しなきゃいけないだろうな。設定はAdblock同様に楽チンなので、追い追いやっていこうと思う。 (追記) 2005-11-29 11:20 下のバーの表示の意味がやっとわかった。「」がJavaScriptのスクリプト数、「J+F+P」はJavaとFlashとその他のプラグインの数だ。全部0か、スクリプトが許可されていれば、バーは出ない。
愛媛FCが残り1試合を残して2位以内を確保し、数々の障壁を乗り越えてJ2への片道切符を手に入れた。おめでとうございます。正式決定は12月だが、犯罪さえ犯さなければ大丈夫だ。 それで、私もちょくちょくチェックしていたGK羽田の日記が今日になって更新されていました。愛媛←→浜松の移動はバスだったみたいですね。8時間かけて。来季はどうするんだろう。まさか札幌へはバスじゃないよな… 川崎の場合は静岡県まではバス(あの、チョロQにもなった今年からの新車)だそうです。磐田や鹿島ではバスを目撃しました。神戸では新幹線のホームで目撃しました。愛媛からだと徳島や神戸はそこそこ近い(鳥栖もかな)けど、近場の京都福岡はJ1に行っちゃうし、広島や大阪らもしばらく落ちそうにないし、サポも選手スタッフも、遠征は大変そうですね。そのへんの状況はJFLでも同じだけど、試合数もだいぶ増える。 まあとにかく、来季は関東開催で時間が空いたら、行ってみたいと思います。草津や徳島のときもそう思ったんだけど、結局行けなかったなぁ。近いのは三ツ沢くらいだったし、なかなか都合も合わなくて。 (追記) 2005-11-28 13:52 改めて地図を見ると、京都や福岡鳥栖はそれほど近場じゃないですね。川崎−名古屋くらいの距離は普通にある。
何やら意味深な依存なのでちょっと見てみた。genericなCCID(Chip Card Interface Device)というのに対応しているらしい。USB接続の、device class 11という種類のデバイス。でも、一体全体、何を買えば使えるのか。 探したら、The GnuPG Smartcard HOWTO(kernelconcepts.de)という文書が転がっていた。対応デバイスリストや使い方も載っている。せっかくだから、一応羅列しとこうかな。
…おれは、買わないけど。
味の素スタジアム、英語で言うとKING AMARAL STADIUMに行ってきましたよ。 得点は右から切れ込んだケンゴのミドル、あとは混戦からサササの人。まあ後半途中から我那覇も動けずキープもできなくなり、守りに入った時点で逆転を覚悟しました。ただ、結局は1-1で済みましたすみません。チャンスも作ってたし。 今日は開門直後に入って座席を確保していたんですが途中で応援ブロックの移動があったので、なんというか…変な席になってしまいました。どう変なのか言いづらいですが、最もうるさいところです。試合は奇跡的に見やすかった。中2日が連チャンで、ノドと足が痛すぎる。風邪っぽいし、明日はカレーでも作りながら寝ていよう。 主審は東城穣さん。流すタイプの人だったので遠慮なしに身体をぶつけ合う激しいファイトになりました。いい試合でしたよ。これには久々の先発フッキとなった谷口も大喜びだったでしょう。我那覇は前半は良かったけど後半は疲れましたね。慣れないループシュートなんて打って遊んでました(勿論枠外)。最後まで真面目にやれよ。当然のように黒津に交代。恐らく、疲れもあるんだろう。 相馬は本当に久しぶりの先発。ヤスが怪我をしたとかで、右サイドを担当。問題ない動きを見せる。ヤスよりいいんじゃないかという声も。上がりのタイミングはヤスほど無鉄砲ではない。アウグストはちょっとお疲れのご様子。 守備。川崎のDF陣は高さがあって放り込みには強いがファーで折り返されるとあっさりぐちゃぐちゃになる。途中から東京はそのパターンを多用するようになってきて、失点シーンもクリアボールを拾われながら左右に振られて混乱したところでクリアできずに混戦になった。決して気が抜けて失点したわけではなく、正攻法で弱いところを突かれてやられたって感じ。ちゃんと身体は張っていたし、悪いところなどなかった。 東京の守備はジュニーニョには挟み込んで強引に来させてジャーンが刈り取る場面が目立ったかなぁ。 セレモニーがあってスタジアムでなかなか流れなかった他会場の結果を家に帰ってきてから見たけど…上位陣がぐだぐだで、すごいことになってきましたね。残り1試合で対象チーム同士の直接対決はなく、5位の千葉まで可能性があります。つまり9試合中5試合が優勝に関わる大一番になるわけです。おもしろすぎですな。 あとヴェルディの降格と柏の入れ替え戦出場が決まりました。入れ替え戦の相手は仙台か甲府で、どちらもアウェイで上位との対決になります。
名詞と動詞を切り出すのにはchasenを使っている。最初は外部コマンドで呼び出していたが、実行時間がかかるのでPythonのモジュールを作って組み込んだ。モジュールを作るといってもSWIGを使えば簡単で、
// swig -I/usr/include -python chasen.i
// gcc -c chasen_wrap.c -I/usr/include/python2.4 -I.
// g++ -shared chasen_wrap.o -lchasen -o _chasen.so
%module chasen
%{
#include "chasen.h"
%}
%rename(getopt) chasen_getopt_argv;
%rename(parse) chasen_sparse_tostr;
%ignore chasen_fparse;
%ignore chasen_fparse_tostr;
%ignore chasen_sparse;
%include "chasen.h"
こんなもんだ。それから、普通にchasenをインストールした状態では英単語や数値を切り出せない。/usr/etc/chasenrcか~/.chasenrcに追加する。
(連結品詞 ((記号 アルファベット)))
(連結品詞 ((名詞 数)))
あとは「単語」→「単語の含まれる文書数」の連想配列を作って一応pickle化して保存しておく。そんなにパワフルなマシンじゃなくて、だいたい1万文書につき40秒くらいかかってしまうので、毎回計算するわけにはいかない。あとは文書ごとに同じようにchasenで名詞と動詞を切り出して、それぞれの単語につき「単語が文書に出現する数*math.log(全文書数/単語の出現する文書数)」をスコアにして、トップ10を計算。一応キャッシュとして保存しておいて、ページのほうではキャッシュデータを元に表示。 全文書に関わる情報を毎回更新せずにやると、division by zeroが発生する。一応この場合はスコア0ということで表現している(本当は間違いで、かなり高いスコアがつくはず)。 たぶん、ちゃんとやればほぼ全部を動的にできると思うんだけどね。全文書に関わる情報をDBに保存しておいて、ページを更新するたびにその情報を更新しておく。あとは表示するときにその文書に関わる情報を見てTF-IDF法で計算したスコアを元にキーワードを求めればいい。そこまでがんばる義理まではないだろう。
ちょっとテスト的に使ってみることにした。キーワードを抽出している。…こういうのってもう流行じゃないのかもね。 TF-IDF法自体はいまいち直観的ではないような気もするスコアリング方法ではあるが、メジャーではあるのですね。 このままいくと、いっそbogofilterとかにかけて文章のSPAMレベルを判定させてみるのもいいかもしれない。一応、機能してないけどエントリのスコアリング投票があるので、それを利用して「つまらない」が多いものをSPAMとして学習していくわけ。…何のために?
日曜のセレッソ戦と同じような試合で、同じように負けた。磐田は強いね。パス回しも上手いしカウンターも脅威。 思うに川崎対策みたいなものがあって、それを実践されたのではないかと。それでもチャンスは作っていたので、あとは得点するだけだと信じる。一つ前のエントリの予想は早くもあっさり外れた。今後は良いほうに外れてほしいものだ。 黒津と谷口が途中出場。谷口はボランチ、黒津はヤスと交代で右にいた。良い出来だったよ。 (追記) 2005-11-25 18:05 そういえばこの日はエバラ坦々ごま鍋の素エキサイトマッチだった。今年は当たらず。先着2000名の中には入れたけどね。
この問題を解消するには、天皇杯に勝ち続けるか、来季までお待ち下さい。 残り3試合。ホーム2戦と近隣アウェイ1戦。磐田東京ガンバと、どの相手も強豪だ。もちろん全部応援しに行くよ。昨年もそうだったが、残り試合が少なくなると妙に名残り惜しくなって困る。昨年の最終戦、鳥栖で試合が終わった後、「あー終わっちゃったなー」「もう終わっちゃったなー」と何度もこぼした。 私は、ホームで圧倒的な強さを誇る川崎がホーム2戦(磐田ガンバ)に勝ってアウェイ(東京)で引き分け、4〜5位でJ1のシーズンを終え、その後の天皇杯では最近調子を上げているマリノスに長崎で敗戦すると予想する。当たれば、残念なことに埼スタでのリベンジは来年にお預けになるが。 もちろんクリスマスや元旦の予定は空きまくっているので、勝ち上がってくれても何の問題もない。 こんなにいいシーズンなのに、もうすぐ終わっちゃうんだよなぁ。何にせよ、明日とガンバ戦は勝ちたいよ。