私はIMAP+Mewを使って、サーバ側にSPAMフィルタ(ベイジアン…いわゆる「学習型」のやつ)を入れている。サーバ側にフィルタを置く場合の問題は、学習にある。学習はクライアント側でメールを見なければできないが、フィルタとそのためのDBはサーバ側にあるのである。 現在の方法は、SPAMがINBOXに入ってたら、一度SPAMメールを「I」でキャッシュに取り込んでから、Mewの「|」コマンド(外部コマンドにメールの内容を送る)でSPAMフィルタに登録するコマンドを呼び出してDBファイル(クライアント側にある)を更新する。DBファイルはメールのバックアップのスクリプトでサーバ側にDBファイルを転送している。このメールのバックアップは不定期に、気が向いたときにやるから、これでDBはなんとなく最新に保たれる。 IMAPの中のメールはサーバにマスターがあってクライアントに少し古いバックアップがある、SPAM用のDBはクライアントにマスターがあってサーバにコピーがある(そしてサーバがコピーを使ってSPAMを嗅ぎ分けてくれる)、という状態。 それなりに便利で、問題なく動いてるけど、微妙に違うような気がしてきた。IMAPのサーバにイベントハンドラを登録できて、ユーザがメールをjunkフォルダに移動したイベントを受けてフィルタDBを更新するとか、サーバ側で定期的にjunkとそれ以外のメールからDBを作り直すとか、もっといい(=ユーザの労力を減らせる)方法があるような気がする。巷のフィルタサービスみたいなのはそういう感じになっているんだろうな(使ったことがない)。
Category: コンピュータ
本日の言葉。 「要登録」ニュースサイトに募る不満(itmedia.co.jp)より。
電子プライバシー情報センター(EPIC)のクリス・ホーフナグル氏は、(登録制に)不満を持つユーザーが「ブルガリア在住の110歳の外科医、名前はミッキーマウス」などと登録することで「自衛」しているため、プロファイルデータが不正確になっており、各社はより立ち入った個人情報を求めるようになるだろうと指摘する。
これいいなぁ。私も必要のないところに本名を書くことは少ないけど、適当に「w」とかにしている。もうちょっとこういう、ストーリー性のあるものにするべきなのかなと思う。 あと、「入力する必要性は認めるけどチェックが激しすぎるサイト」はどうにかしてほしいと思ったことがある。住所の番地の最初が2桁までとか(私の自宅はなんと4桁なのだ)、そういう「おまえ本当の制限を調べてないだろ!!」というのは困った。…たしか、NTTだったかな(違ったかも)。しょうがないからWebでやるのをあきらめたり。 (追記) 2004-06-15 11:37 この記事にはいろいろ込められてるな(笑) 当社を豚呼ばわりし、『インターネットを駄目にしている』とののしるものとか(笑)。でも、本来必要のない個人情報を素直に入力する奴なんていないんだよ。豚に教える必要はない。
WindowsでFSのドライバを書こうと思い立ったがまだツールを何も持っていない。何を注文すれば手に入るのか。
- ドライバを開発するにはDDKが必要
- FSを開発するにはさらにIFS Kitが必要
- MSDNにはいくつかのライセンス(Subscription)がある
- DDKとVisual Studio .NETはProfessional以上に入っているらしい
- Visual Studio .NETにはC++, C#, J#(Java), Basicが入っているらしい
- DDKにはIFS Kitは入っていないらしい(別に$1000程度?)
- MSDNにIFS Kitが入っているかどうかはわからない(書いていないところを見ると入っていない可能性が高い)
- IFS KitなしでFSを開発するのは無理らしい?
- いろいろ計算すると20〜30万+αくらい(単位:日本円)
…いろいろと面倒なんですね。たぶんC++で開発するから、とりあえずMSDNのどれかには契約することになる。VisualStudio.NET+DDKがMSDNより充分安ければそっちもありうる。ただDDK単体でいくらなのかは不明。 MSDNで送られてくるらしいDVD-ROMあたりにコッソリIFS Kitが入ってたりしないかな(10万もするから、そんなことしないかな)。それよりも、以前にある人から聞いた魂の(?)言葉を紹介したい。 (おのれ、)開発者相手に儲けようと思うなよ!!>Microsoft IFS KitでFS開発用の中間ライブラリみたいなの(つまりIFS KitなしでFS開発ができるようにする方法を提供する)を作って5万くらいで売ったらバカ売れだね。間違いない!? (追記) 2004-06-07 21:12 ちっちゃく書いてあった。DDKは単体でUSD $199.95だそうだ。 けっきょく、Visual Studio .NETが4万くらいするのはどうにかいいとしても、DDKが$199.95、IFS Kitが$899と$25と税金がかかるのが一番安い構成になるのだな。20万弱か。でもIFS KitってUS直販だけみたいなのね。DDKもOrderがUSに飛ばされるんだけど。シャレにしては高いよ。
「コードの借用」は違法か–開発者の認識と法律にズレ(cnet.com)。確かに、あるだろうな。
3000人以上の開発者を対象とする匿名のオンライン調査で、70%近い回答者がコードの個人的ライブラリを保存しており、それを会社から会社へと自由に持ち歩いていることが分かった。
ソフトウェアな人は、車輪の再発明はみっともないことで、再利用性の高いコードを書くことが比類なき美徳とされている。それが影響しているように思う。私も、書き捨てるような場合はできる限りone-linerとかでやるようにしている。なるべく抵抗。 共通性が高いものを新たに書くのって面倒なんだよね。特にC言語を使っているとバカにされた気がする。リスト操作とか、デバッグ用のログ系の機能とか、基本の基本まで自分で書かなきゃ、ないんだからさぁ。C++ならSTLのlistでも使えばいいけど、それでもSTLでコンパイルエラーを消すのは大変だからリストを使っているコードまるごと持っていきたいと願うところだ。 借用までいかなくても、「このライブラリどう使うんだっけ?」みたいなサンプルコードとして、昔書いた呼び出し方を見たいと思うことだってある。私は学生から就職してそのまま現在の会社にいるから、たぶんまだ問題にはならないと思うけど。 …libpcapの使い方くらいは転職しても持ってきたいな(笑)。ダメ?
ロジテック、HDD/プリンタなどを増設可能なNAS(impress.co.jp)。おっ、コピーボタンが実装されている。
前面のCOPYボタンを押すことで、前面USBポートに接続したフラッシュメモリなどから内蔵HDDにファイル転送ができる。
しかし、製品情報(logitec.co.jp)によれば、
2.2GBを超える容量のメディアのワンタッチコピーはできません。
というわけで、実質HDDについてはコピーボタンはダメらしい。HDDのバックアップには使えないのか。USB経由でHDDつなげてコピーボタンでバックアップマシン、みたいな使い方はできないということだ。無念。 まあでも、けっこう便利だとは思うけどね。
期限後に申告、公示逃れる セコム創業者の親族3人(yahoo.co.jp)。より、本日のひとこと。
セキュリティー会社の創業者としてリスクを防ぐためやむを得なかった
公示やめようよ、という話なんだけどな。公示を希望する人だけにする、とかさ。この高額納税者リストを使って押し入る先を決める強盗団とかも実際出ていたらしいし。
私はコンピュータに触れるようになって15年とかそのくらいになるのだが、今日はじめて、「」の全角が「〜」じゃないような気がした。「‾」だよね。1〜3みたいな意味で13と書くことはあんまり、ない。フォントにも半角「」が直線であるものと波線であるものがある。なんでだろう。
stringmisc.pyの全角半角変換では「」の全角を「〜」にしてしまっていた。これは、間違い…か??
本日の言葉。こないだのチョコバーとは一味違うバー。 アドレスバーへの無理解が広げる「無断リンク禁止教」(hatena.ne.jp)より、すべてを解決するリンク条項。
必ずリンク先のURLがアドレスバーに現れるようにリンクしてください。
いろいろ条件をつける人はいるけど、これだけあればOKじゃん、という話。たしかに、期待している通りに防げる。 ただ私としてはリンクに制限をつけるなら計算機がそのように制御すべきで、自然言語を使って人間側を制御するのはおかしいと思う。相手がその一文を読むかどうか、読んだかどうかなんてどうやって判断するのだ? …あ、初出のリファラに対して一度LICENSE AGREEMENTみたいなのを表示してAGREEを押させるようにすればいいのか。どっかで試しにやってみようかな(笑)。…迷惑か。 JavaScriptからアドレスバーが読めるんだっけ(よく覚えてないが)、そしたらアドレスバーと期待するURLが違う場合は転送するとかさ。やろうと思えばほとんどのことはできるんじゃないかな。もちろん限界はあるんだけども。 無論、Cookie必須とかリファラ制限とか、システム側でやられて迷惑に感じることがほとんどなんだけど、相手がそういうポリシーならしょうがないかな、と。
チョコレートと交換でパスワードを教えた人、7割を超える–英調査(cnet.com)。お、教えちゃうのかよ!
ロンドンの主要駅の1つリバプールストリート駅で行われたこの調査では、あわせて172人の通勤者に、チョコレートバー1本と交換に勤め先で使用しているパスワードを教えて欲しいともちかけたところ、驚くべきことに37%の人が即座にこれに応じた。また別の34%の人は、おおかたペットや子供の名前でも使っているのだろうと質問者が言うと、あきらめてパスワードを明らかにしたという。
ノートPCや電話に指紋認証つける会社が出てくるのもうなずける。パスワードベースの認証を使おう/作ろうとしている人は考え直したほうがいい。私は、チョコバーじゃ教えないけど。 でもさ、指紋認証が標準的なものになったら、「このチョコバーで指紋とらせてくれ」となるんだろう。そして7割の社会人が気軽に応じるのだ。
ウェブより古いネット情報検索システム『ゴーファー』、今も続く開発(hotwired.co.jp)だって。なつかしー。
一時期、ゴーファーはインターネットを技術に疎い一般の人々へと開放し、オンライン通信の新時代の幕を開けるかに思われた。そうなる可能性は十分にあったが、実際にはワールド・ワイド・ウェブ(WWW)が登場して、代わりにその役目を果たした。
私が初めてインターネットに触れたのは大学1年のときで、しばらくはメールとftp、telnet、rloginだけだった。メールもサーバでmhを使ったりしてたな。すぐにマシンが強化されてサーバでnemacs+mhという時代になったが。gopherを知ったのはだいぶ経ってから。IRCとかNetNewsを一瞬触ったりしつつ、そしてNCSA Mosaicでhttpがきて、netscapeをhomeに展開する開拓者のバイナリをみんなで使わしてもらう時代になり、そしてマシンにnetscapeがインストールされているのが普通な環境になり、そしてだいぶ略して、今に至るというわけで。これが、この10年のできごとだ(『北の国から』風)。まさに10年だ。 かように、私にとってはgopherの天下は短かかった。だいたい、gopherで日本語のページ(「ページ」と表現していたかどうかは覚えていない)を見たことがなかったような気がする。 しかしですね、WiredNewsに言いたいのは、gopherの話をするときはリンクもgopher://なものにしようよということだ。gopher://gopher.quux.org/1/(quux.org)みたいな。