テストの限界

チューリングテストを実際にやるコンテストの話。人工知能の「人間性」はまだ未熟–ローブナー賞コンテスト(cnet.com)

今回の審判は、人間のおとりですら完全に人間だと判断できなかったことから、そもそもテストの手順に問題があったのかもしれない。こちらのスコアの最高は3.867で、「マシンでも人間でもありえる。判断不能」という評価だった。

相手が人間でも判断不能。相手が機械だと「間違いなくマシン」と「おそらくマシン」の境い目である、と。疑おうと思えばいくらでも疑えるのだが、マシンが紛れ込んでいるという先入観があると人間であっても疑われてしまう。

我の文章を見て、書いているのが人間であると判断していただけるだろうか。人間だと判別する人がいるようなら、コンテストにエントリーしようかな。

あ、いや、人工知能としてエントリーするんじゃなくて、審査員としてです、審査員。一応人間ですから、一応。

(追記) 2003-10-23 11:27

素人考えで思ったのは、誤字脱字とかを織り混ぜたりすると人間だと思わせるのには効果的かもね。…そういう問題じゃないかな。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です