@niftyラボでまた新しいサービスが開始されました。
ブログ上の評価を機械的に自動判別して点数を付け、ランキングするというシステムです。
日本語を自動的に判別する、という発想は昔からあるのですが、複雑な日本語をどう判別するのかというロジックの実装がかなり難しく、なかなかこれと言ったサービスは生まれてきませんでした。
で、このWiPiなんですが、やっぱり今ひとつ感が否めません。健闘はしてるとおもうのですけどね。
例えば、「ダ・ヴィンチ・コード」の評価について。
「ダ・ヴィンチ・コード」について書いてあるページのリンクと、そのページ中での○と×の評価のポイントがまとめられた一覧があるのですが、評価×として判断している文章が、「ダ・ヴィンチ・コード...ダ・ヴィンチ・コード (下)」とか「ダ・ヴィンチ・コード...いるので2時間半飽きさせません」なんですね。
前者は、本の下巻のことを指しているのに、「下らない」という意味に解釈しちゃってますし、後者は「○○ません」という単純に語尾の否定の意味だけを解釈しちゃってます。
それだけ日本語は難しいってことなんですね。
WiPiはこの日本語の壁をどう越えていくのか。バージョンアップが楽しみです。