ユーザのクエリの意味の曖昧さを解決してくれる「SemantiFind」

Delicious
[日記]

[O]DEMOfall 08 に出展されているサイト一覧 [2008-09-09-4] という記事で、サイトをみていくと言ったので、順にみていきます。

でも、はやくも面白そうな企業が少しになってきました。
1つ見ては飛ばし、1つ見ては飛ばし。。。
なかなか紹介したいと感じるサービスが見つからないです。

さて今日は「SemantiFind」。

- SemantiFind - Semantic catalog of the Internet
-- http://www.semantifind.com/

SemantiFind enhances your existing search engine experience to save you time and deliver more meaningful results.


SemantiFindは、FireFox専用のツールバーをつかったサービスを提供しています。
ユーザはSemantiFindのツールバーをインストールすることで、
普段愛用している検索エンジンの検索結果を、SemantiFindに拡張してもらえます。

どのような拡張をするのかというと、「ユーザのクエリの意味が一意に決まるように、クエリを追加する」という処理を行ないます。

例えば、「ライブラリ」という検索クエリをユーザーが入力したときに、コンピュータは、それをユーザが「図書館」的な意味で使ったのか、「ソフトウェアの集合体」的な意味で使ったのか、区別することができません。

そのため、Googleの検索結果には、ライブラリに関してさまざまな概念が混在した結果が表示されます。

- ライブラリ - Google 検索
-- http://www.google.co.jp/search?q=%E3%83%A9%E3%82%A4%E3%83%96%E3%83%A9%E3%83%AA

このような事態は様々なクエリに対して考えられます。

多義語による多義性を解消することを主眼に置いた研究は、現実世界の問題が尽きないので活発に行なわれています。
辞書に書いてあるような用語だけでなく、身近な分野だと「人名」、「ソーシャルブックマークのタグ」など、様々な分野のデータで研究が行なわれています。

自然言語処理の分野では、単語の語義の多義性解消を目的としたタスクを、Word sense disambiguation (WSD)と呼んでいます。
# 自然言語処理っぽい人がWSD! WSD!って言っていたら「単語の意味の曖昧性を解消!単語の意味の曖昧性を解消!」的な意味。

さまざまな研究では、自動的、または、半自動的に多義性を解消する技術を開発していますが、
人間が日々おこなう検索では、人間がクエリの意味を絞った方が精度も効率も良いでしょう。

人間にクエリの語義を絞るための追加クエリを提示して、それらの中から最適なものを選ばせる、という解決策は、
Web検索のためのクエリの語義曖昧性解消のシンプルで現実的な解決策だ、と僕は思います。
何故なら、仮にサービス側で自動的に語義を絞っても、数回絞り間違えたら、多くのユーザは2度と使ってくれなくなってしまうからです。

SemantiFindに、ユーザが曖昧性解消のために選択した単語について、ログデータが溜まってくれば、SemantiFind側で自動的に高い精度で曖昧性を解消できるケースも増えると思います。
そのような到達するためには、幅広いユーザにSemantiFindツールバーを使ってもらうかが大切になると思います。

でも、普通の人(僕の母親)とかが、パソコンにFireFoxをインストールして、SemantiFindツールバーをインストールするか、と言うと、SemantiFindが日本語に対応していたとしても、確実に絶対インストールしないと思います。

僕は、SemantiFindはブラウザに標準で組み込まれたときに、初めて実用的になるのではないかな、と思っています。

それに、SemantiFindの使っている技術が独自性のある技術ではなかったり、SemantiFind社が曖昧性解消技術について有効な特許を申請できていなかった場合には、GoogleやYahooやMSが自分たちで同じようなサービスを実装してしまうのではないかな、と思っています。

語義曖昧性解消ビジネスは、何か別のサービスに依存した瞬間から、依存しているサービスに命を奪われるかもしれないので、収益を得られる展開を考えるのはすごく難しいですね。

すごく長いうえに、ネガティブになってきたのでオシマイ。


投稿者:としのり  日時:23:59:59 | コメント | トラックバック |
blog comments powered by Disqus