ITmedia NEWS >

どんな疑問もすぐに解決? goo、日本語自然文検索

» 2004年02月06日 17時21分 公開
[RBB Today]
RBB Today

 NTT持ち株会社とNTT-Xは、gooにて日本語自然文検索の技術「Web Answers」の実験を開始した。3月31日までの予定。Web Answersは、「鉄腕アトムの誕生日はいつ?」などといった話し言葉を解析し答えを返す技術。

 この実験は「gooラボ」で公開されており、質問を入力すると「回答候補」として答えの候補がいくつか挙げられる。さらに、答えの候補ごとに「自信度」が示されていると同時に、回答候補に対して評価ができるようになっている。ほか、答えを導き出すために参照されたWebサイトも表示される。

 ここでは、大きく分けて「質問文のタイプ分類技術」「高速固有表現抽出技術」「Webページ再ランキング技術」の3つの技術が採用されている。

 Web Ansersにたとえば「鉄腕アトムの誕生日はいつ?」との質問が入力されると、“誕生日”が“日付”の形式でユーザから答えが求められていることが解析される。これが質問文のタイプ分類技術だ。また、“誕生日”と“生年月日”を同一の言葉として判断する機能も備わっている。

 次に「鉄腕アトム」と「誕生日」のキーワードでWebを検索し、この中から“日付”に関する情報を抽出する。これが「高速固有表現抽出技術」になる。これらの検索にはgooのエンジンが用いられており、同時に検索順位も参照されている。この順位を質問に応じて上位に表示するのがWebページ再ランキング技術だ。

 この3つの技術の詳細情報をもとに試したところ、「春分の日は?」よりも「春分の日はいつ?」のように求める答えの種別(人名、日付、場所など)を明確にした方が確実に回答が得られるようだ。

 なお、両社では実験の結果をもとにサービス化を検討するとしている。

「鉄腕アトムの誕生日はいつ?」を検索した結果