「話題」に注目する

2010/02/28 なずき部長のコラム

 前回、なずきの特徴である「感性抽出」のお話をしましたが、今回は、もう1つの特徴である「話題抽出」についてお話したいと思います。

「話題抽出」というのは、文章の内容が何について語られているか?を判定するものです。例えば、『マツイがホームランを打った』という文章があったときに、ふつうの日本人(変な表現ですみません)であれば、これが野球について語られたものであることが分かると思います。ところが、ふつうのテキスト解析ソフトウェアでは、これが出来ません。「野球」という言葉が一度も出てこないからです。なずきの話題抽出エンジンは、この何について語られているかを判定する知識辞書を豊富に持っているので、前述の例でも正しく判定することができるのです。

では、「話題」をどのように活用すればよいでしょうか?
1つには、文章の内容に応じたリコメンドが考えられます。単語のレベルでも、他の単語との結びつきの強さ弱さからレコメンド情報を作ることは出来ますが、話題というもう一段抽象化したレベルで考えることにより、より内容にフィットした情報を返すことが出来るようになります。これは、WEBサイトの広告にも応用できる手法です。

他には、不適切な情報(公序良俗に反するような情報)を自動的に検出し、コミュニティの活動を健全に保つ活動に応用するという使い方もありますし、概念検索に活用するというアイデアもあるかもしれません。
ご興味の湧いてきた方は、ぜひご一報ください。

Yahoo!ブックマーク  Googleブックマーク  はてなブックマーク  del.icio.us  newsing