日本語解析エンジン「なずき」 株式会社NTTデータ
ホームなずきについて導入事例なずき日記お問い合わせ
 > サービス・プロダクト > エモーションアナライザ
 
「セマンティックセグメントジェネレータ」は、ブログやTwitter、SNS、ニュース記事等、様々なテキストデータの話題(ジャンル)判定を行うことのできる分析エンジンです。テキストデータに含まれる単語、表現等から何のジャンルについて書かれているのかを高い精度で判定します。また、話題以外に不適切な表現(誹謗中傷等)を含んでいるかどうかも判定・抽出することができます。
 

 
単語だけから話題情報を抽出するのではなく、単語の組み合わせや表現もふまえ、より高い精度で、話題を抽出できます。
 
 
解析対象テキスト例 キーワード抽出
話題抽出
私は嫌いです   文中に「嫌い」という単語が含まれる場合に「評価:悪」と判定
はっきり言って、うざいです   「うざい−悪」というように単語を予め登録すれば判定することも可能
使いやすくしてほしい   「使いやすく」という単語が含まれるため、「評価:良」と誤って判定
品質が高いのはいいけど
値段が高いのはちょっと
  「品質−高い」、「値段−高い」という係り受けの抽出は出来るが評価判定は不可能
※当社比
 
  「話題抽出」以外に「不適切抽出」「キーワード抽出」等、様々な機能を取り揃えております。  
 

 


お客様固有の単語や感性の登録・定義が可能。また、登録の際の補助機能として、対象テキスト内に含まれる新語を自動的に認識し登録候補として抽出できます。  

単語をひらがなやカタカナなど一般的な言葉の揺らぎに対応した形で正規化することができます。(例:「イイ」、「よい」⇒「良い」に正規化)


 


ユーザーやグループを登録することで、分析対象ファイル毎に編集権、アクセス権を設定することができます。   分析結果は、TSV形式のファイルで出力、表計算ソフトや分析ソフト等に取り込んで再利用することができます。
 
 

「セマンティックセグメントジェネレーター」はパッケージだけでなく、エンジンのAPI提供にも対応しております。 御社製品・ソリューション及び社内システム等へのエンジン組込についてもご支援させていただいていますので、下記問い合わせよりご相談ください。

 

資料請求・お問い合わせはこちら

nttdata プライバシーポリシー
 本サイト内に記載されている製品名、サービス名、会社名は、NTTデータもしくは、各社の商標または登録商標です。