形態素解析を行う高速でコンパクトなCOMコンポーネント
形態素解析エンジン『Tofu』は、形態素解析を行うフリーのCOMコンポーネントです。
【特徴】
・Windows上でCOMコンポーネントを呼ぶことができる言語(VB6、C#.net、等)であれば、Tofu COMを使用することができます。
・形態素解析といえば、MeCab が有名ですが、Tofu は シンプルな辞書構造と解析ロジックにより、MeCabの数倍から数十倍の解析スピードです。
・PDAでの利用も考慮して、MeCab(Ver.0.98)が使用している辞書(IPADIC)に比べて約10分の1のシンプルかつコンパクトな辞書です。
・入力する文章に改行やスペース、TABコードなど連続していても、まとめて1個のスペース(記号,空白)に圧縮して解析を続行します。改行の多い記事などのテキストをそのまま入力することができます。
・形態素解析をすぐに試すことができるようデモツールを2種類(VB6版、C#.net版)用意しています。更に、それぞれのソースもプロジェクト毎添付しています。
・Tofuの説明書とAPI仕様書を添付しています。
なお、本製品は、開発途上のプロトタイプであり、単語辞書の追加、連接コスト辞書の修正、解析ロジックの修正などが不定期に発生します。