プロジェクトリーダー: 辻井 潤一(東京大学)
プロジェクトID: JSPS-RFTF96P00502
| [1] | ネットワークに流通する形式度の低いテキストを処理するための耐性の高い解析手法に関する研究: 従来, 部分的構造の解析(Partial Parsing), キーワード・スポッティングの手法として, 比較的アドホックに取り組まれていたテキストの構造解析を言語学的にも健全な枠組のもとに統合し, 高速・高効率で, かつ, 耐性の高い解析手法を確立する。 この解析手法は, テキスト理解の深さをシステムの知識量との相対で行なう耐性の高い言語理解システム, および, テキストからの知識・情報抽出のための基幹技術となる。 |
| [2] | テキストからの分野知識(オントロジー)の獲得技術に関する研究:従来の自然言語処理技術は, 分野依存の知識があればうまく動作するが, それが欠如した場合には, 非常にfragileであった。 [1]の研究は, このfragilityを解決するための解析技術の研究であるが, この項目においては, 知識のボトルネックを解消するためのテキストからの知識獲得の研究を行なう。 特に, 分野オントロジーの基本となる専門用語とその相互の意味関係, および, テキスト解析の際の意味・知識レベルの拘束条件の半自動的な獲得手法を確立する。 |
| [3] | テキスト, および, 間テキスト的な文脈構造に関する研究:ネットワーク中に流通するテキスト, および, 電子化されたオフィス環境でのテキストでは, 別テキストからの直接的な引用に典型的に見られるように, テキスト間での共有する文脈が非常に緊密なものが多く存在する。 この特徴は, 不特定多数を対象とした従来のテキストには見られないものであり, monologueとしてのテキストと会話との中間的な性質を持っている。 この相互関係をどのように把握し蓄積するかは, 自然言語の文脈処理にとって重要なだけでなく, 将来の知的検索システムにとって必要・不可欠なものとなる。 この項目では, 従来の文脈処理的技術と議論展開のモデルとを統合することにより, 間テキスト的な文脈処理の基本技術を確立する。 |