新着情報

  • 2016/2/20 SHACHIの全ての言語資源において、言語資源の詳細情報を閲覧できるようになりました。
  • 2016/1/31 SHACHI Webサイトをリニューアルしました。
  • 2008/4/24 現在、SHACHI検索システムの検索結果画面において、 一部の言語資源の詳細情報が、言語資源名をクリックしても閲覧できなくなっています。 このようなケースの場合、言語資源のidentifier情報として、 関連URLを表示していますので、そちらをご参照下さい。 詳細情報をご提供できるよう、 現在、作業を進めております。 ご了承頂きますよう、よろしくお願い申し上げます。

SHACHIとは

情報通信機構NICTと名古屋大学では、共同で、言語資源の有機的結合を目的に、欧米・アジア諸国の言語資源の詳細なメタ情報を大規模に収集し、大規模言語資源データベースSHACHIを構築している。本プロジェクトの目的は、付与した詳細なメタ情報を利用して、言語資源間の関係性を記述し、言語資源間を有機的に結合することである。
SHACHI に収録されている言語資源(コーパス・辞書・シソーラス・語彙リスト)は2000件を超え、大規模な言語資源アーカイブとなっている。 Metadataは、OLACmetadataSetを拡張したもので、全45種類に及ぶ詳細なメタ情報を人手によって収集している。本言語資源データベースSHACHIは既にいくつかの研究機関に公開しており、アジアの言語資源イニシアティブとして、今後貢献していく予定である。