言語資源の登録件数: 3330件
2023 件中 1311 - 1320 件目
-
C-003759: NTCIR-6 CLQA 多言語質問応答テストコレクション
NTCIRプロジェクトのサブタスクである多言語質問応答タスク(CLQA)で使用されたテストコレクションを収録。NTCIRは、情報検索とテキスト要約・情報抽出などのテキスト処理技術の研究の更なる発展を図るワークショップ型共同研究。CLQAタスクとは、ある言語での質問(日・中・英)に対し、異なる又は同一言語の新聞記事から答えを探すもの。本コレクションには文書データ及びタスクデータ(質問文と回答)を収録。回答となるものは名称もしくは数値表現。尚、文書データ(新聞記事)によってはタスク参加者のみに無料配布されるものがある。
- requires: C-001601: CD-Mainichi Shimbun Data Collection
- references: C-001601: CD-Mainichi Shimbun Data Collection
- isPartOf: C-003648: NTCIRデータセット/テストコレクション
- hasVersion: C-003740: NTCIR-1(情報検索/用語抽出研究用テストコレクション)
- hasVersion: C-003741: NTCIR-2(情報検索用テストコレクション)
- hasVersion: C-003742: NTCIR-2 SUMM(テキスト自動要約用テストコレクション)
- hasVersion: C-003743: NTCIR-2 SUMM TAO(自動要約用データ:TAO作成)
- hasVersion: C-003744: NTCIR-3 CLIR(情報検索/言語横断検索用テストコレクション)
- hasVersion: C-003745: NTCIR-3 PATENT(特許検索テストコレクション)
- hasVersion: C-003746: NTCIR-3 QA(質問応答用テストコレクション)
- hasVersion: C-003747: NTCIR-3 SUMM(テキスト自動要約用テストコレクション)
- hasVersion: C-003748: NTCIR-3 WEB(Web検索評価用テストコレクション)
- hasVersion: C-003749: NTCIR-4 CLIRꉡfeXgRNV
- hasVersion: C-003750: NTCIR-4 特許検索タスクテストコレクション
- hasVersion: C-003751: NTCIR-4 QAC2(質問応答テストコレクション)
- hasVersion: C-003752: NTCIR-4 WEB(Web検索評価用テストコレクションタスク文書データ)
- hasVersion: C-003753: NTCIR-5 CLIR ꉡfeXgRNV
- hasVersion: C-003754: NTCIR-5 CLQA 多言語質問応答テストコレクション
- hasVersion: C-003755: NTCIR-5 特許検索タスクテストコレクション
- hasVersion: C-003756: NTCIR-5 QAC 質問応答テストコレクション
- hasVersion: C-003757: NTCIR-5 WEB検索評価用テストコレクション
- hasVersion: C-003758: NTCIR-6 CLIR ꉡfeXgRNV
- hasVersion: C-003760: NTCIR-6 OPINION 意見分析タスクテストコレクション
- hasVersion: C-003761: NTCIR-6 特許検索タスクテストコレクション
- hasVersion: C-003762: NTCIR-6 QAC 質問応答テストコレクション
- hasVersion: C-003763: NTCIR-6 MuST 「動向情報の要約と可視化」テストコレクション
-
C-003760: NTCIR-6 OPINION 意見分析タスクテストコレクション
-
C-003761: NTCIR-6 特許検索タスクテストコレクション
-
C-003762: NTCIR-6 QAC 質問応答テストコレクション
-
C-003763: NTCIR-6 MuST 「動向情報の要約と可視化」テストコレクション
-
C-003764: 怪異・妖怪伝承データベース
本データベースは、民俗関係の調査などでこれまでに報告された怪異・妖怪の事例を網羅的に収集して、その全体像を把握するとともに、データベースとして構築することで検索性を高めて、世界の研究者や一般市民にむけて広く公開することを目的にしている。 データベースが本来有する情報検索上の利便性により、将来的には怪異・妖怪伝承の数量的な把握に基づく分析・研究の活発化が期待される。
-
C-003767: 現代中国語コーパス
-
C-003781: ヒンディー語古典データベース
概要:ヒンディー語古典文学テキストの全文データベースを構築し、web 上で利用できる形態で公開提供します。このデータベースは、中世ヒンディー語およびインド文化史の研究に貢献することを目指します。
ヒンディー語を表記するデーヴァナーガリー文字に関しては、転写文字以外に、同時に進行している ASTIプロジェクト で開発中のデーヴァナーガリー文字フォントを併用します。
目的:ヒンディー語古典文学にあらわれる特定の語句の用法やその頻度などを、全文検索の手法によって調べ、言語特徴および文化研究に役立たせる。 -
C-003782: ヒンドゥー教聖典データベース
ヒンドゥー教聖典のうちでデータベース化が進んでいない文献のテキストデータベース。サンスクリット語で書かれたインドの聖典がアルファベット転写、ナーガリー文字表記、印刷画像(一部)の3種の形式で検索できる。
-
N-003784: 古代チベット語文献オンライン
かつて中央ユーラシアの中心的存在であった、チベットおよびその周辺の歴史を解き明かすための重要な一次資料である、敦煌出土チベット語文献(フランス国立図書館および大英図書館所蔵)の調査研究の成果。注釈付きのテキスト・コーパスとして公開、検索機能も充実している。10世紀以前のチベットおよびその周辺の歴史、宗教、言語、政治、交易等の研究に寄与。