Language resource #: 3330
Results 1601 - 1610 of 2023
-
C-004247: 日英翻訳エンジン学習・評価用対訳コーパス (Version 1.0)
International Workshop on Spoken Language Translation (略称 IWSLT)の2005年評価キャンペーンの日英翻訳で使用された基本旅行会話データセットに基づいて作られたコーパスであり、翻訳機器学習用データ:20,000文、評価用データ:1,500文(日英対訳文)から構成される。 配布したデータを用いて、各研究機関が開発した機械翻訳手法の精度の確認と当時の参加者のシステムとの比較を行うことができる。
- references: IWSLT基本旅行会話データセット
-
C-004248: A Chinese Dependency Parser(CNP)用中国語解析モデル Version 1
NICT言語基盤グループからオープンソースソフトウェアとして配布している係り受け解析器(A Chinese Dependency Parser,略称CNP)Version 1のための中国語解析用モデルパラメータ。Language Data Consortium (LDC) より配布されているChinese Treebank 4.0,5.0,6.0および Chinese Gigaword を用いて学習した、GBK/UTF-8 文字コード用のモデルを提供。本モデルをCNPと共に用いることにより、高精度な中国語係り受け解析が可能になる。
- references: C-000694: Chinese Treebank 4.0
- references: C-000695: Chinese Treebank 5.0
- references: C-003303: Chinese Treebank 6.0
- references: C-000689: Chinese Gigaword Second Edition
-
C-004249: 意見(評価表現)抽出ツール用モデル Version 1.2
本データベースは、独立行政法人情報通信研究機構 旧知識処理グループ(情報信頼性プロジェクト)によって開発され、ALAGINからオープンソースソフトウェアとして配布されている「意見(評価表現)抽出ツール」のための意見解析用モデルファイルと評価表現辞書から構成される。
- requires: 意見(評価表現)抽出ツール (https://alaginrc.nict.go.jp/opinion/index.html)
-
C-004250: Japanese Aged Persons Speech Database
The database contains reading voices by Japanese native speakers aged 60 years or older.
-
C-004251: Non-native English Speech Database
The database contains English reading voices by non-native speakers.
-
C-004252: Chinese Speech Database
The database contains Chinese (Putonghua) reading voices and spontaneous speech voices by native Chinese from various locations in China.
-
C-004253: Kyoto Sightseeing Information Dialog Database
The database contains speech data and transcripts of simulated, face-to-face dialogs between a professional tour guide and a subject acting as a traveler. One dialog lasts about 30 minutes.
-
C-004254: Japanese Elementary School Pupils' Speech Database
The database contains reading voices of simulated travel conversation and phonetically-balanced sentences by first to fourth grade elementary school pupils.
-
C-004255: Japanese Speech Database
The database contains Japanese phonetically-balanced sentences and finite words uttered by professional narrators.
- references: ATR 503 Sentences
-
C-004256: Japanese-English and Japanese-Chinese Monologue Speech Database
The database contains recorded speech uttered by Japanese-English or Japanese-Chinese bilingual voice actors or amateur persons.