Language resource #: 3330
Results 1611 - 1620 of 2023
-
C-004257: 明六雑誌コーパス
本コーパスは、明治初期の学術啓蒙雑誌『明六雑誌』(1874~1875年刊)全文の形態論情報付きコーパスであり、記事・引用・文字のほか、文や単語にもタグ付けが施されている。
- conformsTo: 近代文語UniDic
-
C-004259: Webデータに基づく複合動詞用例データベース
本データベースは、複合動詞研究用の基礎データを提供することを目的としてWebデータから機械的に構築したものであり、主として語彙的複合動詞を収録。複合動詞・構成動詞検索、格要素・用例一覧の表示、•複合動詞と構成動詞との関係分析の機能を持つ。
- isReferencedBy: G-004258: Webデータに基づく複合動詞用例データベース/日本語複合動詞リスト (ver.1.1)
-
C-004260: 外国人学習者の日本語誤用例集 データベース版
-
C-004261: 外国人学習者の日本語誤用例集 PDF版
-
C-004262: OJAD
OJAD is an online dictionary for Japanese language learners and teachers. It is meant to assist accent acquisition through the use of 4 tools: Word Search, Verb Suffix Search, Text Search, and Suzuki-kun: Prosody Tutor.
- references: C-004324: 現代日本語書き言葉均衡コーパス
-
C-004263: ことばに関する新聞記事画像データベース
国立国語研究所では1949年~2009年9月末まで、ことばに関する新聞記事を集めた「切抜集」を作成。本データベースは、「切抜集」所収記事のうち、1949年~1998年の50年間について、切り抜きのイメージ(画像)をそのまま閲覧できる(本文が読める)ようデータベース化したもの。
- hasFormat: C-003386: ことばに関する新聞記事見出しデータベース
-
C-004264: 雑誌『国語学』全文データベース
日本語学会の(旧)機関誌『国語学』全巻(第1輯(昭和23年)~終刊第219号(平成16年))の全文テキストデータベース。オンライン検索にて閲覧可能。
-
C-004266: Transcription of the Tale of Genji manuscript book at the Library of Congress
The database contains the transcription of the Tale of Genji manuscript at the Library of Congress (LC, LC Control No.:2008427768) and is accessible on-line.
-
C-004268: Rakuten Data Release
The database consists of various data of Rakuten. The current version of Rakuten Data Release contains all product data (approx. 50 million items) and review data (approx. 16.6 million reviews) on "Rakuten Ichiba", facility data (82,458 facilities) and review data (approx. 4.7 million reviews) on "Rakuten Travel", facility data (1,669 facilities) and review data (320,000 reviews) on "GORA"(Rakuten's golf service) and recipe data (approx. 440,000 recipes) and recipe images (approx. 440,000 images) on "Rakuten Recipe".
-
C-004269: IDENTIC
IDENTIC is an Indonesian-English parallel corpus for research purposes. The corpus is a bilingual corpus paired with English. The corpus contains texts coming from different sources with different genres. It is available in two different formats: "plain", stored in text format and "morphologically enriched", stored in CoNLL format.