言語資源の登録件数: 3330件
2023 件中 1321 - 1330 件目
-
N-003787: 漢字字体規範データベース
6世紀~18世紀の漢字写本・石刻本・版本から、特に当代・後代の字体の規範と位置付けられた文献を厳選し、文字単位で総覧したもの。中国写本(敦煌本・宮廷写経類)、中国刻本(石経)・版本(宋版)、中国以外の写本・版本を時代順に対照。朝鮮・越南版本、日本近世版本・写本にも拡張中。
-
C-003788: 中期朝鮮語形態素データベース
15~18世紀(一部その後代の覆刻を含む)の朝鮮での韻書・陀羅尼音注などを、字音・音節単位に分析し、同声・同紐(同じ頭子音・同じ韻尾)の音節を系聯(類推検索)して、字音体系・字音形態素の用法を構成的に示すデータベース。一部は原本画像も閲覧可能。
-
C-003790: 大規模ブログコーパス
国内主要ブログ事業を行っている28社、個人ドメインのブログを含めた約530万ブログをクロール対象として、2007年1月より約6億記事を収集しています。
-
C-003793: 日米特許対訳コーパス
日米の特許から作った大規模な日英対訳コーパス。抽出した文対応データは機械翻訳への適用を目的とする。
-
C-003796: 100地名単語データベース
100 個の地名の単語の音声データベース。12 人の男性が 2 回ずつ読み上げた。
-
C-003798: 中日対訳コーパス
小説,エッセイ,伝記,政治評論・白書,法律関連文書・条約文書,詩など各ジャンルの中日対訳テキスト。
-
C-003803: 日本語会話データベース
日本語母国語話者と非母国語話者の発話パターンの比較分析と日本語教育向けの基礎資料となる言語データベース。
-
C-003804: 羅生門
-
C-003805: The Small Catechism of Martin Luther
-
C-003806: 奥の細道