言語資源の登録件数: 3330件
2023 件中 1231 - 1240 件目
-
C-003606: 読売新聞記事データ集 2007 (*テキスト形式)
読売新聞の本社版及び地方版全記事を収録した新聞記事データ集(タグ付テキストデータ)の2007年版。日本データベース開発株式会社出版のCSV版も有。
- hasVersion: C-001632: Yomiuri Shimbun Articles Data(Japanese)
- hasVersion: C-003607: 読売新聞記事データ集 2006 (*テキスト形式)
- hasVersion: C-003610: THE DAILY YOMIURI 記事データ集 2007 (*テキスト形式)
- hasFormat: C-003604: 読売新聞記事データ<邦文>2007年版 (*CSV形式)
-
C-003607: 読売新聞記事データ集 2006 (*テキスト形式)
読売新聞の本社版及び地方版全記事を収録した新聞記事データ集(タグ付テキストデータ)の2006年版。日本データベース開発株式会社出版のCSV版も有。
- hasVersion: C-001632: Yomiuri Shimbun Articles Data(Japanese)
- hasVersion: C-003606: 読売新聞記事データ集 2007 (*テキスト形式)
- hasVersion: C-003611: THE DAILY YOMIURI 記事データ集 2006 (*テキスト形式)
- hasFormat: C-003605: 読売新聞記事データ<邦文>2006年版 (*CSV形式)
-
C-003608: 読売新聞記事データ<英文>2007年版 (*CSV形式)
言語学・情報学・メディア研究などの調査研究を支援することを目的とする新聞記事データベース。2007年のThe Daily Yomiuriの英文新聞記事データ1年分(約9500記事)をCSV形式にて収録。研究外での使用は禁止。
- hasVersion: C-001630: THE DAILY YOMIURI Articles Data
- hasVersion: C-003604: 読売新聞記事データ<邦文>2007年版 (*CSV形式)
- hasVersion: C-003609: 読売新聞記事データ<英文>2006年版 (*CSV形式)
- hasFormat: C-003610: THE DAILY YOMIURI 記事データ集 2007 (*テキスト形式)
-
C-003609: 読売新聞記事データ<英文>2006年版 (*CSV形式)
言語学・情報学・メディア研究などの調査研究を支援することを目的とする新聞記事データベース。2006年のThe Daily Yomiuriの英文新聞記事データ1年分(約9000記事)をCSV形式にて収録。研究外での使用は禁止。
- hasVersion: C-001630: THE DAILY YOMIURI Articles Data
- hasVersion: C-003605: 読売新聞記事データ<邦文>2006年版 (*CSV形式)
- hasVersion: C-003608: 読売新聞記事データ<英文>2007年版 (*CSV形式)
- hasFormat: C-003611: THE DAILY YOMIURI 記事データ集 2006 (*テキスト形式)
-
C-003610: THE DAILY YOMIURI 記事データ集 2007 (*テキスト形式)
The Daily Yomiuriの本社版記事を収録した国内唯一の英文新聞記事データ集(タグ付テキストデータ)の2007年版。日本データベース開発株式会社出版のCSV版も有。
- hasVersion: C-001630: THE DAILY YOMIURI Articles Data
- hasVersion: C-003611: THE DAILY YOMIURI 記事データ集 2006 (*テキスト形式)
- hasVersion: C-003606: 読売新聞記事データ集 2007 (*テキスト形式)
- hasFormat: C-003608: 読売新聞記事データ<英文>2007年版 (*CSV形式)
-
C-003611: THE DAILY YOMIURI 記事データ集 2006 (*テキスト形式)
The Daily Yomiuriの本社版記事を収録した国内唯一の英文新聞記事データ集(タグ付テキストデータ)の2006年版。日本データベース開発株式会社出版のCSV版も有。
- hasVersion: C-001630: THE DAILY YOMIURI Articles Data
- hasVersion: C-003610: THE DAILY YOMIURI 記事データ集 2007 (*テキスト形式)
- hasVersion: C-003607: 読売新聞記事データ集 2006 (*テキスト形式)
- hasFormat: C-003609: 読売新聞記事データ<英文>2006年版 (*CSV形式)
-
C-003614: 日本語複合辞用例データベース第1版
複合辞の機械処理を研究するための基礎データを提供することを目的として設計・編纂した日本語の用例データベース。337の見出し語(国立国語研究所編『現代語複合辞用例集』に準拠した見出し語125語を細分化)と10,968件の用例(各見出しに最大50件の用例データを付与)を収録。尚、配布パッケージMUST1-distには毎日新聞95年度版の記事データは含まない。
- references: C-001600: CD-Mainichi Shimbun '95 Data Collection
- references: 国立国語研究所編現代語複合辞用例集
- requires: C-001600: CD-Mainichi Shimbun '95 Data Collection
-
C-003615: UAM Spanish Treebank
The UAM Spanish Treebank is a corpus of syntactically annotated Spanish sentences extracted from Spanish newspapers. The current version contains 1600 sentences and their goal is to have 5,000 sentences annotated. The sentences were annotated for syntactic categories (i.e. POS), syntactic functions, syntactic features (e.g. number, gender, tense. etc.) and semantic features (e.g. HUMAN, TIME, etc.). The annotation format is a vertical and indented format close to the PROTEUS format (http://nlp.cs.nyu.edu/index.shtml), and the Penn Treebank schema was used for annotating null elements.
-
C-003617: OpenMWEコーパスv0.01
OpenMWE(慣用句や複合語(MWE: multiword expression)に関わる自然言語処理技術の開発を主な目的とし、MWE関連の言語資源を構築しオープンソースソフトウェアとして配布)において構築された日本語慣用句の用例集。今回の配布では、曖昧性のある慣用句を対象とし、一つの見出し(慣用句)に対して約1000用例を付与。
- references: C-003619: 基本慣用句五種対照表
- references: 日本語Webコーパス
- isReplacedBy: C-004315: OpenMWEコーパスv0.02
-
C-003619: 基本慣用句五種対照表
五種類の日本語資料(小学生用国語辞典2種、専門的慣用句辞典2種、小学生用慣用句辞典1種)に、どのような慣用句が掲載されているかを調べ、その結果を対照表として整理したもの。
- isReferencedBy: C-003617: OpenMWEコーパスv0.01