1191 件
- N-000001: 863 program in 2003 speech synthesis evaluation data
- N-000002: 863 program in 2004 automatic index evaluation data
- N-000003: 863 program in 2004 information index evaluation data
- C-000004: 863 program in 2004 name entry identification evaluation data
- C-000005: 863 program in 2004 speech recognition evaluation data
- C-000006: 863 program in 2005 information index evaluation data
- C-000007: 863 program in 2005 machine translation evaluation data
- C-000008: 863 program in 2005 speech recognition evaluation data
- C-000009: ASCCD-Annotated Speech Corpus of Chinese Discourse
- C-000013: Al-Hayat Arabic Corpus
- D-000020: Biology Database
- C-000024: CADCC-Chinese Annotated Dialogue and Conversation Corpus
- C-000025: CASIA single syllable isolated word speech corpus
- C-000026: CASIA-863Chinese Speech Synthesis Corpus
- N-000027: CASIA-Chinese Emotional Speech Corpus
- C-000028: CASIA-Chinese Question Structures Corpus
- C-000029: CASIA-Mandarin continuous digit speech corpus
- N-000030: CASIA-Northern China accent speech corpus
- N-000031: CASIA-Southern China accent speech corpus
- N-000032: CASIA98-99 speech testing library
- C-000033: CASIAThe weather forecast broadcasts the pronunciation storehouse
- G-000040: Chinese Lexicon
- C-000041: Mandarin Chinese Speech Recognition Corpus (desktop) - single Chinese sentence (200 people)
- C-000042: Mandarin Chinese Speech Recognition Corpus (desktop)- person name (200 people)
- C-000043: Mandarin Chinese Speech Recognition Corpus (telephone channel) - Chinese single sentence (100 people)
- C-000044: Mandarin Chinese Speech Recognition Corpus (telephone channel) - digit string (100 people)
- C-000045: Mandarin Chinese Speech Recognition Corpus (telephone channel) - person name (100 people)
- C-000046: Mandarin Chinese Speech Recognition Corpus (telephone channel) - place name (100 people)
- D-000047: Computer Science Database
- G-000082: Korean Lexicon
- G-000084: LC-STAR English-Hebrew (Israel) Bilingual Aligned Phrasal lexicon
- C-000092: Mandarin Chinese Speech Recognition Corpus (desktop) - digit string (119 people)
- C-000093: Mandarin Chinese Speech Recognition Corpus (desktop) - person name (120 people)
- C-000094: Mandarin Chinese Speech Recognition Corpus (in the car) - person name, place name in Beijing, stocks, digit string (20 people)
- C-000095: Mandarin Chinese Speecon database
- C-000123: RASC863-annotated 4 regional accent speech corpus(II)
- N-000148: TSC973-Telephone Speech Corpus 973
- C-000151: Telephone speech corpus for recognition-Male voice
- C-000152: Text of Northern Bunun (Taiwan)...New TextTexts
- C-000153: The EMILLE/CIIL Corpus
- G-000155: The grammatical knowledge-base of contemporary Chinese (high frequency words)
- C-000156: The identifiable speech database of tabletop speech--the people?fs name, the place?f name (120 persons)
- C-000200: VERBMOBIL II - VM CD 25.1 - VM25.1 (BAS edition)
- C-000201: VERBMOBIL II - VM CD 26.1 - VM26.1 (BAS edition)
- C-000202: VERBMOBIL II - VM CD 27.1 - VM27.1 (BAS edition)
- C-000204: VERBMOBIL II - VM CD 33.1 - VM33.1 (BAS edition)
- C-000205: VERBMOBIL II - VM CD 34.1 - VM34.1 (BAS edition)
- C-000206: VERBMOBIL II - VM CD 35.1 - VM35.1 (BAS edition)
- C-000365: VERBMOBIL II - VM CD 45.1 - VM45.1 (BAS edition)
- C-000366: VERBMOBIL II - VM Bonus CD - VMBONUS (BAS edition)
- C-000367: VERBMOBIL II - VM CD 18.1 - VM18.1 (new edition)
- C-000368: VERBMOBIL II - VM CD 16.1 - VM16.1 (new edition)
- C-000369: VERBMOBIL II - VM CD 62.1 - VM62.1 (BAS edition)
- C-000371: VERBMOBIL II - VM CD 17.1 - VM17.1 (new edition)
- C-000372: VERBMOBIL II - VM CD 19.1 - VM19.1 (new edition)
- C-000375: VERBMOBIL II - VM CD 60.1 - VM60.1 (BAS edition)
- C-000376: VERBMOBIL II - VM CD 61.1 - VM61.1 (BAS edition)
- C-000408: OrienTel Hebrew database
- C-000409: OrienTel Arabic as spoken in Israel database
- C-000422: TC-STAR 2006 Evaluation Package - ASR Mandarin Chinese
- C-000426: Kids01 - PC Environment Children's Speech Corpus
- C-000427: Car Environment Speech DB
- C-000428: Car02 - Car Speech Corpus
- C-000429: Car03 - Car Speech Corpus
- C-000430: Car04 - Car Speech Corpus
- C-000432: CarSpkr01 - Speech Corpus for In-car Speaker verification
- C-000433: Chinese01 - Chinese Speech Corpus
- C-000434: Chinese02 - Chinese Speech Corpus
- C-000435: Chinese03 - Chinese Speech Corpus
- C-000436: Chinese04 - Chinese Speech Corpus
- C-000437: CleanSent01 - Read Sentence Clean Speech Corpus
- C-000438: Dict01 - PC Environment Read Sentence Speech Corpus
- C-000439: Dict02 - PC Environment Read Sentence Speech Corpus
- C-000440: Emotion01- Emotional Speech Corpus
- C-000443: Noisy01 - High Noise Speech Corpus
- C-000444: Num01 - Number Speech Corpus
- C-000445: SimulCar01 - Simulated Speech Corpus in Car Environment
- C-000447: StandMic01 - Speech Corpus for Speech Recognition Assessment
- C-000448: SynthMale01- Read Sentences Speech Corpus for Prosody Synthesis
- C-000449: TelNum01 - Telephone network Number Speech Corpus
- C-000450: VariMic01 - Microphone Performance Test Speech Corpus
- C-000451: Address01 - Korean Address Speech Corpus
- C-000454: Center for Spoken Language Understanding Corpora
- T-000455: 分類語彙表 -増補改訂版-
- C-000456: Embedded01- Embedded Speech Corpus
- C-000457: F-Korean01 - Foreign Speakers’ Korean
- C-000458: K-SEC - Korean Speakers’ Korean and English
- G-000460: Lexical collocation data
- G-000461: Morpheme Dictionary
- C-000463: Multimodal01 - Multimodal Speech Corpus
- C-000464: Simultaneous Interpretation Database (conversation)
- C-000465: SynthFemale01- Read Sentences Speech Corpus for Prosody Synthesis
- N-000466: TC-STAR 2006 Evaluation Package - SLT Chinese-to-English
- C-000467: The Babel English-Chinese Parallel Corpus
- C-000471: The Chinese Treebank
- C-000476: The Lancaster Los Angeles Spoken Chinese Corpus
- C-000478: The PDC2000 Corpus of Chinese News Text
- C-000479: The UCLA Chinese Corpus
- C-000485: 日本音響学会 研究用連続音声データベース
- C-000486: CD-ROM Nikkei Full-text Database - Nikkei Business Daily 1990
- C-000487: CD-ROM Nikkei Full-text Database - Nikkei Business Daily 1991
- C-000488: CD-ROM Nikkei Full-text Database - Nikkei Business Daily 1992
- C-000489: CD-ROM Nikkei Full-text Database - Nikkei Business Daily 1993
- C-000490: CD-ROM Nikkei Full-text Database - Nikkei Business Daily 1994
- C-000491: CD-ROM Nikkei Full-text Database - Nikkei Business Daily 1995
- C-000492: CD-ROM Nikkei Full-text Database - Nikkei Business Daily 1996
- C-000493: CD-ROM Nikkei Full-text Database - Nikkei Business Daily 1997
- C-000494: CD-ROM Nikkei Full-text Database - Nikkei Business Daily 1998
- C-000495: CD-ROM Nikkei Full-text Database - Nikkei Business Daily 1999
- C-000496: CD-ROM Nikkei Full-text Database - Nikkei Business Daily 2000
- C-000497: CD-ROM Nikkei Full-text Database - Nikkei Business Daily 2001
- C-000498: CD-ROM Nikkei Full-text Database - Nikkei Business Daily 2002
- C-000499: CD-ROM Nikkei Full-text Database - Nikkei Business Daily 2003
- C-000500: CD-ROM Nikkei Full-text Database - Nikkei Business Daily 2004
- C-000501: CD-ROM Nikkei Full-text Database - Nikkei Business Daily 2006
- C-000502: CD-ROM Nikkei Full-text Database - Nikkei Business Daily · Nikkei Financial Daily, and Nikkei Marketing Journal 1994
- C-000503: CD-ROM Nikkei Full-text Database - Nikkei Business Daily · Nikkei Financial Daily, and Nikkei Marketing Journal 1995
- C-000504: CD-ROM Nikkei Full-text Database - Nikkei Business Daily · Nikkei Financial Daily, and Nikkei Marketing Journal 1996
- C-000505: CD-ROM Nikkei Full-text Database - Nikkei Business Daily · Nikkei Financial Daily, and Nikkei Marketing Journal 1997
- C-000506: CD-ROM Nikkei Full-text Database - Nikkei Business Daily · Nikkei Financial Daily, and Nikkei Marketing Journal 1998
- C-000507: CD-ROM Nikkei Full-text Database - Nikkei Business Daily · Nikkei Financial Daily, and Nikkei Marketing Journal 1999
- C-000508: CD-ROM Nikkei Full-text Database - Nikkei Business Daily · Nikkei Financial Daily, and Nikkei Marketing Journal 2000
- C-000509: CD-ROM Nikkei Full-text Database - Nikkei Business Daily · Nikkei Financial Daily, and Nikkei Marketing Journal 2001
- C-000510: CD-ROM Nikkei Full-text Database - Nikkei Business Daily · Nikkei Financial Daily, and Nikkei Marketing Journal 2002
- C-000511: CD-ROM Nikkei Full-text Database - Nikkei Business Daily · Nikkei Financial Daily, and Nikkei Marketing Journal 2003
- C-000512: CD-ROM Nikkei Full-text Database - Nikkei Business Daily · Nikkei Financial Daily, and Nikkei Marketing Journal 2004
- C-000513: CD-ROM Nikkei Full-text Database - Nikkei Business Daily · Nikkei Financial Daily, and Nikkei Marketing Journal 2006
- C-000514: 車内対話音声データベース
- D-000515: CICC Basic Chinese Dictionary
- N-000516: CICC Basic Indonesian Dictionary
- N-000517: CICC Basic Thai dictionary
- D-000519: CICC technical dictionary
- N-000520: Classical contrastive lexicon
- C-000525: DVD-ROM Nikkei Full-text Database - Nikkei Daily,Nikkei Business Daily, Nikkei Financial Daily, and Nikkei Marketing Journal 1985-1989
- C-000526: DVD-ROM Nikkei Full-text Database - Nikkei Daily,Nikkei Business Daily, Nikkei Financial Daily, and Nikkei Marketing Journal 1990-1995
- C-000527: DVD-ROM Nikkei Full-text Database - Nikkei Daily,Nikkei Business Daily, Nikkei Financial Daily, and Nikkei Marketing Journal 1994-1998
- C-000528: DVD-ROM Nikkei Full-text Database - Nikkei Daily,Nikkei Business Daily, Nikkei Financial Daily, and Nikkei Marketing Journal 1995-1999
- C-000529: DVD-ROM Nikkei Full-text Database - Nikkei Daily,Nikkei Business Daily, Nikkei Financial Daily, and Nikkei Marketing Journal 1996-2000
- C-000530: DVD-ROM Nikkei Full-text Database - Nikkei Daily,Nikkei Business Daily, Nikkei Financial Daily, and Nikkei Marketing Journal 2001
- C-000531: DVD-ROM Nikkei Full-text Database - Nikkei Daily,Nikkei Business Daily, Nikkei Financial Daily, and Nikkei Marketing Journal 2002
- C-000532: DVD-ROM Nikkei Full-text Database - Nikkei Daily,Nikkei Business Daily, Nikkei Financial Daily, and Nikkei Marketing Journal 2003
- C-000533: DVD-ROM Nikkei Full-text Database - Nikkei Daily,Nikkei Business Daily, Nikkei Financial Daily, and Nikkei Marketing Journal 2004
- C-000534: DVD-ROM Nikkei Full-text Database - Nikkei Daily,Nikkei Business Daily, Nikkei Financial Daily, and Nikkei Marketing Journal 2005
- C-000535: DVD-ROM Nikkei Full-text Database - Nikkei Daily,Nikkei Business Daily, Nikkei Financial Daily, and Nikkei Marketing Journal 2006
- C-000536: DVD-ROM Nikkei Full-text Database - Nikkei Daily,Nikkei Business Daily, and Nikkei Marketing Journal 1975-1979
- C-000537: DVD-ROM Nikkei Full-text Database - Nikkei Daily,Nikkei Business Daily, and Nikkei Marketing Journal 1980-1984
- C-000538: デジタル音声データベース(セットA)
- C-000539: デジタル音声データベース(セットB)
- C-000540: デジタル音声データベース(セットC)
- C-000541: デジタル音声データベース(セットD)
- C-000542: デジタル音声データベース(セットE)
- C-000543: デジタル音声データベース(セットF)
- D-000545: EDICT
- C-000549: 日本音響学会 新聞記事読み上げ音声コーパス
- D-000550: ライフサイエンス辞書
- C-000551: 日本語話し言葉コーパス
- C-000553: 名古屋大学同時通訳データベース
- G-000558: テレビ放送の語彙調査 [語彙表] CD-ROM版
- C-000565: 1997 HUB4 Broadcast News Evaluation Non-English Test Material
- C-000568: 1997 HUB5 Arabic Transcripts
- C-000588: 2001 HUB5 Mandarin Evaluation
- C-000593: ACE 2004 Multilingual Training Corpus
- C-000594: ACE 2005 Multilingual Training Corpus
- C-000598: ARL Urdu Speech Database, Training Data
- C-000609: Arabic Broadcast News Transcripts
- C-000610: Arabic CTS Levantine Fisher Training Data Set 3, Transcripts
- C-000612: Arabic Gigaword Second Edition
- C-000613: Arabic Gigaword
- C-000614: Arabic News Translation Text Part 1
- C-000615: Arabic Newswire Part 1
- C-000616: Arabic Treebank: Part 1 - 10K-word English Translation
- C-000617: Arabic Treebank: Part 1 v 2.0
- C-000618: Arabic Treebank: Part 1 v 3.0 (POS with full vocalization + syntactic analysis)
- C-000619: Arabic Treebank: Part 2 v 2.0
- C-000620: Arabic Treebank: Part 3 (full corpus) v 2.0 (MPG + Syntactic Analysis)
- C-000621: Arabic Treebank: Part 3 v 1.0
- C-000622: Arabic Treebank: Part 4 v 1.0 (MPG Annotation)
- C-000625: BBN/AUB DARPA Babylon Levantine Arabic Speech and Transcripts
- G-000629: Buckwalter Arabic Morphological Analyzer Version 1.0
- G-000630: Buckwalter Arabic Morphological Analyzer Version 2.0
- C-000635: CALLFRIEND Farsi
- C-000637: CALLFRIEND Hindi
- C-000638: CALLFRIEND Japanese
- C-000639: CALLFRIEND Korean
- C-000640: CALLFRIEND Mandarin Chinese-Mainland Dialect
- C-000641: CALLFRIEND Mandarin Chinese-Taiwan Dialect
- C-000644: CALLFRIEND Tamil
- C-000645: CALLFRIEND Vietnamese
- C-000651: CALLHOME Egyptian Arabic Transcripts Supplement
- C-000652: CALLHOME Egyptian Arabic Transcripts
- G-000656: CALLHOME Japanese Lexicon
- C-000657: CALLHOME Japanese Speech
- C-000658: CALLHOME Japanese Transcripts
- G-000659: CALLHOME Mandarin Chinese Lexicon
- C-000660: CALLHOME Mandarin Chinese Speech
- C-000661: CALLHOME Mandarin Chinese Transcripts
- C-000670: CSLU: 22 Languages Corpus
- C-000671: CSLU: Multilanguage Telephone Speech Version 1.2
- C-000687: Chinese <-> English Name Entity Lists v 1.0
- C-000688: Chinese English News Magazine Parallel Text
- C-000690: Chinese Gigaword
- C-000691: Chinese News Translation Text Part 1
- C-000692: Chinese Proposition Bank 1.0
- C-000693: Chinese Treebank 2.0
- C-000694: Chinese Treebank 4.0
- C-000695: Chinese Treebank 5.0
- G-000697: Chinese-English Translation Lexicon Version 3.0
- C-000706: Gulf Arabic Conversational Telephone Speech, Transcripts
- C-000710: HKUST Mandarin Telephone Speech, Part 1
- C-000713: HUB5 Mandarin Telephone Speech Corpus
- C-000714: HUB5 Mandarin Transcripts
- C-000719: ISI Arabic-English Automatically Extracted Parallel Text
- C-000722: Iraqi Arabic Conversational Telephone Speech, Transcripts
- C-000723: JEIDA/JCSD-Channel 0 City Names
- C-000726: JEIDA/JCSD-Channel 0 Isolated Digits
- C-000734: OGI Multilanguage Corpus
- C-000752: CHILDES
- T-000771: Hindi WordNet
- T-000790: 日本語Mindnet
- C-000792: OrienTel Turkish database
- C-000816: The Polyglot Bible
- D-000827: DCS-環境問題情報事典
- G-000828: DCS-科学技術略語辞書
- G-000829: DCS-音訓引き難読語辞書
- C-000830: DCS-日本文学作品名よみかた辞書
- D-000831: DCS-季語季題よみかた辞書
- G-000832: DCS-コンピュータ用語辞書
- G-000833: DCS-神社・寺院名よみかた辞書
- G-000834: DCS-動植物名よみかた辞書
- G-000835: DCS-島嶼名辞書
- G-000836: DCS-事項名辞書
- G-000837: DCS-事項名読みふり辞書
- C-000838: DCS-毎日新聞1991~2006データファイル
- G-000839: DCS - Medical term dictionary
- T-000840: DCS-現代イタリア語表現辞書(伊和・和伊/用例・文例)
- G-000841: DCS-駅名よみかた辞書
- D-000842: DCS-ビジネス/技術 実用英語辞書[第3版]
- G-000843: DCS-地名よみかた辞書
- G-000844: DCS-人名辞書
- G-000845: DCS-人名読みふり辞書
- G-000846: DCS-河川名辞書
- G-000847: DCS-カタカナから引く外国人名綴り方辞書
- G-000848: DCS-苗字8万よみかた辞書
- C-000849: DCS-文献目録・憲法論の50年(1945~1995)
- G-000850: DCS-昭和災害史事典
- G-000851: DCS-西洋人名辞書
- D-000852: DCS-歌舞伎人名事典
- D-000853: DCS-NEW 斎藤和英辞書
- G-000854: DCS-機関名辞書
- G-000855: DCS-英米小説原題邦題事典
- D-000856: DCS-教育問題情報事典
- D-000857: Dual Daijirin[Web edition]
- C-000858: 電総研道案内対話音声コーパス
- D-000859: Eijiro on the WEB
- D-000860: Eijiro
- G-000861: GoiTaikei --- A Japanese Lexicon CD-ROM
- D-000862: Japanese Semantic Pattern Dictionary
- G-000863: パターン意味検索プログラムファイル
- G-000864: パターンパーサ・プログラムファイル
- D-000865: 意味類型パターン辞書
- C-000867: 鳥バンク(Tori-Bank)
- D-000868: WebLSD
- C-000869: 重点領域研究「音声対話」 対話音声コーパス
- C-000880: An-Nahar Newspaper Text Corpus
- D-000908: DixAF (Bilingual Dictionary French Arabic, Arabic French)
- C-000914: ECI/MCI (European Corpus Initiative/Multilingual Corpus I)
- C-000934: Farsdat (Farsi Speech Database)
- C-000946: Hebrew Speecon database
- C-000955: Korean Speecon database
- C-000960: Mandarin-5000 database
- C-000967: OrienTel Morocco MSA (Modern Standard Arabic) database
- C-000968: OrienTel Tunisia MCA (Modern Colloquial Arabic) database
- C-000969: OrienTel Tunisia MSA (Modern Standard Arabic) database
- C-000973: Phonetically Balanced Words (1)
- C-000988: Siemens Shanghai Mandarin FDB-1000
- C-001022: JEIDA/JCSD-Channel 0 Complete
- C-001023: JEIDA/JCSD-Channel 0 Control Words
- C-001024: JEIDA/JCSD-Channel 0 Four Digit Sequences
- C-001025: JEIDA/JCSD-Channel 0 Mono Syllables
- C-001026: JEIDA/JCSD-Channel 1 City Names
- C-001027: JEIDA/JCSD-Channel 1 Complete
- C-001028: JEIDA/JCSD-Channel 1 Control Words
- C-001029: JEIDA/JCSD-Channel 1 Four Digit Sequences
- C-001030: JEIDA/JCSD-Channel 1 Isolated Digits
- C-001031: JEIDA/JCSD-Channel 1 Mono Syllables
- C-001033: Japanese Business News Text Supplement
- C-001034: Japanese Business News Text
- C-001036: Klex: Finite-State Lexical Transducer for Korean
- C-001037: Korean Broadcast News Speech
- C-001038: Korean Broadcast News Transcripts
- C-001039: Korean English Treebank Annotations
- C-001040: Korean Newswire
- C-001041: Korean Propbank
- C-001042: Korean Telephone Conversations Complete Set
- G-001043: Korean Telephone Conversations Lexicon
- C-001044: Korean Telephone Conversations Speech
- C-001045: Korean Telephone Conversations Transcripts
- C-001046: Korean Treebank Annotations Version 2.0
- C-001049: Levantine Arabic Conversational Telephone Speech, Transcripts
- C-001050: Levantine Arabic Conversational Telephone Speech
- C-001052: Levantine Arabic QT Training Data Set 5, Speech
- C-001053: Levantine Arabic QT Training Data Set 5, Transcripts
- C-001060: Middle East Technical University Turkish Microphone Speech v 1.0
- C-001061: Morphologically Annotated Korean Text
- C-001062: Multiple-Translation Arabic (MTA) Part 1
- C-001063: Multiple-Translation Arabic (MTA) Part 2
- C-001064: Multiple-Translation Chinese (MTC) Part 2
- C-001065: Multiple-Translation Chinese (MTC) Part 3
- C-001066: Multiple-Translation Chinese (MTC) Part 4
- C-001069: 2003 NIST Language Recognition Evaluation
- C-001078: Prague Arabic Dependency Treebank 1.0
- C-001105: GlobalPhone Arabic
- C-001106: GlobalPhone Chinese-Mandarin
- C-001107: GlobalPhone Chinese-Shanghai
- C-001112: GlobalPhone Japanese
- C-001113: GlobalPhone Korean
- C-001118: GlobalPhone Tamil
- C-001134: Three parallel language Chinese, English, Japanese corpus developed for Olympic(Chinese and English)
- G-001135: Three parallel language Chinese, English, Japanese corpus developed for Olympic
- G-001136: Tsinghua Chinese Treebank
- N-001197: VERBMOBIL II - VM CD 44.1 - VM44.1 (BAS edition)
- C-001199: 863 Program in 2003 Assessment and test data of chinese recognition
- C-001200: 863 Program in 2003 Assessment and test data of text classification
- C-001201: 863 Program in 2004 Assessment and test data of machine translation
- N-001202: 863 Program in 2004 Assessment and test data of speech synthesis
- C-001203: 863 Program in 2004 Assessment and test data of text classification
- C-001204: 863 program in 2003 automatic index evaluation data
- N-001205: 863 program in 2003 full text retrieval evaluation data
- N-001206: 863 program in 2003 machine translation evaluation data
- C-001207: 863 program in 2003 part-of-speech evaluation data
- N-001208: 863 program in 2003 speech recognition evaluation data
- C-001211: Chinese POS Tagged Corpus
- C-001212: Chinese and English speech corpus
- G-001213: Chinese geographic name storehouse
- D-001214: Chinese-English Olympic Dictionary
- C-001215: Chinese-English Sentence aligned Bilingual Corpus
- D-001220: Mordern Chinese semantic Dictionary based on International Logical Model
- N-001221: Natural Broadcasting Speech corpus
- C-001223: RASC863-annotated 4 regional accent speech corpus(I)
- C-001224: RASC863-annotated 4 regional accent speech corpus(III)
- C-001225: SCSC--Syllable Corpus of Standard Chinese
- C-001228: Special Scene and special domain dialogue corpus
- C-001232: TC-STAR 2005 Evaluation Package - ASR Mandarin Chinese
- N-001234: TC-STAR 2005 Evaluation Package - SLT Chinese-to-English
- C-001237: Taiwan Mandarin Speecon database
- C-001238: The identifiable speech database of Chinese mandarin-----extract database
- C-001239: The identifiable speech database of Chinese mandarin-----wide label
- C-001240: The identifiable speech database of tabletop speech--free topic (50 persons)
- C-001241: The identifiable speech database of tabletop speech--the message (120 persons)
- C-001242: The identifiable speech database of tabletop speech--the message (200 persons)
- C-001244: Turkish Continuous and Isolated Word Speech Database
- C-001246: 1997 Mandarin Broadcast News Speech (HUB4-NE)
- C-001247: 1997 Mandarin Broadcast News Transcripts (HUB4-NE)
- C-001251: Arabic Broadcast News Speech
- C-001255: Chinese Treebank Final Release
- C-001258: Gulf Arabic Conversational Telephone Speech
- C-001259: Iraqi Arabic Conversational Telephone Speech
- C-001260: Penn Chinese Treebank
- C-001291: TDT2 Mandarin Audio Corpus
- C-001294: TDT3 Mandarin Audio
- C-001296: TDT4 Multilingual Broadcast News Speech Corpus
- C-001297: TDT4 Multilingual Text and Annotations
- C-001298: TDT5 Multilingual Text
- C-001299: TDT5 Topics and Annotations
- C-001301: TIDES Extraction (ACE) 2003 Multilingual Training Data
- C-001311: TRECVID 2005 Keyframes & Transcripts
- C-001313: Taiwanese Putonghua Speech and Transcripts
- C-001319: カナダ・バイリンガル話ことばコーパス
- C-001320: フランス語(エックス)多言語話し言葉コーパス
- C-001321: フランス語(パリ)多言語話しことばコーパス
- C-001322: マレーシア語多言語話しことばコーパス
- C-001323: スペイン語多言語話しことばコーパス2004年度版
- C-001324: トルコ語多言語話しことばコーパス
- C-001328: Arabic CTS Levantine Fisher Training Data Set 3, Speech
- D-001355: COMPDIC
- C-001358: Cantonese SpeechDat-like MDB-2000
- C-001359: Mandarin Chinese Desktop Speech Recognition Corpus - Digit String (120 people)
- C-001360: Mandarin Chinese Desktop Speech Recognition Corpus - Digit String (200 people)
- C-001361: Mandarin Chinese Desktop Speech Recognition Corpus - Digit String (849 people)
- C-001362: Mandarin Chinese Desktop Speech Recognition Corpus - Digit String (98 people)
- C-001363: Mandarin Chinese Desktop Speech Recognition Corpus - Monosyllabic (98 people)
- C-001364: Mandarin Chinese Desktop Speech Recognition Corpus - Person Name, Place Name (70 people)
- C-001365: Mandarin Chinese Desktop Speech Recognition Corpus - Person name (849 people)
- C-001366: Mandarin Chinese Desktop Speech Recognition Corpus - Person name, Place Name (10 people)
- C-001367: Mandarin Chinese Desktop Speech Recognition Corpus - SMS (120 people)
- C-001368: Mandarin Chinese Desktop Speech Recognition Corpus - SMS (200 people)
- C-001369: Mandarin Chinese Desktop Speech Recognition Corpus - Simple Chinese sentences (850 people)
- C-001370: Mandarin Chinese Desktop Speech Recognition Corpus - Spontaneous Speech (50 people)
- C-001371: Mandarin Chinese Desktop Speech Recognition Corpus - Spontaneous Speech (849 people)
- C-001372: Mandarin Chinese Desktop Speech Recognition Corpus - Stock (70 people)
- C-001373: Mandarin Chinese Desktop Speech Recognition Corpus - Stock (849 people)
- C-001374: Mandarin Chinese Desktop Speech Recognition Corpus - Stock、 Person Name 、Digit String、Simple Chinese sentences、Spontaneous Speech (50 people)
- C-001375: Mandarin Chinese Telephone Speech Recognition Corpus - Digit String (649 people)
- C-001376: Mandarin Chinese Telephone Speech Recognition Corpus - Digit String
- C-001377: Mandarin Chinese Telephone Speech Recognition Corpus - Person Name (649 people)
- C-001378: Mandarin Chinese Telephone Speech Recognition Corpus - Person Name, Place Name (Mobile telephone 265)
- C-001379: Mandarin Chinese Telephone Speech Recognition Corpus SMS (Mobile telephone 64)
- C-001380: Mandarin Chinese Telephone Speech Recognition Corpus - Simple Chinese sentences (650 people)
- C-001381: Mandarin Chinese Telephone Speech Recognition Corpus - Spontaneous Speech (649 people)
- C-001382: Mandarin Chinese Telephone Speech Recognition Corpus Stock (649 people)
- C-001383: Mandarin Chinese Telephone Speech Recognition Corpus - Stock
- C-001384: Mandarin Chinese Telephone Speech Recognition Corpus -Person Name, Place Name
- C-001385: Mandarin Chinese Speech Recognition Corpus (desktop) - digit string (200 people)
- C-001386: Mandarin Chinese Speech Recognition Corpus (desktop) - place name (200 people)
- D-001391: DIINAR.1 - Arabic Lexical Resource
- C-001401: ECI Multilingual Text
- D-001402: ENAMDICT/JMnedict
- C-001404: Egyptian Colloquial Arabic Lexicon
- C-001406: English Chinese Translation Treebank v 1.0
- C-001409: English-Arabic Treebank v 1.0
- C-001420: Fisher Levantine Arabic Conversational Telephone Speech, Transcripts
- C-001421: Fisher Levantine Arabic Conversational Telephone Speech
- C-001432: Hong Kong Hansards Parallel Text
- C-001433: Hong Kong Laws Parallel Text
- C-001434: Hong Kong News Parallel Text
- C-001435: Hong Kong Parallel Text
- D-001440: JMdict
- C-001441: Japanese Mandarin Speech Recognition Corpus (desktop) single Japanese sentence (200 people)
- C-001442: Japanese Mandarin Speech Recognition Corpus (desktop) Japanese person name (200 people)
- C-001443: Japanese Mandarin Speech Recognition Corpus (desktop) Japanese place name (200 people)
- C-001444: Japanese Mandarin Speech Recognition Corpus (desktop) digit string (200 people)
- D-001445: KANJIDIC/KANJD212
- C-001447: Korean Mandarin Speech Recognition Corpus (desktop) place name (150 people)
- C-001448: Korean Mandarin Speech Recognition Corpus (desktop) digit string (110 people)
- C-001449: Korean Mandarin Speech Recognition Corpus (desktop) person name (150 people)
- C-001450: Korean Mandarin Speech Recognition Corpus (desktop) single Korean sentences (40 people)
- D-001454: LC-STAR Hebrew (Israel) phonetic lexicon
- N-001461: "Le Monde Diplomatique" Text corpus in Arabic
- C-001468: Mandarin Chinese Speech Recognition Corpus (desktop) - place name (120 people)
- C-001469: Mandarin Chinese Speech Recognition Corpus (desktop) - short message (120 people)
- C-001470: Mandarin Chinese Speech Synthesis Corpus (Basic Corpus)
- C-001471: Mandarin Chinese Speech Synthesis Corpus (Integrated Corpus)
- C-001472: Mandarin Chinese Speech Synthesis Corpus
- C-001473: Mandarin Chinese high clarity Speech Recognition Corpus (in recording studio) - (desktop) person name (200 people)
- C-001474: Mandarin Chinese high clarity Speech Recognition Corpus (in recording studio) - (desktop) place name (200 people)
- C-001475: Mandarin Chinese high clarity Speech Recognition Corpus (in recording studio) - (desktop) digit string (200 people)
- C-001476: Mandarin Chinese high clarity Speech Recognition Corpus (in recording studio) - single Chinese sentence (200 people)
- C-001478: Mixer Corpus
- C-001481: Multilingual Corpus
- C-001483: NEMLAR Broadcast News Speech Corpus
- C-001485: NEMLAR Written Corpus
- C-001491: Original Short-Message Data Collation I in Chinese (PinYin)
- C-001492: Original Short-Message Data Collation I in Chinese (named entities)
- C-001493: Original Short-Message Data Collation I in Chinese (participles)
- C-001494: Original Short-Message Data Collation I in Chinese
- C-001495: Original Short-Message Data Collation II in Chinese (PinYin)
- C-001496: Original Short-Message Data Collation II in Chinese (named entities)
- C-001497: Original Short-Message Data Collation II in Chinese (participles)
- C-001498: Original Short-Message Data Collation II in Chinese
- C-001506: Phonetically Balanced Sentences
- C-001507: Phonetically Balanced Words (2)
- C-001508: Phonetically Balanced Words (4)
- C-001509: Phonetically Balanced Words (5)
- C-001510: Phonetically Balanced Words (3)
- C-001511: Phonetically Rich Words
- C-001512: Qualified POS Tagged Corpus
- C-001540: The EMILLE Lancaster Corpus
- C-001541: The Lancaster Corpus of Mandarin Chinese (LCMC)
- C-001573: VERBMOBIL II - VM CD 43.1 - VM43.1 (BAS edition)
- C-001574: VERBMOBIL II - VM CD 46.1 - VM46.1 (BAS edition)
- C-001580: VERBMOBIL II - VM CD 57.1 - VM57.1 (BAS edition)
- C-001581: VERBMOBIL II - VM CD 58.1 - VM58.1 (BAS edition)
- C-001582: VERBMOBIL II - VM CD 59.1 - VM59.1 (BAS edition)
- C-001590: West Point Arabic Speech
- C-001593: West Point Korean Speech
- C-001596: Aozora Bunko
- C-001597: Asahi Shimbun News Article Data for Research
- C-001598: CD-Maichichi Shimbun '91 data collection
- C-001599: CD-Mainichi Shimbun '93 Data Collection
- C-001600: CD-Mainichi Shimbun '95 Data Collection
- C-001601: CD-Mainichi Shimbun Data Collection
- C-001602: CD-ROM Mainichi Shimbun '92 Data Collection
- C-001603: CD-ROM Mainichi Shimbun '94 Data Collection
- C-001604: CD-ROM Nikkei Full-text Database - Nikkei Business Daily 2005
- C-001605: CD-ROM Nikkei Full-text Database - Nikkei Business Daily · Nikkei Financial Daily, and Nikkei Marketing Journal 2005
- C-001606: CRL-DB-TEXT-97-1
- C-001607: Mandarin Chinese Telephone Speech Recognition Corpus SMS (Fixed phone 86)
- C-001608: DVD-ROM 公開公報
- D-001609: EDR Concept Dictionary
- D-001610: EDR Electronic Dictionary
- D-001614: EDR English-Japanese Bilingual Dictionary
- D-001615: EDR Japanese Co-occurrence Dictionary
- C-001616: EDR Japanese Corpus
- D-001617: EDR Japanese Word Dictionary
- D-001618: EDR Japanese-English Bilingual Dictionary
- D-001619: EDR Technical Terminology Dictionary(Information Processing)
- D-001620: English Business Letter Examples Dictionary CD-ROM version
- D-001621: 講談社和英辞典コーパス2003
- C-001622: Kyoto Text Corpus
- C-001623: RWC-DB-TEXT-94-1
- C-001624: RWC-DB-TEXT-94-2
- C-001625: RWC-DB-TEXT-95-2
- C-001626: RWC-DB-TEXT-95-3
- D-001627: RWC-DB-TEXT-96-2
- C-001628: RWC-DB-TEXT-97-1
- C-001629: RWCP-DB-TEXT-CD2
- C-001631: Telephone/Keyboad Conversation Database
- C-001632: Yomiuri Shimbun Articles Data(Japanese)
- D-001646: Dualウィズダム和英辞典
- D-001647: Dualウィズダム英和辞典
- D-001648: 医療辞書'07 for ATOK
- D-001649: 医療辞書'06 for ATOK
- D-001650: 医療辞書'05 for ATOK
- D-001651: 医療辞書'04 for ATOK
- D-001652: 医療辞書'03 for ATOK
- D-001654: Papillon project
- D-001655: CJK Lexical Resources
- D-001657: Dictionary of administrative official document notation for ATOK
- D-001658: Kyodo News reporters' handbook dictionary the 10th edition for ATOK
- D-001659: NHK New Dictionary for the usage of technical terms for ATOK revised edition
- D-001660: Yuhikaku legal terms conversion dictionary V2 for ATOK
- N-001661: Yuhikaku legal terms transformable dictionary for ATOK
- G-001662: Life science dictionary Plus 2007 for ATOK
- G-001663: New Oriental Medicine Dictionary V6 for ATOK
- G-001664: New Oriental Medicine Dictionary V5 for ATOK
- D-001665: New Oriental Medicine Dictionary V4 for ATOK
- G-001666: New Oriental Medicine Dictionary V3 for ATOK
- G-001667: New Oriental Medicine Dictionary V2 for ATOK
- G-001668: 170,000 electric・electronic・informational terms transformable・translatable for ATOK
- G-001669: Transformable・translatable dictionary of architecture・civil engineering terms for ATOK
- D-001670: Transformable・translatable dictionary of 170,000 achinery・engineering terms for ATOK
- G-001672: Comprehensive Database of Japanese Name Variants
- G-001673: Transformative and translatable dictionary of science・agriculture for ATOK
- N-001676: Dictionary for spelling foreign names for ATOK
- N-001677: Kaishashikihou transfoamable dictionary of company names for ATOK
- G-001678: Electric Japanese dictionary of Kojien 5th edition for ATOK
- G-001679: Meikyou Japanese Dictionary・Geneus English Japanese Dictionary・Japanese English DictionaryR.2
- G-001680: Meikyou Japanese Dictionary・Geneus English Japanese Dictionary・Japanese English Dictionary
- G-001681: Dictionary of modern Japanese 2007 for ATOK
- G-001682: Dictionary of modern Japanese 2006 for ATOK
- G-001683: Dictionary of modern Japanese 2005 for ATOK
- G-001684: Dictionary of modern Japanese for ATOK
- G-001685: Electric Encyclopedia Mypedia(edited in August 2006) for ATOK
- C-001692: Mandarin Chinese News Text
- C-001694: Reuters Corpus, Volume 2
- C-001697: Wikiversity
- C-001704: Academia Sinica Balanced Corpus of Modern Chinese
- C-001705: Sinica Treebank
- T-001712: Arabic WordNet
- D-001713: Japanese-English-Japanese Technical Terms
- D-001716: English-Japanese Mechanical Engineering Terms
- D-001717: Japanese<>English Dictionary of Chemistry and Chemical Engineering
- D-001718: Japanese<>English Dictionary of Medicine and Pharmaceutics
- D-001719: Japanese<>English Dictionary of Biology and Biotechnology
- G-001720: 日英コンピュータ・IT用語辞典
- D-001721: Contextual Clues for Named Entity Recognition in Japanese
- G-001723: Multilingual Database of Proper Nouns
- D-001724: CJE Database of Technical Terminology
- G-001725: English-Chinese Dictionary of Computer Terms
- D-001728: The CJKI Japanese English Dictionary
- D-001729: The CJKI English-Japanese Dictionary
- D-001730: JAPANESE PHONOLOGICAL DATABASE
- D-001742: Japanese-English Dictionary of Proper Nouns
- G-001743: WESTERN PERSONAL AND PLACE NAMES IN JAPANESE
- G-001744: Katakana Lexical Database
- G-001745: Japanese Orthographic Variants Classified by Type
- G-001746: Japanese Organization and Company Names
- G-001747: Database of Japanese-English Neologisms
- D-001748: Japanese and International Show Business Celebrities
- D-001749: Japanese-English Dictionary of Business and Finance
- D-001750: Cross-Synonym and Cross-Language Searching in Japanese
- D-001751: SINGLE-CHARACTER DICTIONARY FOR JAPANESE INPUT METHODS
- D-001752: The Kodansha Kanji Learner's Dictionary Electronic Dictionary Edition
- C-003109: 2003 NIST Rich Transcription Evaluation Data
- C-003244: 重点領域研究「音声言語」・試験研究「音声DB」 連続音声データベース
- C-003245: 筑波大 多言語音声コーパス
- C-003246: 東北大-松下単語音声データベース
- C-003247: 基盤研究(A)「日本語方言の地域差」方言音声コーパス
- C-003248: 音声対話データベース (96年版)
- C-003249: 音声対話データベース (97年版)
- C-003250: 検索・要約用ニュース音声データベース
- C-003251: 会議音声データベース
- C-003252: RWCP 実環境音声・音響データベース
- C-003253: CIAIR 子供の声データベース
- C-003254: 雑音重畳日本語連続数字 音声認識評価環境
- C-003255: 雑音下日本語連続数字 音声区間検出評価環境
- C-003256: 実環境車内 日本語連続数字 音声認識評価環境
- C-003257: 実環境車内 日本語単語 音声認識評価環境
- C-003259: 留学生による読み上げ日本語音声データベース
- C-003260: 理研ワープロ操作対話音声コーパス
- C-003261: 日本音響学会新聞記事読み上げ音声コーパス
- C-003262: 新聞記事読み上げ高齢者音声コーパス
- C-003263: ATR Chinese Hotel Reservation Dialogue
- C-003264: Singapore Primary School Chinese Language Text
- C-003265: CSTSC-Flight Corpus
- C-003266: CUCorpora
- C-003267: CUSYL (Version 1.0)
- C-003268: CUWORD (Version 1.0)
- C-003269: CUSENT (Version 1.0)
- C-003270: Simultaneous Interpretation Database
- C-003271: CUDIGIT (Version 1.0)
- C-003272: CUCMD (Version 1.0)
- C-003273: CUCall Cantonese Sentences (Version 1.0)
- C-003274: CUCall Cantonese Words (Version 1.0)
- C-003275: CUCall Cantonese Digits (Version 1.0)
- C-003276: CUCall Cantonese Paragraphs (Version 1.0)
- C-003277: CUCall Cantonese Spontaneous Speech (Version 1.0)
- C-003278: CUCall Putonghua Speech (Version 1.0)
- C-003279: CUCall
- D-003280: CULEX (Version 1.0)
- D-003281: CUPDICT (Version 1.0)
- C-003282: 500-People Telephone Read Speech Corpus
- C-003283: Telephone Name Dialing Corpus
- C-003284: CASS Corpus
- C-003285: Wu-Dialectal Chinese Speech Corpus
- C-003286: BIT-MobileSpeech
- C-003287: BIT-MobileTalk
- C-003288: BIT-TeleSpeech
- C-003289: BIT-TonalName
- C-003290: BIT-MonoSyllable
- C-003291: CCC-VPR3C2005
- C-003292: CCC-VPR2C2005-1000X
- C-003293: CCC-VPR2C2005-1000
- C-003294: CCC-VPR2C2005-3000
- C-003295: CCC-VPR2C2005-6000
- C-003296: CCC-VPR2C2006-10000
- C-003297: CCC-VPR27C2006-50
- C-003298: CCC-VPR36C2006-100
- C-003299: Affective Speech Recognition
- C-003302: Chinese Affect Recognition
- C-003303: Chinese Treebank 6.0
- C-003304: Chinese Gigaword Third Edition
- C-003305: Tagged Chinese Gigaword
- C-003308: Mandarin Affective Speech
- C-003314: OntoNotes Release 1.0
- C-003322: OntoNotes Release 2.0
- C-003327: GALE Phase 1 Arabic Broadcast News Parallel Text - Part 1
- C-003328: GALE Phase 1 Chinese Broadcast News Parallel Text - Part 1
- C-003329: ISI Chinese-English Automatically Extracted Parallel Text
- D-003336: LC-STAR Standard Arabic Phonetic lexicon
- D-003338: LC-STAR Mandarin Chinese Phonetic lexicon
- C-003348: GALE Phase 1 Arabic Blog Parallel Text
- C-003351: スポーツ報知記事データ
- C-003353: ARCADE II Evaluation Package
- C-003355: 現代日本語書き言葉均衡コーパス(モニター公開版)
- C-003357: CESTA Evaluation Package
- C-003365: 太陽コーパス
- D-003367: 計算機用日本語基本辞書IPAL
- C-003369: 大阪外国語大学 多言語平行旅行会話文集 (サンプル)
- C-003370: Orientel United Arab Emirates MCA (Modern Colloquial Arabic)
- C-003371: Orientel United Arab Emirates MSA (Modern Standard Arabic)
- C-003375: JEITAマルチモーダル対話コーパス
- C-003376: Japanese Speecon database
- C-003382: 日本語学習者による日本語作文と,その母語訳との対訳データベース(作文対訳DB) オンライン版
- C-003384: 日本語学習者による日本語/母語発話の対照言語データベース(発話対照DB)
- C-003386: ことばに関する新聞記事見出しデータベース
- C-003388: 近代女性雑誌コーパス
- C-003390: 日本のふるさとことば集成 第1巻 北海道・青森
- T-003402: 分類語彙表-増補改訂版データベース
- C-003404: 日本のふるさとことば集成 第2巻 岩手・秋田
- D-003407: 形態素解析辞書UniDic
- D-003409: 近代文語UniDic ver.0.7
- D-003432: 語種辞書『かたりぐさ』ver.1.0.1
- D-003433: 表記統合辞書 ver.1.0
- C-003436: 自然発話音声データベース SDB
- C-003438: 自然発話音声・言語データベース(日英対訳) SLDB
- C-003440: ATR Dialogue Database
- C-003442: 多数話者音声データベース APP
- C-003444: 多数話者音声データベース APPBLA
- C-003446: 多数話者音声データベース APPDIC
- C-003448: 多数話者音声データベース
- C-003450: 会話表現データベース 模擬会話データ
- C-003452: 会話表現データベース 会話表現集データ
- C-003454: 会話表現データベース
- D-003458: 日本語の語彙特性 第1巻
- D-003460: 日本語の語彙特性 第2巻
- D-003462: 日本語の語彙特性 第3巻
- D-003464: 日本語の語彙特性 第4巻
- D-003466: 日本語の語彙特性 第5巻
- D-003468: 日本語の語彙特性 第6巻
- D-003470: CD-ROM 日本語の語彙特性 第2期
- D-003472: 日本語の語彙特性 第3期 CD-ROM付き
- D-003474: CD-ROM 日本語の語彙特性 第1期
- D-003476: 日本語の語彙特性
- C-003478: 日本のふるさとことば集成 第3巻 宮城・山形・福島
- C-003479: 日本のふるさとことば集成 第4巻 茨城・栃木
- C-003480: 日本のふるさとことば集成 第5巻 埼玉・千葉
- C-003481: 日本のふるさとことば集成 第6巻 東京・神奈川
- C-003482: 日本のふるさとことば集成 第7巻 群馬・新潟
- C-003483: 日本のふるさとことば集成 第8巻 長野・山梨・静岡
- C-003484: 日本のふるさとことば集成 第9巻 岐阜・愛知・三重
- C-003485: 日本のふるさとことば集成 第10巻 富山・石川・福井
- C-003486: 日本のふるさとことば集成 第11巻 京都・滋賀
- C-003487: 日本のふるさとことば集成 第12巻 奈良・和歌山
- C-003488: 日本のふるさとことば集成 第13巻 大阪・兵庫
- C-003489: 日本のふるさとことば集成 第14巻 鳥取・島根・岡山
- C-003490: 日本のふるさとことば集成 第15巻 広島・山口
- C-003491: 日本のふるさとことば集成 第16巻 香川・徳島
- C-003492: 日本のふるさとことば集成 第17巻 愛媛・高知
- C-003493: 日本のふるさとことば集成 第18巻 福岡・佐賀・大分
- C-003494: 日本のふるさとことば集成 第19巻 長崎・熊本・宮崎
- C-003495: 日本のふるさとことば集成 第20巻 鹿児島・沖縄
- C-003506: Hong Kong ICE Corpus
- C-003508: Indian component of the International Corpus of English
- C-003523: Singapore component of the International Corpus of English
- C-003524: 通話品質測定用多言語音声データベース(擬似音声)
- C-003525: 日本語音声データベース
- C-003526: 単語音声データベース
- C-003527: 多言語音声データベース1994
- C-003528: 多言語音声データベース2002
- C-003529: 通話品質測定用多言語音声データベース(都市名)
- C-003530: 広帯域ステレオ音声データベース
- C-003531: 姓名録音音声データベース Ver. 1.1
- C-003532: 高齢者&子供音声データベース
- C-003533: 音素バランス音声データ
- C-003534: The Philippines component of the International Corpus of English
- C-003537: こども語辞書
- D-003539: goo流行語辞書2006
- D-003541: goo流行語辞書2005
- D-003543: 医療辞書'08 for ATOK
- D-003545: ぎょうせい 公用文表記辞書 for ATOK
- D-003552: 共同通信社 記者ハンドブック辞書 第11版 for ATOK
- D-003554: NHK 新用字用語辞書2008 for ATOK
- D-003555: 有斐閣法律法学用語変換辞書V3 for ATOK
- C-003557: 法令翻訳データ (標準対訳辞書対応)
- D-003559: 標準対訳辞書 ver. 3.0 (CSV)
- D-003561: 標準対訳辞書(計算機用)
- C-003563: 単語音声データベースVol.1(制御用語編)
- C-003571: 単語音声データベースVol.2(地名編)
- C-003572: 単語音声データベースVol.3(人名編)
- C-003573: 単語音声データベースVol.4(商取引用語編)
- C-003574: 単語音声データベース (通信端末版)
- C-003575: 単語音声データベースVol.2(地名編) (通信端末版)
- C-003576: 単語音声データベースVol.3(人名編) (通信端末版)
- C-003577: 単語音声データベースVol.4(商取引用語編) (通信端末版)
- C-003585: CD-毎日新聞2007データ集
- C-003588: CD-毎日新聞2007データ集プラス
- C-003589: CD-毎日新聞2006データ集プラス
- C-003590: CD-毎日新聞2005データ集プラス
- C-003593: 朝日新聞記事データ集 学術研究用 2007
- C-003594: 朝日新聞記事データ集 学術研究用 2006
- C-003604: 読売新聞記事データ<邦文>2007年版 (*CSV形式)
- C-003605: 読売新聞記事データ<邦文>2006年版 (*CSV形式)
- C-003606: 読売新聞記事データ集 2007 (*テキスト形式)
- C-003607: 読売新聞記事データ集 2006 (*テキスト形式)
- C-003608: 読売新聞記事データ<英文>2007年版 (*CSV形式)
- C-003609: 読売新聞記事データ<英文>2006年版 (*CSV形式)
- C-003610: THE DAILY YOMIURI 記事データ集 2007 (*テキスト形式)
- C-003611: THE DAILY YOMIURI 記事データ集 2006 (*テキスト形式)
- D-003612: ヨミダス用語辞書
- C-003614: 日本語複合辞用例データベース第1版
- C-003617: OpenMWEコーパスv0.01
- C-003619: 基本慣用句五種対照表
- C-003622: 日本語の語彙特性 第4期
- C-003623: 基本語データベース語義別単語新密度
- C-003629: Tübingen Treebank of Spoken Japanese
- C-003646: Malay Concordance Project
- T-003647: Asian WordNet
- C-003650: 宇都宮大学パラ言語情報研究向け音声対話データベース
- C-003652: 電総研 単語音声データベース
- C-003655: NTT 乳幼児音声データベース
- C-003658: CASTEL/J CD-ROM バージョン1.2
- D-003659: CASTEL/J CD-ROM ミレニアム・バージョン (v.1.3)
- C-003662: 教育研究情報データベース 高校入試問題
- C-003664: 教育研究情報データベース 初等中等教育諸学校における実践的教育研究主題
- C-003665: 教育研究情報データベース 教育学関係博士・修士学位論文題目
- C-003668: 教育研究情報データベース 教育研究所・教育センター刊行論文
- C-003669: 教育研究情報データベース 地方教育センター等における教職員研修講座
- C-003671: 東京大学史料編纂所データベース
- C-003674: 古文書フルテキストデータベース
- C-003676: 古記録フルテキストデータベース
- C-003677: 奈良時代古文書フルテキストデータベース
- C-003679: 平安遺文フルテキストデータベース
- C-003682: 鎌倉遺文フルテキストデータベース
- D-003683: 電子くずし字字典
- C-003686: JCMD大阪
- C-003687: 日本主要都市方言音声データベース
- C-003690: JCMD「天気予報」Ⅰ~Ⅴ
- C-003691: 琉球方言音声データベース
- D-003694: 今帰仁方言音声データベース
- D-003696: 首里・那覇方言音声データベース
- D-003697: 奄美方言音声データベース
- D-003699: 宮古方言音声データベース
- C-003701: 古今和歌集データベース
- D-003703: 電子音声沖縄語辞典
- C-003706: 連歌連想語彙データベース
- C-003708: 連歌データベース
- C-003710: 古事類苑全文データベース
- C-003711: 和歌データベース
- C-003714: 俳諧データベース
- C-003740: NTCIR-1(情報検索/用語抽出研究用テストコレクション)
- C-003741: NTCIR-2(情報検索用テストコレクション)
- C-003742: NTCIR-2 SUMM(テキスト自動要約用テストコレクション)
- C-003743: NTCIR-2 SUMM TAO(自動要約用データ:TAO作成)
- C-003744: NTCIR-3 CLIR(情報検索/言語横断検索用テストコレクション)
- C-003746: NTCIR-3 QA(質問応答用テストコレクション)
- C-003747: NTCIR-3 SUMM(テキスト自動要約用テストコレクション)
- C-003749: NTCIR-4 CLIRꉡfeXgRNV
- C-003751: NTCIR-4 QAC2(質問応答テストコレクション)
- C-003753: NTCIR-5 CLIR ꉡfeXgRNV
- C-003754: NTCIR-5 CLQA 多言語質問応答テストコレクション
- C-003758: NTCIR-6 CLIR ꉡfeXgRNV
- C-003759: NTCIR-6 CLQA 多言語質問応答テストコレクション
- C-003764: 怪異・妖怪伝承データベース
- C-003767: 現代中国語コーパス
- D-003778: 現代チベット語動詞辞典
- C-003781: ヒンディー語古典データベース
- C-003782: ヒンドゥー教聖典データベース
- N-003784: 古代チベット語文献オンライン
- N-003787: 漢字字体規範データベース
- C-003788: 中期朝鮮語形態素データベース
- C-003790: 大規模ブログコーパス
- C-003793: 日米特許対訳コーパス
- D-003795: 基本語意味データベース: Lexeed
- C-003796: 100地名単語データベース
- C-003798: 中日対訳コーパス
- C-003803: 日本語会話データベース
- C-003804: 羅生門
- C-003806: 奥の細道
- C-003807: Learner Corpus Data
- C-003808: Learner Corpus Data: Traveling and Gardening
- C-003809: Learner Corpus Data: Cooking and Gardening
- C-003810: Learner Corpus Data: How Far Did the Kite Go?
- C-003811: Learner Corpus Data: Momotaro
- C-003812: Learner Corpus Data: The North Wind and the Sun
- C-003813: Learner Corpus Data: Mercury and the Workmen
- C-003814: Data Documentation: 9th Graders' Email Messages
- D-003815: Dictionary of Sources of Classical Japan
- C-003819: 大正新脩大藏經テキストデータベース
- G-003825: Kawasaki City CEC Handbook of Common Expressions in School
- G-003826: 算数6ヶ国語対訳集
- C-003827: Kawasaki City CEC Teacher to Parent Letter Correspondence
- C-003828: Kawasaki City CEC Elementary School Education Series: Social Studies
- C-003833: 日本人はどんなふうにしゃべっているの?
- C-003835: 新聞記事文庫
- D-003844: WWWJDIC
- C-003857: The JEFLL (Japanese EFL Learner) Corpus
- C-003859: ORCHID POS-Tagged Corpus
- C-003861: LIVAC Synchronous Corpus
- N-003862: Chinese Dependency Treebank
- C-003863: AnnCorra
- C-003864: Corpus Program
- C-003866: Word List with Accumulated Word Frequency in Sinica Corpus 3.0
- T-003868: Academia Sinica Bilingual WordNet
- T-003869: Academia Sinica Bilingual Ontological Database
- C-003870: Academia Sinica Tagged Corpus of Early Mandarin Chinese
- N-003872: CIRB030
- C-003873: MAT-160
- C-003874: MAT-400
- C-003875: MAT-2000Edu
- C-003876: MAT-2000Com
- C-003877: MAT-2500ExtV-Edu
- C-003878: MAT-2500ExtV-Com
- C-003879: TCC-300Edu
- C-003880: TCC-300Com
- C-003881: Sinica MCDC
- C-003882: EAT-ALL
- C-003883: EAT-200
- C-003884: MATBN
- C-003885: Affix Database
- T-003886: E-HowNet Ontology
- C-003887: The NIE Corpus of Spoken Singapore English
- C-003889: A Corpus of Spoken PRC English
- C-003890: The Yeo (2001) Corpus of Sec 2 Compositions
- C-003891: Gyan Nidhi
- D-003892: SHABDIKA
- C-003893: Annotated Speech Corpora-DRDO
- D-003928: J. P. L. Gwynn, A Telugu-English dictionary
- D-003931: A Dravidian etymological dictionary
- D-003951: Khmer Dictionary
- C-003952: Khmer Bitext Corpus
- C-003953: Lao Text Corpus
- D-003954: Lao Dictionary
- D-003955: Shan Dictionary
- C-003956: Shan Bitext Corpus
- D-003957: Sgaw Karen Dictionary
- C-003958: Mon-Khmer languages database
- D-003959: Mon-Khmer etymological dictionary
- C-003960: Corpus of Khmer Inscriptions
- C-003961: The King's Thai
- C-003962: Bar Ahom Lexicon
- C-003963: Bar Ahom Manuscript
- C-003964: Indian languages Corpora
- C-003965: Assamese Corpora
- C-003966: Manipuri Corpora
- D-003967: English-Assamese Dictionary
- D-003968: Assamese-English Dictionary
- D-003969: English-Manipuri Dictionary
- D-003970: Manipuri-English Dictionary
- D-003971: Hindi-Assamese Dictionary
- D-003972: Transliterated Assamese Dictionary
- C-003973: Archive of Recorded World Literature
- D-003974: GujaratiLexicon
- D-003975: Monier Williams Sanskrit Dictionary
- T-003976: Bhagavadgita
- T-003977: Tirukkural Wordlists
- N-003978: dhvani
- D-003981: Marathi - Hindi Dictionary
- D-003982: Kannada - Hindi Dictionary
- D-003983: Telugu - Hindi Dictionary
- D-003984: Punjabi - Hindi Dictionary
- D-003985: Calita Bengali-Hindi Dictionary
- D-003986: Dishi Bengali-Hindi Dictionary
- T-003987: English-Telugu Dictionary
- D-003988: English - Hindi Dictionary : Version-2.0
- D-003989: Trilingual Dictionary
- D-003990: Universal Word - Hindi Dictionary
- C-003993: Pushto (Pashtun language) instructional recordings
- C-003994: Classical Urdu Poetry
- C-003995: Punjabi instructional recordings
- D-004001: Kamus Bahasa
- C-004003: Radio plays
- C-004005: ACIP RELEASE 6
- C-004007: Chone Drakpa Shedrup Rinpoche
- D-004009: Wa Dictionary Database
- C-004011: Comparative Chart of Wa Orthographies
- C-004012: List of about 300 Pairs of Morphologically-related Wa Words
- C-004013: Samples of spoken Wa
- C-004014: Chinese Web 5-gram Corpus
- G-004022: A Glossary of Pali and Buddhist Terms
- T-004025: OriNet
- T-004026: San-Net
- C-004028: HKCAC
- C-004029: HKCPSC
- C-004030: NTU Corpus of Formosan Languages
- C-004032: SCoRE: Singapore Corpus of Research in Education
- C-004033: Singaporean Preschoolers Oral Competence in Mandarin
- C-004034: Hindi Speech Data base
- C-004035: Mandarin Topic-oriented Conversation Corpus
- C-004036: Mandarin Map Task Corpus
- C-004059: Corpus of Spoken Israeli Hebrew
- D-004067: Dictionnaire francais-japonais version preliminaire 3
- C-004080: Audio Archive of Linguistic Fieldwork
- C-004131: Leipzig Corpora Collection
- C-004164: 日本語アプレイザル評価表現辞書(JAppraisal 辞書)~態度評価編~
- C-004165: 岩波国語辞典第五版タグ付きコーパス2004
- C-004168: 新聞記事GDAコーパス2004
- C-004170: 京都大学格フレーム(Ver 1.0)
- D-004172: GSK地名施設名辞書
- C-004176: 甲南大学こどもコーパス
- C-004178: CASTEL/J CD-ROM V1.5
- C-004206: Uppsala PErsian Corpus
- C-004207: Uppsala PErsian Dependency Treebank
- C-004208: Bijankhan Corpus
- C-004209: Tehran English-Persian Parallel Corpus
- C-004211: CD-毎日新聞2008データ集
- C-004212: CD-毎日新聞2009データ集
- C-004213: CD-毎日新聞2010データ集
- C-004214: CD-毎日新聞2011データ集
- C-004215: CD-毎日新聞2008データ集プラス
- C-004216: CD-毎日新聞2009データ集プラス
- C-004217: CD-毎日新聞2010データ集プラス
- C-004218: CD-毎日新聞2011データ集プラス
- C-004222: Cantonese Accent Chinese Speech Corpus
- C-004223: TH Corpus of Speech Synthesis No. 0
- C-004224: Face Emotional Expression
- C-004225: Chinese Event Bank - Part 1
- C-004226: 京都大学テキストコーパス Version 3.0
- C-004227: 京都大学テキストコーパス Version 4.0
- G-004228: NICT 格助詞変換データ Version 1.1
- C-004230: Wikipedia日英京都関連文書対訳コーパス Version 2.01
- D-004233: 日本語WordNet (1.1)
- T-004234: 日本語WordNet同義対データベース ver 1.0
- C-004235: 日本語Wikipediaエントリの係り受けデータベース
- C-004236: 日本語係り受けデータベース (Version 1.1)
- C-004237: 日英中基本文データ
- G-004238: 文脈類似語データベース (Ver. 1.1.2)
- G-004239: 単語共起頻度データベース (Version 1.1)
- G-004240: 基本的意味関係の事例ベース (Version 1.4)
- C-004241: 京都観光ブログの評価情報付与データ (Version 1.0)
- G-004242: 動詞含意関係データベース (Version 1.3.1)
- G-004243: 負担・トラブル表現リスト (Version 1.0)
- T-004244: 上位語階層データ (Version 1.0.1)
- C-004245: 日本語パターン言い換えデータベース (Version 1)
- G-004246: 日本語異表記対データベース (Version 1.1)
- C-004247: 日英翻訳エンジン学習・評価用対訳コーパス (Version 1.0)
- C-004248: A Chinese Dependency Parser(CNP)用中国語解析モデル Version 1
- C-004249: 意見(評価表現)抽出ツール用モデル Version 1.2
- C-004250: 日本語高齢者音声データベース
- C-004252: 中国語音声データベース
- C-004253: 京都観光案内対話データベース
- C-004254: 日本語小学生音声データベース
- C-004255: 日本語音声データベース
- C-004256: 日英・日中バイリンガル独話音声データベース
- C-004257: 明六雑誌コーパス
- G-004258: Webデータに基づく複合動詞用例データベース/日本語複合動詞リスト (ver.1.1)
- C-004259: Webデータに基づく複合動詞用例データベース
- C-004260: 外国人学習者の日本語誤用例集 データベース版
- C-004261: 外国人学習者の日本語誤用例集 PDF版
- C-004262: OJAD
- C-004263: ことばに関する新聞記事画像データベース
- C-004264: 雑誌『国語学』全文データベース
- C-004266: 米国議会図書館蔵『源氏物語』翻字本文
- C-004268: 楽天データ
- C-004269: IDENTIC
- C-004277: マルチモーダル音声認識評価環境
- C-004281: 特定領域研究「韻律と音声処理」日本語MULTEXT韻律コーパス
- C-004283: 中国語MULTEXTコーパス
- C-004285: 慶應義塾大学 研究用感情音声データベース
- C-004289: 東工大 多言語音声コーパス インドネシア語
- C-004291: AWA長期間収録音声コーパス
- C-004293: 鶴岡調査音声データベース91-92
- C-004295: 身体情報付き男・女・子どもの母音音声データベース
- C-004297: 残響下日本語連続数字 音声認識評価環境
- C-004299: 千葉大地図課題対話コーパス (MapTask)
- G-004304: Yahoo! Search Query Logs for Nine Languages, version 1.0
- C-004308: The ClueWeb09 Dataset
- C-004311: NTT・東北大親密度別単語了解度試験用音声データセット
- G-004312: 難聴者のための単語了解度試験用単語リスト
- T-004314: 動詞項構造シソーラス
- C-004315: OpenMWEコーパスv0.02
- C-004316: Textual Entailment 評価データ
- C-004317: Wenzhou Spoken Corpus Version 1.0
- C-004320: The EMIME Mandarin/English Bilingual Database Version 1.1
- C-004324: 現代日本語書き言葉均衡コーパス
- D-004325: 近代文語UniDic ver.1.3
- D-004326: 中古和文UniDic ver.1.3
- C-004336: GlobalPhone Thai
- C-004338: GlobalPhone Vietnamese
- C-004341: 朝日新聞記事データ(学術・研究用)2008年版
- C-004342: 朝日新聞記事データ(学術・研究用)2009年版
- C-004343: 朝日新聞記事データ(学術・研究用)2010年版
- C-004344: 朝日新聞記事データ(学術・研究用)2011年版
- D-004345: An English Dictionary of the Tamil Verb Second Edition
- C-004348: Chinese Gigaword Fourth Edition
- C-004350: GALE Phase 1 Arabic Newsgroup Parallel Text - Part 1
- C-004351: GALE Phase 1 Arabic Newsgroup Parallel Text - Part 2
- C-004352: GALE Phase 1 Chinese Newsgroup Parallel Text - Part 1
- C-004353: GALE Phase 1 Chinese Newsgroup Parallel Text - Part 2
- C-004356: GALE Phase 1 Chinese Broadcast Conversation Parallel Text - Part 1
- C-004357: GALE Phase 1 Chinese Broadcast Conversation Parallel Text - Part 2
- C-004358: ACE 2005 Mandarin SpatialML Annotations
- C-004360: Chinese Treebank 7.0
- C-004361: Indian Language Part-of-Speech Tagset: Bengali
- C-004362: Indian Language Part-of-Speech Tagset: Hindi
- C-004363: Indian Language Part-of-Speech Tagset: Sanskrit
- C-004364: Korean Newswire Second Edition
- C-004372: Language Understanding Annotation Corpus
- C-004374: XLEL-21
- C-004376: Quranic Arabic Corpus - Version 0.4
- C-004380: Arabic Treebank - Broadcast News v1.0
- C-004381: Arabic-Dialect/English Parallel Text
- C-004382: Chinese Dependency Treebank 1.0
- C-004383: Chinese-English Semiconductor Parallel Text
- C-004384: Malto Speech and Transcripts
- C-004385: Turkish Broadcast News Speech and Transcripts
- C-004388: CALLHOME Mandarin Chinese Transcripts - XML version
- C-004390: CD-毎日新聞2012データ集
- C-004391: CD-毎日新聞2012データ集プラス
- C-004393: 南琉球新城方言音声データベース
- C-004395: 宮古大神島方言音声データベース
- C-004397: 感情評定値付きオンラインゲーム音声チャットコーパス
- C-004399: NetDC Arabic BNSC (Broadcast News Speech Corpus)
- C-004438: Mandarin Chinese Telephone Speech Recognition Corpus - Digit String
- C-004439: Mandarin Chinese Telephone Speech Recognition Corpus - Stock
- C-004450: TC-STAR 2007 Evaluation Package - ASR Mandarin Chinese
- C-004454: TC-STAR 2007 Evaluation Package - SLT Chinese-to-English
- C-004476: LILA Hindi-L1 database
- C-004483: Cantonese Speecon database
- C-004484: Thai Speecon database
- C-004485: OrienTel Jordan MCA (Modern Colloquial Arabic) database
- C-004486: OrienTel Jordan MSA (Modern Standard Arabic) database
- C-004491: LILA Korean database
- C-004530: LILA Marathi database
- C-004554: LILA Hindi Belt database
- C-004555: Spoken Portuguese Corpus
- D-004565: GlobalPhone Japanese Pronunciation Dictionary
- D-004579: GlobalPhone Arabic Pronunciation Dictionary
- D-004589: GlobalPhone Turkish Pronunciation Dictionary
- D-004590: GlobalPhone Vietnamese Pronunciation Dictionary
- D-004591: GlobalPhone Chinese-Mandarin Pronunciation Dictionary
- D-004592: GlobalPhone Korean Pronunciation Dictionary
- C-004601: Nepali Spoken Corpus
- D-004608: GlobalPhone Thai Pronunciation Dictionary
- C-004640: 2008 NIST Speaker Recognition Evaluation Training Set Part 1
- C-004665: Levantine Arabic QT Training Data Set 4 (Speech + Transcripts)
- D-004670: An English Dictionary of the Tamil Verb
- C-004687: 2005 NIST Language Recognition Evaluation
- C-004698: LDC Spoken Language Sampler
- C-004716: 2007 NIST Language Recognition Evaluation Test Set
- C-004717: 2007 NIST Language Recognition Evaluation Supplemental Training Set
- C-004753: 2005 NIST Speaker Recognition Evaluation Training Data
- C-004756: 2006 NIST Spoken Term Detection Development Set
- C-004757: 2006 NIST Spoken Term Detection Evaluation Set
- C-004759: 2005 NIST Speaker Recognition Evaluation Test Data
- C-004766: 2008 NIST Speaker Recognition Evaluation Test Set
- C-004769: 2006 NIST Speaker Recognition Evaluation Training Set
- C-004771: 2006 NIST Speaker Recognition Evaluation Test Set Part 1
- C-004795: GALE Phase 2 Arabic Broadcast Conversation Speech Part 1
- C-004802: GALE Phase 2 Chinese Broadcast Conversation Speech
- C-004808: LDC Spoken Language Sampler - Second Release
- C-004811: GALE Phase 2 Arabic Broadcast Conversation Speech Part 2
- C-004815: GALE Phase 2 Chinese Broadcast News Speech
- C-004818: CALLFRIEND Farsi Second Edition Speech
- C-004821: King Saud University Arabic Speech Database
- C-004834: 2009 NIST Language Recognition Evaluation Test Set
- C-004839: GALE Phase 2 Arabic Broadcast News Speech Part 1
- C-004844: United Nations Proceedings Speech
- C-004851: GALE Phase 3 Chinese Broadcast Conversation Speech Part 1
- C-004855: GALE Phase 2 Arabic Broadcast News Speech Part 2
- C-004858: RATS Speech Activity Detection
- C-004859: Mandarin-English Code-Switching in South-East Asia
- C-004862: Mandarin Chinese Phonetic Segmentation and Tone
- C-004868: GALE Phase 3 Chinese Broadcast Conversation Speech Part 2
- C-004878: LDC Spoken Language Sampler - Third Release
- C-004879: Arabic Learner Corpus
- C-004880: GALE Phase 3 Arabic Broadcast Conversation Speech Part 1
- C-004891: GALE Phase 3 Chinese Broadcast News Speech
- C-004897: GALE Phase 3 Arabic Broadcast Conversation Speech Part 2
- C-004901: 千葉大学 3人会話コーパス
- C-004903: GALE Phase 4 Chinese Broadcast Conversation Speech
- C-004904: GALE Phase 4 Chinese Broadcast Conversation Transcripts
- C-004906: TRAD Pashto Broadcast News Speech Corpus
- C-004911: Large Farsdat
- C-004913: IARPA Babel Cantonese Language Pack IARPA-babel101b-v0.4c
- C-004923: IARPA Babel Assamese Language Pack IARPA-babel102b-v0.5a
- C-004924: IARPA Babel Bengali Language Pack IARPA-babel103b-v0.4b
- C-004926: GALE Phase 3 Arabic Broadcast News Speech Part 1
- C-004930: IARPA Babel Pashto Language Pack IARPA-babel104b-v0.4bY
- C-004932: IARPA Babel Turkish Language Pack IARPA-babel105b-v0.5
- C-004938: IARPA Babel Tagalog Language Pack IARPA-babel106-v0.2g
- C-004943: IARPA Babel Vietnamese Language Pack IARPA-babel107b-v0.7
- C-004948: GALE Phase 3 Arabic Broadcast News Speech Part 2
- C-004957: Collins Multilingual database (MLD) – WordBank with audio files
- C-004958: Collins Multilingual database (MLD) – PhraseBank with audio files
- C-004959: Arabic Speech Corpus
- C-004964: Annotated Speech Corpora for 3 East Indian Languages
- C-004965: RML Emotion Database
- C-004967: 台湾国語多言語話しことばコーパス
- C-004968: スペイン語多言語話しことばコーパス2006年度版
- D-004970: トピック別アイヌ語会話辞典
- C-004971: アイヌ語口承文芸コーパス―音声・グロスつき―
- C-004972: 「日本の消滅危機言語・方言」データベース
- C-004980: TRAD Chinese-French Email Parallel corpus – Test Set
- C-004981: TRAD Chinese-English Email Parallel corpus – Test Set
- C-004982: TRAD Chinese-French Email Parallel corpus – Development Set
- C-004983: TRAD Chinese-English Email Parallel corpus – Development Set
- C-004984: TRAD Chinese-English News Articles Parallel corpus
- C-004985: TRAD Chinese-French News Articles Parallel corpus
- C-004986: TRAD Chinese-English Web domain (blogs) Parallel corpus
- C-004987: TRAD Chinese-French Web domain (blogs) Parallel corpus
- C-004988: TRAD Arabic-English Mailing lists Parallel corpus - Development set
- C-004989: TRAD Arabic-French Mailing lists Parallel corpus - Development set
- C-004990: TRAD Arabic-English Mailing lists Parallel corpus - Test set
- C-004991: TRAD Arabic-French Mailing lists Parallel corpus - Test set
- C-004992: TRAD Arabic-English Web domain (blogs) Parallel corpus
- C-004993: TRAD Arabic-French Web domain (blogs) Parallel corpus
- C-004994: TRAD Arabic-English Parallel corpus of transcribed Broadcast News Speech
- C-004995: TRAD Arabic-French Parallel corpus of transcribed Broadcast News Speech
- C-004996: TRAD Arabic-English Newspaper Parallel corpus - Test set 1
- C-004997: TRAD Arabic-French Newspaper Parallel corpus - Test set 2
- C-004998: TRAD Arabic-French Newspaper Parallel corpus - Test set 1
- C-004999: TRAD Pashto-English News Articles Parallel corpus
- C-005000: TRAD Pashto-French News Articles Parallel corpus
- C-005001: TRAD Pashto-English Parallel corpus of transcribed Broadcast News Speech - Test data
- C-005002: TRAD Pashto-French Parallel corpus of transcribed Broadcast News Speech - Test data
- C-005003: TRAD Pashto-French Parallel corpus of transcribed Broadcast News Speech - Training data
- C-005004: TRAD Pashto Monolingual text Corpus
- D-005014: Collins Multilingual database (MLD) - PhraseBank
- D-005015: Collins Multilingual database (MLD) - WordBank
- C-005016: BOLT Chinese Discussion Forum Parallel Training Data
- C-005017: BOLT Egyptian Arabic SMS/Chat and Transliteration
- C-005018: GALE English-Chinese Parallel Aligned Treebank -- Training
- C-005019: 朝日新聞記事データ(学術・研究用)2012年版
- C-005020: 朝日新聞記事データ(学術・研究用)2013年版
- C-005021: 朝日新聞記事データ(学術・研究用)2014年版
- C-005022: 朝日新聞記事データ(学術・研究用)2015年版
- C-005023: 朝日新聞記事データ(学術・研究用)2016年版
- C-005024: 統語・意味解析情報付き現代日本語コーパス
- C-005025: REXコーパス
- C-005026: 模擬診療録テキスト・データ
- C-005027: CD-毎日新聞2013データ集
- C-005028: CD-毎日新聞2014データ集
- C-005029: CD-毎日新聞2015データ集
- C-005030: CD-毎日新聞2016データ集
- C-005031: CD-毎日新聞2013データ集プラス
- C-005032: CD-毎日新聞2014データ集プラス
- C-005033: CD-毎日新聞2015データ集プラス
- C-005034: CD-毎日新聞2016データ集プラス
- C-005035: IARPA Babel Lao Language Pack IARPA-babel203b-v3.1a
- C-005040: ATR地域別中国語音声データベース
- C-005043: NICT声優対話コーパス
- D-005044: Pashto phonetic lexicon
- C-005045: 読売新聞記事データ<邦文>2008年版
- C-005046: 読売新聞記事データ<邦文>2009年版
- C-005047: 読売新聞記事データ<邦文>2010年版
- C-005048: 読売新聞記事データ<邦文>2011年版
- C-005050: 読売新聞記事データ<邦文>2013年版
- C-005051: 読売新聞記事データ<邦文>2014年版
- C-005052: 読売新聞記事データ<邦文>2015年版
- C-005053: 読売新聞記事データ<邦文>2016年版
- D-005054: ネット・若者用語辞書
- T-005055: 企業名辞書
- D-005056: NDK英中日企業名辞書
- D-005057: 露和辞書データベース
- D-005058: 和露辞書データベース
- C-005061: CMU_ARCTIC speech synthesis databases
- C-005081: 近畿大児童の単語音声データベース
- C-005082: Persian Speech Corpus
- C-005083: NUM 5M Mongolian written corpus
- C-005085: UCLA High-Speed Laryngeal Video and Audio