言語資源検索 - SHACHI: Language Resource Metadata Database

言語資源の登録件数: 3330件 2023 件中 1631 - 1640 件目

検索条件を選択

description_language
language_area
language
type
subject_monoMultilingual
subject_resourceSubject
type_style
type_form
type_sentence
type_linguisticType
type_discourseType
type_purpose
subject_linguisticField
contributor_author_level
contributor_speaker_level
contributor_author_motherTongue
contributor_speaker_motherTongue
contributor_author_dialect
contributor_speaker_dialect
contributor_author_age
contributor_speaker_age
contributor_author_gender
contributor_speaker_gender
type_annotation

C-004285: 慶應義塾大学研究用感情音声データベース
感情を含んだ合成音声の作成を目的として、モーラ数（2～6モーラ）とアクセント型の組み合わせごとに選んだ20文節語それぞれについて47通りの感情で発声した音声を収集したデータベース。
C-004288: 東工大多言語音声コーパスアイスランド語
音声認識用の学習データとして現地で収集した、3種類（音素バランス文、天気に関する質問、ニュース文）のアイスランド語読み上げ音声データベース。
- hasVersion: C-004289: 東工大多言語音声コーパスインドネシア語
- references: JUPITER corpus
C-004289: 東工大多言語音声コーパスインドネシア語
音声認識用の学習データとして収集したインドネシア語音素バランス文の読み上げ音声データベース。音素バランス文は、新聞記事や雑誌を基にしたテキストコーパスから選択した文章に音素バランスを考慮して数十文を追加して作成した343文からなり、全話者が同一のリストを読み上げている。
- hasVersion: C-004288: 東工大多言語音声コーパスアイスランド語
C-004291: AWA長期間収録音声コーパス
本コーパスは、同一話者の音声を定期的にかつ長期間に渡り収録したもの（同一読み上げリストを2～10年に渡り、週に1日、朝・昼・夕の3回）。録音状況として、血圧や脈拍、体調（喉や鼻の調子）、室温などのデータも付属。実際には6名の話者について収録を行ったが、今回は第1期配布として、そのうち男性話者1名の1年間分のデータを公開。
- references: ATR音素バランス503文
C-004293: 鶴岡調査音声データベース91-92
山形県鶴岡市を対象に調査員による面接形式（調査票に従った質問-回答形式）で実施された第3回共通語化調査(1991〜1992年)で録音された音声資料。発音、アクセント、語彙に注目した78項目（91年調査）、72項目（92年調査）を収録。
- replaces: C-004293: 鶴岡調査音声データベース91-92
- hasPart: C-004293: 鶴岡調査音声データベース91-92
C-004295: 身体情報付き男・女・子どもの母音音声データベース
本データベースは、日本語音声の標準的な科学資料としての公開を目的に作成された母音データベースであり、6歳から56歳まで（主に17歳以下）、幅広い年齢層にわたる東京方言（共通語）話者の収録音声を「はー，ひー，ふー，へー，ほー」という音声ファイルに編集。
C-004297: 残響下日本語連続数字音声認識評価環境
ハンズフリー環境下における遠隔発話音声認識の課題の中で、残響に着目した残響下音声認識の評価環境データセット。クリーン環境で収録された音声にインパルス応答を畳み込んだシミュレーション評価、残響下連続数字発声データと評価ツールより構成される基本セットと、基本セットに加算性雑音を重畳したマルチコンディションに対する評価．残響・雑音下連続数字発声データと実環境データで構成されるエクストラセットの２種類のデータ群より構成される．発話内容はCENSREC-1に準じている。
C-004299: 千葉大地図課題対話コーパス (MapTask)
情報提供者と情報追従者が各々地図を持ち、対話による情報交換をしながら情報提供者の持つルートを情報追従者の地図に再現する課題を遂行する課題遂行対話を収録。
C-004300: Yahoo! Semantically Annotated Snapshot of the English Wikipedia, version 1.0
The dataset contains a snapshot of the English Wikipedia processed with a number of publicly-available NLP tools. The dataset contains 1,490,688 entries (excluding redirects). It was built by extracting texts from the XML entry and split into sentences using simple heuristics, and running several syntactic and semantic NLP taggers on it and collected their output.
C-004301: Yahoo! Answers Manner Questions, version 2.0
The corpus is a subset of the Yahoo! Answers corpus from a 10/25/2007 dump, containing 142,627 questions and their answers. It is a small subset of the questions, selected for their linguistic properties. Questions and answers of obvious low quality had been removed. The corpus also contains a small amount of metadata, i.e., which answer was selected as the best answer, and the category and sub-category that was assigned to this question.
- isPartOf: C-004302: Yahoo! Answers Comprehensive Questions and Answers version 1.0

SHACHI - Language Resource Metadata Database