言語資源検索 - SHACHI: Language Resource Metadata Database

言語資源の登録件数: 3330件 2023 件中 1041 - 1050 件目

C-003250: 検索・要約用ニュース音声データベース
ニュース放送用の原稿をプロのアナウンサが読み上げたもの。原稿は専門の放送記者に依頼し，実際の出来事を基に模擬的に作成。アナウンサは下読み後，生放送をイメージして一度だけ読み上げ。
C-003251: 会議音声データベース
4名以上が参加する模擬会議の音声データ。参加者の職業に関係した，企画・立案に関するテーマを設定。話者ごとの接話マイクと全体用のマイクで同時録音。会議風景を3方向から収録した動画像も MPEG で格納。
C-003252: RWCP 実環境音声・音響データベース
非音声音のドライソースとして：非音声音の無響室測定データ(ドライソース)、各種の部屋における再現データ(インパルス応答との畳み込み)を、マイクロホンアレーによるインパルス応答と音声データとして：固定音源のインパルス応答、固定音源(音声)の測定データ、移動音源のインパルス応答、移動音源(音声)の測定データ、拡散音源、背景雑音の測定データを収録。
マイクロホンアレーによる近傍音場でのインパルス応答
対話ロボットの頭部伝達関数
測定に関わるアルゴリズムの解説，使用したソフトウェア
上記測定データを用いた研究事例の紹介
- references: C-001303: TIMIT Acoustic-Phonetic Continuous Speech Corpus
C-003253: CIAIR 子供の声データベース
室内（通常の生活環境下）での小学生男女（288名）の声を収集したもの。
コンテンツA: カタカナ語を中心とした単語 30 〜 40 語
コンテンツB: 童話「マッチ売りの少女」から引用した文章 30 文
コンテンツC: 数字，方向，挨拶などの短い単語 21 語（一部 40 語）
C-003254: 雑音重畳日本語連続数字音声認識評価環境
CENSREC-1 (AURORA-2J) は，雑音環境下連続英語数字音声認識タスクの共通評価フレームワークであるAURORA-2の日本語版である(CENSRECはCorpus and Environments for Noisy Speech RECognitionの略)．CENSREC-1の発声リストはAURORA-2と同一のものである．また，話者数，男女比も同一で話者毎の発声リストも同一となっている．ただし，発声者は日本人，数字の読みは日本語でこの2点がAURORA-2と異なる．
- conformsTo: C-001326: AURORA Project Database 2.0 - Evaluation Package
- references: C-001326: AURORA Project Database 2.0 - Evaluation Package
- isReferencedBy: C-003255: CENSREC-1-C Noisy Speech Detection Evaluation Environments
- isReferencedBy: C-003256: CENSREC-2 In-car Spoken Digits Data and Environments for Noisy Speech Recognition
C-003255: 雑音下日本語連続数字音声区間検出評価環境
CENSREC-1-C(CENSREC-1-Concatenated)は，雑音下音声区間検出をタスクとする共通評価フレームワークである(CENSRECはCorpus and Environments for Noisy Speech RECognitionの略)．CENSREC-1-Cは，連続数字を間隔をあけて発声したものからなり，個々の発声内容はCENSREC-1(AURORA-2J)に準じている．音声データにはシミュレーションデータと実環境下データがある．
C-003256: 実環境車内日本語連続数字音声認識評価環境
CENSREC-1と同じ発話内容を自動車内で収録した音声データ。接話マイクロホンと天井に設置した遠隔マイクロホンを利用。以下の走行速度と車内環境を組み合わせた11種類の環境で収録：走行速度 3種類（アイドリング，低速（市街地）走行，高速走行）、車内環境 4種類（通常走行，エアコンOn，オーディオOn，窓開）。
C-003257: 実環境車内日本語単語音声認識評価環境
CENSREC-2と同じ実験車両で収録した単語および音素バランス文の音声データ。学習データ:音素バランス文。走行速度はアイドリングと低速走行，車内環境は通常走行のみ。テストデータ:「交通情報」「東京都」「ホテル一覧」など単語 50種類。以下の走行速度と車内環境を組み合わせた16種類の環境で収録：走行速度 3種類（アイドリング，低速（市街地）走行，高速走行）、車内環境 6種類（通常走行，ハザードOn，エアコン(Low)，エアコン(High)，オーディオOn，窓開）。
- hasVersion: C-003256: CENSREC-2 In-car Spoken Digits Data and Environments for Noisy Speech Recognition
- hasVersion: C-003255: CENSREC-1-C Noisy Speech Detection Evaluation Environments
- conformsTo: AURORA Project Database 3.0
C-003258: 日本人学生による読み上げ英語音声データベース
日本人学生による英語文・単語音声の読み上げデータベース。読み上げ原稿は：音素学習を念頭においた読み上げセット（音素バランス文（460文）、難音文（32文）、実際の音素学習において利用された文（100文）、ミニマル単語対（302単語対)、音素バランス単語（300単語））と、韻律学習を念頭においた読み上げセット（イントネーションに関する文（94文）、文強勢，文リズムに関する文（120文）、単語アクセントに関する単語（109単語，句））。
- hasVersion: C-003259: UME-JRF Japanese Speech Database Read by Foreign Students
C-003259: 留学生による読み上げ日本語音声データベース
日本における外国人留学生（26言語の母語話者）による日本語文・単語音声の読み上げデータベース。読み上げ原稿は：ATR音素バランス文（503文）、難音文（108文 : 1話者につき54文ずつ発話）、韻律文（42文）、難音単語（115単語）。
- hasVersion: C-003258: UME-ERJ English Speech Database Read by Japanese Students

SHACHI - Language Resource Metadata Database