言語資源の登録件数: 3330件
2023 件中 1041 - 1050 件目
-
C-003250: 検索・要約用ニュース音声データベース
ニュース放送用の原稿をプロのアナウンサが読み上げたもの。原稿は専門の放送記者に依頼し,実際の出来事を基に模擬的に作成。アナウンサは下読み後,生放送をイメージして一度だけ読み上げ。
-
C-003251: 会議音声データベース
4名以上が参加する模擬会議の音声データ。参加者の職業に関係した,企画・立案に関するテーマを設定。話者ごとの接話マイクと全体用のマイクで同時録音。会議風景を3方向から収録した動画像も MPEG で格納。
-
C-003252: RWCP 実環境音声・音響データベース
非音声音のドライソースとして:非音声音の無響室測定データ(ドライソース)、各種の部屋における再現データ(インパルス応答との畳み込み)を、マイクロホンアレーによるインパルス応答と音声データとして:固定音源のインパルス応答、固定音源(音声)の測定データ、移動音源のインパルス応答、移動音源(音声)の測定データ、拡散音源、背景雑音の測定データを収録。
マイクロホンアレーによる近傍音場でのインパルス応答
対話ロボットの頭部伝達関数
測定に関わるアルゴリズムの解説,使用したソフトウェア
上記測定データを用いた研究事例の紹介 -
C-003253: CIAIR 子供の声データベース
室内(通常の生活環境下)での小学生男女(288名)の声を収集したもの。
コンテンツA: カタカナ語を中心とした単語 30 〜 40 語
コンテンツB: 童話「マッチ売りの少女」から引用した文章 30 文
コンテンツC: 数字,方向,挨拶などの短い単語 21 語(一部 40 語) -
C-003254: 雑音重畳日本語連続数字 音声認識評価環境
CENSREC-1 (AURORA-2J) は,雑音環境下連続英語数字音声認識タスクの共通評価フレームワークであるAURORA-2の日本語版である(CENSRECはCorpus and Environments for Noisy Speech RECognitionの略).CENSREC-1の発声リストはAURORA-2と同一のものである.また,話者数,男女比も同一で話者毎の発声リストも同一となっている.ただし,発声者は日本人,数字の読みは日本語でこの2点がAURORA-2と異なる.
- conformsTo: C-001326: AURORA Project Database 2.0 - Evaluation Package
- references: C-001326: AURORA Project Database 2.0 - Evaluation Package
- isReferencedBy: C-003255: CENSREC-1-C Noisy Speech Detection Evaluation Environments
- isReferencedBy: C-003256: CENSREC-2 In-car Spoken Digits Data and Environments for Noisy Speech Recognition
-
C-003255: 雑音下日本語連続数字 音声区間検出評価環境
CENSREC-1-C(CENSREC-1-Concatenated)は,雑音下音声区間検出をタスクとする共通評価フレームワークである(CENSRECはCorpus and Environments for Noisy Speech RECognitionの略).CENSREC-1-Cは,連続数字を間隔をあけて発声したものからなり,個々の発声内容はCENSREC-1(AURORA-2J)に準じている.音声データにはシミュレーションデータと実環境下データがある.
- references: C-003254: CENSREC-1 (AURORA-2-J) Noisy Speech Recognition Evaluation Environments
- hasVersion: C-003256: CENSREC-2 In-car Spoken Digits Data and Environments for Noisy Speech Recognition
- hasVersion: C-003257: CENSREC-3 In-car Isolated Words Data and Environments for Noisy Speech Recognition
-
C-003256: 実環境車内 日本語連続数字 音声認識評価環境
CENSREC-1と同じ発話内容を自動車内で収録した音声データ。接話マイクロホンと天井に設置した遠隔マイクロホンを利用。以下の走行速度と車内環境を組み合わせた11種類の環境で収録:走行速度 3種類(アイドリング,低速(市街地)走行,高速走行)、車内環境 4種類(通常走行,エアコンOn,オーディオOn,窓開)。
-
C-003257: 実環境車内 日本語単語 音声認識評価環境
CENSREC-2と同じ実験車両で収録した単語および音素バランス文の音声データ。学習データ:音素バランス文。走行速度はアイドリングと低速走行,車内環境は通常走行のみ。テストデータ:「交通情報」「東京都」「ホテル一覧」など単語 50種類。以下の走行速度と車内環境を組み合わせた16種類の環境で収録:走行速度 3種類(アイドリング,低速(市街地)走行,高速走行)、車内環境 6種類(通常走行,ハザードOn,エアコン(Low),エアコン(High),オーディオOn,窓開)。
- hasVersion: C-003256: CENSREC-2 In-car Spoken Digits Data and Environments for Noisy Speech Recognition
- hasVersion: C-003255: CENSREC-1-C Noisy Speech Detection Evaluation Environments
- conformsTo: AURORA Project Database 3.0
-
C-003258: 日本人学生による読み上げ英語音声データベース
日本人学生による英語文・単語音声の読み上げデータベース。読み上げ原稿は:音素学習を念頭においた読み上げセット(音素バランス文(460文)、難音文(32文)、実際の音素学習において利用された文(100文)、ミニマル単語対(302単語対)、音素バランス単語(300単語))と、韻律学習を念頭においた読み上げセット(イントネーションに関する文(94文)、文強勢,文リズムに関する文(120文)、単語アクセントに関する単語(109単語,句))。
-
C-003259: 留学生による読み上げ日本語音声データベース
日本における外国人留学生(26言語の母語話者)による日本語文・単語音声の読み上げデータベース。読み上げ原稿は:ATR音素バランス文(503文)、難音文(108文 : 1話者につき54文ずつ発話)、韻律文(42文)、難音単語(115単語)。