Subject: [onsei-mail 02707] 「日英・日中バイリンガル独話音声データベース」公開のお知らせ
From: Keiichi Tokuda 
To: onsei-mail@m.aist.go.jp
Cc: Keiichi Tokuda 
Date: Fri, 25 Mar 2011 12:20:40 +0900

音声メールの皆様

以下のプロジェクトで作成した「日英・日中バイリンガル独話音声データベー
ス」が高度言語情報融合フォーラム(ALAGIN)より公開の運びとなりましたので,
お知らせさせて頂きます.

	    総務省 戦略的情報通信研究開発推進制度 (SCOPE)
      「講演音声翻訳のための多言語音声合成技術に関する研究開発」
      名古屋工業大学,情報通信研究機構 (NICT),京都市立芸術大学

入手方法等に関しては,http://www.alagin.jp/ を参照ください.

======================================================================
	    「日英・日中バイリンガル独話音声データベース」

1) 概要:
日英または日中のバイリンガルである声優または一般人が発声した音声コーパ
ス。発話スタイルは、演説を中心として、読み上げ調も含む。少数の話者が長
時間の収録を行った長時間編と多数の話者が短時間の収録を行った短時間編か
ら構成される。

2)用途:
バイリンガル音声の分析および合成の研究

3)話者:声優および一般人

4)話者数:
  ・日英一般人:男13、女11
  ・日英声優 :男1、女2
  ・日中一般人:男1、女13
  ・日中声優 :男0、女1

5)発話内容:

  ・音素バランス文50〜100文
   ・合文法無意味文50〜100文
   ・米国大統領演説90〜900文
       ※いずれも話者当たり。

6)ファイル形式:Wav

7)データ形式(サンプリング周波数/量子化ビット数/endian) :
       48kHz/32bit/little endian

8)ラベルデータ:

   ・正書法による書き起こしテキスト。
   ・発音(日:片仮名、中:ピンイン、英:音素)
   ・ポーズの時間情報

9)データサイズ:31GB
======================================================================

----
名古屋工業大学 徳田 恵一
tokuda@nitech.ac.jp
http://www.sp.nitech.ac.jp/~tokuda/