Subject: [onsei-mail 00053] RWCP 会議音声 DB-2001 の公開配布
From: Kazuyo Tanaka 
To: onsei-mail@m.aist.go.jp
Cc: kaz.tanaka@aist.go.jp
Date: Fri, 21 Dec 2001 17:35:00 +0900
X-Mailer: QUALCOMM Windows Eudora Pro Version 3.0.3-J (32)
List-Software: fml [fml 4.0 STABLE (20010202)]
List-Post: 
List-Owner: 
List-Help: 
List-Unsubscribe: 

音声メールの皆様

「RWCP会議音声データベース2001」の御案内

技術研究組合新情報処理開発機構(RWCP)・知的資源WG・音声DBグループにお
いて製作を進めてきました「RWCP 会議音声データベース(DVD-ROM 全 2巻)」が研究
用として配布可能になりました。皆様には入手の上、御活用いただければ幸いです。

ここでは、このデータベースの概要、入手に必要な条件・手続きなどを簡単にご案内い
たします。

なお、本データベースは、研究目的に使用されることが前提です。入手(御利用)のた
めには所定の誓約書を新情報処理開発機構宛、提出して頂くことになります。
また、現行組織体制は3月末までの予定となっていますので、本データベースの入手
手続きは2月末時点で一旦、打切りにしたいと思いますので、予め御了承下さい。

RWC知的資源WG、音声DBグループ主査
田中和世(産総研) 


〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
 入手申込手続き等

 1. 申込み手順

(株)メディアドライブが行います。 下記の手順にしたがって下さい。
  1)  メディアドライブへ入手申込 (Email で受け付けます) 
   
   Email address: sprwcdb@mediadrive.co.jp 

  ★このときデータベース名を指定してください。

  2)  メディアドライブから申込者宛 CD-ROM 発送

      (誓約書、手数料請求書、納品書を同封します。)

  3)  誓約書に署名して、メディアドライブに返送してください。
      配送等手数料 (2,000 円) をメディアドライブヘお支払い願います。

     (入手に要する費用は、上記の配送等手数料のみです。同じグループ
      で2セット以上入手することはご遠慮ください。) 

2.  お問い合わせへの対処

  1)  内容等への問い合わせ
      原則として、本メール末尾記載の参考文献を参照され、
   問い合わせに対する負担の軽減にご協力をお願いします。
    (御不明な点は、sprwcdb@mediadrive.co.jp でお受けします。) 

  2)  バグ情報など
      sprwcdb-ans@mediadrive.co.jp へ電子メールでお願いします。なお、
  すぐに回答等を返すというわけにはいきませんので、あらかじめ御了解
   下さい。

〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
「RWCP会議音声データベース2001」概要

1. はじめに
このデータは、音声検索・要約等の研究に利用するため、4, 5名が参加する会議の音
声データを会議風景の動画像と共に収録したものである。収録した会議は、企画・立
案などに関する特定のテーマを設定して、参加者がこのテーマについて結論を導くべ
く議論するというもので、会議自体は模擬会議である。本データは、技術研究組合新
情報処理開発機構(RWCP)・知的資源WG・音声DBサブWGにおいて仕様決定され、作成
されたものである。収容されているデータの権利は、技術研究組合新情報処理開発機
構に帰属する。
 
2. 収録方法
(1)会議の場所は、静かな会議室相当の部屋。
(2)音声データは、会議参加の各話者毎に接話マイク1本、会議全体の音声収録用
マイク1本を用い、マルチプレクサを通し同時録音した。同時に、3方向からビデオカ
メラを用い、会議風景の動画像を収録した。
(3)会議参加者は、会議テーマに関係した職業をもつ者を主体とし、参加者には予
め会議テーマや各自の役割についてのインストラクションなどを与え、会議用資料、
パンフレットなどを配布し、現実の企画・立案等の会議に近い設定とした。

3.収録した会議
 7件、会議時間長1件あたり 30分前後。
 会議参加話者数:4〜5名
 話題:旅行社におけるパッケージツアー企画、 
       同メールマガジンの企画など。

4. 収録データ
4.1 音声データ
音声データは、各話者の音声と、全体の音声がそれぞれ下記のサンプリングデータと
してファイル化されている。会議開始から終了までの1会議分が1ファイルである。
a)原音声を8チャネルデータレコーダでサンプリング周波数24kHz、16ビットでAD変換
したもの。(会議M01〜M05)。
b)原音声をマルチトラックハードディスクレコーダで48kHz、16ビットでAD変換した
もの。(会議M06、M07)。
c)上記のa) およびb)のデータから、サンプリング周波数変換により、16kHz、16ビッ
トに変換したファイル。全会議データ。

4.2 動画像データ
会議風景の動画像は、アナログビデオデータをAVI形式でキャプチャ後、MPEGに変換
したもので、10フレーム/秒のフレームレイトで収録。音声トラック(22.05kHzサン
プリング)付き。

4.3 書き起しデータ
書き起しデータには、a)ポーズの長さに基いて区切られる発声区間を単位として作成
した書き起しデータファイル、b)当該話者が発話権を保持している区間の1発話を単
位として作成した書き起しファイルがある。両者とも各発声・発話単位に対応する音
声区間の時刻が付与されている。

4.4 その他
・参加話者全員について、ATR50文セットを発声した音声データファイルを添付。
・話者情報のファイルが添付されている。

5. 収録メディア
   DVD 全2巻

6. 参考文献:
田中、伊藤、伊原、岡:「会議音声データの収録とデータファイル化」、情報処理学
会音声言語情報処理37‐15、pp.85-90(2001.7.14)。

以上 

=================================