Subject: Distribution of RWCP Sound Scene Database From: "Satoshi Nakamura, Ph.D"To: "onsei-mail" Cc: "Satoshi Nakamura, Ph.D" Date: Thu, 21 Jun 2001 11:47:07 +0900 X-Mailer: Microsoft Outlook IMO, Build 9.0.2416 (9.0.2910.0) Importance: Normal 音声研究者の皆様、 ATR音声言語通信研究所の中村です。 このメーリングリストをお借りいたしまして、RWCPの援助のもと、4年間制作に 携わってきました音響、音声データベースが完成いたしましたので、配布させて いただきたいと思います。 ちなみに、費用は、DVDプレスと送料のみです。 ご研究の一助になれば幸いです。 #このデータベースに関して HSC2001(http://www.slt.atr.co.jp/hsc2001) というワークショップで報告を行いました。そのときの発表資料をこの1週 間の間、 http://www.slt.atr.co.jp/~nakamura/HSC2001-RWC/RWC.htm におきますので、御参笑下さい。 中村 哲 ======================================================================== RWCP 実環境音声・音響データベース のご案内 キーワード:非音声音、移動音声、マイクロホンアレー、音響インパルス応答 編 集:技術研究組合 新情報処理開発機構 RWC研究開発用知的資源ワーキンググループ 実環境音響サブワーキンググループ 著作権者:株式会社三菱総合研究所 ATR音声言語通信研究所 中村哲、西浦敬信 電子技術総合研究所 浅野太 筑波大学 山田武志 早稲田大学 小林哲則 日本電信電話株式会社 本データベースの最新情報は http://tosa.mri.co.jp/sounddb/ にございます。入手方法については http://tosa.mri.co.jp/sounddb/howtoget.htm をご覧下さい。 1.目的 近年、実環境における音響信号をいかに扱うかが問題になっています。実環境 におけるマンマシンインタフェース、音声の認識、環境音の認識、エコーキャ ンセラー、アクティブノイズコントロールなど、多くの実環境音響研究の重要 性がますます増しています。しかしながら、実際にこれらの研究を進めるため に、基準となる共通のデータベースが欠如しています。 実環境における典型的な音場シーンのデータベースがあれば、基礎研究の加速 に貢献し、客観的な研究成果の比較、評価に役立ちます。また、3次元の音環 境で音を収録するには、マイクロホンアレーの利用が不可欠ですが、多数の チャ ネルを持つ高価な設備を導入するのは一般には難しいことです。したがって、 共通のデータベースとして収録し、設備のない研究機関でもこのような研究を 行えるようにすることには大きな意義があると考えます。 RWCP実環境音声・音響データベースは、リアルワールドコンピューティングプ ログラムの一環として、技術研究組合新情報処理開発機構に設置されている 「RWCP研究開発用知的資源ワーキンググループ」の「実環境音響サブワーキン ググループ」において企画、仕様検討され、監修された研究用の共通データ ベー スです。これらのデータは1998年〜2000年に収録されました。 2.収録内容 収録内容は、マイクロホンアレーによる音声測定データやインパルス応答、非 音声音のドライソースなどを含みます。これらは実環境でマイクロホンアレー を用いた音場シーンの研究を進める上で欠かせないものです。また、測定に関 わるいろいろなアルゴリズムの解説や、使用したソフトウエアもあります。さ らに、これらの測定データを用いた研究事例も載せました。 《収録データ》 ・非音声音のドライソース (比屋根,飯尾@三菱総研) - 非音声音の無響室測定データ(ドライソース) - 各種の部屋における再現データ(インパルス応答との畳み込み) ・マイクロホンアレーによるインパルス応答と音声データ (中村,西浦@ATR) - 固定音源のインパルス応答 - 固定音源(音声)の測定データ - 移動音源のインパルス応答 - 移動音源(音声)の測定データ - 拡散音源、背景雑音の測定データ ・マイクロホンアレーによる近傍音場でのインパルス応答 (浅野@電総研) ・対話ロボットの頭部伝達関数 (小林@早稲田大) 《アルゴリズム解説とソフトウエア》 ・TSP(Time-Stretched Pulse)を用いたインパルス応答の測定法 (浅野@電総 研) ・二乗積分法による残響時間の測定法 (中村,西浦@ATR) ・近傍音場での音源位置推定/音源分離 (浅野@電総研) ・スウィープエコー(時間とともに周波数が上昇するエコー) (清原,古家, 金田@NTT) ・ドライソースとインパルス応答の畳み込み計算法 (比屋根,飯尾@三菱総 研) ・信号データの波形表示・編集ソフトウエア 《応用研究事例》 ・マイクロホンアレーを用いた非音声音認識 (比屋根,飯尾@三菱総研) ・マイクロホンアレーを用いたHMMに基づく音源識別と音声認識 (中村,西浦 @ATR) ・環境音重畳音声に対する音声区間検出 (山田@筑波大) 3.利用および入手方法について 本データベースの収録データについて、利用上の制限はありません。 主とし て研究用途を想定しておりますが、製品開発等の営利目的に利用しても構いま せん。 広く非音声音やマイクロホンアレーの研究や技術開発に役立つことを 第一に希望しております。 ただし、利用に際し、以下の条件を守ってください。 ・本データベースに含まれるすべてのデータ、ドキュメント、および、 ソフトウエアの著作権はそれぞれの著作権者が保持します。 ・収録データ自体を製品に組込む場合には、著作権者の了解を得てくださ い。 ・本データベースを利用した成果を論文、ホームページ、報道などを通じて 発表する際には、以下のようなクレジットを入れてください。 「本研究はRWCP実環境音声・音響データベースの○○○○○データを利用 した。」 ・本データベースは無保証です。 本データベースの使用により、 利用者あ る いは第三者が被った直接的または間接的ないかなる損害についても 新情 報 処理開発機構および著作権者はその責任を負いません。 ・本データベースの全部または一部を著作権者の許諾なく、 再配布、複 製、 転用、放送、上映、賃貸業に使用することを禁じます。 ・ソフトウエアに関しては異なる配布条件の場合もあります。 それぞれの ソ フトウエアのページをご覧下さい。 本データベースは DVD-ROM 3枚組 で配布しています。 入手に関しては、 入手方法の御案内をご覧下さい。DVD-ROMプレスおよび配送実費として、 5,000円頂いております。 また、配布枚数には限りがありますことも御了解下さい。 4.お問い合わせ 入手の手続き、内容等への問い合わせは、原則として、ホームページを参照さ れ、 問い合わせに対する当方の負担の軽減にご協力下さい。 (御不明な点は sound-db@mri.co.jp までお願いします) 5. 参考文献 [1] S.Nakamura: "Acoustic sound database collected for hands-free speech recognition and sound scene understanding", International Workshop on Hands-Free Speech Communication (HSC2001), pp.43-46, (2001.4). [2] S.Nakamura, K.Hiyane, F.Asano, T.Nishiura, and T.Yamada: "Acoustical Sound Database in Real Environments for Sound Scene Understanding and Hands-Free Speech Recognition", 2nd International Conference on Language Resources & Evaluation, Athen (2000.6). [3] S.Nakamura, K.Hiyane, F.Asano, and T.Endo: "Sound scene data collection in real acoustical environments", J. Acoust. Soc. Japan (E) Vol.20, No.3 (1999.5). [4] 比屋根, 中村, 浅野, 遠藤: "RWCP実環境音声・音響データベース", 電子 情報通信学 会総合大会, (1999.3). [5] 中村, 比屋根, 浅野, 遠藤: "実環境における音響シーンデータベースの 構築", 日本音響学会秋季研究発表会 (1998.9). [6] S.Nakamura, K.Hiyane, F.Asano, and T.Endo: "Sound Scene Database in Real Acoustic Environments", Oriental COCOSDA Workshop '98(1998.5). ======================================================================== +++++++++++++++++++++++++++++++++++++++++++++++++++++++++ Satoshi Nakamura, Ph.D Head, Department 1, ATR Spoken Language Translation Research Labs. 2-2-2 Hikaridai Seika-cho Soraku-gun Kyoto 619-0288 Japan Tel:0774-95-1370 Fax:0774-95-1308 Email:nakamura@slt.atr.co.jp Secretary: Ms.Kurita +81-774-95-1377 mkurita@slt.atr.co.jp Web: http://www.slt.atr.co.jp/~nakamura (Web address has been changed. Please take a look)