研究プロジェクト

人間の知の創造・伝達の多くは、音声によるコミュニケーションによって行われています。 本分野では、人間どうしがやりとりを行う音声メディアを分析し、自動認識・理解した上で、インタラクションを行えるシステムの実現をめざします。 具体的には、会議や講演のような自然な話し言葉音声をテキスト化するシステム、複数の話者や音源などからなる音環境(や音楽)を解析するシステム、非言語情報も統合しながら自然な対話が行える人間型ロボットなどの研究に取り組みます。

 

話し言葉の音声認識・理解

  • 深層学習によるEnd-to-Endモデル...日本音響学会誌2018年7月号 (PDFファイル)
  • 大規模事前学習モデルに基づく音声認識...日本音響学会誌2023年9月号 (PDFファイル)
  • 音声認識による講演・講義の字幕付与...日本音響学会誌2018年3月号 (PDFファイル)

ロボットとの音声対話

  • アンドロイドによる音声対話研究 ..日本音響学会誌2020年4月号 (PDFファイル) , 日本音響学会誌2022年5月号 (PDFファイル)
  • 音声対話システムの進化と淘汰...人工知能学会研究会資料 SLUD-B203-02 (2013年) (PDFファイル)

音環境解析

  • 実環境下音声認識...情報処理学会研究報告, SLP-146-12 (2023年) (PDFファイル)
  • スマートポスターボード...人工知能学会研究会資料, Challenge-B303-1 (2014年) (PDFファイル)
  • 音楽音響信号解析のためのスパース学習...電子情報通信学会誌2016年5月号 (PDFファイル)