年度
2024 |
2023 |
2022 |
2021 |
2020 |
年度
2019 |
2018 |
2017 |
2016 |
2015 |
2014 |
2013 |
2012 |
2011 |
2010 |
年度
2009 |
2008 |
2007 |
2006 |
2005 |
2004 |
2003 |
2002 |
2001 |
2000 |
2024年度
-
井上昂治, Lala Divesh, Skantze Gabriel, 河原達也.
Voice activity projectionモデルを用いたリアルタイム相槌予測.
人工知能学会研究会資料, SLUD-102-54, 2024.
(text)
-
住田龍宇一, 井上昂治, 河原達也.
RAGチャットボットは重要でない会話を忘れるべきか?
心理学における発見を用いた重要度と忘却の探究.
人工知能学会研究会資料, SLUD-102-12, 2024.
(text)
-
彭子豪, 傅雅慧, ラーラーディベッシュ, エルマーズマイキー, 井上昂治, 河原達也.
アンドロイドericaによる国際会議におけるインタビュー対話システム.
人工知能学会研究会資料, SLUD-102-01, 2024.
(text)
-
稲葉 達郎, 吉井 和佳, 中村 栄太.
音楽生成における時刻と音高相対性の重要性.
情報処理学会研究報告, MUS-141-3, 2024.
(text)
2023年度
-
Jaeyoung Lee and Tatsuya Kawahara.
Low-resource speech recognition using hierarchical CTC and large
pre-trained model.
情報処理学会研究報告, SLP-151-64, 2024.
(text)
-
彭子豪, 傅雅慧, 越智景子, 井上昂治, 河原達也.
感情語りコーパスを用いたバリデーション応答の生成.
人工知能学会研究会資料, SLUD-099-23, 2023.
(text)
-
越智景子, 井上昂治, Lala Divesh, 河原達也, 熊崎博一.
精神科デイケアのための傾聴対話システム:きくロボ.
人工知能学会研究会資料, SLUD-099-16, 2023.
(text)
-
川井悠生, 山本賢太, 越智景子, Lala Divesh, 井上昂治, 河原達也.
半自律対話による同時並列傾聴システム.
人工知能学会研究会資料, SLUD-099-14, 2023.
(text)
-
井上昂治, Lala Divesh, 越智景子, 河原達也, Skantze Gabriel.
音声対話システムの客観評価のための
ユーザのマルチモーダルなふるまいの分析.
人工知能学会研究会資料, SLUD-099-1, 2023.
(text)
-
Hao Shi and Tatsuya Kawahara.
Investigation of adapter for automatic speech recognition in noisy
environment.
情報処理学会研究報告, SLP-149-19, 2023.
(text)
-
渋谷和樹, 河原達也.
アダプタを用いた大規模事前学習モデルの話者適応.
情報処理学会研究報告, SLP-149-18, 2023.
(text)
-
李在詠, 河原達也.
調音属性に関する知識の埋め込みによるアイヌ語音声認識の改善.
情報処理学会研究報告, SLP-149-12, 2023.
(text)
-
中村栄太.
記号列の変異・選択モデルに基づくコード進行の進化過程の分析と予測.
情報処理学会研究報告, MUS-138-5, 2023.
(text)
2022年度
-
三村正人, 井上昂治, 河原達也, 中村友彦, 猿渡洋.
実環境下日本語話し言葉音声コーパスの構築と音声認識ベンチマーク.
情報処理学会研究報告, SLP-146-12, 2023.
(text)
-
藤田陽斗, 坂東宜昭, 井本桂右, 大西正輝, 吉井和佳.
音響イベント定位・検出のための空間情報付き映像・音響信号を用いた自己教師あり学習.
電子情報通信学会技術研究報告, SP2022-53, SIP2022-133, EA2022-89,
2023.
(text)
-
山本賢太, 井上昂治, 河原達也.
音声対話システムによる雑談対話における
キャラクタ表現に基づくユーザ適応の検討.
人工知能学会研究会資料, SLUD-096-29, 2022.
(text)
-
Kak Soky, Sheng Li, Chenhui Chu, and Tatsuya Kawahara.
Domain and language adaptation of large-scale pretrained model for
speech recognition of low-resource language.
電子情報通信学会技術研究報告, SP2022-37, NLC2022-17, 2022.
(text)
-
三村正人, 河原達也.
会議・講演音声から書き言葉へのend-to-end変換.
情報処理学会研究報告, SLP-143-5, 2022.
(text)
-
中村栄太, Rajsuryan Singh.
作曲スタイル分布の動的クラスター構造の分析と予測.
情報処理学会研究報告, MUS-135-11, 2022.
(text)
-
大山偉永, 吉井和佳.
TCN-HSMMハイブリッドモデルに基づくビート・ダウンビート推定.
情報処理学会研究報告, MUS-135-6, 2022.
(text)
-
寺尾萌夢, 吉井和佳.
バンド譜に対する無段階で難易度調整可能な深層ピアノ編曲.
情報処理学会研究報告, MUS-135-3, 2022.
(text)
-
山本賢太, 河野誠也, 河原達也, 吉野幸一郎.
フレーズアライメントと文構造に基づくデータ拡張を用いた
頑健な自然言語生成.
情報処理学会研究報告, NL-252-10, 2022.
(text)
2021年度
-
上乃聖, 河原達也.
音声認識のデータ拡張のための合成音声の周波数スペクトログラム強調.
情報処理学会研究報告, SLP-139-28, 2021.
(text)
-
井上昂治, ラーラーディベッシュ, 河原達也.
共感を表出する音声対話システムのための共有笑い生成.
人工知能学会研究会資料, SLUD-093-27, 2021.
(text)
-
山本賢太, 井上昂治, 河原達也.
音声対話システムのユーザ適応に向けたパーソナリティの関係性の分析.
人工知能学会研究会資料, SLUD-093-02, 2021.
(text)
-
大山偉永, 吉井和佳.
拍節構造の周期性に基づくビート・ダウンビート・テンポ同時推定.
情報処理学会研究報告, MUS-132-21, 2021.
(text)
-
平松祐紀, 中村栄太, 吉井和佳.
ピアノ採譜のための音価推定と声部分離のマルチタスク学習.
情報処理学会研究報告, MUS-132-18, 2021.
(text)
-
寺尾萌夢, 吉井和佳.
難易度に応じた音符統計量と深層学習に基づくバンド譜のピアノ編曲.
情報処理学会研究報告, MUS-132-11, 2021.
(text)
-
井上昂治.
アンドロイドERICAの音声対話システム~マルチモーダルチューリングテストへの挑戦~.
電子情報通信学会技術研究報告, SP2021-7, 2021.
(text)
2020年度
-
Jeongwoo Woo, Masato Mimura, Kazuyoshi Yoshii, and Tatsuya Kawahara.
Speech enhancement in the presence of background music considering
speech and music characteristics.
情報処理学会研究報告, SLP-136-32, 2021.
(text)
-
Kak Soky, Sheng Li, Masato Mimura, Chenhui Chu, and Tatsuya Kawahara.
Comparison of end-to-end models for joint speaker and speech
recognition.
電子情報通信学会技術研究報告, SP2020-43, SIP2019-109, EA2019-78,
2021.
(text)
-
河原達也.
ERATO石黒共生HRIから新学術領域研究「知能対話学」及び
ムーンショット「アバター共生社会」に展開する音声対話研究.
情報処理学会研究報告, SLP-135-2, 2021.
(text)
-
二見颯, 稲熊寛文, 上乃聖, 三村正人, 河原達也.
BERTによるsequence-to-sequence音声認識への知識蒸留.
情報処理学会研究報告, SLP-134-2, 2020.
(text)
-
山本賢太, 井上昂治, 河原達也.
VAEを用いた半教師あり学習による音声対話システムのための
キャラクタ表現.
人工知能学会研究会資料, SLUD-C002-31, 2020.
(text)
-
田中滉己, 井上昂治, 中村静, 高梨克也, 河原達也.
多様なふるまいからの好感判定に基づき発話構成要素を選択する
お見合い対話システム.
人工知能学会研究会資料, SLUD-C002-28, 2020.
(text)
-
井上昂治, ララディベッシュ, 山本賢太, 中村静, 高梨克也, 河原達也.
アンドロイドERICAの傾聴対話システムにおけるWOZとの比較評価.
人工知能学会研究会資料, SLUD-C002-21, 2020.
(text)
-
石塚崚斗,錦見亮, 中村栄太, 吉井和佳.
大局的構造に基づく正則化を用いた自己注意機構付き深層ドラム採譜.
情報処理学会研究報告, MUS-129-3, 2020.
(text)
-
柴田剛,錦見亮, 中村栄太, 吉井和佳.
LSTM-HSMMハイブリッドモデルに基づく音楽構造解析.
情報処理学会研究報告, MUS-128-10, 2020.
(text)
-
石塚崚斗,錦見亮, 中村栄太, 吉井和佳.
事前学習済み言語モデルによる正則化を用いた深層ニューラルネットワークに基づくドラム採譜.
情報処理学会研究報告, MUS-128-8, 2020.
(text)
2019年度
-
秋田祐哉, 上乃聖, 三村正人, 河原達也.
自動字幕作成システムにおけるモデルの拡張.
情報処理学会研究報告, AAC-12-3, 2020.
(text)
-
和気雅弥, 戸上真人, 吉井和佳, 河原達也.
円滑な音声対話のためのセミブラインド音源分離と音声区間検出の統合.
電子情報通信学会技術研究報告, SP2019-112, SIP2019-165, EA2019-163,
2020.
(text)
-
吉井和佳, 関口航平, 坂東宜昭, Mathieu Fontaine, AdityaArie Nugraha.
ブラインド音源分離のための高速多チャネル相関テンソル分解.
電子情報通信学会技術研究報告, SP2019-51, SIP2019-104, EA2019-102,
2020.
(text)
-
稲熊寛文, 三村正人, 河原達也.
ストリーミング注意機構型sequence-to-sequenceモデルによる講演音声認識.
情報処理学会研究報告, SLP-131-9, 2020.
(text)
-
松浦孝平, 上乃聖, 三村正人, 坂井信輔, 河原達也.
民話を対象としたアイヌ語音声コーパスとend-to-end音声認識.
情報処理学会研究報告, SLP-130-16, 2019.
(text)
-
磯西爽太, 井上昂治, 高梨克也, 河原達也.
質問タイプの分類に基づく登録外質問に対する応答生成.
人工知能学会研究会資料, SLUD-B902-06, 2019.
(text)
-
井上昂治, Divesh Lala, 山本賢太, 中村静, 高梨克也, 河原達也.
自律型アンドロイドERICAによる傾聴対話システムの評価.
人工知能学会研究会資料, SLUD-B902-04, 2019.
(text)
-
原康平, 井上昂治, Divesh Lala, 山本賢太, 中村静, 高梨克也, 河原達也.
アンドロイドERICAによる面接対話における掘り下げ質問生成.
人工知能学会研究会資料, SLUD-B902-03, 2019.
(text)
-
柴田健太郎, 中村栄太, 錦見 亮, 吉井和佳.
深層多重音検出を用いた音響信号から楽譜へのピアノ採譜.
情報処理学会研究報告, MUS-125-1, 2019.
(text)
-
上乃聖, 三村正人, 坂井信輔, 河原達也.
音声波形を入力とする単語単位end-to-end音声認識.
情報処理学会研究報告, SLP-129-2, 2019.
(text)
-
春日悠生, 井上昂治, 山本賢太, 高梨克也, 河原達也.
ヒューマンロボットインタラクションコーパスへの
焦点アノテーションの基準と予備的分析.
人工知能学会研究会資料, SLUD-B901-03, 2019.
(text)
-
中村栄太, 齋藤康之, 吉井和佳.
ピアノ運指データを用いた統計学習手法による運指推定と演奏難易度の定式化.
情報処理学会研究報告, MUS-124-12, 2019.
(text)
-
錦見亮, 中村栄太, 吉井和佳.
ビート同期注意機構に基づく歌声のリズム採譜.
情報処理学会研究報告, MUS-124-8, 2019.
(text)
-
呉益明, Tristan Carsault, 吉井和佳.
音楽音響信号に対するラベル・テクスチャ分離型変分自己符号化器を用いた半教師ありコード推定.
情報処理学会研究報告, MUS-124-5, 2019.
(text)
-
中村栄太, 柴田健太郎, 錦見亮, 吉井和佳.
教師なしスタイル変換によるメロディーの自動生成.
情報処理学会研究報告, MUS-124-2, 2019.
(text)
-
関口航平, Aditya Arie Nugraha, 坂東宜昭, 吉井和佳.
深層音声生成モデルと同時対角化可能な空間相関行列に基づく高速マルチチャネル音声強調.
情報処理学会研究報告, MUS-123-29, SLP-127-29, 2019.
(text)
2018年度
-
秋田祐哉, 上乃聖, 三村正人, 河原達也.
音声認識を用いた字幕作成システムの改良.
情報処理学会研究報告, AAC-9-34, 2019.
(text)
-
原康平, 井上昂治, 高梨克也, 河原達也.
移行適格場の情報を考慮したターンテイキング予測.
人工知能学会研究会資料, SLUD-B803-10, 2019.
(text)
-
山本賢太, 井上昂治, 中村静, 高梨克也, 河原達也.
対話のふるまいに基づくキャラクタ表現の対話コーパスにおける分析.
人工知能学会研究会資料, SLUD-B803-08, 2019.
(text)
-
河原達也.
[招待講演]
音声認識の方法論の変遷と展望〜Acoustic-to-Wordモデルを中心に〜.
電子情報通信学会技術研究報告, SP2018-48, 2018.
(text)
-
上乃聖, 三村正人, 坂井信輔, 河原達也.
End-to-End音声合成を用いた単語単位End-to-End音声認識のデータ拡張.
情報処理学会研究報告, SLP-125-2, 2018.
(text)
-
柴田健太郎, 中村栄太, 深山覚, 後藤真孝, 糸山克寿, 吉井和佳.
階乗隠れセミマルコフモデルに基づく音楽音響信号に対するカバー譜生成.
情報処理学会研究報告, MUS-121-16, 2019.
(text)
-
井上昂治, Divesh Lala, 原康平, 相原邦光, 中村静, 高梨克也, 河原達也.
自律型アンドロイドERICAによる就職面接対話.
人工知能学会研究会資料, SLUD-B802-14, 2018.
(text)
-
山本賢太, 井上昂治, Divesh Lala, 中村静, 高梨克也, 河原達也.
自律型アンドロイドERICAによる傾聴対話.
人工知能学会研究会資料, SLUD-B802-13, 2018.
(text)
-
河原達也.
[招待講演] アンドロイドERICAによる人間レベルの音声対話.
人工知能学会研究会資料, SLUD-B802, 2018.
(text)
-
田中滉己, 井上昂治, 中村静, 高梨克也, 河原達也.
初対面対話における好感のモデリングと発話構成要素の選択.
人工知能学会研究会資料, SLUD-B802-3, 2018.
(text)
-
原康平, 井上昂治, 高梨克也, 河原達也.
相槌・フィラー予測とのマルチタスク学習によるターンテイキング予測.
人工知能学会研究会資料, SLUD-B802-1, 2018.
(text)
-
吉井和佳, 佐藤寛之, 坂東宜昭, 中村栄太, 河原達也.
独立低ランクテンソル分析:非負値性・低ランク性・独立性に基づく
ブラインド音源分離の統一理論.
電子情報通信学会技術研究報告, IBISML2018-49, 2018.
(text)
-
上乃聖, 森谷崇史, 三村正人, 坂井信輔, 篠原雄介, 山口義和, 青野裕司, 河原達也.
転移学習による注意機構付き単語単位音声認識の適応.
電子情報通信学会技術研究報告, SP2018-23, 2018.
(text)
-
中村栄太, Emmanouil Benetos, 吉井和佳, Simon Dixon.
多重音検出とリズム量子化の統合による多声音楽の自動採譜.
情報処理学会研究報告, MUS-120-19, 2018.
(text)
-
吉井和佳, 北村昂一, 坂東宜昭, 中村栄太, 河原達也.
モノラル音響信号に対する音源分離のための独立低ランクテンソル分析.
情報処理学会研究報告, MUS-120-18, 2018.
(text)
-
津島啓晃, 中村栄太, 吉井和佳.
コードとメロディの階層的生成モデルに基づくインタラクティブ作曲システム.
情報処理学会研究報告, MUS-120-14, 2018.
(text)
-
和田雄介, 錦見亮, 中村栄太, 糸山克寿, 吉井和佳.
WaveNetを用いた楽譜情報に基づく歌唱F0軌跡の生成.
情報処理学会研究報告, MUS-120-8, 2018.
(text)
-
錦見亮, 中村栄太, 深山覚, 後藤真孝, 吉井和佳.
注意機構を用いたエンコーダ・デコーダモデルに基づく歌声の音符推定.
情報処理学会研究報告, MUS-120-7, 2018.
(text)
2017年度
-
北村昂一, 坂東宜昭, 糸山克寿, 吉井和佳, 河原達也.
ブラインド音源分離のための高速相関テンソル分解.
電子情報通信学会技術研究報告, SP2017-127, SIP2017-153, EA2017-144,
2018.
(text)
-
島田一希, 坂東宜昭, 三村正人, 糸山克寿, 吉井和佳, 河原達也.
マルチチャネル非負値行列因子分解に基づく
ビームフォーミングを用いた雑音環境下音声認識.
電子情報通信学会技術研究報告, SP2017-90, SIP2017-116, EA2017-107,
2018.
(text)
-
石田真也, 井上昂治, 中村静, 高梨克也, 河原達也.
共感表出と発話促進のための聞き手応答を生成する傾聴対話システム.
人工知能学会研究会資料, SLUD-B509-2, 2018.
(text)
-
上乃聖, 稲熊寛文, 三村正人, 河原達也.
CTCによる文字単位のモデルを併用したattentionによる単語単位の
end-to-end音声認識.
情報処理学会研究報告, SLP-120-16, MUS-118-16, 2018.
(text)
(corrected PDF)
-
Tianyu Zhao and Tatsuya Kawahara.
Joint learning of dialog act segmentation and recognition using
neural networks.
情報処理学会研究報告, SLP-119-12, 2017.
(text)
- 錦見亮, 中村栄太, 後藤真孝, 糸山克寿, 吉井和佳.
調とリズムを考慮した階層隠れセミマルコフモデルに基づく歌声の自動採譜.
電子情報通信学会技術研究報告, IBISML2017-54, 2017.
(text)
-
津島啓晃, 中村栄太, 糸山克寿, 吉井和佳.
和音系列に対するPCFGのベイズ学習とSplit-Mergeサンプリングを用いたメロディへの和声付け.
電子情報通信学会技術研究報告, IBISML2017-48, 2017.
(text)
-
吉井和佳.
音楽音響信号解析のためのガンマ過程に基づく無限相関テンソル分解.
電子情報通信学会技術研究報告, IBISML2017-35, 2017.
(text)
-
萩谷俊幸, 帆足啓一郎, 河原達也.
スマートフォンにおけるつまずき検出に基づく音声入力支援システム.
情報処理学会研究報告, HCI-175-5, 2017.
(text)
-
井上昂治, Divesh Lala, Pierrick Milhorat, 高梨克也, 河原達也.
潜在キャラクタモデルによるリアルタイム対話エンゲージメント推定.
人工知能学会研究会資料, SLUD-B508-18, 2017.
(text)
-
井上昂治, Divesh Lala, Pierrick Milhorat, 石田真也, 趙天雨, 高梨克也, 河原達也.
自律型アンドロイドERICAにおける多様な聞き手応答を用いた傾聴対話.
人工知能学会研究会資料, SLUD-B508-11, 2017.
(text)
-
山本賢太, 井上昂治, 中村静, 高梨克也, 河原達也.
自律型アンドロイドの対話の振る舞い制御モデルによる
キャラクタ表現法の検討.
人工知能学会研究会資料, SLUD-B508-05, 2017.
(text)
-
島田一希, 坂東宜昭, 三村正人, 糸山克寿, 吉井和佳, 河原達也.
雑音環境下音声認識のための多チャネル非負値行列因子分解に基づく
教師なしビームフォーマ.
電子情報通信学会技術研究報告, SP2017-23, 2017.
(text)
-
和気雅弥, 坂東宜昭, 三村正人, 糸山克寿, 吉井和佳, 河原達也.
再帰型ニューラルネットワークを用いたセミブラインド音声分離・強調.
電子情報通信学会技術研究報告, SP2017-22, 2017.
(text)
-
坂東宜昭, 三村正人, 糸山克寿, 吉井和佳, 河原達也.
深層生成モデルを事前分布に用いた教師なし音声強調.
電子情報通信学会技術研究報告, SP2017-20, 2017.
(text)
-
錦見亮, 中村栄太, 後藤真孝, 糸山克寿, 吉井和佳.
調とリズムを考慮した階層隠れセミマルコフモデルに基づく歌声F0軌跡に対する音符推定.
情報処理学会研究報告, MUS-116-17, 2017.
(text)
-
津島啓晃, 中村栄太, 糸山克寿, 吉井和佳.
和音系列の統計的木構造解析とSplit-Mergeサンプリングに基づくメロディへの和声付け.
情報処理学会研究報告, MUS-116-14, 2017.
(text)
-
吉井和佳.
モノラル音響信号に対する音源分離のための無限相関テンソル分解.
情報処理学会研究報告, MUS-116-6, 2017.
(text)
- 尾島優太, 中野倫靖, 深山覚, 加藤淳, 後藤真孝, 糸山克寿, 吉井和佳.
既存歌唱曲アレンジのための歌声キーボード.
情報処理学会研究報告, MUS-116-4, 2017.
(text)
- 和田雄介, 坂東宜昭, 中村栄太, 糸山克寿, 吉井和佳.
楽曲中の歌声とユーザ歌唱のリアルタイムアラインメントに基づく伴奏追従型カラオケシステム.
情報処理学会研究報告, MUS-116-3, 2017.
(text)
-
稲熊寛文, 井上昂治, 三村正人, 河原達也.
End-to-endモデルによるsocial signals検出および音声認識との統合.
情報処理学会研究報告, SLP-117-7, 2017.
(text)
-
勝見久央, 井上昂治, 中村静, 高梨克也, 河原達也.
自律型アンドロイドによる対話における同調的笑いの生成.
情報処理学会研究報告, SLP-116-4, NL-231-4, 2017.
(text)
2016年度
-
Yuanchao Li, Inoue Koji, Shizuka Nakamura, Katsuya Takanashi, ToshinoriIshi
Carlos, and Tatsuya Kawahara.
Emotion recognition by combining prosody with text information and
assessment selection for human-robot interaction.
人工知能学会研究会資料, SLUD-B506-09, 2017.
(text)
-
中西亮輔, 井上昂治, 中村静, 高梨克也, 河原達也.
円滑な発話権制御のための談話行為の連鎖に基づく
フィラーの生起と形態の予測.
人工知能学会研究会資料, SLUD-B506-04, 2017.
(text)
-
中村静, 中西亮輔, 高梨克也, 河原達也.
フィラーの韻律的特徴と形態および生起位置との関係の分析.
人工知能学会研究会資料, SLUD-B506-03, 2017.
(text)
-
福田翼, 中村栄太, 糸山克寿, 吉井和佳.
楽譜簡略化と自動補完伴奏によるピアノ演奏練習支援システム.
情報処理学会研究報告, MUS-114-21, 2017.
(text)
-
稲熊寛文, 井上昂治, 三村正人, 河原達也.
LSTM-CTCによる音声対話におけるsocial signalsの検出.
情報処理学会研究報告, SLP-115-9, 2017.
(text)
-
河原達也, 秋田祐哉, 広瀬洋子.
自動音声認識を用いた放送大学のオンライン授業に対する字幕付与.
情報処理学会研究報告, AAC-2-5, 2016.
(text)
-
板倉光佑, 坂東宜昭, 中村栄太, 糸山克寿, 吉井和佳, 河原達也.
マルチチャネル音源分離のための低ランク音源モデルと
スパース重畳過程に基づくネスト型ベイズ混合・因子モデル.
電子情報通信学会技術研究報告, IBISML2016-95, 2016.
(text)
-
錦見亮, 中村栄太, 糸山克寿, 吉井和佳.
歌声F0軌跡に対する自動採譜のための準ビート同期セグメンタルHMM.
電子情報通信学会技術研究報告, IBISML2016-93, 2016.
(text)
-
尾島優太, 中村栄太, 糸山克寿, 吉井和佳.
音楽音響信号に対する多重音高推定と和音構造学習のための階層ベイズ音響・言語統合モデル.
電子情報通信学会技術研究報告, IBISML2016-92, 2016.
(text)
-
吉井和佳, 中村栄太, 糸山克寿, 後藤真孝.
音楽音響信号解析のためのディリクレ過程に基づくベイズ潜在成分分析.
電子情報通信学会技術研究報告, IBISML2016-68, 2016.
(text)
-
中西亮輔, 井上昂治, 中村静, 高梨克也, 河原達也.
発話行為の連鎖を考慮したフィラーの生起と形態の分析.
人工知能学会研究会資料, SLUD-B505-30, 2016.
(text)
-
稲熊寛文, 井上昂治, 中村静, 高梨克也, 河原達也.
初対面対話における韻律的特徴に基づくアイスブレーキングの分析と予測.
人工知能学会研究会資料, SLUD-B505-29, 2016.
(text)
-
井上昂治, Divesh Lala, 高梨克也, 河原達也.
階層ベイズモデルを用いた聞き手の多様なふるまいに基づく
対話エンゲージメントの推定.
人工知能学会研究会資料, SLUD-B505-28, 2016.
(text)
-
井上昂治, Pierrick Milhorat, Divesh Lala, 趙天雨, 河原達也.
自律型アンドロイドERICAによる社会的役割に則したインタラクション.
人工知能学会研究会資料, SLUD-B505-7, 2016.
(text)
-
Sheng Li, Xugang Lu, Shinsuke Sakai, and Tatsuya Kawahara.
Diversity-driven semi-supervised ensemble DNN acoustic model
training.
電子情報通信学会技術研究報告, SP2016-40, 2016.
(text)
-
Richeng Duan, Tatsuya Kawahara, and Masatake Dantsuji.
Pronunciation error detection using DNN articulatory model based on
transfer learning.
電子情報通信学会技術研究報告, SP2016-39, 2016.
(text)
-
坂東宜昭, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 吉井和佳, 河原達也, 奥乃博.
変分ベイズ多チャネルロバストNMFに基づく
マイクロホンの移動・被覆を許容する音声強調.
電子情報通信学会技術研究報告, SP2016-36, 2016.
(text)
-
板倉光佑, 坂東宜昭, 中村栄太, 糸山克寿, 吉井和佳, 河原達也.
マルチチャネル音源分離のためのネスト型基底・音源混合モデルに基づく
時間周波数クラスタリング.
電子情報通信学会技術研究報告, SP2016-31, 2016.
(text)
-
吉井和佳.
[招待講演]階層ベイズ音響・言語モデルに基づく教師なし音楽理解.
電子情報通信学会技術研究報告, SP2016-29, 2016.
(text)
-
石田真也, 井上昂治, 中村静, 高梨克也, 河原達也.
傾聴対話システムのための発話を促す聞き手応答の生成.
人工知能学会研究会資料, SLUD-B504-1, 2016.
(text)
-
中村栄太, 糸山克寿, 吉井和佳.
音型の反復と変形に基づく階層ベイズ音楽言語モデルとMIDI演奏のリズム採譜への応用.
情報処理学会研究報告, MUS-112-22, 2016.
(text)
-
吉井和佳, 中村栄太, 糸山克寿, 後藤真孝.
NMF vs PLCA: 多重音生成過程のための無限因子モデルと無限混合モデル.
情報処理学会研究報告, MUS-112-21, 2016.
(text)
-
大喜多美里, 坂東宜昭, 糸山克寿, 吉井和佳.
視聴覚統合ビートトラッキングとリアルタイムコード認識を用いたダンス共演ロボット.
情報処理学会研究報告, MUS-112-15, 2016.
(text)
-
錦見亮 , 中村栄太, 糸山克寿, 吉井和佳.
歌声F0軌跡に対する音符推定のためのベイジアン準ビート同期HMM.
情報処理学会研究報告, MUS-112-7, 2016.
(text)
-
尾島優太, 中村栄太, 糸山克寿, 吉井和佳.
調・コード・音高・スペクトログラムの階層ベイズモデルに基づく多重音解析.
情報処理学会研究報告, MUS-112-6, 2016.
(text)
-
大田健翔, 秋田祐哉, 河原達也.
講演のリアルタイム字幕付与のための音声認識結果の簡約.
情報処理学会研究報告, SLP-112-12, 2016.
(text)
2015年度
-
土橋彩香, 池宮由楽, 糸山克寿, 吉井和佳.
歌声・調波楽器音・打楽器音分離とユーザ演奏のリアルタイム可視化に基づく音楽演奏練習システム.
情報処理学会 インタラクション, 2016.
-
中西亮輔, 井上昂治, 中村静, 高梨克也, 河原達也.
自律型アンドロイドによる円滑な発話権制御のための
フィラーの生起位置と形態の分析.
人工知能学会研究会資料, SLUD-B503-11, 2016.
(text)
-
中村静, 高梨克也, 山口貴史, Nigel Ward, 河原達也.
相槌「うん」と「うーん」の表記の問題と韻律的な特徴.
人工知能学会研究会資料, SLUD-B503-10, 2016.
(text)
-
山口貴史, 井上昂治, 吉野幸一郎, 高梨克也, Nigel Ward, 河原達也.
傾聴対話システムのための言語情報と韻律情報に基づく
多様な形態の相槌の生成.
人工知能学会研究会資料, SLUD-B503-9, 2016.
(text)
-
河原達也.
[特別講演] 音声認識技術の展開.
電子情報通信学会技術研究報告, PRMU2015-111, 2015.
(text)
-
Sheng Li, Yuya Akita, and Tatsuya Kawahara.
Discriminative data selection from multiple ASR systems' hypotheses
for unsupervised acoustic model training.
情報処理学会研究報告, SLP-109-8, 2015.
(text)
-
秋田祐哉, 三村正人, 河原達也.
音声認識を用いた講義・講演の字幕作成・編集システム.
情報処理学会研究報告, SLP-108-2, 2015.
(text)
-
井上昂治, 河原達也.
自律型アンドロイドEricaのための音声対話システム.
人工知能学会研究会資料, SLUD-B502-5, 2015.
(text)
-
山口貴史, 井上昂治, 吉野幸一郎, 高梨克也, Nigel Ward, 河原達也.
多様な相槌をうつ傾聴対話システムのための相槌形態の予測.
人工知能学会研究会資料, SLUD-B502-1, 2015.
(text)
-
井上昂治, 若林佑幸, 吉本廣雅, 高梨克也, 河原達也.
スマートポスターボードにおける視線情報を用いた話者区間及び相槌の検出.
情報処理学会研究報告, MUS-107-68, 2015.
(text)
2014年度
-
山口貴史, 井上昂治, 吉野幸一郎, 高梨克也, 河原達也.
傾聴対話における相槌形態と先行発話の統語構造の関係の分析.
人工知能学会研究会資料, SLUD-B403-4, 2015.
-
池宮由楽, 糸山克寿, 吉井和佳.
市販楽曲中の歌声の分離と音高推定に基づく歌唱表現編集システム.
情報処理学会 インタラクション, 2015.
-
井上昂治, 若林佑幸, 吉本廣雅, 高梨克也, 河原達也.
ポスター会話における音響・視線情報を統合した話者区間及び相槌の検出.
情報処理学会研究報告, SLP-105-9, 2015.
(text)
-
高橋文彦, 森信介.
仮名漢字変換ログを用いた単語分割・読み推定の精度向上.
情報処理学会研究報告, NL-219-15, 2014.
(text)
-
山崎健史, 森信介, 河原達也.
フローグラフからのレシピ文自動生成.
情報処理学会研究報告, NL-219-13, 2014.
(text)
-
吉野幸一郎, 河原達也.
ユーザの焦点を用いたPOMDPによる音声情報案内システム.
人工知能学会研究会資料, SLUD-B402-14, 2014.
-
吉野幸一郎, 河原達也.
ユーザの焦点を用いたPOMDPによる音声情報案内システム.
情報処理学会研究報告, SLP-104-9, 2014.
(text)
-
井山貴裕, 杉山治, 坂東宣昭, 糸山克寿, 吉井和佳, 奥乃博.
深度センサとマイクロフォンを用いた聴覚アウェアネスの提示.
人工知能学会研究会資料, SIG-Challenge-B402-03, 2014.
(PDF)
-
坂東宣昭, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 吉井和佳, 奥乃博.
マイクロホンアレイとスピーカをもつ柔軟索状ロボットのための動的スピーカ選択 による姿勢推定の高速化.
人工知能学会研究会資料, SIG-Challenge-B402-08, 2014.
-
鈴木泰山, 内山雄司, 青木保一, 相良毅, 秋田祐哉, 河原達也, 竹田香織, 増山幹高.
音声認識技術の活用による国会審議映像検索システムの実現.
情報処理学会研究報告, SLP-103-5, 2014.
(text)
-
吉井和佳, 糸山克寿, 後藤真孝.
多重音基本周波数解析のための無限重畳離散全極型モデル.
情報処理学会音楽情報科学研究会, MUS-104-9, 2014.
(PDF)
-
前澤陽, 糸山克寿, 吉井和佳, 奥乃博, 河原達也.
結合動的モデルに基づく音響信号アライメント.
情報処理学会音楽情報科学研究会, MUS-104-13, 2014.
(PDF)
-
池宮由楽, 糸山克寿, 吉井和佳, 奥乃博.
混合音中の歌声F0軌跡に対する歌唱表現転写システム.
情報処理学会音楽情報科学研究会, MUS-104-23, 2014.
(PDF)
-
三村正人, 坂井信輔, 河原達也.
ディープオートエンコーダとDNN-HMMを用いた残響下音声認識.
情報処理学会研究報告, SLP-102-6, 2014.
(text)
-
Sheng Li, Yuya Akita, and Tatsuya Kawahara.
Classifier-based data selection for lightly-supervised training of
acoustic model for lecture transcription.
情報処理学会研究報告, SLP-102-4, 2014.
(text)
-
童弋正, 秋田祐哉, 河原達也.
講演スライドの文字認識結果を用いた音声認識の改善.
情報処理学会研究報告, SLP-102-3, 2014.
(text)
-
井上昂治, 若林佑幸, 吉本廣雅, 河原達也.
多人数会話における視線情報を用いた話者区間検出.
情報処理学会研究報告, SLP-102-1, 2014.
(text)
-
前澤陽, 糸山克寿, 吉井和佳, 奥乃博.
潜在共通構造モデルに基づく音響信号間アライメント.
情報処理学会音楽情報科学研究会, MUS-103-23, 2014.
(PDF)
-
池宮由楽, 糸山克寿, 吉井和佳, 奥乃博.
市販楽曲からの歌い方ライブラリの作成.
情報処理学会音楽情報科学研究会, MUS-103 -48, 2014.
(PDF)
-
MaryamSadat Mirzaei and Tatsuya Kawahara.
Partial and synchronized caption generation to enhance the listening
comprehension skills of second language learners.
情報処理学会研究報告, SLP-101-15, NL-216-15, 2014.
(text)
2013年度
-
河原達也.
スマートポスターボード:
ポスター会話のマルチモーダルなセンシングと解析.
人工知能学会研究会資料, Challenge-B303-1, 2014.
(PDF)
-
桑原暢弘, 秋田祐哉, 河原達也.
音声認識結果の有用性の自動判定に基づく
講義のリアルタイム字幕付与システム.
音声ドキュメント処理ワークショップ, 2014.
(PDF)
-
吉野幸一郎, 河原達也.
ユーザの焦点に適応的な雑談型音声情報案内システム.
人工知能学会研究会資料, SLUD-B303-11, 2014.
-
上里美樹, 高梨克也, 河原達也.
傾聴対話における相槌の韻律的特徴の同調傾向の分析.
人工知能学会研究会資料, SLUD-B303-02, 2014.
-
新田恒雄, 小林哲則, 中村哲, 武田一哉, 河原達也, 伊藤彰則.
音声言語情報処理研究会の20年—歴代主査による研究レビュー—.
情報処理学会研究報告, SLP-100-5, 2014.
(text)
-
河原達也.
音声認識の方法論に関する考察—世代交代に向けて—.
情報処理学会研究報告, SLP-100-3, 2014.
(text)
-
高梨克也.
[招待講演]マルチモーダルインタラクション分析の基礎と現代的課題.
電子情報通信学会技術研究報告, SP2013-102, 2014.
(text)
-
森信介, 山肩洋子, 笹田鉄郎, 前田浩邦.
レシピテキストのためのフローグラフの定義.
情報処理学会研究報告, NL-214-13, 2013.
(text)
-
河原達也, 林宗一郎, 高梨克也.
ポスター会話における聴衆のマルチモーダルな振る舞いに基づく
興味・理解度の推定.
情報処理学会研究報告, SLP-97-12, 2013.
(text)
-
三村正人, 河原達也.
CSJを用いた日本語講演音声認識へのDNN-HMMの適用と話者適応の検討.
情報処理学会研究報告, SLP-97-9, 2013.
(text)
-
吉野幸一郎, 森信介, 河原達也.
述語項構造を介したWebテキストからの文選択に基づく言語モデルの評価.
情報処理学会研究報告, SLP-97-4, 2013.
(text)
-
河原達也.
音声認識の方法論に関する考察—歴史的変遷と今後の展望—.
情報処理学会研究報告, MUS-99-1, 2013.
(text)
2012年度
-
河原達也.
[特別講演] スマートポスターボード:
ポスター発表における場のマルチモーダルなセンシングと認識.
電子情報通信学会技術研究報告, PRMU2012-167, 2013.
(text)
-
河原達也.
[招待講演] 音声対話システムの進化と淘汰.
人工知能学会研究会資料, SLUD-B203-02, 2013.
-
吉野幸一郎, 森信介, 河原達也.
点予測による述語項構造解析.
情報処理学会研究報告, NL-209-6, 2012.
(text)
-
河原達也.
議会の会議録作成のための音声認識−衆議院のシステムの概要−.
情報処理学会研究報告, SLP-93-5, 2012.
(text)
-
笹田鉄郎, 森信介, Graham Neubig, 河原達也.
素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習.
情報処理学会研究報告, NL-207-8, 2012.
(text)
-
Mijit Ablimit, Tatsuya Kawahara, and Askar Hamdulla.
Comparison of discriminative models for lexicon optimization for
ASR of agglutinative language.
情報処理学会研究報告, SLP-92-13, 2012.
(text)
-
Randy Gomez and Tatsuya Kawahara.
Wavelet packet decomposition approach to reverberant speech
recognition.
情報処理学会研究報告, SLP-92-11, 2012.
(text)
-
河原達也.
[招待講演] スマートポスターボード:
ポスター会話のマルチモーダルなセンシングと認識.
電子情報通信学会技術研究報告, SP2012-51, 2012.
(text)
-
吉野幸一郎, 森信介, 河原達也.
述語項構造を介した文の変換と選択に基づく音声対話用言語モデルの構築.
情報処理学会研究報告, SLP-91-3, NL-206-3, 2012.
(text)
2011年度
-
岩立卓真, 高梨克也, 河原達也.
ポスター会話におけるパラ言語・非言語情報を用いた
話者交替及び次話者の予測.
人工知能学会研究会資料, SLUD-B103-10, 2012.
-
Welly Naptali and Tatsuya Kawahara.
Automatic transcription of TED talks.
音声ドキュメント処理ワークショップ, 2012.
(PDF)
-
Mijit Ablimit, Tatsuya Kawahara, and Askar Hamdulla.
Evaluation of lexicon optimization based on discriminative learning.
情報処理学会研究報告, SLP-89-2, 2011.
(text)
-
渡邉真人, 秋田祐哉, 河原達也.
予稿の話し言葉変換に基づく言語モデルによる講演音声認識.
情報処理学会研究報告, SLP-89-1, 2011.
(text)
-
吉野幸一郎, 森信介, 河原達也.
述語項の類似度に基づいてニュース記事の案内を行う音声対話システム.
人工知能学会研究会資料, SLUD-B102-08, 2011.
-
平山高嗣, 角康之, 河原達也, 松山隆司.
情報コンシェルジェ:mind probingに基づくマルチモーダル
インタラクションシステム.
電子情報通信学会技術研究報告, HCS2011-37, 2011.
-
土屋貴則, 高梨克也, 河原達也.
ポスター発表における質問者と質問の種類の推定のための
マルチモーダルな聞き手行動分析.
人工知能学会研究会資料, SLUD-B101-14, 2011.
-
Randy Gomez and Tatsuya Kawahara.
Robust speech recognition in noisy and reverberant environments using
wavelet-based Wiener filtering.
情報処理学会研究報告, SLP-87-14, 2011.
(text)
-
吉野幸一郎, 森信介, 河原達也.
述語項の類似度に基づく情報推薦を行う音声対話システム.
情報処理学会研究報告, SLP-87-11, 2011.
(text)
-
Cheongjae Lee, Tatsuya Kawahara, and Alexander Rudnicky.
Collecting speech data using Amazon's Mechanical Turk for
evaluating voice search system.
情報処理学会研究報告, SLP-87-9, 2011.
(text)
-
Mijit Ablimit, Tatsuya Kawahara, and Askar Hamdulla.
Lexicon optimization for automatic speech recognition based on
discriminative learning.
情報処理学会研究報告, SLP-87-5, 2011.
(text)
-
秋田祐哉, 河原達也.
講演に対する読点の複数アノテーションに基づく自動挿入.
情報処理学会研究報告, SLP-87-4, 2011.
(text)
2010年度
-
Randy Gomez and Tatsuya Kawahara.
Robust speech recognition using optimized wavelet denoising with
noise profiles.
情報処理学会研究報告, SLP-85-12, 2011.
(text)
-
Cheongjae Lee, Alexander Rudnicky, and Tatsuya Kawahara.
Combining slot-based vector space models for voice book search.
情報処理学会研究報告, SLP-85-5, 2011.
(text)
-
中田陽介, Graham Neubig, 森信介, 河原達也.
点予測と系列予測の2段階化による品詞推定の精度向上.
情報処理学会研究報告, NL-200-2, 2011.
(text)
-
秋田祐哉, 三村正人, Graham Neubig, 河原達也.
国会音声認識システムの音響・言語モデルの半自動更新.
情報処理学会研究報告, SLP-84-3, 2010.
(text)
-
Randy Gomez and Tatsuya Kawahara.
Robust speech recognition using optimized wavelet filtering in
reverberant conditions.
人工知能学会研究会資料, Challenge-B002-4, 2010.
(PDF)
-
吉野幸一郎, 河原達也.
Webからの情報抽出を用いた対話システムの評価.
人工知能学会研究会資料, SLUD-B002-04, 2010.
-
中田陽介, Graham Neubig, 森信介, 河原達也.
点予測による形態素解析.
情報処理学会研究報告, NL-198-8, 2010.
(text)
-
吉野幸一郎, 河原達也.
Webからの情報抽出を用いた音声対話システム.
情報処理学会研究報告, SLP-82-20, 2010.
(text)
-
Mijit Ablimit, Graham Neubig, Masato Mimura, Shinsuke Mori, Tatsuya Kawahara,
and Askar Hamdulla.
Uyghur morpheme-based language models and ASR.
情報処理学会研究報告, SLP-82-17, 2010.
(text)
-
Graham Neubig, 三村正人, 森信介, 河原達也.
ベイズ推論を用いた連続音声からの言語モデル学習.
情報処理学会研究報告, SLP-82-16, 2010.
(text)
-
須見康平, 河原達也.
音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出.
情報処理学会研究報告, SLP-82-8, 2010.
(text)
-
三村正人, 河原達也.
会議音声認識におけるBICに基づく高速な話者正規化と話者適応.
情報処理学会研究報告, SLP-82-6, 2010.
(text)
-
Randy Gomez and Tatsuya Kawahara.
Robust speech recognition using optimized wavelet-based
dereverbaration.
情報処理学会研究報告, SLP-82-5, 2010.
(text)
2009年度
-
元木環, 上田寛人, 宮部誠人, 河原達也, 林由華, 田窪行則.
文化と言語の維持保存に貢献するためのデジタル博物館の試み
--トランスクリプションデータを流用する字幕映像生成システムの提案.
情報処理学会研究報告, DD-75-1, 2010.
(text)
-
高梨克也, 常志強, 河原達也.
聞き手の興味・関心を示すあいづちの生起する会話文脈の分析.
人工知能学会研究会資料, SLUD-A903-05, 2010.
-
Graham Neubig, 秋田祐哉, 森信介, 河原達也.
文脈を考慮した確率的モデルによる話し言葉の整形.
情報処理学会研究報告, SLP-79-17, 2009.
(text)
-
須見康平, 河原達也, 緒方淳, 後藤真孝.
Podspotter: 音リアクションイベント検出に基づくポッドキャストブラウザ.
WISS (インタラクティブシステムとソフトウェアに関するワークショップ),
pp.171--172, 2009.
-
Randy Gomez and Tatsuya Kawahara.
Speech enhancement optimization based on acoustic model likelihood
for noisy and reverberant environment.
人工知能学会研究会資料, Challenge-A902-9, 2009.
(PDF)
-
勝丸徳浩, 河原達也, 秋田祐哉, 森信介, 山田篤.
講義音声認識に基づくノートテイクシステム.
電子情報通信学会技術研究報告, SP2009-53, WIT2009-59, 2009.
(text)
-
森信介, 小田裕樹.
3種類の辞書による自動単語分割の精度向上.
情報処理学会研究報告, NL-193-14, 2009.
(text)
-
常志強, 高梨克也, 河原達也.
ポスター会話におけるあいづちの韻律的特徴に関する印象評定.
人工知能学会研究会資料, SLUD-A901-06, 2009.
-
須見康平, 河原達也, 緒方淳, 後藤真孝.
ポッドキャストを対象とした音リアクションイベント検出.
情報処理学会研究報告, SLP-77-24, 2009.
(text)
-
Graham Neubig, 森信介, 河原達也.
重み付き有限状態トランスデューサーと対数線形モデルを用いた
話し言葉の整形.
情報処理学会研究報告, SLP-77-21, 2009.
(text)
-
三村正人, 秋田祐哉, 河原達也.
統計的言語モデル変換を用いた音響モデルの準教師つき学習.
情報処理学会研究報告, SLP-77-8, 2009.
(text)
2008年度
-
Randy Gomez and Tatsuya Kawahara.
Unsupervised optimization of dereverberation parameters using
likelihood of speech recognizer.
情報処理学会研究報告, SLP-75-4, 2009.
(text)
-
David Cournapeau, Shinji Watanabe, Atsushi Nakamura, and Tatsuya Kawahara.
Using online model comparison in the Variational Bayes framework -
an application to voice activity detection.
情報処理学会研究報告, SLP-75-3, 2009.
(text)
-
清水徹, 中村哲, 河原達也.
音声翻訳単位の推定における句読点情報の効果.
電子情報通信学会技術研究報告, SP2008-100, NLC2008-45 (SLP-74-22),
2008.
(text)
-
秋田祐哉, 三村正人, 河原達也.
会議録作成支援のための国会審議の音声認識システム.
電子情報通信学会技術研究報告, SP2008-99, NLC2008-44 (SLP-74-21),
2008.
(text)
-
常志強, 高梨克也, 河原達也.
ポスター会話におけるあいづちの形態的・韻律的な特徴分析と
会話モード間との相関の分析.
人工知能学会研究会資料, SLUD-A802-02, 2008.
-
Randy Gomez and Tatsuya Kawahara.
Robust speech recognition in reverberant environment by optimizing
multi-band spectral subtraction.
人工知能学会研究会資料, Challenge-A802-4, 2008.
(PDF)
-
清水徹, 中村哲, 河原達也.
同時通訳者の知識と韻律情報を用いた講演文章のチャンキング.
情報処理学会研究報告, SLP-72-15, 2008.
(text)
-
勝丸徳浩, 秋田祐哉, 森信介, 河原達也.
大学講義のノートテイク支援のための音声認識用言語モデルの適応.
情報処理学会研究報告, SLP-72-5, 2008.
(text)
-
Hongcui Wang and Tatsuya Kawahara.
A Japanese CALL system based on dynamic question generation and
error prediction for ASR.
情報処理学会研究報告, SLP-72-3, 2008.
(text)
-
森信介.
音声認識のための言語処理:何が足りないか?.
情報処理学会研究報告, SLP-72-7, 2008.
(text)
-
笹田鉄郎, 森信介, 河原達也.
テキストと音声を用いた単語と読みの自動獲得.
情報処理学会研究報告, SLP-72-1, 2008.
(text)
-
尾嶋憲治, 河原達也, 秋田祐哉, 内元清貴.
話し言葉の整形作業における削除箇所の自動同定.
情報処理学会研究報告, SLP-71-13, NL-185-13, 2008.
(text)
2007年度
-
瀬戸口久雄, 高梨克也, 河原達也.
ポスター会話における聞き手反応のマルチモーダルな分析.
人工知能学会研究会資料, SLUD-A703-12, 2008.
-
翠輝久, 河原達也.
文書検索システムにおけるベイズリスクに基づく対話戦略のオンライン学習.
電子情報通信学会技術研究報告, SP2007-142, NLC2007-79 (SLP-69-47),
2007.
(text)
-
篠崎隆宏, Mari Ostendorf, 河原達也.
頑健なパラメタ推定のためのAggregated EM法の提案と評価.
電子情報通信学会技術研究報告, SP2007-134, NLC2007-71 (SLP-69-39),
2007.
(text)
-
石塚健太郎, 荒木章子, 藤本雅清, 瀬戸口久雄, 高梨克也, 河原達也.
ポスター会話に対する発話区間検出と話者識別の検討.
電子情報通信学会技術研究報告, SP2007-133, NLC2007-70 (SLP-69-38),
2007.
(text)
-
David Cournapeau and Tatsuya Kawahara.
Using Variational Bayes Free Energy for noise robust online voice
activity detection.
電子情報通信学会技術研究報告, SP2007-131, NLC2007-68 (SLP-69-36),
2007.
(text)
-
Hongcui Wang and Tatsuya Kawahara.
Decision tree based error analysis for effective prediction in ASR
for Japanese CALL system.
電子情報通信学会技術研究報告, SP2007-121, NLC2007-58 (SLP-69-26),
2007.
(text)
-
秋田祐哉, 河原達也.
言語モデルと発音辞書の統計的話し言葉変換に基づく国会音声認識.
電子情報通信学会技術研究報告, SP2007-106, NLC2007-43 (SLP-69-11),
2007.
(text)
-
高梨克也, 瀬戸口久雄, 坊農真弓, 河原達也.
ポスター会話における発話の情報構造と基盤化の分析.
人工知能学会研究会資料, SLUD-A702-06, 2007.
-
豊倉正佳, 翠輝久, 河原達也.
音声対話システムにおける対話相手・発話意図と
発話タイミングの関係の分析.
人工知能学会研究会資料, SLUD-A702-04, 2007.
-
駒谷和範, 河原達也, 奥乃博.
京都市バス運行情報案内システムにおける
実ユーザのふるまいの経時的変化の分析.
情報処理学会研究報告, SLP-67-17, 2007.
(text)
-
篠崎隆宏, 河原達也.
効率的なクロスバリデーション尤度評価に基づく混合ガウス分布の最適化.
情報処理学会研究報告, SLP-67-15, 2007.
(text)
-
戸田智基, 篠崎隆宏, 秋田祐哉.
ICASSP2007報告.
情報処理学会研究報告, SLP-67-8, 2007.
(text)
-
瀬戸口久雄, 高梨克也, 河原達也.
多数のセンサを用いたポスター会話の収録とその分析.
情報処理学会研究報告, SLP-67-6, 2007.
(text)
-
尾嶋憲治, 秋田祐哉, 河原達也.
局所的な係り受けと韻律の素性を用いた話し言葉の節・文境界推定.
情報処理学会研究報告, SLP-67-3, 2007.
(text)
-
根本雄介, 河原達也, 秋田祐哉.
スライド情報を用いた言語モデル適応による講義の音声認識と字幕付与.
情報処理学会研究報告, SLP-66-16, NL-179-16, 2007.
(text)
2006年度
-
翠輝久, 河原達也, 正司哲朗, 美濃導彦.
質問応答・情報推薦機能を備えた音声による情報案内システム.
インタラクション, (一般講演), pp.19--26, 2007.
-
根本雄介, 秋田祐哉, 河原達也.
講義音声認識のためのスライド情報を用いた言語モデル適応.
音声ドキュメント処理ワークショップ, pp.89--94, 2007.
(PDF)
-
翠輝久, 河原達也.
文書検索型音声対話システムにおけるベイズリスクに基づく
対話制御の最適化.
情報処理学会研究報告, SLP-65-10, 2007.
(text)
-
翠輝久, 河原達也.
ドメインとスタイルを考慮したWebテキストの選択による
対話システム用言語モデルの構築.
電子情報通信学会技術研究報告, SP2006-126, NLC2006-70 (SLP-64-42),
2006.
(text)
-
西村竜一, 秋田祐哉, 須藤克仁, 大庭隆伸.
(サーベイ)ICSLPにおける研究動向 −言語モデル・対話システムを中心に−
電子情報通信学会技術研究報告, SP2006-125, NLC2006-69 (SLP-64-41),
2006.
(text)
-
河原達也.
〔招待論文〕 筆記録作成のための話し言葉処理技術.
電子情報通信学会技術研究報告, SP2006-120, NLC2006-64 (SLP-64-36),
2006.
(text)
-
浜辺良二, 内元清貴, 河原達也, 井佐原均.
話し言葉における引用節の自動認定および引用符の付与.
電子情報通信学会技術研究報告, SP2006-109, NLC2006-53 (SLP-64-25),
2006.
(text)
-
南條浩輝, 河原達也.
単語グラフを利用したベイズリスク最小化音声認識と
それに基づく重要文抽出.
電子情報通信学会技術研究報告, SP2006-106, NLC2006-50 (SLP-64-22),
2006.
(text)
-
翠輝久, 河原達也.
質問応答技術を利用したインタラクティブな音声対話システム.
人工知能学会研究会資料, SLUD-A602-06, 2006.
-
翠輝久, 河原達也.
限定されたドメインにおける質問応答機能を備えた
文書検索・提示型対話システム.
情報処理学会研究報告, SLP-62-13, 2006.
(text)
-
根本雄介, 秋田祐哉, 河原達也.
会議音声の自動話題分割による単語辞書と言語モデルの適応.
情報処理学会研究報告, SLP-62-12, 2006.
(text)
-
David Cournapeau and Tatsuya Kawahara.
Robust voice activity detection based on enhanced cumulant of LPC
residual and on-line EM algorithm.
情報処理学会研究報告, SLP-62-3, 2006.
(text)
-
西光雅弘, 河原達也, 高梨克也.
隣接文節間の係り受け情報に着目した話し言葉のチャンキングの評価.
情報処理学会研究報告, SLP-61-4, 2006.
(text)
2005年度
-
西光雅弘, 高梨克也, 河原達也.
係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング.
電子情報通信学会技術研究報告, SP2005-137, NLC2005-104 (SLP-59-48),
2005.
(text)
-
秋田祐哉, 河原達也.
統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換.
電子情報通信学会技術研究報告, SP2005-108, NLC2005-75 (SLP-59-19),
2005.
(text)
-
南條浩輝, 翠輝久, 河原達也.
単語の重要度を考慮したベイズリスク最小化音声認識と
それに基づく情報検索.
電子情報通信学会技術研究報告, SP2005-99, NLC2005-66 (SLP-59-10),
2005.
(text)
-
木田祐介, 河原達也.
複数特徴の重み付き統合による雑音に頑健な発話区間検出.
情報処理学会研究報告, SLP-57-9, 2005.
(text)
-
Ian Lane and Tatsuya Kawahara.
Incorporating in-domain confidence and discourse coherence measures
in utterance verification.
(text)
情報処理学会研究報告, SLP-57-7, 2005.
-
西光雅弘, 秋田祐哉, 河原達也.
大語彙連続音声認識を用いた落語のリアルタイム字幕付与.
情報処理学会研究報告, SLP-57-5, 2005.
(text)
-
Carlos Troncoso and Tatsuya Kawahara.
Automatic transcription of panel discussions using trigger-based
language model adaptation.
情報処理学会研究報告, SLP-57-3, 2005.
(text)
-
下岡和也, 河原達也, 内元清貴, 井佐原均.
『日本語話し言葉コーパス』における自己修復部(Dタグ)の
自動検出および修正に関する検討.
情報処理学会研究報告, SLP-56-14, NL-167-14, 2005.
(text)
2004年度
-
翠輝久, 河原達也.
文書検索タスクにおける検索要求明確化のための対話戦略.
情報処理学会研究報告, SLP-55-15, 2005.
(text)
-
李晃伸, 河原達也, 鹿野清宏.
信頼度基準デコーディングを用いた高効率な単語グラフ生成法.
情報処理学会研究報告, SLP-55-13, 2005.
(text)
-
北出祐, 河原達也.
講義の自動アーカイブ化のためのスライドと発話の対応付け.
情報処理学会研究報告, SLP-55-11, 2005.
(text)
-
Ian Lane, Tatsuya Kawahara, and Satoshi Nakamura.
Out-of-domain detection incorporating dialogue context and topic
clustering.
電子情報通信学会技術研究報告, SP2004-130, NLC2004-90 (SLP-54-50),
2004.
(text)
-
南條浩輝, 河原達也.
音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング.
電子情報通信学会技術研究報告, SP2004-122, NLC2004-82 (SLP-54-42),
2004.
(text)
-
Carlos Troncoso, Tatsuya Kawahara, Hirofumi Yamamoto, and Genichiro Kikui.
Trigger-based language model construction by combining different
corpora.
電子情報通信学会技術研究報告, SP2004-100, NLC2004-60 (SLP-54-20),
2004.
(text)
-
翠輝久, 清田陽司, 駒谷和範, 河原達也, 黒橋禎夫, 木戸冬子.
音声版ダイアログナビ:音声対話によるソフトウェアサポート.
情報処理学会研究報告, SLP-53-11, 2004.
(text)
-
秋田祐哉, 河原達也.
『日本語話し言葉コーパス』を用いた汎用的な発音変動モデルの統計的学習.
情報処理学会研究報告, SLP-53-3, 2004.
(text)
-
翠輝久, 駒谷和範, 清田陽司, 河原達也, 木戸冬子.
音声対話による大規模知識ベース検索システム --音声版ダイアログナビ--.
情報処理学会研究報告, SLP-52-4 (HI-109-4), 2004.
(text)
2003年度
-
上野晋一, 河原達也.
ユーザと状況のモデルを用いたプランニングを行う音声対話システム.
人工知能学会研究会資料, SLUD-A303-11, 2004.
-
下岡和也, 内元清貴, 河原達也, 井佐原均.
話し言葉の係り受け解析と文境界推定の相互作用による高精度化.
話し言葉の科学と工学ワークショップ, pp.119--126, 2004.
(PDF)
-
北出祐, 南條浩輝, 河原達也.
談話標識と話題語を用いた重要文抽出手法のCSJの学会講演における評価.
話し言葉の科学と工学ワークショップ, pp.111--118, 2004.
(PDF)
-
河原達也.
『日本語話し言葉コーパス』を用いた音声認識の進展.
話し言葉の科学と工学ワークショップ, pp.61--66, 2004.
(PDF)
-
河原達也, 武田一哉, 伊藤克亘, 李晃伸, 鹿野清宏, 山田篤.
連続音声認識コンソーシアムの活動報告及び最終版ソフトウェアの概要.
電子情報通信学会技術研究報告, SP2003-169, NLC2003-106 (SLP-49-57),
2003.
(text)
-
李晃伸, 河原達也, 鹿野清宏.
2パス探索アルゴリズムにおける高速な単語事後確率に基づく信頼度算出法.
電子情報通信学会技術研究報告, SP2003-160, NLC2003-97 (SLP-49-48),
2003.
(text)
-
Ian Lane, Tatsuya Kawahara, Tomoko Matsui, and Satoshi Nakamura.
Out-of-domain utterance detection based on confidence measures from
multiple topic classification.
電子情報通信学会技術研究報告, SP2003-159, NLC2003-96 (SLP-49-47),
2003.
(text)
-
南條浩輝, 北出祐, 河原達也.
談話標識の統計的選択に基づいたCSJの講演からの重要文抽出.
電子情報通信学会技術研究報告, SP2003-125, NLC2003-62 (SLP-49-13),
2003.
(text)
-
秋田祐哉, 河原達也.
話題と話者に関するPLSAに基づく言語モデル適応.
電子情報通信学会技術研究報告, SP2003-124, NLC2003-61 (SLP-49-12),
2003.
(text)
-
西田昌史, 河原達也.
BICに基づく話者モデル選択の教師なしインデキシングにおける評価.
電子情報通信学会技術研究報告, SP2003-103, WIT2003-15, 2003.
-
河原達也, 住吉貴志, 李晃伸, 坂野秀樹, 武田一哉, 三村正人, 伊藤克亘, 伊藤彰則,
鹿野清宏.
連続音声認識コンソーシアム2002年度版ソフトウエアの概要.
情報処理学会研究報告, SLP-48-1, 2003.
(text)
-
駒谷和範, 上野晋一, 河原達也, 奥乃博.
ユーザモデルを導入したバス運行情報案内システムの実験的評価.
情報処理学会研究報告, SLP-47-12, 2003.
(text)
-
翠輝久, 駒谷和範, 河原達也, 奥乃博, 木戸冬子.
音声対話によるソフトウェアサポートタスクのための確認戦略.
情報処理学会研究報告, SLP-47-11, 2003.
(text)
-
北出祐, 南條浩輝, 河原達也, 奥乃博.
談話標識と話題語に基づく統計的尺度による講演からの重要文抽出.
情報処理学会研究報告, SLP-46-2, NL-155-13, 2003.
(text)
2002年度
-
長谷川将宏, 河原達也, 奥乃博.
談話標識の抽出に基づいた討論音声へのMPEG-7タグの自動付与.
人工知能学会研究会資料, SIG-SLUD-A203-3, 2003.
-
住吉貴志, 河原達也, 奥乃博.
HTMLのフォーム入力のための文法の自動生成とSALTによる実装.
情報処理学会研究報告, SLP-45-21, 2003.
(text)
-
伊藤亮介, 駒谷和範, 河原達也, 奥乃博.
ロボットとの音声対話におけるユーザの心的状態の分析.
情報処理学会研究報告, SLP-45-18, 2003.
(text)
-
西田昌史, 秋田祐哉, 河原達也.
討論音声を対象とした話者モデル選択による話者インデキシング
と自動書き起こし.
電子情報通信学会技術研究報告, SP2002-157, NLC2002-80 (SLP-44-37),
2002.
(text)
-
南條浩輝, 河原達也, 山田篤, 内元清貴.
講演音声認識のための言語モデルの教師なし適応.
電子情報通信学会技術研究報告, SP2002-152, NLC2002-75 (SLP-44-32),
2002.
(text)
-
Ian Lane, Tatsuya Kawahara, Tomoko Matsui, and Satoshi Nakamura.
Language model switching based on topic detection for dialog speech
recognition.
電子情報通信学会技術研究報告, SP2002-145, NLC2002-68 (SLP-44-25),
2002.
(text)
-
河原達也, 住吉貴志, 李晃伸, 坂野秀樹, 武田一哉, 三村正人, 山田武志, 西浦敬信,
伊藤克亘, 伊藤彰則, 鹿野清宏.
連続音声認識コンソーシアム2001年度版ソフトウエアの概要.
情報処理学会研究報告, SLP-43-3, 2002.
(text)
-
秋田祐哉, 河原達也, 奥乃博.
多数話者音声データベースを用いた討論音声の教師なし話者インデキシング.
情報処理学会研究報告, SLP-42-9, 2002.
(text)
-
上野晋一, 駒谷和範, 河原達也, 奥乃博.
バス運行情報案内システムにおけるユーザモデルを用いた適応的応答の生成.
情報処理学会研究報告, SLP-42-2, 2002.
(text)
-
山肩洋子, 河原達也, 奥乃博.
ロボットとの音声対話のための信念ネットワークを用いた適応的言語理解.
人工知能学会研究会資料, SIG-SLUD-A201-3, 2002.
-
下岡和也, 河原達也, 奥乃博.
講演の書き起こしに対する統計的手法を用いた文体の整形.
情報処理学会研究報告, SLP-41-3, NL-149-12, 2002.
(text)
2001年度
-
南條浩輝, 河原達也.
講演音声認識のための種々の形態素解析及び音響モデルの評価.
話し言葉の科学と工学ワークショップ, pp.47--52, 2002.
-
安達史博, 河原達也, 奥乃博, 岡本隆志, 中嶋宏.
VoiceXMLの動的生成に基づく自然言語音声対話システム.
情報処理学会研究報告, SLP-40-23, HI-97-23, 2002.
(text)
-
Raux Antoine and Tatsuya Kawahara.
Intelligibility assessment and pronunciation error diagnosis for a
CALL system.
電子情報通信学会技術研究報告, SP2001-134, 2002.
-
井本和範, 壇辻正剛, 河原達也.
文強勢と等時性の自動検出に基づく英語韻律学習支援システム.
電子情報通信学会技術研究報告, SP2001-133, 2002.
-
駒谷和範, 河原達也, 清田陽司, 黒橋禎夫, Pascale Fung.
柔軟な言語モデルとマッチングを用いた音声によるレストラン検索システム.
電子情報通信学会技術研究報告, SP2001-113, NLC2001-78 (SLP-39-30),
2001.
(text)
-
南條浩輝, 河原達也.
発話速度に依存したデコーディングと音響モデルの適応.
電子情報通信学会技術研究報告, SP2001-103, NLC2001-68 (SLP-39-20),
2001.
(text)
-
山肩洋子, 河原達也, 奥乃博.
視覚情報を話題の対象とする音声対話システム.
電子情報通信学会技術研究報告, SP2001-97, NLC2001-62 (SLP-39-14),
2001.
(text)
-
河原達也, 住吉貴志, 李晃伸, 武田一哉, 三村正人, 伊藤彰則, 伊藤克亘, 鹿野清宏.
連続音声認識コンソーシアム2000年度版ソフトウェアの概要と評価.
情報処理学会研究報告, SLP-38-6, 2001.
(text)
-
住吉貴志, 李晃伸, 河原達也.
音声認識エンジンJulius/JulianのAPI実装.
情報処理学会研究報告, SLP-37-16, 2001.
(text)
-
伊藤亮介, 駒谷和範, 河原達也.
家電製品のマニュアルの知識と構造を利用した音声対話ヘルプシステム.
情報処理学会研究報告, SLP-37-1, 2001.
(text)
-
山肩洋子, 河原達也.
音声対話システムにおける訂正発話の韻律的特徴の分析.
人工知能学会研究会資料, SIG-SLUD-A101-3, 2001.
-
長谷川将宏, 秋田祐哉, 河原達也.
談話標識の抽出に基づいた講演音声の自動インデキシング.
情報処理学会研究報告, SLP-36-6, NL-143-11, 2001.
(text)
-
河原達也, 加藤一臣, 南條浩輝, 李晃伸.
話し言葉音声認識のための言語モデルとデコーダの改善.
情報処理学会研究報告, SLP-36-3, NL-143-8, 2001.
(text)
2000年度
-
加藤一臣, 河原達也.
種々のコーパスの重み付き混合に基づく講演音声認識のための言語モデル.
話し言葉の科学と工学ワークショップ, pp.85--92, 2001.
-
南條浩輝, 河原達也.
発話速度に依存した音素・音節モデル化の検討.
話し言葉の科学と工学ワークショップ, pp.93--100, 2001.
-
坪田康, 壇辻正剛, 河原達也.
日本人の発音誤りパターンの対判別を利用した英語発音教示システム.
電子情報通信学会技術研究報告, SP2000-125, 2001.
-
鹿島博晶, 河原達也.
複合的言語制約に基づくキーフレーズスポッティングによる対話音声理解.
電子情報通信学会技術研究報告, SP2000-114, NLC2000-66 (SLP-34-40),
2000.
(text)
-
加藤一臣, 南條浩輝, 河原達也.
講演音声認識のための音響・言語モデルの検討.
電子情報通信学会技術研究報告, SP2000-97, NLC2000-49 (SLP-34-23),
2000.
(text)
-
河原達也.
(サーベイ) 話し言葉音声認識の概観.
電子情報通信学会技術研究報告, SP2000-95, NLC2000-47 (SLP-34-21),
2000.
(text)
-
李晃伸, 河原達也, 鹿野清宏.
モノフォンモデルを用いた状態選択に基づく音響尤度計算の高速化.
電子情報通信学会技術研究報告, SP2000-91, NLC2000-43 (SLP-34-17),
2000.
(text)
-
秋田祐哉, 河原達也.
会議音声の自動アーカイブ化システム.
電子情報通信学会技術研究報告, SP2000-85, NLC2000-37 (SLP-34-11),
2000.
(text)
-
河原達也.
音声認識技術の今後の10年について --予測調査--.
情報処理学会研究報告, SLP-32-6, 2000.
(text)
-
武田一哉, 徳田恵一, 今井亨, 中村哲, 河原達也.
ICASSP2000に見る世界の研究動向.
情報処理学会研究報告, SLP-32-14, 2000.
(text)
-
安達史博, 駒谷和範, 河原達也.
音声対話情報検索システムにおける想定外の発話の分析とその対処.
人工知能学会研究会資料, SIG-SLUD-A001-2, 2000.
-
南條浩輝, 加藤一臣, 三村正人, 李晃伸, 河原達也.
種々のタスクにおける大語彙連続音声認識システムの性能評価と診断.
情報処理学会研究報告, SLP-31-11, 2000.
(text)
-
河原達也, 李晃伸, 小林哲則, 武田一哉, 峯松信明, 嵯峨山茂樹, 伊藤克亘, 伊藤彰則,
山本幹雄, 山田篤, 宇津呂武仁, 鹿野清宏.
日本語ディクテーション基本ソフトウェア(99年度版)の性能評価.
情報処理学会研究報告, SLP-31-2, NL-137-7, 2000.
(text)
-
井本和範, 壇辻正剛, 河原達也.
CALLシステムのための英語文強勢知覚のモデル化.
電子情報通信学会技術研究報告, SP2000-1, 2000.
1999年度
-
駒谷和範, 河原達也.
音声認識結果の信頼度を用いた頑健な混合主導対話の実現法.
情報処理学会研究報告, SLP-30-9, 2000.
(text)
-
三村正人, 河原達也.
対話音声認識を指向した音響モデルの構築.
電子情報通信学会技術研究報告, SP99-140, 2000.
-
李晃伸, 河原達也, 武田一哉, 鹿野清宏.
Phonetic tied-mixture モデルを用いた大語彙連続音声認識.
電子情報通信学会技術研究報告, SP99-100, NLC99-32 (SLP-29-8), 1999.
(text)
-
坪田康, 壇辻正剛, 河原達也.
フォルマント構造推定による日本人用英語発音教示システム.
情報処理学会研究報告, SLP-27-12, 1999.
(text)
-
鹿島博晶, 蒲谷武正, 河原達也.
携帯情報端末用メモパッドと固有名詞の音声入力方式.
情報処理学会研究報告, SLP-27-11, 1999.
(text)
-
河原達也.
ESCA IDS'99 (Interactive Dialogue in Multi-Modal
Systems)ワークショップ報告.
情報処理学会研究報告, SLP-27-10, 1999.
-
南條浩輝, 李晃伸, 河原達也.
大語彙連続音声認識における認識誤り原因の自動同定.
情報処理学会研究報告, SLP-27-6, 1999.
(text)
-
李晃伸, 河原達也.
大語彙連続音声認識エンジンJuliusにおけるA*探索法の改善.
情報処理学会研究報告, SLP-27-5, 1999.
(text)
-
河原達也, 李晃伸, 小林哲則, 武田一哉, 峯松信明, 伊藤克亘, 山本幹雄, 山田篤,
宇津呂武仁, 鹿野清宏.
日本語ディクテーション基本ソフトウェア(98年度版)の性能評価.
情報処理学会研究報告, SLP-26-6, NL-131-6, 1999.
(text)
-
加藤一臣, 李晃伸, 河原達也.
講演ディクテーションのための話題独立言語モデルと話題適応.
情報処理学会研究報告, SLP-26-2, 1999.
(text)