[Go to English page]
Hideki Kawahara, Professor, Wakayama University
音声、知能、計算機、SF、音楽、数学。趣味として、仕事として、
あるいは単なる知的好奇心から関わってきた一見すると脈絡の無い項目。
科学技術の進歩とネットワークの急速な発展は、これらを
「聴覚メディア処理の研究」という
ライフワークとして追求することを可能にしました。
技術に人間を合わせるのではなく、人間に合わせて技術を開発するための機は熟しつつあります。
「人間のための聴覚メディア処理」には、迂遠には見えても、
聴覚・音声の発達・進化をリバースエンジニアリングして本質を理解することが必須です。
実際、この戦略は、画期的な音声処理技術STRAIGHTを生み、それが新たな聴覚の本質の発見と検証に結びついて来ました。
研究室の仲間や世界中に広がる志を同じくする研究仲間達とともに、
「人間のための聴覚メディア処理」を確かな技術とし普及させるための基盤を整備することを使命として、
教育・研究に携わっています。
以下は、リストからの抜粋です。簡単な紹介を添えてあります。
- Hideki Kawahara, Masanori Morise, Ryuichi Nisimura and Toshio Irino:
An interference-free representation of group delay
for periodic signals,
Proc. APSIPA, 3-6 December, OS.17-SLA 8, 2012 Calfornia, USA. (4/Dec./2012)
(パワースペクトル、瞬時周波数に続いて、群遅延も繰返しに影響されない表現を求めました。ここでもFlanaganの式が鍵になっています。)
- Hideki Kawahara, Masanori Morise, Ryuichi Nisimura, Toshio Irino:
Deviation measure of waveform symmetry and its
application to high-speed and temporally-fine F0
extraction for vocal sound texture manipulation,
Interspeech2012, 2012. (10/Sept./2012)
(シャウト等に含まれる高速な基本周波数の変動に追従できる方法を発明しました。ここで、ようやく一年前の瞬時周波数の新しい計算法が役立ちました。)
- Hideki Kawahara and Masanori Morise,
Technical foundations of TANDEM-STRAIGHT, a speech analysis, modification and synthesis framework,
SADHANA - Academy Proceedings in Engineering Sciences, Vol.36, Part 5, pp.713-722, 2011.
(PDF)
(TANDEM-STRAIGHTのスペクトルの計算法の技術的背景をまとめてあります。オープンアクセスの資料です。)
- Hideki Kawahara, Toshio Irino and Masanori Morise,
An interference-free representation of instantaneous frequency of periodic signals and its application to F0 extraction,
Proc. ICASSP 2011, May 2011. (doi:10.1109/ICASSP.2011.5947584 )
(隣接する調波の影響を受けない瞬時周波数計算法を発明しました。1966年のFlanaganの式に、非常に面白い性質がありました。)
- 河原 英紀:音声分析合成技術の動向、日本音響学会誌、Vol.67, No.1, pp.40-45 (2011).
(日本語によるTANDEM-STRAIGHTとモーフィングの解説。2007年の解説と同様に、この執筆の後に新しい瞬時周波数計算法を
発明したことにより、また、最新情報ではなくなってしまいました。上記参照。)
- Kawahara, H.; Nisimura, R.; Irino, T.; Morise, M.; Takahashi, T.; Banno, H.; , "Temporally variable multi-aspect auditory morphing enabling extrapolation without objective and perceptual breakdown," Acoustics, Speech and Signal Processing, 2009. ICASSP 2009. IEEE International Conference on , vol., no., pp.3905-3908, 19-24 April 2009
(doi: 10.1109/ICASSP.2009.4960481)
(時間軸を含む様々な属性のモーフィング率を、時間の関数として設定することを可能にするモーフィングを定式化しました。)
- Stefan R. Schweinberger, Christoph Casper, Nadine Hauthal, Juergen M. Kaufmann, Hideki Kawahara, Nadine Kloth, David M.C. Robertson, Adrian P. Simpson and Romi Zaeske,
Auditory Adaptation in Voice Perception, Current Biology 18, 684-688, May 6, (2008).
(聴覚における高次属性の残効の存在を初めて明らかにした論文です。STRAIGHTによるモーフィングの、効果的な利用法の一例です。)
- Kawahara, H.; Morise, M.; Takahashi, T.; Nisimura, R.; Irino, T.; Banno, H.; , "Tandem-STRAIGHT: A temporally stable power spectral representation for periodic signals and applications to interference-free spectrum, F0, and aperiodicity estimation," Acoustics, Speech and Signal Processing, 2008. ICASSP 2008. IEEE International Conference on , vol., no., pp.3933-3936, March 31 2008-April 4 2008
(STRAIGHTのアルゴリズムを根本から定式化し直しました。計算量が大きく削減され、理論的な見通しも良くなりました。)
- 河原英紀:Vocoderのもう一つの可能性を探る--音声分析変換合成システムSTRAIGHTの背景と展開--,
日本音響学会誌,Vol.63,No.8,pp.442-449 (2007). [解説]
(日本語によるSTRAIGHTの解説。ただし、この執筆の後に新しいSTRAIGHTスペクトル推定法を
発明したことにより、最新情報ではなくなってしまいました。上記参照。)
- Hideki Kawahara: STRAIGHT, Exploration of the other aspect of VOCODER:
Perceptually isomorphic decomposition of speech sounds,
Acoustic Science and Technology, Vol.27, No.6, (2006).[招待論文]
(STRAIGHTの最新の情報をまとめた資料。
学会のWebから資料をダウンロードできます。
Acoustic Science and Technology のページ(PDF))
- David R. R. Smith, Roy D. Patterson, Richard Turner, Hideki Kawahara and Toshio Irino,
The processing and perception of size information in speech sounds,
Journal of the Acoustical Society of America, Vol.117, Issue 1, pp.305-318, 2005.
(聴覚には話者のサイズの情報を抽出する機能があることを明らかにした論文。
STRAIGHTがこの機能の発見のきっかけとなり検証の手段として用いられた。
この発見は、入野とPattersonによる聴覚初期過程の計算理論を補強する。)
- Hideki Kawahara and Hisami Matsui: Auditory Morphing based on
an Elastic Perceptual Distance Metric in an Interference-free
Time-frequency Representation, Proc. ICASSP'2003, vol.I, pp.256-259,
2003.
(STRAIGHTに基づく音声モーフィング手法を提案した国際会議資料。
感情音声の研究への応用は、同年のEUROSPEECHで発表。
この手法は、 様々な研究機関で利用されはじめています。
STRAIGHT を用いた感情モーフィングのデモ(Flashムービー)
(説明)
[demo英文]
)
- Hideki Kawahara, Ikuyo Masuda-Katsuse and Alain de Cheveigne:
Restructuring speech representations using a pitch-adaptive time-frequency
smoothing and an instantaneous-frequency-based F0 extraction:
Possible role of a reptitive structure in sounds, Speech Communication,
27, pp.187-207 (1999).
(STRAIGHTの最初の版とその背景となる思想を提案した論文。本論文は,EURASIPの最優秀論文賞を受賞)
Last update: 2013年 5月16日 木曜日 17時59分46秒 JST