“声を出さない”で会話する〜ITX2002「ITX2002 Summer」で数多く展示された“未踏ソフトウェア創造事業”の1つに、声を出さずにささやくだけで、音声を合成する技術が展示された
携帯電話の使用が、列車の中などの“逃げ出すことのできない”空間において嫌われ、禁止される理由の1つに、発する声が“うるさい”“奇異な印象を与える”“やっかみを感じる”ということが挙げられる──。 情報処理振興事業協会(IPA)が主催した「ITX2002 Summer」に出展した竹内康人氏が、テーマ概要として記した言葉だ。鹿児島大学工学部情報工学科の竹内教授は、IPAの未踏ソフトウェア創造事業の案件として、ささやき声でも通話できるシステムを開発、展示した。 竹内氏が言う“ささやき声”とは、「自分でも聞こえないくらいの声」のこと。単に音を大きくしたり、ノイズを消すシステムではなく、音を変換する。システムとしては、周囲をはばかるところでの通話を可能としている。
声には、無声音と有声音がある。有声音は声帯を震わせる音。ノドに手を当てると響く。ささやき声を出してみると、声帯が震えず無声音であることが分かる。 竹内氏の研究は、この「無声音というヒソヒソ声を有声音化」するものだ。無声音は声帯がなくても発声できるため、「筆談に代わるものとして、手術などで声帯をなくした人にも対応できる」(竹内氏)。 システムはマイクで撮った無声音をPC上のソフトウェアで有声音に変換するというもの。会場では実際にヘッドセットが用意され、デモンストレーションも行われた。まさに「自分にも聞こえないような小さな声」でしゃべってみたが、しっかりと普通の音声に変換された。 ただし、音質に関しては良いとはいえず、お経のような音になる。子音の変換にもまだ問題が残っているようだ。あくまで聞こえないくらいの音を、聞いて認識できる音に変換するものである。また、今回のシステムでは発声してから変換された音が出てくるまでに2秒ほどのタイムラグが発生していた。竹内氏によると、入力された音声を3秒間ほどキャッシュしてから処理を行っているため。商用化された際には、FFT(高速フーリエ変換)をDSPを用いて行うためリアルタイム処理が可能になるという。 無声音から有声音への変換は、「母音・子音が続く日本語に特化」(竹内氏)しているため、ほかの言語には新たな対応が必要となる。
竹内氏は「最初は携帯電話のひそひそ声に向けて開発していたが、医療現場などにも向く。声が出ない人のために特殊化することも考えている」と語る。 確かに現在のシステムでは、どうしても音質が悪いのがネック。しかし、公共の場所で携帯電話の利用が嫌われる理由には“大声で話す”ことへの嫌悪感があることは間違いない。 一部の携帯電話には「ささやきモード」という、小さな声で話しても大きな声で伝わる機能が搭載されているが、基本的にはマイクの感度を上げて周囲のノイズを軽減する処理がされているだけだと思われる。「ホワイトノイズを消すのではなく、有声音を復活させる」(竹内氏)処理は、この研究の独特なところだろう。 先日、歯に埋め込む携帯電話の話題を掲載したが(6月19日の記事参照)、このような端末が実現したら当然話すほうもヒソヒソ声で話す必要がある。また音声認識機能も、ヒソヒソ声なら周囲を気にすることなく使えそうだ。 応用はいろいろ、ささやき声を活用したあっと驚くソリューションが登場することに期待したい。 関連記事 対話エージェントやインターネット“視聴”システムも――「ITX 2001」 歯に埋め込む携帯電話 関連リンク 情報処理振興事業協会(IPA)未踏ソフトウェア創造事業 採択案件評価書 情報処理振興事業協会(IPA) [斎藤健二, ITmedia] Copyright © ITmedia, Inc. All Rights Reserved. モバイルショップ
最新CPU搭載パソコンはドスパラで!!
最新スペック搭載ゲームパソコン
FEED BACK |