こんにちは、EPoch IT 部の坂田です。
Google が検索エンジンで培ったノウハウを用いて作った
Google Translate という機械翻訳サービスがあります。
検索エンジンは世界中の何ヶ国語ものウェブサイトを解析し、
サイト内の文章や単語を解析し、言語構造・文法に照らし合わせ、
どのようなサイトかを判断する
それを応用して作られたのが Google Translate です。
膨大な辞書データベースを用いて、
もっとも自然な言葉に変換することが出来ます。
そして、つい先日、スウェーデンの学生が、
Google Translate と Youtube の字幕機能を併せて応用することで、
歌詞をいろんな言語に自動翻訳して歌わせる
Google Music Translate という試みを行いました。
これからは歌詞の時代? 「世界の音楽を自国語で楽しめる」学生発のアイデア : ライフハッカー[日本版]
http://www.lifehacker.jp/2012/11/121126kotakugmt.html
自動で訳して自動で歌わせる、これは非常に面白い試みと感じました。
翻訳の精度、歌の精度、まだまだ改善の余地は大いにありますが、
Youtube でのプレゼンテーションを見ていると、
機械翻訳した歌詞を、自動読み上げ音声で流しているので、
あまり歌のように聞こえなかった所が気になりました。
もしかしてこれは、日本の
凄いポテンシャルを発揮するんじゃないかと思いました。
初音ミクなどに代表される VOCALOID を使用した歌というのは、
今ひとつ機械的な発声の域から抜け出ないところがありました。
Perfume のようなテクノポップ調に仕上げる場合は、
機械的な声でも、むしろ機械的だからこそ調和しやすいですが、
そうでない場合はなかなか自然に歌わせることが難しいものでした。
しかし、最近の
機械音声に歌唱力を持たせる研究『
今や日本の VOCALOID の技術は大いに研鑽・洗練されています。
VocaListener(ぼかりす): ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステム
VocaListener2(ぼかりす2): ユーザ歌唱の音高と音量だけでなく声色変化も真似る歌声合成システム
歌声・音声分析合成のためのF0適応多重フレーム統合分析に基づくスペクトル包絡と群遅延の推定法
VocaListener はお手本となる歌唱音声データが必要ですから、
今ではまだこういったことは夢物語の域を出ないですが、
もし、Google Music Translate と Vocalistener の技術が組み合わさって、
世界中の曲が自分の国の言語で、自然な歌唱で聴けることが出来たりすれば、
それはもう一気に音楽がグローバリゼーションに持っていかれそうです。
ただ、もはや既に、その一歩手前のところまで来ているように思います。
音声認識技術と Google Translate のような自動翻訳技術を使った、
自動リアルタイム通訳のシステムは現在既に開発されています。
Google開発中の自動通訳フォンは、ほんにゃくこんにゃくだ : TechWave
http://techwave.jp/archives/51390744.html
あるいは映像認識技術と AR (拡張現実) を駆使して街頭の看板やメニュー等を
自動翻訳する技術さえ開発されています。
オムロン、外国語のメニューや掲示、標識をリアルタイム翻訳する携帯アプリを発表
http://jp.techcrunch.com/archives/20120104japan-omron-augmented-reality-translation-app/
というか日本においては、結構昔 (2006 年ごろ)からあります。
携帯電話のカメラをかざすと英単語を翻訳する「カメラ辞典」 - GIGAZINE
http://gigazine.net/news/20060831_camera_dictionary/
カメラで写した外国語を翻訳して AR で反映する技術、
マイクで拾った外国語を翻訳して読み上げる技術、
外国の曲を自然な歌唱力で自国語で歌い上げる技術、
そんな機能を搭載したメガネとインカムだけつけていれば、
海外でもネイティブとそう大差なく不自由なく暮らせる世界が、
もしかしたら 5 年後ぐらいに訪れるのかもしれません。
もともと IT には国境はありませんが、
いずれ言語の壁も取り払われることでしょう。
単なるグローバリゼーション以上の、
スーパーグローバリゼーションが起こるのかもしれません。