「Wormhole / Yumi AraI」聴き比べ
「Wormhole / Yumi AraI」いよいよ発売になります。
今回はSynthesizer Vを利用した画期的な制作が行われています(下図左側)。
またたった1タイトルにもかかわらず、ものすごく多くの形態で提供されています(下図右側)。
なお、下図は、当サイトで想像したもので、実作業に基づいたものではありません。本当にこのようになっているかどうかは、わかりません。
|
|
このコーナーでは、制作過程を推察して楽しんだり、AIヴォーカルとリアルヴォーカルの聴き比べ、
各メディアの聴き比べ等を掲載していこうかなと思っています。
Synthesizer V
|
下記のソースからSynthesizer Vがどのように使われたか、推察してみたいと思います。 · DTM STATION「Synthesizer Vが蘇らせた荒井由実の歌」 · テレビ朝日系「EIGHT JAM」2025.11.2放送 · NHK「ミュージックスペシャル」2025. |
|
|
Synthesizer V自体はDreamtonics社が開発、AHS社が販売する市販品です。プリセット若しくは、オプション販売されている歌声ライブラリーに対し、歌詞とメロディを打ち込むと、歌声を生成できます。
今回は、非売品のユーミンの歌声を生成できる歌声ライブラリーが制作されています。これをこのページでは「AIユーミン」と呼ぶことにします。AIユーミンは2年を費やして70年代から80年代にレコーディングされたマスターテープのヴォーカルトラックを使用し学習させたそうです。これはSynthesizer Vのチームによって行われたようですね。
歌声ライブラリーには、生成する歌声を調整できる様々な調整つまみがあります。「スタイルプリセット」「パラメータ」「チューニング」などがこれにあたります。これは市販品のSynthesizer Vにも存在しますが、ユーミンAI用に「90s」「Ballade」といったオリジナルのプリセットが開発されているそうです。「90s」は生成される歌声に90年代の要素を強くするために作られたそう。市販品のSynthesizer Vのつまみ操作についてはこの動画が分かり易いです → この動画1つで Synthesizer V Studio 2 Pro の使い方がわかる【完全ガイド】 by SLEEP FREAKS このパラメータの調整は正隆さん自らが行っていたようです。動画を見ていただくとわかりますが、AIの支援を受けるとは言え、人間が行うかなり緻密な操作です。また、どのパラメータをどう調整すれば、生成される歌声にどういう影響が出るかは人間が経験して憶えていくしかありません。12曲分この操作を行われたとすると相当な労力だと思います。11月8日のニッポン放送の特集および11月21日放送のANN GOLDによるとVを使った最初の曲は24年7月に発表された「LET’S GET IT STARTED !」でこの曲の制作の頃はまだ歌詞とメロディをベタ打ちしていたそうです。正隆さんも「まだVの扱いが初心者レベルだった」とか。 |

|
2025年11月6日放送の「NHK MUSIC SPECIAL」によるとVが作る歌声の表現力には限界があったため、途中からユーミンが実際に歌う歌声をソースにするようになったそうです。23年11月に公開されたSynthesizer V Studio 1.11にはボーカルをMIDIに変換する機能が加わっており、これを利用し、リアルユーミンの歌声をMIDI化し、これをAIユーミンに与えて歌声を生成させることにしたそうです。上図はCopilot (AI Chat)の情報を元にしているため、本当にこんなにたくさんの情報をMIDIに乗せられるのかは分かりませんが、標準的なマウスとキーで歌詞やメロディを入力するのではなく、実際の歌声を入力するようにしたそうです。NHKの特集ではこのリアルユーミンをソースとした生成ボーカルを「第3のユーミン」と呼んでいました。一番最後に、一番こなれた頃に制作されたのが2曲目の「Cinnamon」だそうです。 |
提供メディアと聴き比べ

CT: カセットテープ、BD: 初回盤ブルーレイディスク、DA: Dolby Atmon / Inv: 逆相処理、TD: トラックダウン処理
※ 上図は管理人の想像で、実際にこういう作業が行われたかどうかはわかりません。
今回もけっこうなメディア数で提供されていますので、下記のように聴き比べしたいと思います。
聴き比べ1
2chものをヘッドホンで聴き比べします。
ただし、@〜CおよびGは、聴いたところ同じプリマスターから分岐している可能性が高いため、同じものとします。
またDTS HD5.1chを2.0ch化したものとDolby Atmos 2.0chも聴き比べします。
聴き比べ2
JKは空間オーディオで5.0chのマルチスピーカーシステムで聴き比べします。
※は@と[Fの逆相]をミックスして、ヴォーカルのみの音源を作って聴いてみたいと思います。