リリースされた曲は一つのステレオミックスで、すべての楽器と声が2チャンネルに混ざっています。音源分離はこれを逆向きにたどります。AIを使って各パートを推定し、ミックスをステムと呼ばれる個別のトラックに分けるのです。曲がステムに分かれると、ボーカルをミュートして伴奏を作ったり、ギターをソロにしてリフを覚えたり、パートのバランスを好みに合わせて整えたりできます。本記事では、ステムとは何か、分離はどう行われるのか、そしてなぜ練習に重要なのかを解説します。
ステムとは具体的に何か
ステムとは、曲を構成する一つの分離された要素です。リードボーカル、ドラム、ベース、あるいは残りの楽器をひとまとめにしたもの。これらのステムを合わせると元のミックスに戻ります。曲をステムに分けるからこそ、ボーカルを消したり、特定の楽器一つだけを上げたりできるのです。
AIがミックスを分離する仕組み
分離モデルは、各パートがわかっている多数の曲で学習されます。声や楽器のスペクトル上の指紋を学び、一度も聴いたことのないミックスから各パートを推定します。結果は完璧な再録音ではありませんが、ほぼすべての曲で練習に使えるほどクリーンです。
分離が練習に役立つ理由
ボーカルをミュートすれば歌い手はクリーンな伴奏を得られ、ギターをソロにすれば演奏者はなぞるべき正確な音を得られます。分離は、区間ループ、同期歌詞やタブ、録音の聴き比べを可能にする土台です。これらの機能はいずれも、まずパートを分けることが必要だからです。