イントロ
生成AIで「作曲」とか、全自動でやってて何が作曲だよ?
人の手が加わるって、どうせプロンプト入れて生成ボタン押すだけだから誰でもできるんだろ?
そんなもん作曲でもなんでもねーだろ!なめてんのか!
って、よく目にする「AI作曲」への批判です。正しいものの見方です(笑)。
「作品」とは?
適当にジャンルや雰囲気を表す簡単な言葉を入れてポンと出た生成物は、いわば「河原で拾ってきた、なんだか色艶がいい感じの小石」です。
ポンと出たものの中には、当然気に入ってしまうものがでてきます。気に入った小石を拾いたくなるのが人情です。子どもなら思わず友達に見せびらかしたりもしますよね。
でも、拾ってきてコレクションするだけならともかく、それを「見て、ぼくの作品だよ!」って言い出すなら、そりゃあ「何を言ってるのかわからねー」となりますよね。
そこでぼくは考えました。
どうやったら「ただの拾った小石」を自分の作品として提示できるだろう?
現実の小石ならいくらでもやり方はあるでしょう。
いい感じに削っていって、なにかの形に仕上げてしまえば、それは彫刻です。
削らずに形はそのままで、いい感じに色を塗って模様を描いていけば、立派なストーンアートです。
AI音楽のつくりかた
Suno(スーノ)との出会い
音楽のための生成AI、ぼくは初めにSunoというサービスを使い始めました。Sunoに限らず、この手のものはプロンプトや歌詞を入れて指示するだけでとりあえず「曲」が生成されます。
そしてそれ以外にも「Cover」や「Extend」など、生成物を「加工」するための機能も用意されています。はじめのうちはあえて使いませんでしたが、音声ファイルをAIに読み込ませて加工するための「Upload」機能もあります。読み込んだ音をプロンプトの「指示」も踏まえてAIが再解釈して出力してくれます。
拾っただけの小石を自分のものにするためには、これらの機能を無理矢理にでも駆使しなきゃだめだろうな、とその時は考えました。

オリジナルソングコンテスト受賞インタビューでも少しお話しましたが、ぼくはまずCoverを重ねることを思いつきました。
昔、今はなき福岡の「SYZYGY(サイジジー)」というレーベルに所属する「Tanzmuzik(タンツムジーク)」というテクノの伝説的な二人組のアーティストユニットがいて、そのメンバーの一人である「サワキオキヒデ」という方が雑誌のインタビューで語っていたことを思い出したんです。ソロアルバム「A Boy In Picca Season」のリリースの時だったはずです。
ところで、よろしければ、このコラムはその名盤を聴きながら読んでいただければうれしいです。
「A Boy In Picca Season」1996年初出。
阪神淡路大震災の翌年です。ずいぶんと時間が過ぎました。
過去に戻って拾った石
たしかオキヒデさんは、とにかく「リサンプリング」を多用して、多重録音も駆使して音を重ねまくって作っている、というようなことを述べられていたと記憶しています。一度サンプリングしたものを加工して、それをテープに録ったらまたそれをサンプリング(リサンプリング)、の繰り返しで音を作るというような内容だったと思います。はた織りみたいですね。
で、時を経て、ぼくも思ったんです。SunoもCoverを使えばできるじゃないか、と。
もちろん厳密にはサンプリングとは違う処理ですが、Cover機能のミソは、Coverの元となる曲の「音楽性」を保ったままプロンプトの抜き差しや歌詞の編集などによって別の形に「加工」ができるということです。それを繰り返していけば、と思い立ちました。
Sunoの仕様上、プロンプトには文字数制限があって、ぼくが始めた2024年9月当時はまだ128文字程度しか入力できませんでした。今は200文字です(ちなみに歌詞は3000文字)。しかも128文字ぎっちり記述したからといって、それらを全てAIがいい感じで読み取ってくれるとも限らないんです。
しかし、さっきの方法なら、いわば「原曲そのものをひとつのプロンプトとしてAIが処理」してくれている。最初に色々と実験的にいじっていてそんな感触がありました。
つまり、自分が一番大事にしたい「音楽性」を含む曲をとにかくまず最初に生成できれば、それをベースにしながらどんどん形を変えていける。形が変わっても最初の音楽性を殺さずに、少しずつ要素を足しながら、自分の作品として、自分がちゃんと手を入れた、意思を刻み込んだ作品として提示できるんじゃないか?と考えました。
また「ポン出し」なら求める曲にたどり着ける確率は限りなく低くなりますが、このやり方を踏めば、少しずつその「確率変動の幅」を狭めていきながら求める方向へ誘導していくことができ、最終的には辿り着きたかった地点にそれなりの精度で到着できるだろう、と。
今では「コアプロンプト + 表層プロンプト1 + 表層プロンプト2 + …」といったように構造化しながらステップを踏むやり方で固めてきていますが、その時はとにかく思いついたことをそのまま色々試したり、なかなか行き当たりばったりでもありました。
実例紹介
ぼくがSunoを始めて最初に真面目に取り組んだ曲、「Narcissus」を例にとります。
取り掛かった時は、ドラムンベースを基調として、でもそこまでゴリゴリのドラムンベースじゃなく、「美しいポップス」にしたいな、と思いました。
そんな感じで、出したい音楽的な要素は頭の中にある程度あったので、何をベースにするかを考えて書いたプロンプト、そしてそこから100以上は生成した中から「最初の分岐点」として選んだのがこの素材です。
この時のプロンプトはまだ先に少し触れた「構造化」をする前の書き方で、最初の工程のものを含む各分岐点のプロンプトには、今のやり方での「コアプロンプト」の一部が含まれます。
次に、ここにぼくの「求める響き」を落とし込みたかったので、次の要素のプロンプトを入れつつまた100、200とCoverして、求めるものに近い素材が出てきた時点でそれを次の分岐点とします。
そこにさらに最後の要素を加えて、何度かキーワードの抜き差しなどを経て「これだ!」というものが出るようになると、何度生成ボタンを押しても、ある程度自分の望んでいる方向のものしか出てこなくなります。
ここまできたなら、即興フレーズも入れたい、AIに即興を入れてほしい、わかりやすく人間的な要素をAIに出してほしい、そう思い始めてプロンプトを色々と組み替えて、最終的に「作品」としてドローアウトしたものがこれです。
ぼくはAIで音楽を完成させること、あるいはそこまでの過程のことをドローアウトと呼んでいます。Sunoの公式ドキュメントにもある表現 (drawing out)です。
この曲では工程を三つ踏みましたが、これ以降の作品では六段、七段と踏んでいるものもあります。工程が進んで結局途中で放棄した作品はそれなりにありますし、完成したものもそこに辿り着くまでに、多い時で800近くの曲を捨てた上で成り立っていることになります。
人間だもの
こんな話にたいして需要もあるはずがないのに、ぼくがこれを書いたのには理由がいくつかあります。
ひとつめは、アバネコことFukuoka Digital編集長(?)から、書いてみらんね!と要請があったからです。
ふたつめは、受賞インタビューの際にAI時代を踏まえたSF談義が花開いてしまい、活動や作品作りなどについてあまりお話できなかったからです(笑)。
みっつめは、「人はバイアスから逃れられない生き物」だからです。
だから広告代理店なんて商売も成り立つわけです。
人間は、目の前にあるものの価値を判断するときに、誰かが良いと言っているものを良いものだと思い込みます。その「誰か」に権威があればなおさらです。
目の前にある美しくておいしいケーキは、フランス帰りのパティシエが真心と丹精を込めてこしらえました、と言われると、もっとおいしくなります。
ぼくはこうした人間の性質、認知バイアスを批判的に捉えてはいます。しかし同時に、それは人間が生物として生き残っていく確率を高めるために発達させてきた重要な心理機能であることも理解しています。
だからぼくは、それを最大限利用して、こう述べなければなりません。
他の連中のことは知らないが、おれのAI音楽は手間がかかっている。
どの作品もそれぞれ、様々なアイディアをじぶんなりに慎重に試しながら、やっと辿り着いた一作だ。
曲そのものを作る処理をしているのは、たしかにAIに違いない。
しかしそれは、おれが自分の意志を最大限AIに伝え、理解してもらった上で実行されている。
どの曲にも、間違いなくおれの意思が刻み込まれている。
それは間違いなくおれの音楽であり、おれの作品だと断じる。
多重録音という言葉を知っているか?
アンプラグドで何かを形にしたことがあるのか?
DAWを使っておいて「お手製の曲」だって?
AI作曲を、なめるな。
そして、このぼくのAI音楽活動のテーマでもあり、「自称音楽家」としてのポリシーを示す言葉を置いておきます。
これが全てです。
今後とも、よろしく。
魂などというものはどこにも存在せず、また何ものにも宿りはしない。
それは我々の知性と呼ぶべきものが、目の前に見出してしまうものでしかない。
魂に価値はなく、魂を見出してしまう我々の存在にこそ、意味と価値があるのだ。
おまけ
最後に、お口直しとして、当レーベルが抱える仮想三人組アイドルユニットプロジェクト「ユメ・ミライ・オシレイション」の「空の向こうに(English Build)」をどうぞ!