ボーカロイド・生成AI・ポストパンデミック――北出栞『「世界の終わり」を紡ぐあなたへ』刊行記念イベント@DOMMUNE 第1部
北出栞 + 柴那典 + 宇川直宏
本記事は2024年5月にDOMMUNEで配信された、北出栞『「世界の終わり」を紡ぐあなたへ――デジタルテクノロジーと「切なさ」の編集術』 刊行記念イベントの音声を書き起こし、再構成を加えたものです(DOMMUNE許諾済)。第1部は、音楽ジャーナリストの柴那典さんとDOMMUNE主宰の宇川直宏さんを迎え、ボーカロイド、生成AI、ポストパンデミックなどの話題をめぐって議論が広がりました。同書をすでに読まれた方も、これからお読みになるという方も、ぜひお楽しみください。
ボーカロイドは「文化」になった
今回のイベントのホストの北出栞です。『「世界の終わり」を紡ぐあなたへ――デジタルテクノロジーと「切なさ」の編集術」という本を、4月に太田出版から刊行させていただきました。
この本は、〈セカイ系〉というキーワードでいろいろな文化事象を取り扱ったものになっておりまして。この言葉自体は、20年前に『新世紀エヴァンゲリオン』や新海誠作品に対して言われたもので、「化石」的な言葉ではあるんですけど、当時、インターネットやパソコンが出てきたばかりの時にネットコミュニティの中から生まれてきた背景があり、新海さんの『ほしのこえ』もそういうテクノロジーの恩恵を受けて個人制作された作品だったし、しかもその内容というのも、宇宙空間でガラケーのメールでやり取りをするといったもので、新しいテクノロジーによって「どこか遠く=世界」につながるみたいな感覚が希望的に表れたものだとする整理ができると思ったんですね。
そして、パソコンやガラケーを使って「世界」にアクセスする、当時の「届きそうで届かない」という感覚を「切なさ」という言葉で置き換え、現代の高速で「つながりすぎる」デジタル環境、ソーシャルメディアやスマートフォンが全盛の時代において、同じような感覚を取り戻すことは可能なのだろうか、という話をしている本になります。
柴さんは、ちょうど10年前に『初音ミクはなぜ世界を変えたのか?』という本を、同じ版元の太田出版さんから出されたんですよね。自分は世代的に米津玄師さんとかと近いんですが、彼らも通ってきたBUMP OF CHICKENなどの日本語ロックの文脈を踏まえつつ、ボーカロイドで自己表現する人たちが出てきている中で、それをどう音楽的な歴史の中に位置づけられるのかという本で。今でも初音ミク、ボーカロイドというものを音楽的に語るなら必読の、ずっと読み継がれている本ですね。こういう本を書きたいと思って、今回の本を書いた部分もある。なので、感想を直接お伺いできるのをとても嬉しく思っております。

柴那典『初音ミクはなぜ世界を変えたのか?』
よろしくお願いします。どこから話しましょうか?
柴さんは献本を差し上げた際、いわゆるY2Kとかの話も含めて、これはある種の感性論なんだとおっしゃってくださいましたよね。
そうですね。献本をいただいて、「〈セカイ系〉がひとつのテーマでありながら、過度に内面的な論調ではない」とツイッターに投稿しました。〈セカイ系〉について語ったものって、どうしても作品論として、過剰に思い入れの強いものとか、逆に批判的なものとかが多かったと思うんですけど、そうではなく非常にメディア論的なアプローチで書かれているなと。ソーシャルメディア以降の時代、常時接続を強いられる、まずは自分のアカウントとハンドルネームを設定しないと存在できないという時代になってしまったときに、どうしたら非接続でいられるのかみたいな問いとして〈セカイ系〉を再設定している感じがした。そこがすごく面白かったです。
デジタルデトックス的な、とりあえずスマホの電源を切れとか、それじゃ全然解決にならないと思うんですよね。ソーシャルメディアもスマホも、すでにインフラとして生活に浸透しているし、その上でどう切断された場所を確保するかという議論が必要だと思っていて。そのためには、たとえ建前であれネットワークから切り離されたものとして扱うことができる、作品という枠組みに注目するのが良いと思ったんです。
〈セカイ系〉の始祖とされるような新海さんや庵野さんは、今なおトップランナーとして若い人に向けた作品を作り続けているし、その影響を受けた若い世代や、海外の作家も出てきている。「非接続」的な感性は、作品という形では連綿と息づいている気がしたし、そういう感性のカタログを作りたいという気持ちがあったんですよね。
その中でも、孤独な場所を確保しながら自己表現をすることによって、というか、むしろそのことによってグローバルにヒットする例として、今だとボーカロイド音楽があると思うんですね。『プロジェクトセカイ』という今ヒットしているボカロ音楽のリズムゲームには、まさにカタカナで「セカイ」って入ってたりもするし。
柴さんは初音ミクの本を出されてからもずっとシーンを見られてきて、米津玄師さんのインタビューとかもずっと担当されているじゃないですか。去年もYOASOBIの「アイドル」の、ものすごい破格のヒットとかもありつつの中で、どういう風にこの10年シーンが変わってきたか、そして今のボーカロイド文化をどのように見ていますか。
10年前にあの本をどういう危機感を持って書いたかというと、やっぱり当時はニコニコ動画から初音ミクを語る論調がほとんどで、アイドルマスター、東方Project、初音ミクという括り方だったんですよね。つまりキャラクター文化としての初音ミク、という。ボカロPの「P」が「アイマス」から来ているというのも含めて、文化的にも非常に密接だった。当時の10代、20代、30代の男性ネットユーザーを中心とした文化コミュニティと密接に関わりのあるものとして捉えられていたわけです。
僕も2007、2008年くらいはそういうものだと思っていたので、初音ミク自体もそんなに初期からガッツリ追っかけていたわけじゃなかった。でも、それこそ今米津玄師として活動してるハチや、2019年に急逝してしまったwowakaとか、DECO*27とか、その辺りのクリエイターが出てきた頃から、ここに鉱脈があると思った。自分は今「邦ロック」という言葉で括られている日本のロックシーンの文脈で仕事をしてきた人間であって、その代表的な存在であるBUMP OF CHICKENやRADWIMPSという存在と確実に繋がる感性がここにはあるのに、自分を含めロッキング・オン周りで仕事してきた人間がボカロのことを無視している。これはまずいぞという危機感があって、あの本を書いたんですね。
で、結果的にいうと、その賭けは当たった。それは米津玄師とかYOASOBIとかが売れてるってことももちろんそうなんだけれども、それ以上に文化として根づいたということで。この前、Adoの国立競技場のライブに行ってきたんですが、彼女はそこで「私が愛した文化」とMCで言っていたんですね。つまり、ボカロ文化で育ち、そのまま誰もが知るスターになる人というのが出てきた。
僕はあの本の最後に、「ブームが終わって、カルチャーが始まる」と書いたんです。当時は「ボカロ衰退論」みたいなことが言われていたんだけど、そんなことはないんだと。ボカロカルチャーの勃興について、サード・サマー・オブ・ラブという言い方をしたんですが、本家のサマー・オブ・ラブが67、68年に始まって、70年代に終わるように、サード・サマー・オブ・ラブたるボカロの勃興期のブームも一旦終わるかもしれませんが、サマー・オブ・ラブのあとにロックがカルチャーとして花開いたように、ボカロカルチャーもその後10年で花開くでしょうと。
そして、それから10年経った今、Adoは今20代前半で、国立競技場のライブには、彼女に憧れてる10代くらいの女の子も会場にたくさんいて。こうやって文化が受け継がれていくんだなと。『プロセカ』のユーザー層もめっちゃ若いんですよね。
10代の女子がすごく多いっていう話ですね。
なので、今10代・20代のボカロカルチャーを楽しんでいる人たちが「これは文化なのである」という自己認識をしながら楽しんでいる、その始まりを記録することができた、それが僕の本が寄与した一番大きなことかもしれないなと。
生成AI・XR・ボーカロイド/IP化する音楽のゆくえ
僕は柴さんの本が出た当時、最高齢のボカロPと言われていた冨田勲先生と一緒に『イーハトーブ交響曲』というプロジェクトに関わっていたんです。コンセプト段階からご相談を受け参加し、パッケージデザイン、番組プログラム制作、ライヴ配信まで担当していました。
冨田先生は、当時、日本で唯一モーグ・シンセサイザーを個人で購入した音楽家です。ロバート・モーグから海外通販で購入して、日本に持ち込もうとしたんですけど、兵器だと思われて税関で止められたという逸話があります(笑)。
さて、そんな風に苦労して買ったはいいものの、手に負えない。綿密なマニュアルもないし、どうやって音楽を構築していけばいいのかまるきりわからず、あれこれ実験している間に、「あれ、これ人間の声に似てるぞ」と感じた音が出力されたらしいんですね。そうして探求していくうちに「もしかしたら、シンセサイザーに喋らせ、歌わせることができるんじゃないか」と閃いたと。そうして生み出されたのが『月の光』(1974)や『展覧会の絵』(1975)という作品で、後者はニューマスタリング版のジャケットを僕が担当しました。
「機械的な声」ということで当時流行ったのは、肉声に楽器の音を合成し、和音で喋っているように加工するヴォコーダーというもので、もともとは軍事用に開発された音声通信の圧縮技術です。たとえば冨田先生の探求と同時代にはクラフトワークの『アウトバーン』(1974)や『放射能』(1975)などのアルバム、後にはYMOの『テクノポリス』(1979)などに使われていた。
それに対して冨田先生のアプローチというのは、生身の身体を介さずに、機械から発せられたボイスに、いかに擬似的に温かい生命を吹き込むかというものだったわけです。そのとき冨田先生の脳内でイメージされていたのは、初音ミクみたいな存在だったと後にご本人から聞きました。結局出力できたのは「パピプペポ」の音だけで、16歳の初音ミクとは対照的な「パピプペ親父」という通称で呼ばれていましたが(笑)。そのパピプペ親父がロケット運転士や管制官の声として合成され、元祖ボーカロイドとして活躍しまくるのが『惑星』(1976)です。
そもそも楽器というのは、すべて身体の動きと連動したものとして鳴らされて、享受されてきたわけですが、シンセサイザーの登場によって「非身体的な音楽」というものが始まった。それでも最後に声が残ったわけですが、声すらも非身体的なものとして合成できるというのが、テクノロジーとしてのボーカロイドの何より画期的なところだったと。
その通りですね。ただ、世界最古の電子楽器とされているテルミンからしても、開発当初から「声に似ている」と言われていたんです。だからさまざまな代表的な歌曲を電子楽器に「歌わせよう」という発想は、その始まりからたくさん試されてきたと言えます。ちなみにコーネリアスも、ワールドツアーでテルミンを使っていて、観客席から演奏者を募りステージに登らせて、エルヴィス・プレスリーの「Love Me Tender」を手振りで「歌ってもらう」パフォーマンスをしていますね。これは大変身体的な「唱法」なわけです。
そう考えると、電子楽器の歴史のある側面は、「声に似てしまう」電子音というものを、どうコンテンポラリーミュージックとして扱っていくのかというトライアルの連続とも言えるんですよ。人類が新しい電子楽器を手にするたびに、声という「生楽器」が都度注目されて加工されたり、もしくは、さも演奏に生身の身体が関わっているかのような錯覚をエンターテイメントとして提供する歴史を脈々と重ねてきた。テルミン、ボコーダー、トーキングモジュレーター、シンセサイザー、サンプラー……だからこそ、僕たちは初音ミクに驚愕したわけです。しかもそれが後には視覚的にも、ホログラフィックなバーチャルリアリティ空間を、裸眼で体験できるようなARのステージングとして結実する。
自分の本の中では、初音ミクの視覚文化における特異性を示すものとして、2008年『ユリイカ』初音ミク特集号で中田健太郎さんという方が提唱していた「セカイ系的主体」という概念を紹介しました。
〈セカイ系〉は批評的な文脈では、ラカンのいわゆる「想像界・象徴界・現実界」のモデルになぞらえられることが多くて、象徴界=言語的な秩序で満たされた世界=社会領域の記述が抜け落ちているのが特徴だと。ラカンは一方で「声」というものを現実界、つまりイメージ(想像界)でも言語(象徴界)でも捉えきれない、どこか恐ろしげな場所から響いてくるものとして位置づけていて、人間は「声そのもの」を享受することに耐えられないから、必ずその出どころとしての身体イメージを必要とすると言っている。そういうものとして、言わば事後的に見出されるのが、「初音ミク」と言われて僕らが想像する、あの緑髪ツインテールのイメージなんじゃないか。それは人間とも単なる人工のキャラクターとも異なる、新しい主体のモデルなんじゃないか、という話です。

『ユリイカ』2008年12月臨時増刊号 総特集=初音ミク ネットに舞い降りた天使
去年、16歳で生まれた初音ミクが、16周年を迎えましたよね。その祝辞をクリプトンさんに依頼されて、僕は次のようなメッセージを送りました。ちなみに先に補足しておくと、以下で初音ミクに「ちゃん」付けしている理由は、先方の擬人化された物語にノリ良く答えているだけで、日常で「ちゃん」付けしたことは一度もないです(笑)。
ミクちゃんがこれまで展開してきた、無数のオルタナティヴな自己の拡張/拡散は、XR(クロス・リアリティ)的感性が求められるポストパンデミック期に差し掛かり、やっと今、時代の側が追いついてきたと言えるでしょう!!!! そしてアイデンティティーの境界線を極限まで溶かし、解放し果てても、ミクちゃんの“声”という圧倒的な存在感は、今もヴォーカロイドとしての自己同一性を伴って輝き続けています。そう、初音ミクこそが受肉オーソリティーであることに誰も異論はないと思います!!!!!!! あの人もこの人もあの動物もあの存在もあの霊体すらも初音ミクであり得るし、ミクチャならば同一性だけではなく、同二、同三、同十六、同七十八億二千万三百二十七万二百十八性ですら成立させる事が可能でしょう!!!!!!!!! ミクちゃんの益々のご発展と無限の拡散をお祈り申し上げます。改めまして、16歳のお誕生日おめでとうございます!!!!!!!!!!!!!!!!
僕はここで書いた「同一性」の拡張と、それを取り巻くユーザーの幻想が、初音ミクの最大の存在意義だと思っているんですよ。先日、OpenAIがSoraという生成AIを発表しましたよね。ユーザーのプロンプトに応じて最大1分間のビデオを生成する。この映像を観てください。Soraを使って、4分間のミュージッククリップを作ったものです。
この映像の何が重要かと言ったら、誰にも現場で演技指導なんてしてないんですよ。でもたくさんの人間っぽく生成された登場人物が、存在すらしない空間でプロンプトに従って「演技」している。Soraは最大1分の映像しか生成できないわけだから、実際には切れ目があるにも関わらず、物語を紡げるぐらいの登場人物の同一性、アイデンティティが4分の映像を通じて一貫し、醸し出されている。この「生成において、アイデンティティを一貫させる」ということが、これまでのAIではなかなかできなかったことなんですよね。
これを初音ミクの話題につなげて考えるならば、誰の曲においても初音ミクは初音ミクだ、という自己同一性を拡張させながら保っている。他者が初音ミクをイメージして初音ミクに何かを歌わせようとしても、初音ミクという存在そのものはそこから漂白されずにあり続けるということと、尺的な制約のある生成動画の連なりが、登場人物のアイデンティティを保持したままその世界観を広げ、進行する映像=物語を成立させてしまうことって、僕は近しいことだと思うんですよ。
ちょうど「ちゃん」付けの話がありましたが、僕はそういう物語にどうしてもノリよく応えられず、頑なに抵抗しようとしてしまうところがあるんですよね(笑)。初音ミク、というかボーカロイドにしても第一義的に無人称的なテクノロジーであり、「誰でもない」ことにその真価があるんじゃないかと思っていて。
本の中で柴さんの本を引用しているんですけど、ちょっと批判的な文脈で引用させていただいているんです。というのもsupercellというユニットで今活躍されてるryoさんという方が「メルト」という楽曲を出して、その「メルト」から歌ってみたとかいろいろ出てきて、関連曲がニコニコ動画のランキングを席巻したという「メルトショック」と言われる事件が2008年にあったんですね。
このことを柴さんはryoさんみたいな人が出てきて、初音ミクという「道具」を使う作家的な人が現れてきた、つまり「初音ミク」という名前よりも「ryo」という名前のほうが「キャラが立った」ということのメルクマールとして位置づけているんですけど、ryoさん本人は後年「メルト」について、この曲の主人公は初音ミクですらない、恋する匿名の女の子なんだけど、初音ミクを使うことによってそういう「自分ではない何者か」になれるというところにボーカロイドの魅力を感じると言っていて。そうした「自分ではない何者かになれる」イメージを持つということが、誰もがアカウントを持って喋らなきゃいけない時代に対するカウンターになるんじゃないかと僕は思うんです。
だからさっきのような映像を観たときにも、「人間の同一性が保たれていてすごい」という感想にはならないんです。それよりも、人間だったらブレーキをかけてしまうような、本当に人間のかたちがぐずぐずにメルトして(溶けて)しまうみたいな表現がAIから出てきたときに、怖さとともにすごいと感じるんだろうなと思いますね。
僕としては宇川さんの話と北出さんの話、どちらもわかるというか。若林恵さんとtofubeatsさんがローリングストーン誌の対談で、「音楽がIP化している」って話をしていたんです。Perfumeぐらいまでの時代の人たちはアーティストと呼ばれていたけど、YOASOBIってIPなんじゃないかと。確かにコンポーザーのAyaseさんはボカロPをやっていたから、楽曲自体にボーカロイド的な感性が反映されているのは間違いないんだけれども、ソニー・ミュージックという企業の「小説を音楽にする」プロジェクトありきで始まったユニットだし、非常にしっくりくる見立てだなと思ったんですね。
でもしっくりくると同時に、いや待てよと。音楽がIPになってるのではなく、人間がIPになってるんじゃないか。そう連想が広がったんですね。
例えば今のツイッターにインプレゾンビというものがいます。ツイッター、というか「𝕏」が収益化したということは、人々の日々のアルゴリズムによって増幅されるつぶやきや感情というものが、収益になる知的財産、つまりIPであるって見なされたってことなんですよね。そもそも、2017年にTikTokが出現して以降の今のソーシャルメディアというのは、mixiやFacebookなどのソーシャルなつながりを可視化させるためのツールではなく、アルゴリズムにおすすめされたものを見ている、アルゴリズムメディアだと思うんですよ。
そして、生成AIはこの傾向を加速させると僕は思うんです。北出さんはポスト・ボカロ時代の表現として、映像と音楽がソフトウェア上で等価に扱われるものとしてのミュージックビデオをひとつのモデルとして提示していますが、これから先は誰もがそういうマルチモーダル(共感覚)的な生成AIを、ツールとして使えるようになっていく。そうすると、マルチモーダル化した人間がIP化していき、それが小銭を稼ぎ、世にインプレゾンビがはびこるみたいな、本当に地獄のようなディストピアが広がっていく可能性がある。
個人的には、こういう状況を「わくわくディストピア」と名付けて楽しんでしまう性質なのですが、こういう時代だからこそ、自ら疎外と孤独を自ら選ぶことの愉悦も際立つと思うんですね。クリエイターという言葉、またそれが指す人間というのは、本来そうした愉悦を手放さない側の人間だと思うので、そういう意味でAIを用いたクリエイションがどういう形で広がっていくかは気になっています。
ポストパンデミックの静寂から始まる文化史
宇川さんからポストパンデミックという単語が出ましたが、北出さんの本も、まさにパンデミック期の描写から始まるんですよね。どこか安らぎをもたらすものだったと。確かに最初の緊急事態宣言が出た2020年4月頃って、世の中的にもすごい閉塞感と挫折感があって、いろいろ大変な時期だったのは間違いない。でも、たとえば今日も渋谷のスクランブル交差点を渡ってパルコまで歩いてきたわけですが、活気が戻ってきたなと感じる一方で、どこか落ち着かない感じもする。漢字で書かれる大文字の「世界」から切り離された、カタカナの「セカイ」に自らの意思で自分を置くことができたのがあの時期だったのかなという感覚は、自分にも理解できるところがあります。
あの時期、たまにマスクをつけて散歩したりすると、鳥は地上の混乱とか関係なく空を飛んでいて。しかも車も少なくなったから、空気も澄んでいて。そんな世界に静けさがあるという感覚、常時接続で騒がしい時代だったのがほんのひととき静かになった、そのイメージから語り始めたいなという気持ちがあって。
パンデミックを「静寂」として捉えるという話で、印象に残っているトピックがあって。あるサンフランシスコのベイエリアの鳥類生態学者のレポートによると、パンデミックの数年間で、ロックダウンが実施された都市において、そこに生息していたさまざまな鳥たちの逢引の声、さえずり、対話が拡張されたというんです。元々は美しく情報量の多い声を持っていたのが、パンデミック以前には騒音に負けないようにと、ボリュームを大きく叫ぶしかコミュニケーションの方法がなくなっていた。それがパンデミックの間に、潜んでいた中域の、魅力的なバイブレーションが復活したというんですよ。しかもかなり小さいヴォリュームで情報量の多い、そして解像度の高い周波数を自己合成し、遠方へ伝達できるようになった。
そして面白いことに、配信というキーワードが再注目されたのもコロナ禍なんですよね。これは当事者として実感したことで、当時全国から「DOMMUNEのシステムを教えてください」って連絡が来たんです。DOMMUNEって、ライヴ配信のパイオニアみたいな存在として、2010年のSNS元年からもう14年やり続けているわけじゃないですか。もちろん隠すものでもないから、実際の機材リストと配線図をPDFにして、全国のライヴハウスやクラブに向けてアップしました。高解像度のパフォーマンスをスイッチングし、遠隔でもソーシャルストリーミングの魔術を使ってメッセージを伝え、マネタイズするということが可能になった。つまり鳥たちと同じく音声の飛距離がコロナ禍で圧倒的に伸びた、ということです。
一方で、新型コロナのパンデミック期においてはペストやコレラやスペイン風邪の時代とは違い、ソーシャルメディアで国境を超え繋がった時代のソーシャルディスタンシングだったので、亡くなった人へのRIPの言葉も高い解像度、情報量で可視化されましたよね。ソーシャルメディア以降、人々の呪いや怒りが可視化され、増幅されたと言われますが、こんなにも呪いと祈り、両方の声が溢れた時代ってかつてなくて……僕はそれ自体には一長一短あり、良いとも悪いとも言うべきではないと思っていて、純粋に驚異を持って捉えるべきだと感じています。北出さんのこの本の言葉で語るなら、コロナ禍では高解像度でしっかり「届き」「つながった」と言えるでしょう。
つまり何が言いたいかというと、「声」の新たな合成と拡張が、リアルな生態系とオンラインで同時期に起こった。ポストパンデミック時代を、人類がそんな驚異を体験した後の時代として捉えると、新たなボーカロイド文化史=音声合成技術文化史を描くこともできるんじゃないかと。なぜならその後に、生成AIが創作の歴史に絡んでくる時代を僕らは受け入れることになったわけですから。
僕なりに北出さんの本、そしてそこから広がった今日の話をまとめると、呪いが満ちている時代に、祈るにはどうすればいいのかという話だったんだと思います。祈るということは本当に重要なことで、それは表現に結びつく。祈るときには他者は必要ない、孤独に潜らざるを得ないというときに、今、デジタルテクノロジーをパートナーに選ぶことによって、人は新たな形で祈ることができるようになっているんだろうなと、そう感じました。