この動画は、AIによるメディア生成、特に音楽・画像・動画生成に対する制作者としての複雑な感情を率直に語るものである。コーディング支援AIと異なり、現在のメディア生成AIは既存のプロフェッショナルツールを補完するのではなく、完全に置き換えようとしている点が問題だと指摘する。音楽制作やグラフィックデザインの現場を理解しないテック企業が、創作の本質を無視して「誰でもクリエイターになれる」という幻想を売り込んでいる現状を批判的に分析している。真の創作支援とは、既存のツールボックス内で面倒な作業を効率化することであり、創作プロセス全体を自動化することではないという主張が展開される。音楽業界の経済構造や著作権問題、そして本当に有益なAIツールのあり方について、制作者の視点から深く掘り下げた内容となっている。

AIメディア生成への複雑な感情
この時点で、皆さんの多くは私がAI関連の様々な話題を取り上げていることで知っているでしょう。特に数日前に公開したNano Banana 2の動画の後ではそうだと思います。おそらく皆さんは、私がこのAI関連のすべてに全力で取り組んでいて、すべてをAIで置き換えたいと思っていると考えているでしょう。
それは真実ではないだけでなく、実際には私が本当にあまり共感できないAIのタイプがいくつかあります。特にメディア生成です。でも待ってください、あなたはNano Banana Proを本当に気に入っていたのではないですか?自分のサービスで販売しているのではないですか?こう言うことで超偽善的な人間になっているのではないですか?私の話を聞いてほしいのです。これについて本当にたくさんの思いがあるからです。
皆さんのほとんどは、私をコードで知っているでしょうが、それだけが私の学位ではありません。実は私は音楽に本当に本当に夢中なんです。人生ずっとそうでした。私はオーディオエンジニアリングの学位を持っていて、これは私が深く関心を持っていることなんです。音楽をやっている友人がたくさんいて、テック業界の友人とほぼ同じくらいいます。そして私はこれらの空間の間で多くの時間を過ごしています。だからこそ、AI音楽ジェネレーターであるSunoの評価額を見て深く傷つきました。
年間で30億ドルを超えるのがやっとの業界で24億5000万ドルの評価額は狂っています。この会社は音楽業界の10分の1もの価値があるんです。私はこのことについてTwitterで議論になっています。なぜなら、これは私が深く関心を持っていることだからです。そしてそれは音楽生成だけではありません。画像生成、動画生成、そして現在メディア関連のすべてを行おうとする試みにも同様の問題があります。
そしてそのどれも本当に実行可能で価値があるとは感じられません。ここでの私の感情には多くの層があり、正直言ってかなり複雑です。アートの世界でお金がどのように動くのか、そもそも創造がどのように起こるのかについて、ここで言いたいことがたくさんあります。でも悲しいことに、アートについて語ることは、アートを作ることよりも稼げない唯一のことです。だから今日のスポンサーのために少し休憩する必要があります。
これまでになく、想像できる最高のUIを作ることが簡単になりました。問題は、どうやってそれを想像するのかということです。十分な創造性がなかったり、良いデザインを作る経験がなかったりすると、正しく仕上げるのは本当に難しいです。ありがたいことに、私たちが参考にできるアプリや画面、ソフトウェアが何百万も既に作られています。
でも、インスピレーションを得るために適切なものをどうやって見つけるのでしょうか?構築しているもののモックとして使う最高のスクリーンショットを見つけようとしてGoogle画像を検索するのは本当に面倒です。今日のスポンサーであるMobinを使わない限りは。彼らは実世界のインスピレーションを得るための最高の情報源です。最近私のUIが良く見えるようになったことに気づいたなら、それはほぼ彼らのおかげです。
新しいモデルがより良いデザインになっているのも助けになっていますが、Mobinの方がはるかに大きく貢献しています。彼らが最初にスポンサーシップについて連絡してきたとき、私は興味を持ちました。それでサインアップしました。そして彼らとの最初の広告は、それがどれほど便利かに純粋に感動した私の反応です。今では、UIを構築するときにほぼいつもこれを使っています。特にiOSで、でもウェブプロジェクトでもです。
例えば、見栄えの良いログイン画面を作りたいとしましょう。ファブリックやアデラインなど、他の関連性のある参考資料を見ることができます。ビジネスウェブサイト用のものなど、カテゴリーに特化したものが欲しいとしましょう。ここにはDubsのサインインページ、Clickup、Intercomなどがあります。
ログインページではなく、コメントセクションが欲しいとしましょう。ここにいくつかのビジネス向けコメントセクションがあります。これは本当に便利です。なぜなら、コメントはビジネスの世界では、YouTubeやTwitterなどとは全く異なる意味を持つからです。そしてここでTrelloでコメントがどのように表示されるかを正確に見ることができます。
これを使いたい場合は、画像を保存するか、コピーをクリックするか、あなたが使っているOSに応じてControl CまたはCommand Cを押すだけです。あなたがデザイナーなら、おそらくMacを使っているでしょうから、Command Cです。選んだバイブコーディングツールに移動して、Command Vを押し、「これと同じように作って」と言えば完了です。他のデザインからインスピレーションを得るのがこれほど簡単になったことはありません。
バイブコーディングをしようとしているのではなく、単に参考資料を探しているだけであっても、Figmaで日々を過ごしていてインスピレーションを見つけようとしているだけであっても、Mobinは驚くべき価値があります。月額たったの10ドルです。それが私に節約してくれた時間と、私のユーザー体験とUIの品質向上だけでも、それよりはるかに価値があります。
私を信じられないなら、soyv.link/mobinで自分で試してみてください。ここには分解したい層がたくさんあります。異なるタイプの生成があります。特にLLMがあります。それらでテキストを生成する能力があります。エッセイ、記事、その他ここで想像するものすべてです。それらでコードを生成する能力もあります。
特にこの部分は非常に興味深いです。これについては後で戻ります。他のタイプのメディア生成もあります。これが実際に話したいものです。これらのほとんどは拡散ベースですが、背後にある技術について詳しく説明する必要はありません。それはそれほど重要ではありません。
話したいのは、画像生成、音声生成、動画生成です。そして音声生成と言うとき、主に音楽生成を意味していますが、正直なところ、これは対話と音楽の2つのカテゴリーに分けることができます。そして私がこれらが本当にクールだと思い、これらすべてが本当にイタいと思うことが、矛盾していて痛々しく聞こえることは分かっています。特に私が画像生成を使い始めて、それを自分の製品の一部として組み込んでいるときには。でも理由があるんです。そしてそれらをうまく説明できていませんでした。
以前の動画で少し触れました。PewDiePieのAIに関する見解について話していたときです。掘り下げる良い機会でしたが、私がこのように考える理由を表面的にしか説明しませんでした。まだ適切な深堀りはしていません。OatmealもAIアートと彼がそれについてどう感じているかについて素晴らしいコミックを作りました。
アーティストからのAI関連についての最も中立的で合理的な見解の一つだと思います。これを読みたい方のために説明文にリンクを残します。強くお勧めします。OatmealにはAIアートがどのように有用であるかについてのセクションさえあり、これは私にとって非常に有用な移行になります。なぜなら、これが私が話したいことだからです。
私はそれが描画の細かい作業、つまり創造的ではなく管理的に感じられる部分を扱うための強力なツールになり得ると信じています。すべてのアーティストには独自の細かい作業があります。私にとっては背景です。私のコミックのほとんどには背景がありません。だから私はよく空間に浮かぶ青白い塊を描いています。背景を省くことで、私にとって重要な部分、つまりコメディ、楽しさ、ラットコプターに集中できます。
私は自分のコミックでAIを使う予定は全くありませんが、それが漫画制作の創造的に不可欠な側面に集中できるようにする方法は理解できます。それはスペルチェッカーを使うアーティスト版のようなものです。さあ、本題に入りましょう。これは私が掘り下げたい本当に重要な部分です。ほとんどのAIがステロイドを使った自動補完だからというだけでなく、ツールボックスの中のツールであるというこの考えが、これらすべての空間で重要だからです。関連するクリエイターたち。
ミュージシャンであれ、グラフィックアーティスト、画家であれ、ソフトウェアを書く開発者であれ、私たちは皆ツールボックスを持っています。ツールボックスは私たちが使うすべての異なるもので満たされています。それはVS CodeやCursorやVimのような私たちのコードエディターかもしれません。そしてその中にツールがあります。
それは私がこれをデモするために再インストールしたばかりのFL Studioのようなプロダクションソフトウェアかもしれません。すべての動画でFinal Cutを使っているような動画編集スイートかもしれません。それは多くの異なるものである可能性がありますが、あなたのツールボックスは通常、1つの主要なソフトウェアと、その中またはその横にある他のものです。
例えば、一部の開発者はVS Code内のターミナルを使うのが好きです。他の開発者はVS Codeの外にターミナルを持っていて、2つのアプリ間を行き来します。それが私のやり方です。つまり、問題は、これらすべてのために今作られているこれらのAIツールと、私たちが既に使っている既存のプロフェッショナルツールとの関係に帰着します。
AIコードがどのように起こったかについて少し話します。最初の主要なAI開発ツールはCopilotでした。Copilotが最初にどのように機能したかというと、小さな少し愚かなモデルで、エディターで何をしているかを監視し、あなたがちょうどやっていることとファイル内のカーソルがどこにあるかに基づいて自動補完を生成しました。
だからbfs関数を実行するというようなコメントを書くと、関数という単語を入力し始めるとすぐに、あなたが何をしようとしているかを認識して、そのための自動補完を書くことができました。そしてこれは素晴らしかったです。なぜならCopilotが私たちのツールボックスの中に存在していたからです。だから私たちのツールボックスが主にVS Codeで、Copilotという使える新しいAIツールがあるとします。
CopilotはVS Codeの中にあります。それを置き換えようとしているのではありません。再考しようとしているのでもありません。それを補強し、開発者として行う特定の退屈なタスクを簡単にしようとしているのです。そしてこれが定着するにつれて、モデルは良くなり始めました。MicrosoftとOpenAIはCopilotを使う人々からより多くのデータを取得し始めました。
そしてフライホイールが本当に回り始め、その結果、モデルはコードにおいて本当に優れたものになりました。そして今、私たちの既存のツールボックスの外に存在できるツールがますます増えています。Cursorのようなものはまだここに当てはまると私は主張します。それがVS Codeを置き換えているとしても、まだVS Codeに基づいています。しかしそれはまだVS Codeエコシステム全体を持っています。
Cursor、Windsurf、さらには新しいGoogle IDEであるAnti-gravityさえも、すべて同じツールセットのための異なるハーネスです。彼らは私たちのツールボックスを置き換えているのではありません。彼らはその中に同じツールを持ち、いくつかの新しい興味深い部分を加えたツールボックスの新しいフレーバーです。だから今、別のタイムラインを想像したいと思います。Copilotが開発者として見た最初のAIツールではなかったと想像してください。
何か別のものだったと想像してください。Lovableが最初のAI開発ツールだったと想像してください。そしてLovableがコードを見たりGitHubとリンクしたりすることを全く許可しなかったと想像してください。Lovableは私たちがコードを書く方法を補強するツールではないでしょう。Lovableは私たちのツールボックスの代替品になるでしょう。だからVS CodeがLovableをその中に持つか、LovableがVS Codeの新しい代替品でその中に同じものがあるのではなく、Lovableが存在します。
したがって、もう私たちのツールボックスは必要ありません。さて、あなたが本物の開発者なら、これを見て笑うでしょう。特にこれらのモデルが最初どれほど悪かったかを覚えているなら。笑えます。コードを見ずにコードを書ける世界なんてありません。それはただ馬鹿げています。なぜ誰がこれをやりたいと思うでしょうか?さあ、もう一歩進みましょう。
Lovableの作成者が実際には開発者ではなかったとしましょう。Lovableを作った人々が、例えばサッカーか何かが好きな友人として座って、「やあみんな、サッカー関連を管理するためのアプリを作れたらかっこいいね。誰もコーディング方法を知らないのは残念だ。やってみよう」と言ったと想像してください。
ああ、コーディングを学ぶのは難しい。コーディングを学ぶのがもっと簡単だったら、もっとたくさんのコーダーがいるでしょう。それを直すべきだ。そして彼らはLovableを作りに行きました。既存のツール、標準、業界、そしてその分野で成功している人々すべてを拒否して。私たちは皆、そこで何が起こるか予測できると思います。私たちは彼らをからかうでしょう。
開発者はこれを笑うでしょう。なぜソフトウェアについて何も知らないこれらすべての人々が現れて、私たちがやっていることは難しすぎると言い、彼らはそもそもそれを理解していないのに、もっと簡単にするつもりだと言うのでしょうか?私たちは彼らを笑うでしょう。それは馬鹿げているでしょう。もし私があなたに、これがまさにすべてのメディア生成会社がやっていることだと言ったらどうでしょうか?Nano Bananaに携わった人々は、15年間Photoshopを使ってきたわけではありません。Sunoで働いている人々は、人生ずっと音楽の制作、ミキシング、マスタリングをしてきたわけではありません。
そして約束しますが、OpenAIでSoraをやっている人々は、動画編集ソフトを特別によく理解しているわけではありません。だから彼らは私たちのツールボックスを置き換えたいのです。ツールボックスが難しすぎるから捨てるべきだという結論には、それを理解していない限り到達しません。
そしてあなたの目標がツールボックスを置き換えることであるなら、そのツールボックスを全く理解していない可能性が非常に高いです。そしてそれが、これらのものを構築している企業から最も見てきたことです。彼らは私たちがどのように構築するかを理解していません。彼らは私たちがどのように創造するかを理解していません。彼らは私たちがやっていることの詳細と、どのようにそれを行うかを理解していません。
メディア生成を行うときに、これらのものが実際にどのように適用されるかには違いがあります。例えば、私は多くの資産を含むサムネイルを作成します。Oatmealが言ったことと同様に、これらのもののいくつかは退屈で、私はそれらをやるのが好きではありません。私たち全員には独自の細かい作業があります。やりたくないと感じるものです。私にとっての一般的なユースケースは、偽のチャットインターフェースです。
OpenAIとGoogleがSlackでやり取りしているものをサムネイルの一部として使いたいんです。これは私がより大きな創作の一部として欲しい資産です。それはパズルのピースの一つです。VS Code内でLLMを使って作業している何かの一部を生成するのと同じように、GeminiとNano Banana Proを使って、他に作っているものに必要な資産の一部を作成できます。この種のものには本当に役立ちます。
でもそれを使う上で本当に多くの制約があり、はるかに有用性が低くなります。背景の削除のような基本的なことでさえ、それはやりません。Nano Bananaに透明な背景を求めると、背景にグレーと白の市松模様を幻覚として生成します。それさえも整列されておらず、その画像からあなたのものを取り出すことができなくなります。
それはパズルのピースとして有用になるように構築されていません。パズル全体を行うように構築されています。ツールボックスを置き換えるように構築されていますが、画像がどれほど柔軟であるかという性質のため、それを回避することができます。例えば、この部分を使いたい場合、この全体のスクリーンショットをそのまま保存して使う世界はありません。
私がすることは、ズームインして欲しい小さな部分だけを取得し、それから残りのサムネイルを作りに行くことです。それを取得して、本物のプロフェッショナルなグラフィックスイートに入れます。私はAffinity Photoを使っています。新しいサムネイル。これを少し展開します。背景を適切な色にします。Benと私が取り組んできたピックのようなものに飛び込んで、多くのことを再考します。
彼は実際に私が使えるタグシステムを構築しました。タグはTheoの顔です。私の顔の写真を取得します。そしてはい、ここの背景はAIで削除されています。これを貼り付けます。影を追加します。これを調整します。あまり正しく見えません。また、私が望むよりも解像度が低いです。おそらく何らかの方法でこれをアップスケールするでしょう。これは私がサムネイルを作るためによく行うフローです。
10個に1個くらい、推測ですが、一部を生成するためにAIを使っています。なぜなら代替案は、作ろうとしている正確なスクリーンショットを作るために、Slackのインスペクト要素で大量の時間を費やすことだからです。そして以前はそれをやっていました。本当にひどいです。全然楽しくありません。これらのAI生成ツールが私にとってこの特定の面倒な部分を合理化できるという事実は素晴らしいですが、それでも大量の変更を加えなければならないことがよくあります。例えば、ここでは絵文字のものがそこにあるのが嫌いです。だからこれをラスタライズします。
変更が気に入らない場合に備えて吹き飛ばします。ここに置きます。削除。削除。切り取り。そして同じことをもう一度。動画の資産を作業するときに、ここで見ているようなことを正確にどれほど頻繁に行っているか、あなたたちに言えません。そしておそらく今日のバーも下に移動し、それから全体を少し上に移動します。
どうやってここに入ったんだい、Miles?締め出したはずなのに。そのグループを動かして。ほら。実際に、これを分離できます。見てください。これで使えるサムネイルになりました。だいたい欲しいところに持っていくために3分ほどの変更を加える必要がありました。それでも、解像度が十分に低いです。おそらくこれをもっと真剣に受け止めたい場合は、別のパスを行うでしょう。猫の休憩です。
これを生成してごらん。あえて。良い子だ。ここにいるべきじゃないんだよ、Miles。どうやって侵入したのかさえ分からない。とにかく、これは私のツールの外に存在するもの、この場合はNano Bananaをどのように使って、私のニーズに合うように強制するかの例です。
この焼き付けられた画像を与える代わりに、何らかの方法でレイヤーやPhotoshopファイルを与えてくれたら、物事を調整できるのではるかに良いでしょう。なぜならコードはメディアよりもはるかに柔軟だからです。AIコーディングツールがコードを決して与えなかったと想像してください。コンパイルされたバイナリだけを与えて、逆コンパイルして、リバースエンジニアリングして、それから手動でそれらの変更を加え始めない限り、ソースに戻って変更を加える方法がないとします。
それがこれらのメディア生成ツールを使って作業するときの感覚です。幸いなことに、画像は比較的柔軟なメディアで、部分を切り取ったり、他のツールを使って背景を削除したり、部分をアップスケールしたり、部分を重ねたり、これらすべてを自分で処理したりできます。しかしそれは音楽と動画には当てはまりません。少なくとも全く同じレベルではありません。
すみません、猫が今すごく甘えています。昨夜友人のサムネイルを手伝っていて、AI生成されたスクリーンショットをまともに見えるようにトリミング、カット、チョップ、アップスケール、微調整に少なくとも20〜30分を費やしました。そして本当に面倒でした。それでもすべてを自分で作るよりは少し簡単でした。
でも要点は、仕事をしなくて済むようにメディアを生成しているわけではないということです。退屈な部分を滑らかにするために生成を使っているのです。そしてこれは、開発者としてAIが素晴らしいときです。これはメディアで働く人としてもAIが素晴らしいときです。信じられないかもしれませんが、私は多くのコンテンツを制作しています。1日1本の動画で、それぞれに複数のサムネイルを作っています。私たちは大量のものを制作しています。
相棒、本当にごめん。君を死ぬほど愛しているけど、君は私の仕事を不可能にしているんだ。彼を追い出します。ちょっと待ってください、みんな。では、なぜこれが音楽と動画とではこんなに違うのでしょうか?まあ、それらのメディアはこの種のことを行うのがはるかに難しいだけです。何かを切り取って動画で下に移動させることはできません。なぜなら次のフレームでは、それが間違っているからです。
そしてフレームごとにそれを行おうとして、これらの異なるフレーム間で何かがずれていると、それは絶対的な混乱です。Da VinciやFinal Cut、そして今ではPremiereでさえも、誰かから背景を削除するためにロトスコープのようなことができるツールがいくつかあります。おそらく私自身のイントロでFaZeがこれをやっているのを見たことがあるでしょう。
それはAIを使っていて、それはクールですが、それは人々がメディア生成について話すときに話しているものではありません。動画で自分を選択して、シャツの色を赤に変更するように言い、1時間の動画の残りは同じだが私のシャツが赤いという世界のアイデア。どのツールもそれをやろうとしていません。彼らは私のエディターを置き換えようとしています。
そしてこれが問題です。ここにはほとんどスケールのようなものがあります。一方の端にコードがあり、もう一方の端に動画生成があります。私の意見では、画像生成を超えたほぼすべてのものは有用でなくなります。なぜなら、何かをすることがはるかに難しいからです。
評価すべき点を述べます。Sunoは、曲全体を生成するだけでなく、ステムを生成してそれらを整理して作業できる、よりスタジオのような製品を作ろうとしていることは知っています。本当にひどいウェブアプリで。ええ、クール。以前にやっていたことよりは良いです。
そして、これを使ってステムを生成したり、15個のユニークなサンプルを作成して、本物のエディターで使うために気に入ったものの1つを選んだりできるなら、もしかしたらクール。もしかしたら。でも、これはただそれだけじゃないんです。違う感じ方ができたらいいのにと本当に思います。彼らが単に私たちのツールボックスとこれらのものを作る人間を置き換えようとしているだけではないという希望を与えてくれる、この分野でもっと多くのことが起こっているのを見られたらと心から願っています。でもそれは彼らがやっていることではありません。
彼らは私たちの仕事を楽にしようとしているのではありません。彼らは私たちの分野全体が愚かで、それを自動化できると主張しています。そしてそれは愚かです。これについては他に何もありません。私が狂っていてただの嫌悪者なのか、それともここで良い点を指摘しているのか、コメントで教えてください。皆さんがどう感じているのか気になります。そして私はこれについて大量に炎上することはないと確信しています。次回まで、平和ですよ、オタクたち。
コード生成とメディア生成の本質的な違い
ここで分解したいいくつかの層があります。異なるタイプの生成があります。具体的にはLLMがあります。それらでテキストを生成する能力があります。エッセイ、記事、その他ここで想像するものすべてです。それらでコードを生成する能力もあります。
特にこの部分は非常に興味深いです。これについては後で戻ります。他のタイプのメディア生成、実際に話したいものがあります。これらのほとんどは拡散ベースですが、背後にある技術について詳しく説明する必要はありません。それはそれほど重要ではありません。
話したいのは画像生成、音声生成、動画生成です。そして音声生成と言うとき、主に音楽生成を意味していますが、正直なところ、これは対話と音楽の2つのカテゴリーに分けることができます。そして私がこれらのものが本当にクールだと思い、これらすべてが本当にイタいと思うことが、矛盾していて痛々しく聞こえることは分かっています。特に私が画像生成を使い始めて、それを自分の製品の一部として組み込んでいるときには。でも理由があるんです。そしてそれらをうまく説明できていませんでした。
以前の動画で少し触れました。PewDiePieのAIに関する見解について話していたときです。掘り下げる良い機会でしたが、私がこのように考える理由を表面的にしか説明しませんでした。まだ適切な深堀りはしていません。OatmealもAIアートと彼がそれについてどう感じているかについて素晴らしいコミックを作りました。
アーティストからのAI関連についての最も中立的で合理的な見解の一つだと思います。これを読みたい方のために説明文にリンクを残します。強くお勧めします。OatmealにはAIアートがどのように有用であるかについてのセクションさえあり、これは私にとって非常に有用な移行になります。なぜなら、これが私が話したいことだからです。
私はそれが描画の細かい作業、つまり創造的ではなく管理的に感じられる部分を扱うための強力なツールになり得ると信じています。すべてのアーティストには独自の細かい作業があります。私にとっては背景です。私のコミックのほとんどには背景がありません。だから私はよく空間に浮かぶ青白い塊を描いています。背景を省くことで、私にとって重要な部分、つまりコメディ、楽しさ、ラットコプターに集中できます。
私は自分のコミックでAIを使う予定は全くありませんが、それが漫画制作の創造的に不可欠な側面に集中できるようにする方法は理解できます。それはスペルチェッカーを使うアーティスト版のようなものです。さあ、本題に入りましょう。これは私が掘り下げたい本当に重要な部分です。ほとんどのAIがステロイドを使った自動補完だからというだけでなく、ツールボックスの中のツールであるというこの考えが、これらすべての空間で重要だからです。関連するクリエイターたち。
ミュージシャンであれ、グラフィックアーティスト、画家であれ、ソフトウェアを書く開発者であれ、私たちは皆ツールボックスを持っています。ツールボックスは私たちが使うすべての異なるもので満たされています。それはVS CodeやCursorやVimのような私たちのコードエディターかもしれません。そしてその中にツールがあります。
それは私がこれをデモするために再インストールしたばかりのFL Studioのようなプロダクションソフトウェアかもしれません。すべての動画でFinal Cutを使っているような動画編集スイートかもしれません。それは多くの異なるものである可能性がありますが、あなたのツールボックスは通常、1つの主要なソフトウェアと、その中またはその横にある他のものです。
一部の開発者はVS Code内のターミナルを使うのが好きです。他の開発者はVS Codeの外にターミナルを持っていて、2つのアプリ間を行き来します。それが私のやり方です。つまり、問題は、これらすべてのために今作られているこれらのAIツールと、私たちが既に使っている既存のプロフェッショナルツールとの関係に帰着します。
Copilotとツールボックス補完の成功例
AIコードがどのように起こったかについて少し話します。最初の主要なAI開発ツールはCopilotでした。Copilotが最初にどのように機能したかというと、小さな少し愚かなモデルで、エディターで何をしているかを監視し、あなたがちょうどやっていることとファイル内のカーソルがどこにあるかに基づいて自動補完を生成しました。
だからbfs関数を実行するというようなコメントを書くと、関数という単語を入力し始めるとすぐに、あなたが何をしようとしているかを認識して、そのための自動補完を書くことができました。そしてこれは素晴らしかったです。なぜならCopilotが私たちのツールボックスの中に存在していたからです。だから私たちのツールボックスが主にVS Codeで、Copilotという使える新しいAIツールがあるとします。
CopilotはVS Codeの中にあります。それを置き換えようとしているのではありません。再考しようとしているのでもありません。それを補強し、開発者として行う特定の退屈なタスクを簡単にしようとしているのです。そしてこれが定着するにつれて、モデルは良くなり始めました。MicrosoftとOpenAIはCopilotを使う人々からより多くのデータを取得し始めました。
そしてフライホイールが本当に回り始め、その結果、モデルはコードにおいて本当に優れたものになりました。そして今、私たちの既存のツールボックスの外に存在できるツールがますます増えています。Cursorのようなものはまだここに当てはまると私は主張します。それがVS Codeを置き換えているとしても、まだVS Codeに基づいています。しかしそれはまだVS Codeエコシステム全体を持っています。
Cursor、Windsurf、さらには新しいGoogle IDEであるAnti-gravityさえも、すべて同じツールセットのための異なるハーネスです。彼らは私たちのツールボックスを置き換えているのではありません。彼らはその中に同じツールを持ち、いくつかの新しい興味深い部分を加えたツールボックスの新しいフレーバーです。だから今、別のタイムラインを想像したいと思います。Copilotが開発者として見た最初のAIツールではなかったと想像してください。
何か別のものだったと想像してください。Lovableが最初のAI開発ツールだったと想像してください。そしてLovableがコードを見たりGitHubとリンクしたりすることを全く許可しなかったと想像してください。Lovableは私たちがコードを書く方法を補強するツールではないでしょう。Lovableは私たちのツールボックスの代替品になるでしょう。だからVS CodeがLovableをその中に持つか、LovableがVS Codeの新しい代替品でその中に同じものがあるのではなく、Lovableが存在します。
したがって、もう私たちのツールボックスは必要ありません。さて、あなたが本物の開発者なら、これを見て笑うでしょう。特にこれらのモデルが最初どれほど悪かったかを覚えているなら。笑えます。コードを見ずにコードを書ける世界なんてありません。それはただ馬鹿げています。なぜ誰がこれをやりたいと思うでしょうか?さあ、もう一歩進みましょう。
Lovableの作成者が実際には開発者ではなかったとしましょう。Lovableを作った人々が、例えばサッカーか何かが好きな友人として座って、「やあみんな、サッカー関連を管理するためのアプリを作れたらかっこいいね。誰もコーディング方法を知らないのは残念だ。やってみよう」と言ったと想像してください。
ああ、コーディングを学ぶのは難しい。コーディングを学ぶのがもっと簡単だったら、もっとたくさんのコーダーがいるでしょう。それを直すべきだ。そして彼らはLovableを作りに行きました。既存のツール、標準、業界、そしてその分野で成功している人々すべてを拒否して。私たちは皆、そこで何が起こるか予測できると思います。私たちは彼らをからかうでしょう。
開発者はこれを笑うでしょう。なぜソフトウェアについて何も知らないこれらすべての人々が現れて、私たちがやっていることは難しすぎると言い、彼らはそもそもそれを理解していないのに、もっと簡単にするつもりだと言うのでしょうか?私たちは彼らを笑うでしょう。それは馬鹿げているでしょう。もし私があなたに、これがまさにすべてのメディア生成会社がやっていることだと言ったらどうでしょうか?
メディア生成企業の根本的な問題
Nano Bananaに携わった人々は、15年間Photoshopを使ってきたわけではありません。Sunoで働いている人々は、人生ずっと音楽の制作、ミキシング、マスタリングをしてきたわけではありません。そして約束しますが、OpenAIでSoraをやっている人々は、動画編集ソフトを特別によく理解しているわけではありません。だから彼らは私たちのツールボックスを置き換えたいのです。ツールボックスが難しすぎるから捨てるべきだという結論には、それを理解していない限り到達しません。
そしてあなたの目標がツールボックスを置き換えることであるなら、そのツールボックスを全く理解していない可能性が非常に高いです。そしてそれが、これらのものを構築している企業から最も見てきたことです。彼らは私たちがどのように構築するかを理解していません。彼らは私たちがどのように創造するかを理解していません。彼らは私たちがやっていることの詳細と、どのようにそれを行うかを理解していません。
メディア生成を行うときに、これらのものが実際にどのように適用されるかには違いがあります。例えば、私は多くの資産を含むサムネイルを作成します。Oatmealが言ったことと同様に、これらのもののいくつかは退屈で、私はそれらをやるのが好きではありません。私たち全員には独自の細かい作業があります。やりたくないと感じるものです。私にとっての一般的なユースケースは、偽のチャットインターフェースです。
OpenAIとGoogleがSlackでやり取りしているものをサムネイルの一部として使いたいんです。これは私がより大きな創作の一部として欲しい資産です。それはパズルのピースの一つです。VS Code内でLLMを使って作業している何かの一部を生成するのと同じように、GeminiとNano Banana Proを使って、他に作っているものに必要な資産の一部を作成できます。この種のものには本当に役立ちます。
でもそれを使う上で本当に多くの制約があり、はるかに有用性が低くなります。背景の削除のような基本的なことでさえ、それはやりません。Nano Bananaに透明な背景を求めると、背景にグレーと白の市松模様を幻覚として生成します。それさえも整列されておらず、その画像からあなたのものを取り出すことができなくなります。
それはパズルのピースとして有用になるように構築されていません。パズル全体を行うように構築されています。ツールボックスを置き換えるように構築されていますが、画像がどれほど柔軟であるかという性質のため、それを回避することができます。例えば、この部分を使いたい場合、この全体のスクリーンショットをそのまま保存して使う世界はありません。
私がすることは、ズームインして欲しい小さな部分だけを取得し、それから残りのサムネイルを作りに行くことです。それを取得して、本物のプロフェッショナルなグラフィックスイートに入れます。私はAffinity Photoを使っています。新しいサムネイル。これを少し展開します。背景を適切な色にします。Benと私が取り組んできたピックのようなものに飛び込んで、多くのことを再考します。
彼は実際に私が使えるタグシステムを構築しました。タグはTheoの顔です。私の顔の写真を取得します。そしてはい、ここの背景はAIで削除されています。これを貼り付けます。影を追加します。これを調整します。あまり正しく見えません。また、私が望むよりも解像度が低いです。おそらく何らかの方法でこれをアップスケールするでしょう。これは私がサムネイルを作るためによく行うフローです。
10個に1個くらい、推測ですが、一部を生成するためにAIを使っています。なぜなら代替案は、作ろうとしている正確なスクリーンショットを作るために、Slackのインスペクト要素で大量の時間を費やすことだからです。そして以前はそれをやっていました。本当にひどいです。全然楽しくありません。これらのAI生成ツールが私にとってこの特定の面倒な部分を合理化できるという事実は素晴らしいですが、それでも大量の変更を加えなければならないことがよくあります。例えば、ここでは絵文字のものがそこにあるのが嫌いです。だからこれをラスタライズします。
変更が気に入らない場合に備えて吹き飛ばします。ここに置きます。削除。削除。切り取り。そして同じことをもう一度。動画の資産を作業するときに、ここで見ているようなことを正確にどれほど頻繁に行っているか、あなたたちに言えません。そしておそらく今日のバーも下に移動し、それから全体を少し上に移動します。
どうやってここに入ったんだい、Miles?締め出したはずなのに。そのグループを動かして。ほら。実際に、これを分離できます。見てください。これで使えるサムネイルになりました。だいたい欲しいところに持っていくために3分ほどの変更を加える必要がありました。それでも、解像度が十分に低いです。おそらくこれをもっと真剣に受け止めたい場合は、別のパスを行うでしょう。猫の休憩です。
これを生成してごらん。あえて。良い子だ。ここにいるべきじゃないんだよ、Miles。どうやって侵入したのかさえ分からない。とにかく、これは私のツールの外に存在するもの、この場合はNano Bananaをどのように使って、私のニーズに合うように強制するかの例です。
この焼き付けられた画像を与える代わりに、何らかの方法でレイヤーやPhotoshopファイルを与えてくれたら、物事を調整できるのではるかに良いでしょう。なぜならコードはメディアよりもはるかに柔軟だからです。AIコーディングツールがコードを決して与えなかったと想像してください。コンパイルされたバイナリだけを与えて、逆コンパイルして、リバースエンジニアリングして、それから手動でそれらの変更を加え始めない限り、ソースに戻って変更を加える方法がないとします。
それがこれらのメディア生成ツールを使って作業するときの感覚です。幸いなことに、画像は比較的柔軟なメディアで、部分を切り取ったり、他のツールを使って背景を削除したり、部分をアップスケールしたり、部分を重ねたり、これらすべてを自分で処理したりできます。しかしそれは音楽と動画には当てはまりません。少なくとも全く同じレベルではありません。
すみません、猫が今すごく甘えています。昨夜友人のサムネイルを手伝っていて、AI生成されたスクリーンショットをまともに見えるようにトリミング、カット、チョップ、アップスケール、微調整に少なくとも20〜30分を費やしました。そして本当に面倒でした。それでもすべてを自分で作るよりは少し簡単でした。
でも要点は、仕事をしなくて済むようにメディアを生成しているわけではないということです。退屈な部分を滑らかにするために生成を使っているのです。そしてこれは、開発者としてAIが素晴らしいときです。これはメディアで働く人としてもAIが素晴らしいときです。信じられないかもしれませんが、私は多くのコンテンツを制作しています。1日1本の動画で、それぞれに複数のサムネイルを作っています。私たちは大量のものを制作しています。
相棒、本当にごめん。君を死ぬほど愛しているけど、君は私の仕事を不可能にしているんだ。彼を追い出します。ちょっと待ってください、みんな。では、なぜこれが音楽と動画とではこんなに違うのでしょうか?まあ、それらのメディアはこの種のことを行うのがはるかに難しいだけです。何かを切り取って動画で下に移動させることはできません。なぜなら次のフレームでは、それが間違っているからです。
そしてフレームごとにそれを行おうとして、これらの異なるフレーム間で何かがずれていると、それは絶対的な混乱です。Da VinciやFinal Cut、そして今ではPremiereでさえも、誰かから背景を削除するためにロトスコープのようなことができるツールがいくつかあります。おそらく私自身のイントロでFaZeがこれをやっているのを見たことがあるでしょう。
それはAIを使っていて、それはクールですが、それは人々がメディア生成について話すときに話しているものではありません。動画で自分を選択して、シャツの色を赤に変更するように言い、1時間の動画の残りは同じだが私のシャツが赤いという世界のアイデア。どのツールもそれをやろうとしていません。彼らは私のエディターを置き換えようとしています。
そしてこれが問題です。ここにはほとんどスケールのようなものがあります。一方の端にコードがあり、もう一方の端に動画生成があります。私の意見では、画像生成を超えたほぼすべてのものは有用でなくなります。なぜなら、何かをすることがはるかに難しいからです。
評価すべき点を述べます。Sunoは、曲全体を生成するだけでなく、ステムを生成してそれらを整理して作業できる、よりスタジオのような製品を作ろうとしていることは知っています。本当にひどいウェブアプリで。ええ、クール。以前にやっていたことよりは良いです。
そして、これを使ってステムを生成したり、15個のユニークなサンプルを作成して、本物のエディターで使うために気に入ったものの1つを選んだりできるなら、もしかしたらクール。もしかしたら。でも、これはただそれだけじゃないんです。違う感じ方ができたらいいのにと本当に思います。彼らが単に私たちのツールボックスとこれらのものを作る人間を置き換えようとしているだけではないという希望を与えてくれる、この分野でもっと多くのことが起こっているのを見られたらと心から願っています。でもそれは彼らがやっていることではありません。
「誰でもミュージシャンになれる」という幻想
彼らは私たちの仕事を楽にしようとしているのではありません。彼らは私たちの分野全体が愚かで、それを自動化できると主張しています。そしてそれは愚かです。これについては他に何もありません。私が狂っていてただの嫌悪者なのか、それともここで良い点を指摘しているのか、コメントで教えてください。皆さんがどう感じているのか気になります。そして私はこれについて大量に炎上することはないと確信しています。次回まで、平和ですよ、オタクたち。
さて、私たち全員がここに来た目的のものについて話す必要があります。Sunoはどこに位置するのでしょうか?Sunoは私を苛立たせます。これが私にこの動画を作らせるほどトリガーした投稿です。私はしばらくの間Jasmineの友人だったので、これは私にとってショックでした。私は歌いながら育ちました。どこへ行っても歌っていました。日記に歌を書いていました。先生たちに、大人になったら歌手とソングライターになりたいと言っていました。
2006年にミュージシャンになりたいと思うには、低所得家庭にはないリソースが必要でした。私の両親は楽器を買う余裕がありませんでした。音楽のレッスン料を払えませんでした。スタジオに入れてもらえませんでした。私が持っていた夢は、今まで単なる記憶になっていました。私は、すべての人のための音楽創造を可能にしている会社で働けることを、誇りに思い、光栄に思っています。寝室にいる13歳の子供で、ミュージシャンになることを夢見ている人のために、あなたはなれます。
すべてのプロのアーティストのために、あなたは愛していることをもっとできます。20年前、私が小学生で、制作する方法もなく見知らぬ人に書いた歌を見せていたときに、Sunoが存在していればよかったと本当に思います。でも今日それが存在していて、それを必要としているかもしれない他のすべての子供たちのために本当に嬉しいです。私たちはまだ始まったばかりです。皆さんの多くが開発者であることを知っているので、私はコンピューターに夢中になって育ちました。
見つけられるすべてのアプリをいじり、ノートにウェブサイトのアイデアをスケッチし、先生たちに大人になったらプログラマーになりたいと言っていました。2006年に開発者になりたいと思うには、低所得家庭にはないリソースが必要でした。私の両親はまともなコンピューターを買う余裕がありませんでした。コーディングクラスの費用を払えませんでした。
キャンプに送ったり、メンターシップを得たりすることもできませんでした。私が持っていた夢は、今まで単なる記憶にゆっくりと変わっていきました。問題が見えますか?開発者なら、あなたは少なくともかすかにまともなコンピューターでコーディングできることを知っています。
これまでにリリースされた最も重要なアルバムのいくつかは、数年前の安っぽいMacBookで、GarageBandの無料版または海賊版を使って制作されました。Grimesというアーティストを聞いたことがあるかもしれません。Oblivionというトラックを含む彼女の最初のアルバムは、当時のポップミュージックをある意味で破壊しました。あなたが知らないかもしれないのは、彼女がこのアルバムを古い半分壊れたMacBookのGarageBandで制作したことです。
またJusticeというバンドを聞いたことがあるかもしれません。2007年にDanceとGenesisなどいくつかの大きなダンス曲を作ったバンドです。面白いことに、これらもGarageBandで制作されました。これは特に面白い例です。なぜなら、このアルバムは2007年に出て、私たちが今読んだツイートは2006年についてでした。言い訳はありません。
4年前に購入したベースティアのiPadで、驚くべき画期的な作品を制作しているアーティストがいます。そして音楽を制作する方法を学ぶために必要なすべてとそれ以上を出しているミュージシャンがたくさんいます。Jane Removerは私の最近のお気に入りのプロデューサーの一人で、彼女は自分のアルバムがどのように作られたかを正確に示す信じられないような分析をしています。
文字通り、アルバムのプロジェクトファイルを開いて、曲がソフトウェアでどのように作られたかを見せています。知識へのアクセスはこれまでになく良くなっています。最高のアーティストは、自分たちがどのように物事を行うかを共有するだけで、あなたは見て学び、質問さえでき、多くの人が応答してくれます。そしてツール自体もこれまでになくアクセスしやすくなっています。
電話やiPadに本物の制作ソフトウェアをダウンロードして実際の音楽を作れるという事実は信じられないことです。そして音楽を楽器を持ってステージで演奏できるものに煮詰めるなら、私たちは音楽について根本的に異なる定義を持っています。パフォーマンスがどれほどクールであっても、そして私はピアノで15年間やりました、分かります。
それは私にとって、音を通じてユニークなアイデアを創造することほどクールではありません。私は、誰かが音を通じて伝えることができるアイデアや、彼らがあなたに与えることができる雰囲気に、ステージでどれだけ速く音符を打てるか、演奏する前に何年のレッスンとトレーニングを経たかよりもはるかに興味があります。それは個人的に私にとってはるかに興味深くありません。
そして、ギターを弾く能力がないからミュージシャンになれないと思うなら、それはタイピングが遅すぎるからプログラマーになれないと言うようなものです。それはただ愚かです。それだけです。これらのツールは、それに入るのがとても難しいことだからブロックされている意欲的なミュージシャンのためのものではありません。
これらのツールは、音楽にそれほど関心がないが、ミュージシャンになれたらクールだと思う、やる気のない人々のためのものです。YouTubeでこれを大量に見ます。誰かと過ごした非常に気まずい会話の数を伝えることはできません。「ええ、少し副収入が欲しいんです。このエンジニアリングの仕事は疲れます。YouTubeを試してみたいです。
できるだけ少ない努力で成功するYouTubeチャンネルを作るにはどうすればいいですか?」最初に尋ねる質問は、「どれくらいYouTubeを見ていますか?1日に何時間見ていますか?お気に入りのYouTubeチャンネルは誰ですか?」そしてほぼいつも返答は、「ええ、YouTubeをそんなに見ません。Mr. Beastはクールだと思います。
あなたの動画を1本見たことがあります。たくさんお金を稼いでいるようですね」馬鹿げています。私のチャンネルがなぜ良いか知っていますか?私が中毒者だからです。YouTubeを見すぎています。そして私だけではありません。私のチャンネルマネージャーのBenは、私が彼の動画を見て、彼が私の動画を見たから出会いました。
私のエディターのFaZeも、私のチャンネルの熱心な視聴者で、働いていて他のことをしているときはいつもYouTubeを見ています。そのものを愛していなければ、そのものが上手になることはありません。そして、人々の需要が、そのものを愛する人々よりも多い分野では、それは公平です。約4年前とそれ以前は、コードを書くのが好きな人々よりもはるかに多くのエンジニアリングの役割がありました。つまり、コードを愛していない人々を雇うことは大丈夫でした。
そしてお金を稼ぐことが目標なら、それほど好きでなくてもコードに入ることは大丈夫でした。それは、平均的な才能レベルが成功できる空間でのみ機能します。ミュージシャンのトップ0.1%だけが音楽で生計を立てることができます。思考実験をしてみましょう。
私のYouTubeチャンネルは、本当に長いコンテンツで月に200万から300万ビューを獲得しています。私の平均動画の長さは40〜50分です。だから、かなり良い広告収入を得ているはずです。1か月にYouTubeで20万から30万再生を絞り出せればラッキーなミュージシャンがたくさんいます。だから、私が非常に技術的な聴衆を持つチャンネルで250万から300万を獲得していて、たくさんのお金で広告を出すことができ、私のビューははるかに長くてより多くの広告を経験していることを知っています。
YouTubeの広告でどれくらいのお金を稼いでいると思いますか?おそらく、開発者の聴衆で200万から300万再生のようなかなり大きな数字を考えているでしょう。それはたくさんです。月に数万から数十万ドルに違いありません、よね?私のチャンネルは広告収入で月に6000から8000ドルを稼いでいます。
それは私のエディターに支払うのにほぼ十分です。それは私たちが行っている他のすべてには十分ではありません。私のマネージャーには十分ではありません。私の機材には十分ではありません。動画のためにAI生成に費やすトークンには十分ではありません。月に6000ドルは、私がここでやっていることを維持するのに十分ではありません。
そして私はここで、ほとんどのかなり成功しているミュージシャンがやっているよりもはるかに良い数字をやっています。そしてそれらのミュージシャンは曲の途中でスポンサースポットを行うことはできません。それらのミュージシャンは、動画が私の動画ほど長くないため、動画に多くの広告を入れることはできません。彼らは何も得ていません。私は、私よりもはるかに有名なアーティストをたくさん知っていますが、YouTube収入から月に約2000ドル、SpotifyやOther streaming platformsから1〜2ドルを稼いでいます。ここにはほとんどお金がありません。
絶対的なトップの人々だけが音楽でまともな生計を立てています。だから、「ええ、音楽は結構クールです。でも本当に私向きではありません。もっと簡単なら、やるでしょう」というようなことなら、生き残れません。オーディオソフトウェアを学ぶことや、オーディオソフトウェアにアクセスすることが、より多くのミュージシャンを妨げているものだと思うなら、この図全体の何も理解していません。この仕組みがどのように機能するかから非常に遠く離れていて、侮辱的です。
そして人々が作っているこれらのツールすべては、私たちが使うものを簡単にしようとしているのではありません。それらは難しすぎるため、すべてを置き換えようとしています。それはとても愚かです。それは信じられないほど愚かです。そして私がTwitterでこれについて不満を言ったとき、私が得た返信はさらに愚かでした。
Jazzを愛しているけど、これは本当に違います。音楽は参入するのに最もアクセスしやすい分野の1つです。私のお気に入りのアルバムの多くは、寝室でiPadで制作されました。でもそれが違いです。それらは制作されました。人間によって音を作り出すために努力が払われました。AI音楽生成ほど魂のないアートはありません。これは新しいアーティストを可能にしません。
それは、アートについて気にかけない、やる気のない人々を可能にします。私はここのすべての言葉を支持します。ある人は、彼らがMIDIでメロディーを作成し、それをSuno Studioに読み込んで、様々な楽器でメロディーを配置するようにAIに促すことで、それをより豊かにすると言いました。これがどれほど愚かか、言葉で表現する方法さえ分かりません。
MIDIが何か分からない場合、それはどの音符がいつ、どれくらいの音量で演奏されるかを言うためにメロディックデータを配置するための標準です。それがどのように聞こえるべきかを言っているのではありません。音符といつ音符が演奏されるかを言っているだけです。FL Studioで面白いものをお見せします。これまでに作られた私のお気に入りのソフトウェアの1つです。新しい楽器を追加しましょう。
ライブに行く直前にこれをインストールしたばかりなので、VSTのどれもインストールされていません。Toxicが大好きですが、Citrusを使いましょう。ああ、私のキーボードスキルは以前のようではありません。こんなツールでピアノを弾くのがとても上手でした。さて、いくつかのキーが正しく動作していません。このキーボードやそれがどのように機能するかに慣れていません。
ここで私が指摘したかった点は、MIDIを生成することがどれほど複雑かということです。これはMIDIループです。ここに音符を置くことができます。再生を押します。そして今、それが演奏されています。さて、メロディーを書いて作曲するのが難しすぎると言いましょう。なぜなら私は wannabe musicianであって、本物のミュージシャンではないからです。私はほとんどWindowsで制作してきましたが、それはイタいです。だからこれを見てください。
音符の代わりにコードを置くだけで、作曲の方法を変えることができます。クール。でもそれはまだ仕事が多すぎます。もっと簡単なものが欲しいです。それをやりましょう。神様、このプログラムは最後に使ってから本当に変わりました。デスクトップには本当に古いバージョンがまだインストールされています。おそらく近いうちに新しいのを学ぶべきだと気づいています。レンチですか?ああ、そうです。リフマシーン。
見てください。MIDIシーケンスを生成しました。これがなぜこんなに簡単に生成できるか知っていますか?それはただの数学だからです。音楽理論とはそれだけです。互いに基本的な関係を持つ12音の本当に基本的な数学です。それはそれほど難しくありません。
それがフレックスだと思うなら、これらのツールがMIDIを持ってきたから実際に役立つというのは、Lovableが本物のプログラミングツールだと言うようなものです。なぜならJiraチケットのスクリーンショットを持ってきたからです。気にしません。それは現実からあまりにもかけ離れています。15歳からメロディーやシーケンスを生成してきました。そして何を知っていますか?今行った生成は、私が既に使っているツールの中にあります。
それはツールボックス内に存在します。それを置き換えているのではありません。それが、これらのものについて私が持っている問題全体です。それらのどれも、私のソフトウェア内で私を助けていません。誰かが、私の音楽内で使用するユニークなサンプルを作成できるように、ループジェネレーターやサンプルジェネレーターを作成するなら、それはちょっとクールでしょう。
誰かが、プロフェッショナルなソフトウェアを使用している本物のミュージシャンをターゲットにして、彼らの作業をAIで補完し、面倒なことを滑らかにする有用なピースを与えようとするなら、それは素晴らしいでしょう。それに本当に夢中になるでしょう。しかしそれは、これらの企業のどれもがやっている方法ではありません。彼らは皆、私たちのソフトウェアを何らかのもので置き換えようとしています。
Jazzのストーリーに戻ります。なぜなら、ここには私の心を本当に壊す1つのピースがあるからです。彼女が本当に歌手とソングライターになりたかったというアイデア、特にソングライターの部分。ミュージシャンの大多数、楽器を学び、それを演奏するために何年も費やす人々の大多数、彼らの大部分は音楽を書くことは決してありません。彼らは他人によって書かれた音楽を演奏しています。なぜなら、ほとんどの人は音楽を演奏する能力として見ているのであって、創造する能力としてではないからです。そしてそれは常に私を深く苛立たせてきました。
それが最も私を苛立たせる場所の1つは、特定のミュージシャンがそれについてどれほどエリート主義的であるかです。子供たちが音楽で新しいクールなことをすることを許可することが重要だと思います。私が本当に好きな子供の一人は、Netspendというアーティストです。彼のものをどれだけ問題なく再生できるかわかりません。実際、これは大丈夫かもしれません。なぜならそれはすべてから削除されているからです。それは陽気です。
その中にある他のサンプルがそこにタグ付けされています。私はこれを見て、すぐに「このラップ、何だこれ?嫌いだ」と言っている人がたくさんいることを知っています。そして、まあ、それがあなた向きでないなら、それはそうではありません。さて、これは今ヒップホップである空間を大規模に革新している16歳の子供です。彼は信じられないと思います。
彼が私に成長するには時間がかかりましたが、今では完全に成長しました。彼の以前の曲ははるかにインディーでした。最大のものは約10万再生くらいでしたが、これは爆発しました。これは驚くほど早く100万再生に達しました。そしてそれは大きなサウンドチェンジ、美学的チェンジ、そして彼にとって間違いなく成長し、輝く瞬間でした。この曲が彼のチャンネルにないことに気づくかもしれません。
それは著作権侵害を受けたからです。メインの曲で何かが起こっているからではなく、実際にここの最後で起こることのためです。そこの最後にあるあの小さなギターループは、彼が後で出す予定だった別の曲のイントロです。そしてギターループは、2004年頃のDeftones の曲からサンプリングされています。彼らはサンプルをクリアできると思っていました。
彼らは軽いクリアを持っていたとされています。すべてが永遠に時間がかかっていました。だからNetspendは彼の個人的なYouTubeチャンネルにランダムに曲をドロップしました。それはほぼ即座にDMCAを受けます。そして彼らはその曲を削除しただけでなく、その他の曲のスニペットを含んでいたため、これを削除しました。
彼らは彼の最初の100万再生トラックを彼から奪いました。なぜなら、彼らはラップ曲での20年前のギターループの彼の使用と再利用が、何らかの形で彼らの仕事と競合し、彼らにお金とビジネス機会を失わせていると思ったからです。それは妄想です。それはアートとメディア内の進歩への軽蔑です。ただ馬鹿げています。そして、「ああ、それはレーベルがクソだ」とあなたが好きなだけ言うことができます。そして多くの人がそう言うだろうと知っています。レーベルは最悪です。気にしません。
ミュージシャンは立ち上がって、「よ、これは最悪だ」と言うことができます。これはOliver Treeの昔に起こりました。彼がインタビューを行い、彼のレーベルが彼のもののいくつかを使用している他のアーティストとどのようにクソで、これが彼にとってどれほど重要で、どれほど欲求不満だったかについて話しました。Deftonesはヒップホップを見下しているからです。彼らはこれらの他の空間を見下しています。だから、彼らはそれについてクソです。
それはそれです。彼らはMetallicaほど悪くはありません。彼らは、IPアドレスに基づいて推測した人々の名前の500ページくらい印刷して、Lime Wireを一度開いたすべての人々を訴えようとして議会に現れました。
メタルシーンについて何かがあり、彼らがギターをどれだけ速く演奏できるかについてどれほど気取っているかで、彼らは芸術的進歩について気にかけるのをやめます。そしてそれは最悪です。それは本当に最悪です。これのどれも著作権法とあなたの著作権を守ることについてではありません。それを失う可能性があります。それは起こっていることではありません。これは実際に気にかけない人々が、気にかける人々の邪魔をしているということです。そしてそれはただ不愉快です。
そして今、ランダムな誰かがこの動画を再アップロードして、Netspendに行くべき、Netspendに支払うべき、Netspendのキャリアを前進させるべき350万再生を得ましたが、弱く時代遅れの音楽の仕組みに関する見解を持つ人々によって押し戻されています。そしてこれらの人々は業界中にいます。
そして、DeftonesやMetallicaのような企業と最初にコラボレーションを始めるアーティストのタイプに賭けます。なぜなら、彼らはこの狂気に問題を見ないからです。実際の狂気。ただただ狂気を想像してください。20年間関連性がなかったミュージシャンであり、16歳または17歳の子供があなたのものを非常に気に入っているので、彼らの作品の非常に小さな部分としてそれを参照しています。そしてあなたの反応は、それを削除させるか、それが削除されるのを黙って座っているかのどちらかです。それは私にはただ狂っています。
そしてこの種の、一方ではこれは盗難と見なされ、彼らはDMCAプロセスを経てそれに勝つことができます。他方では、SunoにColdplayのスタイルで曲を生成させることは完全に問題ありません。馬鹿げています。実際に狂っています。そして私を非常に苛立たせます。そしてこれらはそれで大丈夫な人々のタイプです。なぜなら彼らはクールな音楽や音を作ることに興味がないからです。
彼らは楽器をどれだけ速くうまく演奏できるかを見せびらかすことに興味があります。そして私はただ気にしません。本当に気にしません。それは、あなたがどれだけ優れたプログラマーであるかを、本当に速くタイピングすることで見せびらかすようなものです。これについて話す前に、もう一つの角度で話したいことがあります。そしてこれを修正する方法について話します。そしてこれをどのように修正するかについて話します。
創作と消費、そして価値の三要素
もう一度、このことについて話す重要な違いがあります。音楽を作ることには2つの側面があります。その音楽を体験し、その音楽から感情や感情を持つリスナーの側面があります。そして、それを作ることから得られる雰囲気と感覚であるもう一つの側面があります。
新しいメディアの一部を作ることから得られる満足感。これを創作と消費に分解できます。音楽を作成しているとき、それはあなたに特定の感情を与え、あなたの目標はあなたが作成する音楽が、その音楽の消費者に感情を与えることです。
ライティングも同様だと主張できます。あなたが深く関心を持っている何かについての記事やブログ投稿やエッセイを書くとき、ライターとしての満足感があり、それからそれを消費する人としての満足感があり、興味深い情報を与えて気分を良くします。動画についても同じことが言えます。画像についてもある程度同じことが言えます。しかしここには第三のピースがあります。価値です。本当に良いブログ投稿を書くと、それはライターとして私を満足させるかもしれません。
それを消費する人として、いくつかの興味深い情報を与えて気分を良くするかもしれませんが、それはまた、Googleで私のウェブサイトがより良く配置されるのに役立ちます。ロボットによって読まれるときに実用的な価値があり、私のウェブサイトがより良いパフォーマンスをし、私にとって即座のビジネスインパクトを持つことを可能にします。これはコードではさらにそうです。
コードを書くとき、それは私をかなり良く、賢く、素晴らしいと感じさせるかもしれません。コードを読むことは、誰にとっても本当に何もしません。いくつかのコードを見て、「うわー、それは本当に賢い」と言うのは時々クールです。これらの他の場所のどこよりも少ないですが、それはまだ一種のものですが、コードの価値の大部分は、人々がそれを読んで感情を持つことからではありません。
コードを消費することから価値を得ることはありません。コードを実行することから価値を得ます。これは、LLMを素晴らしいものにするために私たちが行っているすべての作業が実際に経済的に意味をなすいくつかの理由の1つです。なぜなら、LLMの出力の大部分は、人間によって見られることは決してないからです。
推論トレースの大部分は、ユーザーに渡されることさえありません。ましてやユーザーに見られることもありません。生成されるコードの大部分は開かれていません。それはバックグラウンドで実行され、タスクを実行するか、人がウェブサイトを一度チェックした後に生成されて捨てられるだけです。LLMによって生成されるコンテンツの大部分は、人間によって消費されることは決してありません。
Sunoやこれらの音楽ジェネレーターによって生成されるコンテンツの大部分は、一人の人間によって消費され、それ以外は何もありません。誰かがそれを直接見ることの外に、大規模言語モデルによって生成される言葉やコードやものには多くの価値があります。それが消費されることの外に、音楽生成には価値がありません。
それが消費されることの外に、画像生成には価値がありません。そして、それが消費されることの外に、動画生成には価値がありません。これが問題です。LLMとその周りに構築されたものは、本質的にはるかに構成可能で、強力で、率直に言って私にとって刺激的です。なぜなら、それらを使う本当にクールな方法を見ることができるからです。メディア生成のものは、それが聞かれたり見られたりすることの外に有用ではありません。そしてそれは最悪です。この作業のいくつかを行う必要がある場所がありますが、それほど直接的ではありません。私はロックインして注意を払っています。
例えば、私のサムネイルの1つの背景や、実世界のどこかに出されるポスターの一部であるいくつかの資産。それらのタイプのものは、同じように入れているすべての詳細で感情を呼び起こそうとしているわけではないため、同じレベルの詳細と注意を必要としないかもしれません。
十分に良く見えるようにしようとしているだけですが、その種のものはそれほど多くありません。特に音楽の世界では。もちろん、ミュージシャンに支払うことなく映画のサウンドトラックを生成できたらクールでしょうが、サウンドトラックは映画の最もクールな部分の1つです。なぜその部分を自動化するのでしょうか?それはただ狂っているように感じます。
そして、これが最も見逃されている部分だと思います。LLMは、それらがどのように認識され消費されるかの外に価値を生成できます。他のタイプのメディア生成はこれを持っていません。あなたが最後にそれを聴いたらすぐに、Sunoの曲には価値がありません。
そしてそれはまた、ああ私の神、私は頭の中にあったこの物を作ったという同じクールな雰囲気を提供しません。なぜなら、創作側の満足感の多くは、あなたが想像していた物の実行から来るからです。存在してほしいと思っているアプリケーションを想像していて、それを書きたい方法を考えて、それからそれを行うと、このビジョンを実行したことの満足感を得ます。
頭から出そうとしている考えであるブログ投稿を書くとき、それが頭から出たことの満足感を得ます。テキストプロンプトでAI生成する曲をするとき、あなたはただランダムなダイスロールを打って、出てくるものがクールであることを望んでいるだけです。満足感にははるかに及びません。
頭の中で曲を想像して、それからそれを作ることはできません。歌詞を書くことができます。MIDIトラックを渡すこともできるかもしれません。そしてそれは感じるものは何でも生成しますが、あなたはそれをステアリングしていません。コントロールしていません。欲しいものを伝えて、それを取り戻すことを望んでいます。それは、曲のアイデアを持つのと同等でしょう。
だからミュージシャンを見つけて、お金を払って、「ねえ、これみたいな曲を作って、彼らが大体あなたが望むようにそれを行うことを望みます。はるかに自動化され、はるかに悪いだけです。音楽を生成することは、コードを生成することとは全く異なります。なぜなら、ピースを混ぜることができないからです。それがどのように消費されるかの外に有用ではありません。
それはサンプリングとは全く異なります。なぜなら、あなたが理解し尊重する一部を見て、どこか別の場所でその部分を再利用しようとしているのではないからです。それはAI生成されたブログ投稿とは全く異なります。なぜなら、あなたが持っているアイデアを取り出して、それを正しく編集しているのではないからです。それは、音楽を理解していない誰かが友人にそれを行くように言っているのです。
それは、私があなたに、犬のためのTinderのようなアプリが欲しいと言っているようなものです。私のためにそれを作ってください。そしてあなたがすべてのピースを理解できることを望んでいます。それはただ愚かです。そのようには機能しません。それは馬鹿げています。そして彼らが構築を終えたときに満足感を得ることはありません。請求書を受け取ります。ここでの私のポイントについて混乱している人々を見ました。消費に関する点についてです。私の主張は、音楽は人間によって消費されるので、人間によって作られるべきだということですか?
いいえ、それは私のポイントではありません。私のポイントは実際にはその逆です。コードも人間によって消費されることができますが、気にしません。なぜならコードの価値は、人間がそれを消費することではないからです。コードの価値は、コードが実行されてサービスを提供することです。音楽の価値は、それを聴くことだけです。それが重要な唯一の部分です。音楽に他の価値はありません。
つまり、2つのAIモデルがある場合、1つはテキストとコードを生成でき、1つは音楽を生成できます。テキストとコードを生成できるものは、ブログ投稿、記事、エッセイなど、人間のためのものを作ることができます。そして、誰も読まなくても有用なコードを作ることができます。LLMを反復し続けることは価値があります。なぜなら、LLMが生成するものは、人間がそれに触れなくても有用だからです。
音楽モデル、画像モデル、または動画モデルによって生成されたものには、それがどのように消費されるかの外に、全くゼロの価値もありません。曲を生成する唯一の価値は、それを聴くことです。生成されるテキストの大部分は、人間によって消費されることは決してありません。生成される音楽の大部分は、一人の人間によってのみ消費されます。それがここでの違いです。
消費側の外にこれには価値がありません。それがそれを非常に魂のないものにします。次の男と同じくらい、クソなAIブログ投稿が嫌いです、信じてください。しかし、人間が読んでいるテキストの外に、AIがテキストを生成することには多くの価値があります。これらのものには全く価値がありません。システィーナ礼拝堂は教皇によって委託されました。
実行がそれを良くし、教皇が想像できたものを超えて拡大したものです。私たちは理由があってミケランジェロを評価しています。はい、このアナロジーが好きです。礼拝堂を作成したのは教皇ではありません。彼はそれを委託しました。ミケランジェロはそれを設計し、デザインした人であり、それを作成した人として記憶される価値があります。
そしてSunoを使うとき、それは実質的にSunoの作成者が曲を作ったのであって、あなたではありません。しかしそれさえもそうではありません。彼らは出てくる音を作成した人ではありません。彼らは他のアーティストからの大量のメディアでトレーニングしました。彼らは必ずしもその権利を持っていませんでした。少なくとも彼らは持っていませんでした。なぜなら、私のお気に入りであるWarnerがSunoと提携を結んだからです。
はい、本当に。この取引は、Sunoの最高クラスのAI機能と、音楽とテクノロジーの交差点におけるWMGのアーティスト開発リーダーシップと専門知識を結びつけます。この取引はまた、企業間の以前の訴訟を解決します。
知っておくべき重要なことは、Warnerや他の音楽レーベルは、Suno、Facebookのような大企業から大量のお金を取る方法を常に探しており、これについてはすぐに話します。また、自分のアーティストからお金を取ることも探しています。約束しますが、SunoからWarnerのアーティストに行くドルは実質的にゼロです。
これは、Warnerビジネス、Warner法務チーム、そしてあまりにも多くのお金に値するスタートアップであるSunoとの間の合意です。私はこれがすべてどのように機能するかについて、あまりにも多くの内部情報を持っています。誰かがちょうどチャットでそれに触れました。TwitchはDJのもう一つの例です。あなたには分かりません。私は元のTwitch音楽製品のスペックを書きました。私はそこで地上階に非常に深く関与していました。これがすべてどのように機能するかについて、あまりにも多くを知っています。
そして、すべての人のためにすべてをめちゃくちゃにした1つの取引がありました。2018年、FacebookとWarner Music Inc.が動画とメッセージのための録音および出版された音楽取引を結びました。2010年代半ばから後半にかけて、すべての音楽レーベルは、YouTubeやTwitterやFacebookやこれらすべてのサービスを取り除くことができないことに気づきました。
だからそれをしようとする代わりに、彼らはそれらに課金できるかもしれないと思いました。だから彼らはそれらすべてに行って、YouTubeで彼らの曲の1つが再生されるたびに支払われるように、取引をインクアウトしようとしました。しかし実際には、それが行ったことは、3時間の動画の中で誤って15秒の曲を再生すると、すべての収益がWarnerに行くことです。素晴らしい。素晴らしい。
それがすべてを間違って行ったことであるなら、それは大丈夫でしょう。しかしこれはすべてが崩壊した取引です。Facebookはfacebook.comでの動画にもっと力を入れたかったのです。彼らはVineやYouTubeとよりアクティブに競争したかったのです。彼らはTwitchとも競争しようとしていました。Facebookゲーミングの日々を覚えているなら、良い時代でした。
彼らは既に、背景で曲が再生されているランダムな30秒のクリップのためにWarnerによって訴えられ始めていました。Facebookは大量のお金を持っていました。彼らは、これらのどれも邪魔になることを望んでいませんでした。だから彼らは、音楽業界全体とテクノロジーとの関係を誤ってめちゃくちゃにしたことをしました。彼らはWarnerに約10億ドルを支払って、あなたが感じるところでどこでも私たちのものを使う包括的ライセンスを取得しました。Warnerが彼らを訴えないように、そして視聴回数に基づいて支払う必要なく、許可なしにものを使えるようにするためです。YouTubeでは、Warnerの
音楽ライセンスに帰することができるすべてのビューが、Warnerにお金をもたらします。Facebookでは、それはどれも重要ではありませんでした。それは実際にはかなり役立ちます。なぜなら、当時Facebookはビュー数を人為的に水増ししていたので、ビューごとに支払うならそれらをめちゃくちゃにしていたでしょう。
彼らはこのフラット料金をインクしました。なぜなら彼らはこれすべてを扱いたくなかったからです。そして彼らはそれで文字通り何もしませんでした。仮定は、これがすべての新しいタイプの音楽創造と音楽クリエイターがFacebookで成功することを可能にするだろうということでした。おそらく人々はDJセットをライブストリームするでしょう、おそらく彼らはダンス動画をするでしょう、おそらく彼らはこれらすべての異なることをするでしょう。そしてそれは決して起こりませんでした。
しかしFacebookがこのライセンスに数十億ドルを支払ってから、それを一度も使わなかったので、Warnerが以来維持しようとしている基準を設定しました。それは、彼らのIPにアクセスするという単なる概念が数十億ドルの価値があるということです。だから彼らはそれを請求すべきです。
そして数字がTwitchに来ていたとき、同様の取引がどれくらいのお金がかかるかについて、Twitchは既に赤字です。彼らはTwitchをはるかに、はるかに深い赤字に置いていたでしょう。陽気なほどです。そしてTwitchの回避策は美しかったです。私たちが思いついた解決策は、ラジオライセンスがオンデマンドライセンスとは非常に異なっていたということです。動画をクリックして曲を聴くことができるなら、それはおそらく、行って曲とそれへのアクセスのために支払うことの市場置換です。
しかし、あなたがラジオを聴いていて、私が好きな曲を再生して、もう一度聴きたいなら、ラジオでそれをもう一度再生させることはできません。曲を見つけて支払う必要があります。だから、一般的に言えば、ライブ音楽放送は著作権に関してより寛大なルールを持っています。
その上、ライブ音楽放送は警察することがはるかに難しいです。なぜなら、すべての単一のライブストリームにリスナーとフィーラーを持っている必要があり、数十人に対してあなたの著作権を侵害しているものを見つけることを望むからです。取り込みとそれらの違反を特定するためのコストは、それから得ることができるお金の量に対して、現実からあまりにもかけ離れているので、どの企業もそれを行いません。
代わりに彼らがすることは、ストリームが終わるまで待ってから、はるかに安い500倍速のような速度で再生される署名を探してVODをチェックすることです。だからTwitchの解決策は素晴らしかったです。私たちは2つのオーディオトラックを導入しました。一般的なストリームオーディオである1つと、音楽やその他の著作権とメディアを含む別のトラックです。そしてストリームが終わったら、2番目のオーディオトラックは保存しません。最初のものだけを保存します。
だから、Primogenのようなクリエイターが音楽を再生してストリームしていることに気づいたかもしれませんが、VODを見に行くと、音楽がなくなっています。それは彼が音楽を2番目のトラックにストリームしているからです。それにより、2つのチャンネルを適切に使用している場合、Twitchで音楽をライブで再生することでDMCAを受けることが実質的に不可能になります。
これは、これらすべての音楽ライセンスのものであるクソに対処するための法的考慮の技術的回避策です。もし私がここに座って、Sunoと Warnerのどちらがより悪いかをあなたに伝えなければならないなら、私は本当に苦労するでしょう。これらの人々全員が悪です。彼らはすべて最悪です。彼らの誰も音楽やメディアについて気にかけていません。
そして彼らのどちらも、アーティストが受けるべきものを有意義に支払うことは決してないでしょう。だからSunoは新しいWarnerです。そしてWarnerに勝たせる代わりに、彼らは提携しています。これは私を病気にさせます。これらすべてを言ったので、私には少しの希望があります。これがすべてどのように救われることができるかについて話しましょう。メディア生成ツールとテクノロジーをプロフェッショナルにとって実際に有用にするにはどうすればよいでしょうか?皆さんに見せたい2つの例があります。
これらの例は、以前のツールボックスの会話から来ています。ツールはボックスの外に住んでそれを置き換えようとしているのか、それともツールはあなたのツールボックスの中に入るもう一つのツールであり、プロフェッショナルとしてあなたをより生産的にするものなのか?私が見たこれらのAIツールの大部分は、ツールボックスを置き換えようとしています。そしてそれらはすべて最悪です。しかしそれを回避し、代わりにツールボックス内で有用なツールを作ろうとしているいくつかのものがありました。
そのうちの1つは、私が最近投資した会社、Co-createです。Co-createは動画制作を補強しようとしています。彼らはAI動画生成をしようとしているのではありません。彼らはAIを使って、プロフェッショナルな動画チームがより速くクソを取り除くのを助けようとしています。
従来の動画編集ソフトウェアは、手動作業の時間を要求します。クリップを並べ替え、オーディオを同期し、ラフカットを構築します。それがほとんどのクリエイターが、実際に作成するよりも整理に多くの時間を費やす理由です。Co-createは、技術的な苦労を自動化するプロフェッショナル第一の動画編集ツールで、ストーリーテリング、クリエイティブディレクション、そして繋がるコンテンツを作ることに集中させてくれます。
それはプロフェッショナルな動画編集ソフトウェアでの取り込みと整理のステップを自動化するように構築されています。チームが数十時間の映像を記録し、それを2〜5分の動画に使いたいとき、すべての映像を並べ替えるだけでも不愉快です。それをエディターの適切な場所に配置して作業を開始できるようにすることはもちろんです。
そしてあなたは、別のファイルから別の人のコンピューターから音声を同期する必要があることに気づきます。これらのより大きな動画制作チームで作業しているときは不愉快です。アシスタントエディターと呼ばれる役割カテゴリ全体があります。彼らはいつか本物のエディターになることを望んでいる人々で、業界に入る彼らの方法は、ただそこに座ってリードエディターのためにファイルを整理することです。
実際に動画編集ソフトウェア内でチョッピングの実際の作業を行っている1人のメインエディターのために、これらのアシスタントエディターが3〜5人いることがよくあります。これを自動化することは、私が実際にかなり興奮していることです。市場がどれくらい大きくなるかわかりませんが、誰かがそれをやっていることに興奮しています。彼らは実際のプロフェッショナルな動画スタジオに行って、床に座って、何が機能するか、何が欲求不満か、何が彼らをブロックしているかを見て、それからそれらの退屈な部分を自動化するために必要なものを構築しようとしています。それは素晴らしいです。彼らはツールボックスに適合しようとしています。彼らはそれを置き換えようとしていません。それを置き換えることは
愚かだからです。そして今、私のお気に入りの人間の一人、Daddy Kevへのもう一つの接線です。Kevは伝説的なレコードプロデューサーでオーディオエンジニアです。彼は何十年もミキシングとマスタリングをしてきました。私のお気に入りのレコードの多くはKevによってミキシングされました。ほとんどすべてのFlying Lotusのリリース、大量のDatalus、Bus Driver、Noage Thing、Sam I amなど。それは2000年代だけです。
2010年代には、彼は本当に人気が出ました。当時画期的だったBathのアルバムCeruleanに取り組んでいました。私はまだそのアルバムが大好きです。私のお気に入りのJohn Wayneのものの束。Mr. WazoによるStage TwoとStage Threeの両方。信じられないプロジェクトです。私はそれらの両方をビニールで持っています。Thundercat、彼はすぐにその後人気が出ました、Igloo Ghost、彼も深く愛しています。
このDJ PayPalのプロジェクト、それは時間的に完全に忘れられていますが、それはクソ信じられないです。彼を本当に愛しています。そして、もっと多くのもの。あなたがアメリカのヒップホップや実験的な電子音楽に少しでも興味があるなら、ここでスクロールして、あなたが聴いたことがあるものを見ることができます。確実に。彼はプロダクションを理解しています。
彼はオーディオエンジニアリング、ミキシング、マスタリング、これらすべてのものを理解しています。好奇心から、彼はAI関連のものを使って遊び始めました。曲を与えて、「何を変えますか?」と尋ねることで、ミキシングがどのように処理するかを見るためです。そしてそれが行った提案は、彼が期待していたよりも良かったです。
AIが実際に提案していることを行う方法はありませんでしたが、それはまともなことを提案するでしょう。そして彼がすべてのAIメディア会社がやっていることを見て、彼らがプロセス全体を置き換えようとしていて、彼が焦点を当てていた部分を補強していないことを見たとき、彼はそれを修正したいと決めました。
この男が最近50歳になったにもかかわらず、彼はこれをやりたいと決めました。これを理解したいと思いました。だから彼はコーディングの仕方を学び始めました。彼が欲しいものを構築できるようにするためです。そしてここで私の超スパイシーな見解が入ります。開発者は、彼らが気にかけない業界について学ぶにはあまりにも愚かすぎます。
コーディングを学ぶことは、音楽業界の深さへの理解を築くよりもはるかに簡単です。私は、ここのDaddy Kevが信じられないものを作るためにコードについて十分に教えることができるという信念をはるかに多く持っています。技術ブロの束がプロフェッショナルなメディアクリエイターのために実際に有用なツールを作ることができるよりもです。
技術ブロがミュージシャンをKevよりもよく理解すると考えることは、私にとってただ笑えることです。それは私たちが住んでいる本物の世界ではありません。そして彼の現在のプロジェクトDEXスイートがとてもクールな理由です。それは音楽DEXファイルのためのXMLビルダーでパーサーです。それは音楽制作ソフトウェアのための一般的なフォーマットです。彼はそのデータを解析して、すべての種類の異なることに使いたいと思っています。
だから彼はもちろんRustで動作するRustコアを書きましたが、TypeScript.jsとPythonでも動作します。人々がこれらのファイルをいじるためにこれを使えるようにするためです。そしてそれは非常に非常にクールです。これはまた彼の学習プロジェクトの一種です。彼はソフトウェア開発の知識を深め、彼が存在してほしいと思っているものを構築するためにどこに侵入できるかを理解するためにこれを行っています。これはとてもとてもクールです。
そして彼が私に、それに全力で取り組んでお金を調達したいと言う瞬間、私は彼にかなりの小切手を書くつもりです。なぜなら、分野の専門家がコーディングを学ぶことは、コードの専門家が分野を学ぶよりも常に有意義により良いパフォーマンスをするからです。そしてこれが私たちの勝ち方です。これらの技術ブロが分野を自動化できるふりをしているから気を取られるのをやめる必要があります。なぜなら彼らにはできないからです。彼らはそれを理解していません。
そのようには機能しません。彼らは音楽を理解せずに現れてそれを置き換えることはできません。私たちは、より良いツールを作り、私たちをクリエイターとしてより生産的にする既存のツールボックス内でものを構築するために、これらのものを使う必要があります。動画エディターでのより良いキャプションシステムのようなもの。画像エディターでの背景削除のようなもの。
Photoshopでのシャツのスワッピング、顔のスワッピング、そしてすべてのその楽しいもののようなもの。音楽ソフトウェアでのサンプルクリエイター、ループクリエイター、EQツール、そしてこれらすべてのもののようなもの。今起こっているAI革命を利用するために構築されている場合、私たちのツール内で起こり得る非常にクールなものがたくさんあります。
しかし代わりに、私たちは、誰もがすぐにミュージシャンになるだろうから、私たち全員が置き換えられるだろうと言われています。うまくいけば、これはあなたが私がこの空間のどこに座っているかをよりよく理解するのに役立ちます。私は、私たちのツールボックスをAIで置き換えることは、本当にイタいと思います。私は、AIのために創造者になる人々が、実際にそのことを気にかけているからではなくそうする人々は、本当にイタいと思います。誰かが、AIがそれを少し簡単にしたから音楽やゲームや動画や何かを作り始めて、それから欲求不満になって、本物のものを学びに行ったなら。それはちょっとクールです。それが私が思いつくことができる唯一の利点です。誰かが彼らの最初の曲を作ろうとしています。
Sunoでそれがどれほどイタいかを理解してから、プロデュースを学びに行きます。それはクールです、推測します。しかし、一方でコードがあり、他方で動画生成があるこのスペクトルで、画像生成を超えたほぼすべてのものは、私の意見では有用でなくなります。なぜなら、何かをすることがはるかに難しいからです。
評価すべき点です。Sunoが、曲全体を生成するだけでなく、ステムを生成して、それらを整理して作業できる、よりスタジオのような製品を作ろうとしていることは知っています。本当にひどいウェブアプリで。ええ、クール。以前にやっていたことよりは良いです。
そして、これを使ってステムを生成したり、15個のユニークなサンプルを作成して、本物のエディターで使うために気に入ったものの1つを選んだりできるなら、もしかしたらクール。もしかしたら。でも、これはただそれだけじゃないんです。違う感じ方ができたらいいのにと本当に思います。彼らが単に私たちのツールボックスとこれらのものを作る人間を置き換えようとしているだけではないという希望を与えてくれる、この分野でもっと多くのことが起こっているのを見られたらと心から願っています。でもそれは彼らがやっていることではありません。
彼らは私たちの仕事を楽にしようとしているのではありません。彼らは私たちの分野全体が愚かで、それを自動化できると主張しています。そしてそれは愚かです。これについては他に何もありません。私が狂っていてただの嫌悪者なのか、それともここで良い点を指摘しているのか、コメントで教えてください。皆さんがどう感じているのか気になります。そして私はこれについて大量に炎上することはないと確信しています。次回まで、平和ですよ、オタクたち。


コメント