
14,473 文字

これは現在使える最高のオープンソースAI音楽ジェネレーターです。その名もAceep(エーセップ)。このビデオでは、いくつかのデモを紹介し、使い方を説明するとともに、生成結果をさらに良くするための便利なヒントやコツもお教えします。もちろん、これをローカルにダウンロードしてインストールする方法も紹介するので、無料で何度でもオフラインで使うことができるようになります。
早速始めましょう。これはAce StudioとStepfunによる新しいAI音楽ジェネレーターで、使い方はとても簡単です。基本的にはUdioやSunnoやRefusionのようなものです。ジャンルや音楽の雰囲気を指定し、オプションで歌詞を追加してから「生成」ボタンを押すだけです。
まずは彼らのデモをいくつか紹介します。
「夢じゃない、道の始まり。音楽が流れる未来を作る。聴き、成長するモデル。新世界のリズムとなる一歩。もう限界も境界線もない。百万の心に千の歌。火花を灯し、音を高める。新しい基盤が生まれる。私たちが踏み出す一歩は、速くて自由な世界への跳躍。天を揺るがす消えない私たち。エースステップ、ビートは続く。強く見つけた。強く見つけた。新しい夜明け」
とても素晴らしいですね。数週間前に、Yuという別のオープンソース音楽ジェネレーターを紹介しましたが、この新しいAEPは単純に言ってずっと優れています。
また、SununoやUdoと同様に、歌詞の中に「verse」(詩)、「pre chorus」(プリコーラス)、「chorus」(コーラス)などのメタタグを追加できることに注意してください。これについては後ほど詳しく説明します。
こちらはオルタナティブロックのジャンル例です。どんな感じか聴いてみましょう。
「都会の空に明るい光が点滅。理由もなく速く走る。エレクトリックな夜に心が燃える。疲れを知らず夢を追いかける。私たちの目に。輝く大きな夢。群衆の上で大きく輝く。束縛から解き放たれたように生きる。夜の中で自由に荒々しく。終わりなくビートを感じる。真夜中の空気の中で心が衝突する。私たちはここに属している。気にすることなど何もない」
とても素晴らしいですね。これは本物のロック曲のように聞こえます。ボーカルと楽器の音が非常にリアルでダイナミックです。オープンソースツールとしては本当に印象的です。
こちらはエレクトロニックラップです。「波のうねり、デジタルハスラーが真夜中にスニーカーを履いてビートを刻む」
いくつかの単語を歌詞全体で発音を間違えていましたが、いつでも再生成したり、インペイント(部分修正)したりできます。後で説明します。
さて、これはかなりクレイジーな例です。プロンプトは「ダブステップ、不気味、ダブステップ、ダブステップ、ダーク、ダブステップ、ダブステップ、恐怖、もっとダブステップ。この曲をとにかくダブステップにしてください」です。そして歌詞には、誰かが叫んでいるような暗く恐ろしい歌詞があります。聴いてみましょう。
「鋼を開く。彼は立ち上がる、血を感じるために。炎が轟き、空を暗くする。弱き者は震え、すべて死ななければならない」
ああ、アメリカンなヘビーメタルの声を出して、かなり狂ったドロップを生成できました。また、メタタグで「エコーする唸り声」と指定すると、実際にエコーする唸り声が生成されます。印象的ですね。
次に、「エーテル的でダークな液体、深いベースライン、女性ボーカル」としてみましょう。そして歌詞をこんな感じに設定します。聴いてみましょう。
とても興味深いですね。こちらは女性の声を使った別の例です。「ああ、ああ、ナナナ、イェイェイェ」
かなりクールでした。実際には正確な「ナ」や「イェ」や「オー」の数を歌っているわけではなく、やや不安定ですが、それでも興味深い実験です。
これは楽器演奏のみも生成できます。こちらはサックスとジャズです。聴いてみましょう。
確かにサックスとジャズのように聞こえます。
こちらはピアノ、バイオリン、変ロ長調、アレグロのソナタです。こちらはギターのクラシックタンゴです。美しく超リアルに聞こえます。こちらはサイケデリックトランスです。
英語に加えて、さまざまな言語で曲を生成することもできます。いくつか例を紹介します。
こちらは中国語のエレクトロニックハウスです。こちらはフランス語の例です。こちらはドイツ語の例です。ドイツ語を理解できる方は、この曲が正しく歌われているかどうかコメント欄で教えてください。
そして日本語の曲もあります。もちろん、かわいいカワイイボーカルのアニメになります。
うーん、本当にJ-POPのように聞こえますね。特にギターとメロディーがとても良いです。
そして韓国語もあります。
さて、デモはここまでにして、使い方と使用場所について説明しましょう。オンラインで使用したい場合は、ページ上部に無料のHugging Faceデモがあります。クリックするとこのように表示されます。
または、GitHubをクリックすると、ローカルにダウンロードして実行する方法も記載されています。後ほど詳しく説明します。インストールすると、インターフェースもこのように表示されます。
それでは、各設定の意味と使い方について説明しましょう。
まず、オーディオの長さがあります。デフォルト値の「-1」を設定すると、下に入力した歌詞に合わせて自動的に曲の長さが調整されると思うかもしれませんが、そうではありません。自動的に合わせるわけではなく、30秒から4分の間のランダムな長さになります。そのため、「-1」のままにするのではなく、歌詞の長さに基づいて適切な長さを設定することをお勧めします。
こちらにはオーディオからオーディオへの機能がありますが、これは後ほど説明します。
こちらにタグがあります。これはジャンルや曲の雰囲気を指定するものです。そして下には歌詞があります。
スクロールすると、基本設定があります。推論ステップは、AIが生成前に実行する反復回数を意味します。一般的に、ステップ数が多いほど曲の品質が高くなりますが、ある程度を超えると効果は薄れます。デフォルト値の27が適切なポイントのようです。もっと速く生成したい場合は、品質を犠牲にするリスクを負って20程度に設定することもできます。私はデフォルトの27のままにしておきます。
ガイダンスについては、実際に設定できる値が3つあります。最初のガイダンスは、AIが指定したジャンルと歌詞をどれだけ忠実にフォローするかを決定します。右にドラッグすると、プロンプトと歌詞をより文字通りに従います。左にドラッグすると、よりクリエイティブになり、プロンプトにそれほど従わなくなります。デフォルト値に戻しておきましょう。
ただし、ここで入力したテキストプロンプトに対して別のガイダンスを設定することで、この値を上書きすることもできます。AIに指定したジャンルを本当に守ってほしい場合は、この値を高く設定できます。これらの値のいずれかが1より大きい限り(これは1より大きいです)、全体のガイダンススケールは無視されることに注意してください。これを0にリセットしておきます。
そして、歌詞のガイダンススケールもあります。AIにより正確に歌詞を歌わせたい場合は、この設定を高い値にドラッグできます。AIは時に埋め語句を追加したり、発音を間違えたりするため、この場合はこの設定を調整するとよいでしょう。私は今のところこれを0にリセットしておきます。
こちらには詳細設定もあります。Eulerは、音楽を生成するために使用するアルゴリズムです。ここから2つ選択できるほか、異なるタイプのCFGも選択できます。これらの設定を自由に試してみてください。微妙な違いが出るかもしれませんが、私はすべてデフォルトのままにしておくことが多いです。
では、曲を生成してみましょう。これらの歌詞をすべて選択して、ChatGPTで生成したランダムな歌詞を貼り付けます。ここではフルソングではなく、詩とプリコーラスとコーラスのみがあります。そのため、長さを90秒に設定します。これはおおよその見積もりです。そしてこちらは簡単なものにして、「ポップロック」と入力しましょう。これだけです。「生成」をクリックしましょう。
これが結果です。
「あなたはリサイクルショップで買った服に心を載せた。誰も信じないような話を私に話してくれた。世界は残酷だけどあなたは優しいと言った。だから私はあなたの痛みを点線のようにたどった。私たちはその瞬間、魔法のようで、野性的で、気づいていなかった。でも童話は冷たい夜の空気の中で静かになる。あなたは私が留まるべき嵐だった。滑り落ちた稲妻のような愛。現実を語り、雨の中で微笑んだ。私はあなたの痛みを通して踊り続けた」
次に、ポップロックの代わりに、「J-pop EDM」というジャンルの例を示します。そしてChatGPTからのランダムな日本語の歌詞を貼り付けました。聴いてみましょう。
歌詞全体に、「verse one」(1番)、「pre chorus」(プリコーラス)、「chorus」(コーラス)、「drop」(ドロップ)、「synth solo」(シンセソロ)などの特定のタグがあることに注目してください。これらの異なるセクションを曲の中で聴くことができます。これらのメタタグはAIに曲の構造に関する方向性を与えます。曲に一貫性を持たせるために、これらのキーワードを追加することが非常に重要です。
例えば、詩とコーラスで同じメロディを繰り返すことがよくありますよね?また、コーラスはバースよりもエキサイティングでクライマックスになるように作りたいはずです。だからこれらのタグは非常に重要です。
これらのタグに加えて、「buildup」(盛り上がり)や「intro」(イントロ)、「outro」(アウトロ)、「bridge」(ブリッジ)なども使えます。これらは私が効果的だと思ったいくつかの例ですが、他にも役立つメタタグがあるかもしれません。もし何か他にも見つけたら、ぜひコメント欄で共有してください。
例えば、こちらは詩とコーラスの間に「guitar solo」(ギターソロ)を追加した別の生成例です。結果を聴いてみましょう。
歌詞でできるもう一つのクールな技があります。行の最後に括弧内に単語を追加すると、通常はその部分がエコーします。例えば、ここでコーラスでは「sky」を括弧内に入れ、次の行では「I」を2回繰り返し、その次の行には「fly」があります。コーラスに飛んでそれを聴いてみましょう。
「君と僕は舞い上がる。ベースを落として、リズムに身を任せて。熱を感じて、理由を尋ねないで」
そこでエコーが聞こえましたね。括弧内の単語がエコーしています。
歌詞を書く際のもう一つのヒントです。「RTXGPU」のような略語がある場合は、各文字をしっかりと間隔を空けるようにしてください。例えば、このように各文字の間にスペースを入れたり、このようにハイフンを入れたり、点を入れたりして、各文字が間隔をあけて読み上げられるようにします。
また、「5090」のような数字を使う場合、数字ではなく実際にどう言うべきかを入力するのが最善です。この場合、「5090」を「fiftyninetyと」呼びたいとします。
ここには2つの詩があります。最初の詩では、これをしないでください。これらの部分を正しく歌うとは期待していません。2番目の詩では、文字を分けて、さらに数字の言い方を指定しました。これでずっと正確に歌うはずです。両方の詩を聴いてみましょう。
「立ち上がって、景色を飛び回ろう。ARCGUで夢をレンダリング、空を壊すほど速く。高くて値打ちがある愛」(1番)
「立ち上がって、景色を飛び回ろう。GPUで夢をレンダリング、空を壊すほど速く。5090のように高い愛。ビットごとに雰囲気を作り上げる。電圧が上昇し、私たちは非常に生き生きとしている。ラグもキャップもなく、光と音だけ。このデジタルな愛の中で、決して電源が切れることはない」(2番)
さて、歌詞のフォーマット方法についていくつかのヒントとコツを紹介しましたが、タグのヒントとコツも紹介しましょう。
一般的に、ジャンルだけを指定すれば機能するとわかりました。「ロック」や「ポップ」、「オーケストラ」、「EDM」、「トランス」、「シンセウェーブ」などです。これらをすべて1つのプロンプトに入れないでください。完全に異なるジャンルを混ぜ合わせるのは非常に難しいです。
歌手の性別を指定したい場合は、単に「男性歌手」や「男性ボーカリスト」、「女性ボーカリスト」、「女性歌手」と書けばOKです。「アップビート」「エネルギッシュ」「感情的」などの単語も、うまく機能する傾向があります。
ただし、機能しないタグもあります。「~のスタイルで」と書いても機能しません。「テイラー・スウィフトのスタイルで」と書いても、彼女のカントリーポップスタイルの曲は生成されません。また、「ビートルズのように」と書いても、ビートルズのスタイルの曲は生成されません。これは機能しません。
BPMを指定しても実際には機能しません。何度もテストして、メトロノームを使って生成された曲のBPMと指定したBPMを比較しましたが、実際には正確ではありません。ただし、このタグを使って曲のペースをある程度指示することはできます。例えば、BPM 180に設定した曲は実際にBPM 180になるわけではありませんが、BPM 60に設定した曲よりは速くなります。これを使って曲のスピードをだいたい設定できます。
試してみて機能しないもう一つのことは、キーを設定することです。「Aマイナーキー」や「Gメジャー」、「Dマイナーキー」などと書いても、正しいキーは得られません。また、最後に拍子記号も機能しません。「3/4拍子」などと入れても、実際に3/4拍子の曲は生成されません。少なくとも70〜80%の場合、これは機能しません。
タグは主にジャンルや楽器、曲の雰囲気を指定するのに適しています。
さて、歌詞の代わりに完全に楽器だけの曲を生成したい場合は、このように角括弧で「instrumental」(インストゥルメンタル)と書くだけです。試してみましょう。
こちらに「synth wave」(シンセウェーブ)と入れて、少し速くするために20秒に設定します。「生成」をクリックして結果を見てみましょう。
シンセウェーブの代わりに、こちらはブルーグラスの例です。また、「instrumental」の代わりに、単に「inst」と書いても楽器のみの曲が生成されます。
もっと速くするために15秒に設定します。そして「生成」をクリックします。これが結果です。
ブルーグラスの代わりに、こちらは「kawaii bass」(カワイイベース)の例です。どんな感じか聴いてみましょう。
こちらは「lofi hiphop」(ローファイヒップホップ)の例です。どう思いますか?あまりローファイにもヒップホップにも聞こえませんね。
インストゥルメンタルについては、ロックやブルーグラス、カントリー、シンセウェーブ、レトロウェーブ、トランス、フューチャーベース、カワイイベースなどのジャンルではうまく機能しますが、クラシック音楽やオーケストラ音楽、アンビエント音楽などの他のジャンルではあまりうまく機能しません。ただ、これはSunoやUdo、Refusionなどの他のツールでも同様です。それらは特定のジャンルの生成には非常に適していますが、他のジャンルにはあまり適していません。
次に、「audio to audio」(オーディオからオーディオへ)という非常にクールな機能を紹介します。これをクリックすると、参照トラックをアップロードしてそのスタイルを生成できます。例えば、Refusionで生成した曲の最初の約40秒をアップロードします。
素早く再生してみましょう。「真実を貫き、変わらないで。信念を守ることをすべて教えてくれた。今ではあなたの言うことがほとんど理解できない。あなたが変わってしまった。最後には価値があったの?最後には価値があったの?」
ちなみに、この曲は数日間頭から離れませんでした。ここにはスライダーがあり、この参照オーディオが生成にどれだけ影響するかを調整できます。通常、デフォルト値の0.5でも高すぎます。これを0.6や0.7にドラッグすると、生成物は参照オーディオとほぼ同じように聞こえます。そのため、0.2から0.3の範囲が最適だと思います。0.2にしてみましょう。
タグには、「pop uplifting female vocals」(アップリフティングなポップの女性ボーカル)など、この曲を説明してみます。そして歌詞には、ChatGPTで生成した歌詞を貼り付けます。それだけです。「生成」をクリックして結果を見てみましょう。
これが結果です。「疑いの音に目覚めた。ささやきが私を引き下ろそうとしている。でも私は前にも嵐を乗り越えてきた。そしてまだドアの前に立っている。私は輝くつもりよ」
とても素晴らしいですね。参照オーディオと非常に似ていることがわかります。歌手は同じように聞こえます。全体的なキーと楽器も参照トラックのように聞こえます。これは非常に便利なツールです。既存の曲のスタイルで新しい曲を生成したい場合は、このオーディオからオーディオ機能を使用できます。ただし、このスライダーは非常に重要です。低い値に設定するようにしてください。そうしないと、参照曲と似すぎてしまいます。
ここでエラーに気づきました。見つけてみましょう。ここで余分な単語を発音しているようです。このセクションだけを再ペイントしましょう。「あなたはいつでも炎を暗くしようとする」と書いて、ここに音節を埋めてみます。
そして、この行の開始と終了を見つけてみましょう。36から始まり、40で終わります。36から40までを再ペイントしましょう。ソースについては、ここにあるテキストから音楽への生成を使用します。あるいは、編集するための曲をここにアップロードすることもできますが、私はテキストから音楽を使用します。そして「再ペイント」をクリックします。
これが結果です。ここに「always」という追加の単語を入れたことに注目してください。時間を節約するために、コーラスまでスキップします。
「まだドアの前に立っている。私は変わるつもりよ。あなたはいつでも炎を暗くしようとする」
そこにありました。魔法のように、インペイントしたい場所の歌詞が変わりました。
忘れていたことが一つあります。このバリアンススライダーは非常に重要です。これは基本的に、インペイントエリアをどれだけ変更したいかを決定します。曲が本当に変わっていないと感じる場合は、このバリアンス量を増やしてエリアをさらに変更してみることができます。
次に、ここにあるこれらのタブのいくつかも説明しましょう。まず、この「retake」(リテイク)タブは、上で生成した曲を再生成しますが、いくつかの違いを加えます。それがこのバリアンススライダーの目的です。これを0.1や0.2などの低い値にドラッグすると、この曲を再生成します。ほとんどの要素は同じままですが、微妙な違いがあります。一方、この値をより高くドラッグすると、曲にさらに多くの違いが加わります。
例えば、これがオリジナルの曲だとします。まず再生してみましょう。「ネオンライトが明るく点滅する。都市は夜更けにうなる。リズムがコンクリートの血管を通って脈打つ」
それがオリジナルの曲だとして、バリアンス0.2でリテイクすると、どのように聞こえるでしょうか。「ネオンライトが明るく点滅する。都市は夜更けにうなる。リズムがコンクリートの血管を通って脈打ち、リフレインのエコーの中で失われる」
オリジナルの曲と少し違いますね。今度はバリアンスをさらに高く4に設定して、どのように聞こえるか聴いてみましょう。「ネオンライトが明るく点滅する。都市は夜更けにうなる。リズムがコンクリートの血管を通って脈打ち、リフレインのエコーの中で失われる」
聞いてわかるように、オリジナルの曲よりもずっと異なって聞こえます。基本的に、曲を再生成したいが、いくつかの違いを加えたい場合にこのリテイク設定を使用します。
リペイントについては前に説明しました。曲の特定のセクションだけを編集できる機能です。編集したい曲のどの部分の開始時間と終了時間をここで指定します。
そして、この「edit」(編集)タブについて説明します。これも非常に便利で、同じ曲を保ちながら異なる歌詞を歌わせたい場合に使用します。ここですでに曲を生成しました。ジャンルは「acoustic pop emotional」(アコースティックポップ感情的)です。まず聴いてみましょう。
「同じコーヒー、違う種類のデート。私たちが作った思い出をスクロールしながら、あなたが立ち去った理由を探している。でも私は打ちのめされない。笑顔を浮かべ、王冠をかぶる」
では、曲の残りの部分は同じままで、いくつかの単語だけを異なる歌詞で歌わせたいとします。この編集タブでは、基本的に歌詞をここにコピーできます。いくつかの単語を変更してみましょう。
「day」の代わりに「way」と書きます。「why you walked away」の代わりに「why you couldn’t stay」と書きます。そして「break me down」の代わりに「break me now」と書きます。ここでいくつかの微妙な変更を加えました。
そして下では、編集した歌詞だけを切り替えて曲の残りの部分に影響を与えないように「only lyrics」(歌詞のみ)を選択します。その他の設定はそのままでOKです。下では「text to music」(テキストから音楽)を選択します。はい、今生成したこの曲を参照したいからです。その後、「edit」をクリックして結果を見てみましょう。
これが最終的な曲です。最初の曲とまったく同じですが、編集した歌詞を歌っていることに注目してください。「思い出をスクロールしながら、あなたが留まれなかった理由を探している。でも私は今打ちのめされない。笑顔を浮かべ」
これがこの非常に便利な編集機能です。
最後に、この「extend」(拡張)タブがあります。これはかなり自明です。これは基本的に、上で生成した曲を拡張します。右から30秒間このトラックを延長したい場合は、これを選択するか、延長したい長さを増やすこともできます。または、右ではなく左に曲を延長したい場合は、このスライダーを調整することもできます。
拡張ソースについては、「text to music」を選択すると、ここにあるものになります。または「upload」をクリックすると、ここに曲をアップロードして拡張することもできます。
これでこのプラットフォームでできるすべての機能の説明は終わりです。これは非常に強力なツールであり、完全に無料でオープンソースです。
次に、これをダウンロードして無制限に自分のコンピューター上でオフラインで使用する方法を説明しましょう。
こちらが彼らの公式GitHubリポジトリで、詳細は下のリンクに記載します。下にスクロールすると、最小VRAMの要件は8GBと書かれています。多くの人にとってこれは非常にアクセスしやすいです。そしてこれはオープンソースなので、コミュニティがこれをさらに量子化または圧縮して、さらに低いVRAMでも動作する可能性があります。ただし、現時点では、公式リポジトリでの最低要件は8GBです。
これはNvidia GPUでなくても動作します。MacBook M2でも動作させることができます。
ちなみに、彼らはComfy UIインテグレーションも持っています。Comfy UIで使用したい場合はこちらをクリックしてください。ただし、このビデオでは、Comfy UIをダウンロードしてすべてのノードやヌードルを扱う手間を省くために、彼らのネイティブインターフェースをダウンロードして使用する方法だけを説明します。
最初のステップは、このリポジトリをクローンする必要があります。これにはGitがコンピューターにインストールされている必要があります。まだインストールしていない場合は、インストール方法を説明します。すでにGitがインストールされている場合は、次のセクションにスキップしてください。
必要なのは、使用しているオペレーティングシステム用の最新リリースをダウンロードすることだけです。私はWindowsを使用しているので、Windowsのダウンロードをクリックします。64ビットを実行しているので、これをクリックしてダウンロードします。
このexeファイルをダウンロードしています。完了したら、そのexeファイルを開いてステップに従うだけです。「次へ」をクリックします。デフォルトのインストール場所(Program Files/Git)を使用します。「次へ」をクリックします。これをデフォルトのままにしておきます。また「次へ」をクリックします。「次へ」をクリックします。これらすべてについてデフォルト設定を使用します。設定がたくさんあるので、すべて「次へ」をクリックします。
それからすべてのファイルをインストールするはずです。これには数分かかるかもしれません。完璧です。これでGitがインストールされました。
コンピューターにGitがインストールされていると仮定して、コンピューターのどこにインストールするかに移動します。例えば、デスクトップにインストールしたいとします。デスクトップを開き、上部に「cmd」と入力して、デスクトップフォルダー内でコマンドプロンプトを開きます。そして、このaepリポジトリをクローンするためにこの行をコピーする必要があります。Enterを押します。
その後、デスクトップには「astep」という新しいフォルダーが表示されるはずです。それを開くと、このGitHubリポジトリに表示されるすべてのファイルとフォルダーが含まれているはずです。
次のステップは、astepフォルダーにディレクトリを変更することです。コマンドプロンプトでは、まだデスクトップにいるからです。この行をコピーしてここに貼り付け、フォルダーをastepに変更します。Enterを押した後、私たちはクローンしたばかりのaepフォルダー内にいることに注意してください。
次のステップでは、仮想環境を作成する必要があります。インストールされていない場合は、インストール方法を説明します。すでにインストールされている場合は、次のセクションにスキップしてください。
Anaconda.comにいます。実際にはMiniondaをインストールします。これはAnacondaの最小限のバージョンです。完全なAnacondaをインストールすると、必要ではない多くのパッケージと依存関係がインストールされます。これはコンピューターの容量を取るだけでなく、もちろんインストール時間も長くなります。しかし、Miniondaはベアボーンパッケージです。そして、常に後から追加のパッケージと依存関係をインストールできます。
「Latest Minionda installer links by Python version」をクリックします。私はWindowsを使用しているので、これらのいずれかをインストールします。無料でオープンソースのAIツールの場合、通常はPython 3.12をサポートしていないため、Python 3.11バージョンをインストールする方が良いです。これをクリックすると、exeファイルがコンピューターにダウンロードされます。
ダウンロードが完了したら、このファイルをダブルクリックして、インストールを完了するための手順に従います。「次へ」をクリックし、「同意する」をクリックします。これを「すべてのユーザー」に設定しましょう。デフォルトのインストール先フォルダーに進みます。また、「完了時にパッケージキャッシュをクリアする」もチェックします。これにより、機能に影響を与えずにディスク容量が解放されます。完了したら、「次へ」をクリックします。これで完了です。
まだ終わっていません。コマンドプロンプトを開いて「conda –version」と入力すると、まだ「認識されていない」と表示されます。これは、まだAnacondaをパスに追加していないためです。これを終了しましょう。
パスに追加するには、この機能「システム環境変数の編集」を検索するだけです。これをクリックし、「環境変数」をクリックしてから、「Path」と書かれているものをクリックし、「編集」をクリックします。ここがAnacondaのパスを追加する場所です。Anacondaをどこにインストールしたかによって異なります。私の場合、Program Dataにインストールしました。したがって、Program Data/minになります。scriptsをダブルクリックすると、condaがここにあることがわかります。これが貼り付けたいフォルダーです。
これを右クリックして「パスとしてコピー」を選択します。環境変数ウィンドウに戻り、「新規」をクリックしてパスをここに貼り付けます。「OK」をクリックし、再び「OK」をクリックし、もう一度「OK」をクリックします。
今、コマンドプロンプトを再度開いて「conda –version」と入力すると、24.5.0を実行していることがわかります。これでAnacondaが正常にインストールされたことを示しています。
インストールされていると仮定して、次のステップはcondaを使用して「ace_step」という新しい仮想環境を作成することです。これはPython 3.10を使用します。この行をコピーしてここに貼り付け、Enterを押します。
これが新しい環境を作成している間、仮想環境を作成する目的が初めての方のために説明します。これは、ACE stepに必要なすべてのパッケージと依存関係を格納するコンピューター上の別のハードドライブのようなものと考えてください。既存のライブラリや依存関係と競合しないように、すべてを別の環境にダウンロードして格納したいのです。
仮想環境を作成した後、次のステップは仮想環境をアクティブにすることです。この行をクリックしてここに貼り付けます。これはcondaを使用して、「ace_step」という名前の作成した環境をアクティブにします。Enterを押すと、各行の先頭に括弧内に環境名が表示されていることに注意してください。これは仮想環境内にいることを示しています。
さて、このオプションをカバーしました。次のステップは、すべての依存関係をインストールすることです。Nvidia GPUを搭載したWindowsを使用している場合(私がそうです)、この行を実行する必要があります。これをコピーします。そして仮想環境内で、ここに貼り付けてEnterを押します。
これによりPyTorchやその他の依存関係がダウンロードされます。サイズは約2.8GBです。インターネットの速度によっては時間がかかるでしょう。
エラーメッセージなしでこの行が再び表示されたら、PyTorchのインストールに成功したことを意味します。次のステップは、a stepとその主要な依存関係をpipでインストールすることです。この行をコピーして、ここに貼り付けてEnterを押します。再び、これを実行するために必要なすべてのパッケージと依存関係をインストールします。インターネットによっては数分かかります。
この長い依存関係リストをインストールした後、エラーメッセージなしでこの行が表示されたら、a stepのインストールに成功しています。これで実行に進むことができます。
このコマンドプロンプトを終了して、最初からこれを起動する方法を示しましょう。AEPフォルダー(ダウンロードした場所)に移動し、上部に「cmd」と入力してコマンドプロンプト内でこのフォルダーを開きます。
そして単に「conda activate」と入力し、仮想環境の名前を入力するだけです。私たちの場合は「ace_step」です。これを入力してEnterを押します。これで仮想環境内にいることがわかります。
最後のステップは「astep-server –port 7865」というコードを実行することです。この行をコピーしてここに貼り付けます。
初めて実行する場合、数分かかる場合がありますが、最終的にはローカルURLで実行されているという行が表示されます。Ctrlキーを押しながらこのリンクをクリックすると、ブラウザでこのインターフェースが開きます。これはブラウザを使用していますが、これは完全にオフラインであることに注意してください。ここに表示されているこのローカルアドレスを使用しています。
すべてが機能することを確認しましょう。いくつかのランダムな歌詞を貼り付けます。これを非常に速くするために、長さを15秒に設定します。タグには単に「pop」と入力します。そして「generate」をクリックします。
初めて「generate」をクリックすると、音楽を実際に生成するために、モデルなどの追加ファイルをダウンロードする必要があることに注意してください。これは約7〜8GB必要なようです。再度、インターネットによっては、最初の曲を実際に生成する前にすべてをダウンロードするのに数分待つ必要があります。
すべてのモデルをダウンロードした後、曲の生成に進みます。これが結果です。すべてが機能していることを確認するために、これを素早く再生しましょう。「夜はすべて輝き、彼らは栄える。電気的な鼓動は、彼らを駆り立てる。私の心は生き残るためだけに急いでいる」
完璧です。これがa stepをローカルでコンピューターにインストールする方法です。先ほど言ったように、これは現在使用できる最高の無料でオープンソースのAI音楽ジェネレーターです。非常に柔軟で、曲を編集したりインペイントしたり、オーディオからオーディオへの変換など、多くの機能があります。これは非常に強力なツールです。オープンソース化してくれた彼らに敬意を表します。そしてこれはさらに良くなるでしょう。
コメント欄でこれについてどう思うか教えてください。試してみる機会があった場合、どのような素晴らしい生成結果が得られましたか?また、インストール中にエラーが発生した場合は、コメント欄にエラーメッセージをコピーして貼り付けてください。可能な限りトラブルシューティングのお手伝いをします。
ちなみに、私が個人的にこれらのAIツールを実行するために使用している正確なラップトップを獲得したい場合、それはRTX 5000 ADAを搭載したDell Precision 5690です。私はDellテクノロジーズと提携して、幸運な勝者に同じラップトップをプレゼントします。下の説明にギブアウェイのリンクがあります。規約と条件が適用されます。


コメント