本動画は、AI画像生成ツールMidjourneyの包括的な初心者向けガイドである。投稿者は2023年から数万枚の画像を生成してきた豊富な経験をもとに、基本的な使用方法から高度なパラメーター設定まで詳しく解説している。プロンプトの書き方、アスペクト比やスタイライズなどのパラメーター活用法、最新の動画生成機能、料金プランの選び方まで幅広くカバーした実践的な内容となっている。

Midjourney完全攻略ガイド
さて、この動画ではMidjourneyの使い方について話していこうやないか。Midjourneyは僕が今まで使ったAIツールの中で、おそらく一番よう使うたやつやと思う。いや、絶対そうやわ。せやから今回は、Midjourneyの完全チュートリアルとして、使えるプロンプトの包括的なリストも含めて紹介するで。特に基礎的なレベルから始めて、君らが正確にどうやって使うかを理解できるようにしていくつもりや。
最高の画像と動画を作るための最良の構成要素を見せていくで。僕がMidjourneyを使ってるって言うときは、冗談やないねん。もうかなり長い間、これで画像を作り続けてる。ここに昨日作った画像がいくつかあるわ。もしスクロールして戻ったら、全部が読み込まれへんのは、単純に僕が作った動画の量があまりにも多いからや。
でもここで見てもらえるように、めちゃくちゃたくさんあるねん。何千枚、いや多分何万枚っていうレベルで、2023年1月まで遡れるで。ちなみに、これらは当時の最先端やった。最近、Midjourneyがこれらの画像を動画に変換する機能を追加してくれて、その動画がほんまに驚くべきもので、画像の本質をしっかりと捉えてくれてるねん。せやから僕は絶対にこれが大好きやわ。
Meta(Facebook)との提携と基本操作
彼らはMeta、つまりFacebookとも提携を始めたんや。せやからこのアートスタイルをもっと頻繁に見ることになると思うで。よっしゃ、早速始めていこうか。
まず、midjourney.comにアクセスして、サインインして、作成を開く。これがこの小さなアイコンやな。ここにプロンプトを入力して、エンターを押すんや。これが僕のプロンプトや。
「ジョン・ウィックの折り紙スタイルの戦闘シーンで、折り紙のキアヌ・リーブスが片手に侍の刀、もう片手に拳銃を持って、暗殺者のグループと戦いを繰り広げる」って入力したんや。残りの部分についてはまだ心配せんでええ。すぐに意味が分かるから。エンターを押すか、送信をクリックすると、僕らの頭の中で想像したものを作り始めてくれる。
完成に近づいてきて、モデルがぼやけた状態からかなり良い感じの画像まで、生命を吹き込んでいく様子が見えるやろ。クリックするともう少し良く見ることができるで。矢印キーやクリックで順番に見ていくことができる。
初期結果の評価と次のステップ
正直、全部かなり良い感じやわ。これが多分一番好きかな。めちゃくちゃええやんか。これは折り紙っていうより、紙とか張子って感じやけど、ジョン・ウィックとしては素晴らしいな。もしここで何か不完全な部分や違和感を感じても心配せんでええで。これはまだ最初の下書きみたいなもんやから。
画像を生成すると、1から4まで番号が振られるねん。1、2、3、4って感じで。もしくはこんなグリッドになったら、やっぱり1、2、3、4や。次のステップは2つのうちどちらかをすることや。変化させるか、アップスケールするかやな。
ここで見てもらえるように、「V subtle」「V strong」って書いてある。Vはveryの意味で、「この概念が気に入った、こんな感じでもっと作って」っていう意味や。例えば、この4つの中で僕はこれがほんまに気に入ってる。「subtle」は微妙な変化でこんな感じのをもっと作ってっていう意味で、「V strong」は大きくて強い変化でこんな感じのをもっと作ってっていう意味やねん。せやからV strongとV subtleの両方をクリックして、2つの違いを見てみるわ。「animate」は動画を作ってくれる機能や。
これがすぐに出てくるで。これが僕らが頼んだ2つの結果や。1つは微妙で、もう1つは強い変化や。どっちがどっちか多分分かるやろ?これが微妙な変化の方やな。元の画像にかなり似たままで、微妙で小さな変化はあるけど、シーンや構図は同じままや。
下の方が強い変化の方やな。服装や位置、何を持ってるかとか、大きな変化が加えられてる。強い変化の方を見てみると、めちゃくちゃええやんか。これが1、2、3、4や。微妙な変化の方では、これが1、2、3、4やな。
僕だけかもしれんけど、これがほんまに気に入ってるわ。よっしゃ、次は何をするか?こんな感じで少しスライドアウトしてみよう。右のバーで、僕らができるもっとたくさんのアクションが見えるで。
バリエーション作成とアップスケール機能
さっきvaryを試したやろ?せやから微妙な変化や強い変化でこの画像に似た画像を作るんや。君らが望む限り、そのイテレーションを続けることができる。微妙な変化を続けて、新しい画像を作って、目指してる完璧な見た目を得られるかどうか確認していくんやな。
もしくは、完成したらアップスケールをクリックできる。これは画像のより大きなバージョンを作ってくれて、解像度もかなり高くなる。それに、元の画像に何か変な部分があったら、それを滑らかにしてくれることが多いねん。
せやから、より多くの計算処理やリソースを投入して、その美しい画像を生成するっていうことやな。そして再び、微妙なアップスケールか、よりクリエイティブなアップスケールを選ぶことができる。微妙な方をクリックして、それからクリエイティブな方もクリックして、両方がどんな感じになるか見てみるわ。
そして今、2つのアップスケールが完成した。これが微妙な方やな。少し拡大してみよう。すごいやろ。ディテールを見てみ。質感や布地、全部分かるやんか。スクロールしていくと、視野や背景のぼやけた人物とかも分かる。これはええ感じや。指とかもほぼ全部ちゃんと見えるわ。素晴らしいな。
これが微妙な方で、こっちがクリエイティブな方や。いくつか変わってる部分があるな。表情とかも変わってる。でも基本的には同じ場所から始まってるから、どことなく似た感じになるねん。これが2つの違いやな。スタイルが少し変わって、しわの具合とか、彩度の一部とかが変わってる。
どっちでも好きな方を使ったらええで。よっしゃ、これが気に入ったとしよう。右下に「animate image」があるねん。もしこのビューにいるなら、ホバーして「animate」をクリックできるし、画像をクリックすると実行できるコマンドの全リストが右側に表示される。ダウンロードしたり、お気に入りにしたり、いろんなことができるし、使ったプロンプトも確認できる。でも下の方に「animate image」があるねん。
動画生成機能の使い方
一番シンプルな使い方は「auto」やな。「low motion」や「high motion」も選べる。low motionは多分スローモーションみたいな感じで、剣をゆっくり動かすような感じやろ。high motionは多分もっと格闘シーンみたいな感じになるやろな。せやからlow motionとhigh motionの両方を試してみるで。画像を作るときと似てて、4つのバリエーションを提供してくれる。せやからその中からどんなアニメーションが欲しいかを選ぶことができるねん。
ここで料金について、特に動画に関して簡単に説明しとくのが重要やと思う。知っておかなあかんことがあるからな。最新の料金については公式サイトで確認してもらったらええけど、動画に関して特に理解しておかなあかんのは、「relaxed mode」っていうのがあるっていうことや。
基本的に、プロンプトを入力したら、すぐに結果をくれる。これが「fast mode」ですぐに結果が出るモードや。それとは別に「relaxed mode」もあって、これは基本的にGPUがもう少し空いてるときまで動画や画像の作成を遅らせるモードやねん。毎月限られた量のfast hoursがもらえるけど、proプランとmegaプランでは無制限のrelaxed mode動画が使えるねん。
料金プランと商用利用について
これを説明する理由は、無制限の動画が欲しかったら、proとmegaモードで使えるからや。例えば、商用目的で使う場合、これは購読者には広く許可されてるけど、年間収益が100万ドル以上やったら、proかmegaを使わなあかん。でもポイントは、無制限の動画生成ができるっていうことや。ただ、relax modeで実行する必要がある。せやから開始まで10分くらいかかるかもしれん。
僕はまだそんなに試してへんけど、動画の作成を遅らせるだけで、無制限に動画を作ることができるねん。せやからたくさんの動画が必要な何かを作ってる場合、例えば商用映像、Bロール、自分の映画作りとか、何でもええけど、月60ドルから始まって、商用利用ができるねん。これはかなりかっこええと思うわ。
みんなに向いてるとは思わへんけど、すぐに全部を手に入れる代わりに少し待つのを厭わへんなら、なかなかええ小技やと思うねん。よっしゃ、最初の4つのバリエーションが完成したで。これが僕らが使うlow motionやな。見てみよう。
これが最初のやつや。なかなか面白いな。めちゃくちゃかっこええやん。戦闘シーンが進行してるのが分かるで。これが2番目や。おお、いい感じやな。そんなに良くはないかな。これが3番目や。まだまだええ感じやで。3番目にはかなり多くの破片が飛んでるな。そして4番目がこれや。彼が回転しながら忍者と戦ってる。その中の1人が地面に倒れてるで。
動画結果の評価と拡張機能
僕は1番が一番好きかもしれんな。ほんまにスタイルによるけど、完璧に見えるやつもあるからな。これは明らかに少し難しいやろな。考えてみたら、様々な折り紙の人物がジョン・ウィックの映画を再現してるデータなんて、そんなにあるわけないからな。
せやから、これはこれで、かなりええと思うわ。飛び散る破片がたくさんあるこのやつもなかなかグラフィカルやな。ここからlow motionやhigh motionで動画を拡張することもできる。こうやって割り当てられた秒数以上の長さを得ることができるねん。これらは5.2秒やけど、拡張することでどんどん長くできるで。
これで飛び込んで始めるために知っておく必要があることは以上やな。問題は、どうやってもっと上手くなるかやろ?ここの「explore」セクションに行って、これでその週、その日、その月のコミュニティお気に入りの画像と動画が表示される。例えば、トップウィークの動画を見たいとしたら、ここにリストされてる。
いろいろ見て回って、みんなが作ってるものをチェックしてみるとええで。僕は人々が作ったトップウィーク、トップマンス、どんなトップ期間でもええけど、そういう画像と、君らが本当に気に入るスタイルを見ることを強く勧めるわ。もし本当に何かが目を引いたら、それをクリックすると、それを開発するために使われた実際のプロンプトを見ることができるねん。
プロンプト作成のコツと重要要素
これがこの画像に貢献したプロンプトや。これがこれを作ったプロンプトやな。せやからこれらの異なる画像がどうやって作られたかを、プロンプトを見て結果を確認することで理解できるねん。
大きな違いを生むのは何か?プロンプトでは、被写体、媒体、照明、ムード、ショットタイプ、時代などについて具体的に書くことやな。媒体が多分一番大きな要因やろな。パステル画にしたいか?ピクセルアートにしたいか?リアルなカメラで撮影したような感じにしたいか?マクロ写真にしたいか?最高の出力を得るためには、どんな媒体を使ってるかを指定するものがあった方がええやろな。
これは森の動物をフィーチャーしたヴィンテージスタイルの青と白のツイル・ド・ジョワイ柄やな。何かは分からへんけど、ツイルって入力したら、発音は分からんけど、これが出てくるねん。
そうやろ?僕らはこの媒体、このスタイルが欲しいけど、森の動物と一緒にって言ってるねん。そしたらバーンと、これが現れる。これは人間の目のエアブラシ絵画やな。せやからまさに僕らが得ようとしてる媒体やねん。
これは美しくて素晴らしい若い女性やな。媒体に注目してみ。「stock photo」って言ってるねん。せやからその被写体のストックフォトがどんな感じに見えるかっていう期待通りの感じやな。スキー、スキーゴーグル、冬の風景の外でって指定もしてる。完璧やな。
ここで注目してみ、「GQ雑誌のためのポーズ」って言ってるねん。これでバッチリや。白い背景、顔のコントラスト、リアルな写真撮影。
プロンプト構造の理解
こうやってこれらのプロンプトを見てると、それらが最終的な画像にどう翻訳されるかが分かり始めるやろ。でもこれらが本当に役立つ要素やねん。再び、被写体、つまり被写体は誰か?この場合は、22歳の白人男性やな。バーン。これが被写体や。媒体、照明。顔にコントラストの照明があるのに気づくやろ。
ショットタイプやろ?リアルな写真撮影。時代。GQ雑誌って言ってるから、それで何となく時代が分かるやろ?ルネサンスやないし、もう少し現代的やねん。これがプロンプトや。これが多分、何が現れるかを変えるために一番いじらなあかん部分やな。
何がうまくいくかを理解する一部は、ただいろいろ試してみることや。他のみんなが何を作ってるかを見て、もっといろんなことをやってみる。異なることを続けてやってたら、何がうまくいって何がうまくいかないかが分かってくるで。これがプロンプトや。再び、これが一番大きな要素やな。
パラメーターの活用法
でもパラメーターもあるねん。パラメーターはプロンプトの後に付ける小さな要素や。最初は少し複雑に見えるかもしれんけど、お気に入りのパラメーターを覚えてしまったら、めちゃくちゃ簡単になるで。
僕が多分一番よく使うのは「d-aspect」、ショートカットは「d-a」や。アスペクト比は写真の幅と高さみたいなもんやな。このキアヌ・リーブスでは9:16を使った。せやからこれは縦長みたいな感じや。これは16:9やから、ワイドスクリーンみたいなアスペクト比やな。
これは1:1のアスペクト比やろな。分かるやろ?せやからこれは9:16などなどや。プロンプトセクションでどうやって使うか?例えば、女性のカバのグラマーショットが欲しいとしよう。これがプロンプトの終わりや。そしたらスペース、ダッシュAR、スペースや。少しズームアウトして分かりやすくするわ。
せやから「d-AR」やろ?それからスペース。それからアスペクト比を入力する。幅×高さやな。9:16は縦長になって、16:9は横長になる。1:1は正方形になる。何が一番ええと思うかやな。せやから1:1、16:9、9:16をやってみるで。他にも時々見るのは3:4とかやな。
好きなもの何でも入れることができるけど、多分もう少し一般的なやつがいくつかあって、それがここで見えるやつやな。よっしゃ、これが1つ目で正方形や。幅広のやつらが16:9や。上下のやつらが9:16や。そしてこれらが3:4や。見てみ、その美しい、美しいカバを。
関係ない話やけど、これが彼らの頭蓋骨がどんな感じか知ってた?これらは化け物やで。もしこんな化石を見つけたら、人間を食べる恐ろしい見た目の化け物やと思うやろな。でも彼らがちょっとぽっちゃりした見た目やから、「あ、大丈夫、化け物のはずがない」って思うねん。でも実際は化け物やねん。証拠Aや。忘れたらあかんで。
高度なパラメーター設定
コアなレイアウトとスタイルに関する他の面白いパラメーターは以下のやつらや。ライトモードのウェブサイトに切り替えるで。事前に警告しとくけど、raw、chaos、weird、stylizeがあるねん。実際、これはダークモードでもちゃんと動くな。
stylizeがあるねん。これは「d-stylize」か「d-s」やな。これは芸術的なフレアをコントロールする。これが0、100、500、1000や。再び、何が一番好きかを見るためにいろいろ試してみてや。
rawモードは画像をもっとコントロールできるようにしてくれる。これはもっと、考えてみたら、ハウススタイルみたいなもんがあるねん。人々が投票で上げ下げすることで時間をかけて徐々に進化していくMidjourneyの特定のスタイルがある。君らはそれから離れたいかもしれん。このrawモードがそれをできるようにしてくれるねん。
標準モードは、ここで見てもらえるように、少し芸術的で、カラフルで、アニメっぽい。rawモードは少しよりリアルやな。そのMidjourneyモードから離れて、より幅広い芸術スタイルができるようにしてくれる。
chaosまたは「d-C」もあるねん。ここで見てもらえるように、「d-c」でその数字を増やすと少しよりカオスになる。より多様性が出て、少し変になるねん。これは亀やけど、chaosを増やすと、これも亀かもしれんって感じになる。
これは0から100まで設定できる。せやから女性のカバのグラマーショットで、chaosを100に設定したら、こんな感じになるかもしれん。形作られていく中で、もうちょっと変になってるのが分かるやろ。これがその結果の1つや。うわ。これがもう1つやな。せやから、かなり多様性があるのが分かるやろ。変な結果を期待してや。
探索機能とパーソナライゼーション
この時点で、本当に作り始めるために知っておく必要があることのほとんどを知ってるで。exploreを見てみ。人々が何を使ってるかを見る。様々な画像をクリックしてや。どうやって書いてるかを見る。これをクリックするだけでプロンプトにインポートして、似たようなものを作れるかどうか確認できるで。
君らの結果は異なるseedのために違うものになるやろな。各画像は異なるseedから始まる。これはランダム化されたパラメーターみたいなもので、似たseedから始めた場合にのみ似た画像を得ることができるねん。これはちょっと複雑やから、別の動画で説明するけど、試してみる価値があるかっこええことの1つは、personalizeをチェックすることや。
ここでパーソナライゼーションをオンにして、気に入った画像を選ぶことができるねん。時間が経つにつれて、AIモデルが君の好きなもののプロフィールを作成して、君のお気に入りのスタイルや好みに合わせてスタイライズしようとしてくれるようになるねん。ここで違いを見ることができる。これは人やけど、異なるスタイル好みを持つ異なる人々に対してやな。ここで見てもらえるように、めちゃくちゃ、めちゃくちゃ、めちゃくちゃ違うねん。
ムードボード機能と総括
最新の機能がムードボードや。僕はまだこれを試す機会がなかったんやけど、これは特定のビジョンがある場合のためのもんやな。例えば、スタイリスティックなカートゥーンを作ってて、全部を同じスタイルで統一したい場合。画像のコレクションをキュレートして、スタイルを設定することができるねん。
フォーカスされたムードボードは一貫性を作り出す。僕がちょうど作ったMidjourneyを使うための包括的なガイドがあるねん。価格プラン、Discordの使い方など全てを網羅してる。君らはMidjourneyをDiscord内でも使うことができるからな。Discord内で作成することができて、それにはたくさんのメリットがあるねん。
インペインティング、アウトペインティング、パンニング、ズーミングなど、僕らが話してへんことがまだまだたくさんあるねん。基本的に、インペインティングは既存の画像の何らかの側面を変更することや。アウトペインティングは1つの画像を与えたら、AIモデルがその周りの全てを作成することやな。せやからズームアウトすると、その周りがどんな感じになるかを想像してくれるねん。
最終的なアドバイスと今後の展開
僕らが話したseedとか、fast modeでやってるかどうか、draft modeでやってるかどうかなど、再現性とスピードのためのパラメーターもあるねん。ガイドをチェックしてみてや。下にリンクを残しとく。全ての隅々まで入り込んで、全てがどう動くかを説明するより完全で包括的なチュートリアルも作るつもりや。特定のことをカバーしてほしかったら、下にコメントしてや。
でもこの動画で、始めるために必要な全てが揃ったで。もしまだMidjourneyを使ったことがないけど使いたいと思ってたら、再び、これは多分僕のナンバーワンツールや。僕がどれだけの画像を作ったかを見たやろ。これは2023年から使い続けてる1つのやつやねん。画像作成のためのたくさんの他のAIツールが市場に出てきたけど、僕がいつも戻ってくるのはこれなんや。それが生み出すことができる信じられないスタイルのおかげやな。
ということで、チャンネル登録を忘れんといてや。見てくれて本当にありがとう。次の動画で会おうな。


コメント