初心者でも簡単!Stable Diffusion WebUI Forgeのインストールする
低スペックのパソコンでも画像生成が出来るStable Diffusion WebUI Forge
特に画像生成AIの分野では、その進歩が物凄いものがあります。
その中で多くの注目を集めているのが「Stable Diffusion」です。
Stable Diffusionは2022年に開発された画像生成AIで、プロンプトを入力するだけで人物や動物、風景など多様な画像を生成することができます。パソコンにインストールすることが出来るのも特徴です。
Stable Diffusionをパソコンにインストールして使う際に、人気を博しているのがStable Diffusion webui A1111版です。
このツールは、ブラウザ経由で簡単に画像生成ができる無料のWEBアプリケーションで、Google Chromeなどの主要なブラウザで利用可能です。初心者でも手軽に操作できるインターフェースを備えています。
しかし、Stable Diffusion webui A1111版ですが、高いスペックのパソコンが必要です。推奨スペックとしては、CUDA対応のNVIDIA製GPU(VRAM 12GB以上)、16GB以上のRAM、そして最新のマルチコアプロセッサが揚げられています。
そこで注目されるのがStable Diffusion WebUI Forgeです。VRAM 6GB以上のNVIDIA製GPUを推奨としており、より低スペックのパソコンでも画像生成が可能となっています。
ただし、Stable Diffusion WebUI Forgeをインストールするとなると、専門知識が必要だったり、難易度が高いという課題がありました。
そんな中、「Stability Matrix」というアプリを使うことで、Stable Diffusion WebUI Forgeを簡単にインストールできる方法が登場しました。
今回のブログ記事では、Stability Matrixを活用してStable Diffusion WebUI Forgeをパソコンにインストールする手順をご紹介します。
なお私は以下のパソコンの一世代前のモデルでStable Diffusion WebUI Forgeをインストールし、使用しています。
初心者でも簡単!Stable Diffusion WebUI Forgeのインストールする方法
①Stability Matrixをダウンロードする
Stability Matrixのページ(https://github.com/LykosAI/StabilityMatrix )へ target=”_blank”き、下へスクロールすると、Stability Matrixのダウンロードする項目が現れます。
ご自身のPCのOSをクリックします(私はWindows11なので、「Windows 10、11」をクリックしました)。
するとStability MatrixをZip形式に圧縮したファイルを保存しますか?と尋ねられるので、任意の場所に保存します。私はダウンロードフォルダに保存しました。
Stability MatrixをZip形式に圧縮したファイルを、右クリックして「全てを展開」を選択し、解凍します。
解凍したStability Matriのフォルダ(StabilityMatrix-win-x64)をお好きな場所に移動します。私はCに移動しました。
②Stability Matrixを開き、Stable Diffusion WebUI Forgeをインストールする
解凍したStability Matriのフォルダ(StabilityMatrix-win-x64)を開くと、Stability Matri.exeのアイコンがあります。
するとStability Matrix.exeが開きます。
※WindowsによってPCが保護されましたという画面が出たら、詳細情報をクリックして、実行をクリックしてください。
Portableモードにチェックをいれると、全てのデータと設定が同じフォルダに保存されて、管理がしやすくなるので、チェックを入れて、続けるをクリックします。
お好きなUIをインストールして始めようという画面が出るので、Stable Diffusion WebUI Forgeの項目にあるRecommendedをクリックします。
オススメのモデルのダウンロードを薦める画面が現れますが、ここは無視して閉じるを押します。
インストールが開始されます。時間がかかるので、気長に待ちましょう。
インストールが完了すると、以下のような画面になります。
③Stable Diffusion WebUI Forgeに商用利用可能のモデルを追加する
Stable Diffusion WebUI Forgeに「CreativeML Open RAIL++-M」というライセンス」の商用利用可能のモデルを追加します。
私がStable Diffusion WebUI Forgeで画像生成する場合、自分が絵を描く時の資料として生成するのがほとんどで、そのまま使用することはほぼないのですが、一応商用利用可能のモデルのほうが安心して使用できるため、この手のモデルを追加して利用しています。
Stable Diffusion WebUI Forgeにモデルを追加するには、Stable-diffusionというフォルダの中に入れます。
Stable-diffusionフォルダの中身の開き方ですが、Data→Packages→stable-diffusion-webui-forge→models→Stable-diffusionとクリックします。
私が今回、商用利用可能のモデルは以下のものです。
【実写系モデル】
yayoi_mix(SD1.5モデル)
https://civitai.com/models/83096/yayoimix
fuduki_mix(SDXL 1.0モデル)
https://civitai.com/models/129830/fudukimix
【アニメ・漫画系モデル】
Emi 2.5 Model Card(SDXL 1.0モデル)
https://huggingface.co/aipicasso/emi-2-5/tree/main
④Stable Diffusion WebUI Forgeを起動する
Stability Matrixの画面にStable Diffusion WebUI Forgeの項目が現れます。
Lanuchをクリックします。
初めて起動する時は時間がかかりますが、2回目以降はすぐにStable Diffusion WebUI Forgeが立ち上がります。
⑤実際にStable Diffusion WebUI Forgeで画像を生成してみる
今回はStable Diffusion WebUI Forgeで、Emi 2.5 Model Cardと、fuduki_mix、yayoi_mixを使って、画像生成をしてみます。
最初にEmi 2.5 Model Cardというモデルでを生成します。
最初にUIをXLにします。
次にCheckpoint(モデルのことです)をEmi 2.5 Model Cardにします。
私は、最初に以下の基本となるプロンプトをプロンプト入力欄に入力しています。
masterpiece, from side, full body, cute face, black eyes,1girl,
ネガティブプロンプト(画像生成 AIに描いてほしくない要素を指定するための言葉)を、ネガティブプロンプトプロンプト入力欄に入力しています。
(worst quality,low quality:2),(painting,sketch,flat color),monochrome,grayscale,ugly face,bad face,bad anatomy,deformed eyes,missing fingers,acnes,skin blemishes,nsfw,nude,nipples
ここでは、「街を歩くブラウスを着たかわいい日本人の女の子」という絵を生成したいと思います。
最初に入力したプロンプトの後に、「街を歩くブラウスを着たかわいい日本人の女の子」の英文である「Cute Japanese girl wearing a blouse walking in the city」を入力します。
英語が苦手(私もそうです)という方は、翻訳サイトで英文に直して、それを貼り付ければいいでしょう。
そしたらGenerateを押します。
1分程度で、画像が生成されます。
次にfuduki_mixというモデルで、実写なリアルな絵を生成します。
最初にUIをXLにします。
次にCheckpoint(モデルのことです)をfuduki_mixにします。
以下の基本プロンプトをプロンプト入力欄に入力しています。
(masterpiece,best quality:1.4),(8k,raw photo, photo realistic:1.2), shiny skin, detailed skin, detailed face, black eyes, 1girl,
ネガティブプロンプトは、ネガティブプロンプト入力欄に入力しています。
(worst quality,low quality:2),(painting,sketch,flat color),monochrome,grayscale,ugly face,bad face,bad anatomy,deformed eyes,missing fingers,acnes,skin blemishes,nsfw,nude,nipples
「街に来て右手を挙げているブラウスを着た日本人の女の子」という絵を生成したいと思います。
最初に入力したプロンプトの後に、「街に来て、右手を挙げている、ブラウスを着た日本人の女の子」の英文である「A Japanese girl in a blouse comes to town and raises her right hand」を入力します。
そしたらGenerateを押します。
1分程度で、画像が生成されます。
fuduki_mixというモデルで、実写なリアルな絵を生成します。
最初にUIをSDにします。
Clip skipを2にします。
次にCheckpoint(モデルのことです)をyayoi_mixにします。
以下の基本プロンプトをプロンプト入力欄に入力しています。
(masterpiece,best quality:1.4),(8k,raw photo, photo realistic:1.2), shiny skin, detailed skin, detailed face, black eyes, 1girl,
ネガティブプロンプトは、ネガティブプロンプト入力欄に入力しています。
(worst quality,low quality:2),(painting,sketch,flat color),monochrome,grayscale,ugly face,bad face,bad anatomy,deformed eyes,missing fingers,acnes,skin blemishes,nsfw,nude,nipples
「街に来て右手を挙げているブラウスを着た日本人の女の子」という絵を生成したいと思います。
最初に入力したプロンプトの後に、「街に来て、左手を挙げている、ワンピースを着た日本人の女の子」の英文である「A Japanese girl in a dress, coming to town, raising her left hand」を入力します。
そしたらGenerateを押します。
1分程度で、画像が生成されます。
私の画像生成AIの考え
私にとっての画像生成AIはアイデア出しツール
私は絵を描いたり写真を撮ったりしている人間で、画像生成AIは、絵や写真のアイデアを考えるためのツールとして使っています。
画像生成AIにプロンプトで生成したものの中で、構図など、自分には思いつかないものがあったりします。それをアイデアとして自分の絵に取り入れる、写真を撮る時の構図の参考にする、そんな使い方です。
絵を描くのに時間がかかるのは、アイデアを出すことですし、いい写真を撮るには構図をどうするかです。その時間を短縮できるメリットがあるため、私は画像生成AIをアイデア出しツールとして使ってます。
あくまでもアイデアを取り入れるだけの使用であり、絵自体は私自身の手で白紙から一から描いていますし、写真はカメラやスマホで撮っています。
なので、画像生成AIが生成したものをそのまま使うことはありません。
画像生成AIで生成をしたものをそのまま使わない理由
私が画像生成AIで生成したものをそのまま使わない理由は、単に画像生成AIは、絵や写真のアイデアを考えるためのツールとしてしか思っていましからです。
ただこんな個人的な思いを抜きにして考えてみても、画像生成AIで生成したものをそのまま使うのは、慎重になった方がいいなとは思います・
多くの画像生成AIは、その学習元に無断転載サイトにアップされている絵描きのイラストが含まれています。
これらの画像は無断転載なので、当然、著作者から許可を得ない状態で使用されていて、その数は膨大のようです。
そのようなシステムなので、生成された画像には、自分が知らないだけで、実は著作権がある画像と類似しているものがある可能性があります。そのため、これらをそのまま使うと、著作権侵害で訴えられる可能性があります。
Adobe Fiteflyのようにそのようなサイトから学習してませんとうたっている画像生成AIもありますが、学習元のAdobe Stockには無断転載されたものが含まれていたりするので、安心して使用するのは危険です。
あとはこれは画像生成AIに限ったことでなく、生成AI全体の問題として、情報漏洩の可能性があります(Stable Diffusion WebUI Forgeのように、ロ^カル環境で使用する画像生成AIは話は別です)。
入力したプロンプトは、一旦はサーバーに保管されます。その時にAIは進化のために学習するのですが、その時に、第三者に情報を盗まれる可能性があります。なので、会社等の重要な情報をプロンプトに書くと、それが漏洩する可能性があります。
まだ安心して使えるシステムになってなく、これを商用利用可能としてサービス提供している背景には、今、パソコン業界でビックビジネスになるものが久々に出てきたから、それで稼ごうという苦しい台所事情を私は見る気がします。
それが先走ってしまい、企業の利益第一で、実際にはユーザーが安心して使えるシステムになっていません。
以上の観点から、自分の身を守るために、私は画像生成AIでそのまま使うには慎重に、自己責任で行ったほうがいいと思います。
無難な画像生成AIの使い方
私が画像生成AIを絵や写真のアイデア出しツールとして使用できるのは、私自身が絵を描いたり、写真を撮ったりすることに対するキャリアが長いためです。
だからそれをアイデアとして、自分の絵に取り入れたり、写真の構図の参考に出来るからです。
しかし、そんな人ばかりではありません。絵を描けない人は多くいますし、いい構図の写真が撮れる人が多くいるわけでもありません。
そんなが、画像生成AIを使う場合、以下のような方法があると思います。
単なるエンタメとして、個人だけで楽しむ程度に使う場合です。それをSNSなどのメディアに投稿しないのなら、何の問題も発生しないでしょう。私も生成していて、いろんな画像が出てくるのが、ガチャガチャのようで面白いなって思うときもあります。
デザイナーが自分のイメージの見本として生成し、それを見本にとしてプロのイラストレーターや写真家に渡して、描いてもらったり撮ってもらったりという方法です。画像生成AIが生成したものをそのまま使用することはないので、これも何の問題も発生しないでしょう。
ビジネスなどで絵が必要となった場合に、使いたいイメージのものを生成し、それを元にしてそれに似たフリー素材を検索して探して使う方法です。これも画像生成AIが生成したものをそのまま使用しないので、何の問題も発生しないでしょう。
画像生成AIは新しい技術で、権利問題など法整備が整っていないため、現時点では使うのは避けた方がいいでしょう。
絵を描く人も、将来を考えて、画像生成AIを勉強したほうがいい
絵を描く人や写真を撮る人にとって、画像生成AIの登場は、私も最初はそうでしたが、大きな衝撃であり、嫌悪感を感じたと思います。簡単に絵や写真を生成できるため、今までの自分の努力が無駄になるのではないか、仕事が奪われるのではないかという不安を感じる人もいるでしょう。
画像生成AIは多くの著作権を持つ画像を無断で学習しているため、権利の問題に対する不安があります。現時点では、権利の問題が解決されていないため、先ほど描いた通り、現時点では使うのは慎重に、自己責任で行うべきでしょう。
しかし、私は、将来的には法整備が進み、問題がクリアされると思っています。
私としては、著作権などは画像生成AIを開発している会社が全て持ち、使用者には使うことことは許可し、トラブル等の問題は全て画像生成AIを作っている会社が対処するのが好ましいと思っています。
そうなると、その際、画像生成AIを使ったちょっとしたカットの制作は一般的になるでしょう。
漫画やアニメ、ゲームといった商業作品に関しては、画像生成AIを作る会社に著作権などを持たれると利益が得られなく権利の問題も複雑になってしまうため、利益と著作権の観点から、漫画家やアニメーター、ゲーム制作会社がオリジナルを作るという従来通りの制作が続くと思っています。
そのため、絵を描く人や目指す人は、画像生成AIについて学んでおいたほうがいいと思っています。実際に絵を商売にする場合、AIと手描きの両方ができれば、仕事の幅が広がるからです。
一方、芸術としての絵に関しては、今まで通りの方法で、絵で描く撮ることが価値を持ち続けるでしょう。世界に1つしかない作品だからこそ、芸術としての価値があるからです。写真に関しては報道写真などは、今まで通りに写真は撮られるでしょう。でないと嘘の報道になってしまうからです。
将来的には、商業的な絵と芸術としての絵、報道としての写真がクッキリと区別される時代が来ると思っています。
将来的には、商業的な絵と芸術としての絵がクッキリと区別される時代が来ると思っています。
最後に…画像生成AIを、著作権などの問題を無視して紹介するブログや動画は信頼しない方がいい
なお、ブログや動画などで、画像生成AIの使い方を紹介しているものがあります。
しかしこれら制作者の多くは、絵を描く能力がなく、いい写真を撮る能力もなく単なる遊び感覚で画像生成AIを紹介している、又は画像生成AIを使ってお金儲けをしようという、単なる情報商材として作っています。
私は多くの画像生成AIの動画やブログを見ますが、単なる使い方だけを紹介しているけど、これをなんの問題もなく、仕事などに活用しているという人が多い気がして、見てて何の役にも立たないなって思ってしまいます。
これらの人間の大半は、物作りのプロではないため、物を作る上で必要な権利問題の知識がないため、それらに言及もできていない、どんな仕事に活用するかにも言及でしていません。
なので、その手のブログや動画を信頼して見るのは危険なので、これらを真に受けないで見るか、避けるかがいいでしょう。