画像生成を快適に!Stable Diffusion WebUI Forgeの拡張機能
Stable Diffusion WebUI Forgeで画像を生成する際、プロンプトの入力や画像スタイルのプロンプトを調べたりすることが、手間がかかるため、面倒だと思う人は多いと思います。
そんな時に便利な拡張機能があります。
今回のブログ記事では、画像生成をより快適にするためのおすすめ拡張機能を3つご紹介します。
これらの拡張機能を活用することで、プロンプト作成の手間を大幅に軽減出来ると思います。
なお私は以下のパソコンの一世代前のモデルでStable Diffusion WebUI Forgeをインストールし、使用しています。拡張機能を追加しても快適に画像生成が出来ています。
画像生成を快適に!Stable Diffusion WebUI Forgeの拡張機能3選
1.prompt-all-in-one
Stable Diffusion WebUI Forgeで画像生成する際に、面倒なのはプロンプトを作ることでしょう。画像生成の専門的なプロンプトを調べたり、また具体的なプロンプトを日本語で描いた後に、Google翻訳して英語にするなど、これらはかなり面倒です。
それらを簡単にしてくれる拡張機能が、prompt-all-in-oneです。
prompt-all-in-oneのインストール及び設定の方法をご紹介します。
①Extensionsタブを選択し、Install From URLを選択する
Extensionsタブを選択します。
その中にInstall From URLという項目があるので、それを選択します。
②prompt-all-in-oneのURLアドレスを入力し、インストールをする
URL for extension’s git repositoryの入力欄に、以下のURLアドレスを入力します。
https://github.com/Physton/sd-webui-prompt-all-in-one
そのあとにInstallボタンをクリックします。
なおこの機能はインストールが完了するまで時間がかかりますが、気長に待ちましょう。
以下の画面のようにInstallボタンの下に文章が現れたらインストール完了です。
③実際にprompt-all-in-oneがインストールされたかを確認し、再起動する
実際にprompt-all-in-oneがインストールされたかを確認します。
Installedをクリックし、Check for updatesボタンをクリックします。
下へスクロールし、以下のような画面になっていたら、実際にprompt-all-in-oneことが確認できます。
そうしたらAppy and quitボタンをクリックします。
すると、Stable Diffusion WebUI Forgeが再起動します。
なおなかなか再起動しない場合は、手動でStable Diffusion WebUI Forgeを終了させて再起動させてください。
④prompt-all-in-oneの設定
prompt-all-in-oneをインストールすると、このような画面になります。
おそらく最初から日本語になっていると思いますが、なっていない場合はLanguageのアイコンをクリックし、日本語を設定してください。
これから自動翻訳の設定を行います。
設定:翻訳API、自動翻訳、表示/表示のアイコンをクリックします。
その横にある雲のアイコンをクリックします。
翻訳APIから[無料]Googleを選択します。
下へスクロールし、保存ボタンをクリックします。
すると、「新しいキーワードを入力してください」という入力欄が現れます。
この入力欄に、日本語で入力しENTERキーを押すと、英語に翻訳してプロンプト欄に入力してくれます。
以下は、「街を歩くブラウスを着たかわいいアニメ風の日本人の女の子」と入力した結果の例です。
翻訳されたプロンプトを、Emi 2.5 Model Cardをモデルにして画像生成して見ましょう。
クオリティの高い画像を生成するために、以下の基本となるプロンプトを、prompt-all-in-oneで作ったプロンプトの前に入力しします。
masterpiece, from side, full body, cute face, black eyes,1girl,
そして以下のネガティブプロンプトを入力します。
(worst quality,low quality:2),(painting,sketch,flat color),monochrome,grayscale,ugly face,bad face,bad anatomy,deformed eyes,missing fingers,acnes,skin blemishes,nsfw,nude,nipples、
そしてGenerateボタンを押します。
以下が生成した画像です。
prompt-all-in-oneは、Extra Networkの横の欄に多くのタブが並んでいて、それをクリックするとある程度のプロンプトの候補が現れます。
その候補をクリックすると、プロンプト欄に、プロンプトが入力されます。
この機能を使って、yayoi_mixをモデルに画像生成した例です。プロンプトに、「1人の女の子」、「微笑」、「水上公園」、「パーカー」、「高解像度」を選びました。
クオリティの高い画像を生成するために、以下の基本となるプロンプトを、prompt-all-in-oneで作ったプロンプトの前に入力します。
(masterpiece,best quality:1.4),(8k,raw photo, photo realistic:1.2), shiny skin, detailed skin, detailed face, black eyes, 1girl,
そして以下のネガティブプロンプトを入力します。
(worst quality,low quality:2),(painting,sketch,flat color),monochrome,grayscale,ugly face,bad face,bad anatomy,deformed eyes,missing fingers,acnes,skin blemishes,nsfw,nude,nipples
そしてGenerateボタンを押します。
以下が生成した画像です。
2.EasyNegative
「生成したくない要素」や「避けたい特徴」を指定するためのプロンプトをネガティブプロンプトといいます。
ネガティブプロンプトには、結構の数があり、それを全て入力していては面倒です。
それを解消してくれるのがEasyNegativeです。
EasyNegativeには、多くのネガティブプロンプトが入っていて、これを追加するだけで、ネガティブプロンプトを入力しなくて済みます。
EasyNegativeの追加方法についてご紹介します。
①EasyNegativeのサイトからダウンロードする
以下のサイトに行きます。
EasyNegative.safetensorsの横にあるダウンロードアイコンをクリックし、ダウンロードします。
②EasyNegative.safetensorsを「emdenddings」に移す
ダウンロードしたEasyNegative.safetensorsを「emdenddings」に移します。
そうしたら、一旦、Stable Diffusion WebUI Forgeを終了し、また起動します。
③EasyNegativeをネガティブプロンプトに設定する
ネガティブプロンプトの入力欄にカーソルを置きます。
Generationの横にあるTextual Inversionタブをクリックします。
EasyNegativeが入っています。それをクリックします。
すると、ネガティブプロンプトの入力欄にEasyNegativeと入力されます。
これでEasyNegativeの設定は終了です。
3.Style Selector
画像生成をする際に、例えば実写風、アニメ風、線画風など画像のスタイルを変更する際に、それをわざわざプロンプトで入力するのは面倒です。
そんな時に便利なのがStyle Selectorです。
この拡張機能は、いろんな画像スタイルが用意されていて、それを選択するだけで、画像スタイルを変更できます。
Style Selectorの追加方法についてご紹介します。
①Extensionsタブを選択し、Install From URLを選択する
Extensionsタブを選択します。
その中にInstall From URLという項目があるので、それを選択します。
②Style SelectorのURLアドレスを入力し、インストールをする
URL for extension’s git repositoryの入力欄に、以下のURLアドレスを入力します。
https://github.com/ahgsql/StyleSelectorXL
そのあとにInstallボタンをクリックします。
なおこの機能はインストールが完了するまで時間がかかりますが、気長に待ちましょう。
以下の画面のようにInstallボタンの下に文章が現れたらインストール完了です。
③実際にStyle Selectorがインストールされたかを確認し、再起動する
実際にStyle Selectoreがインストールされたかを確認します。
Installedをクリックし、Check for updatesボタンをクリックします。
下へスクロールし、以下のような画面
になっていたら、実際にStyle Selectoreがインストールされたことが確認できます。
そうしたらAppy and quitボタンをクリックします。
すると、Stable Diffusion WebUI Forgeが再起動します。
なおなかなか再起動しない場合は、手動でStable Diffusion WebUI Forgeを終了させて再起動させてください。
これでStable Diffusion WebUI ForgeにStyle Selectorが追加されました。
実際にEmi 2.5 Model Cardをモデルに、「街を歩くワンピーズを着たかわいい日本人の女の子」というプロンプトを追加し、Style Selectoreでanimeにチェックを入れて、画像生成してみます。
なおクオリティの高い画像を生成するために、以下の基本となるプロンプトを、prompt-all-in-oneで作ったプロンプトの前に入力します。
masterpiece, from side, full body, cute face, black eyes,1girl,
Generationの横にあるTextual Inversionタブをクリックします。
EasyNegativeが入っているので、それをクリックします。
そうすると、ネガティブプロンプトの入力欄にEasyNegativeと入力されます。
その後に、Generateボタンを押します。
生成した画像です。アニメ風の画像が生成されます。
yayoi_mixに「街を歩くワンピーズを着たかわいい日本人の女の子」というプロンプトを追加し、Style SelectoreでAnalog Filmにチェックを入れて、画像生成してみます。
なおクオリティの高い画像を生成するために、以下の基本となるプロンプトを、prompt-all-in-oneで作ったプロンプトの前に入力します。
(masterpiece,best quality:1.4),(8k,raw photo, photo realistic:1.2), shiny skin, detailed skin, detailed face, black eyes, 1girl,
そして以下のネガティブプロンプトを入力します。
Generationの横にあるTextual Inversionタブをクリックします。
EasyNegativeが入っているので、それをクリックします。
そうすると、ネガティブプロンプトの入力欄にEasyNegativeと入力されます。
その後に、Generateボタンを押します。
生成した画像です。アナログフィルムで撮ったような画像が生成されます。
fuduki_mixをモデルに、「街を歩くワンピーズを着たかわいい日本人の女の子」というプロンプトを追加し、Style SelectoreでCinematicにチェックを入れて、画像生成してみます。
なおクオリティの高い画像を生成するために、以下の基本となるプロンプトを、prompt-all-in-oneで作ったプロンプトの前に入力します。
(masterpiece,best quality:1.4),(8k,raw photo, photo realistic:1.2), shiny skin, detailed skin, detailed face, black eyes, 1girl,
そして以下のネガティブプロンプトを入力します。
Generationの横にあるTextual Inversionタブをクリックします。
EasyNegativeが入っているので、それをクリックします。
そうすると、ネガティブプロンプトの入力欄にEasyNegativeと入力されます。
その後に、Generateボタンを押します。
生成した画像です。シネマティックな画像が生成されます。
私の画像生成AIの考え
私にとっての画像生成AIはアイデア出しツール
私は絵を描いたり写真を撮ったりしている人間で、画像生成AIは、絵や写真のアイデアを考えるためのツールとして使っています。
画像生成AIにプロンプトで生成したものの中で、構図など、自分には思いつかないものがあったりします。それをアイデアとして自分の絵に取り入れる、写真を撮る時の構図の参考にする、そんな使い方です。
絵を描くのに時間がかかるのは、アイデアを出すことですし、いい写真を撮るには構図をどうするかです。その時間を短縮できるメリットがあるため、私は画像生成AIをアイデア出しツールとして使ってます。
あくまでもアイデアを取り入れるだけの使用であり、絵自体は私自身の手で白紙から一から描いていますし、写真はカメラやスマホで撮っています。
なので、画像生成AIが生成したものをそのまま使うことはありません。
画像生成AIで生成をしたものをそのまま使わない理由
私が画像生成AIで生成したものをそのまま使わない理由は、単に画像生成AIは、絵や写真のアイデアを考えるためのツールとしてしか思っていましからです。
ただこんな個人的な思いを抜きにして考えてみても、画像生成AIで生成したものをそのまま使うのは、慎重になった方がいいなとは思います・
多くの画像生成AIは、その学習元に無断転載サイトにアップされている絵描きのイラストが含まれています。
これらの画像は無断転載なので、当然、著作者から許可を得ない状態で使用されていて、その数は膨大のようです。
そのようなシステムなので、生成された画像には、自分が知らないだけで、実は著作権がある画像と類似しているものがある可能性があります。そのため、これらをそのまま使うと、著作権侵害で訴えられる可能性があります。
Adobe Fiteflyのようにそのようなサイトから学習してませんとうたっている画像生成AIもありますが、学習元のAdobe Stockには無断転載されたものが含まれていたりするので、安心して使用するのは危険です。
あとはこれは画像生成AIに限ったことでなく、生成AI全体の問題として、情報漏洩の可能性があります(Stable Diffusion WebUI Forgeのように、ロ^カル環境で使用する画像生成AIは話は別です)。
入力したプロンプトは、一旦はサーバーに保管されます。その時にAIは進化のために学習するのですが、その時に、第三者に情報を盗まれる可能性があります。なので、会社等の重要な情報をプロンプトに書くと、それが漏洩する可能性があります。
まだ安心して使えるシステムになってなく、これを商用利用可能としてサービス提供している背景には、今、パソコン業界でビックビジネスになるものが久々に出てきたから、それで稼ごうという苦しい台所事情を私は見る気がします。
それが先走ってしまい、企業の利益第一で、実際にはユーザーが安心して使えるシステムになっていません。
以上の観点から、自分の身を守るために、私は画像生成AIでそのまま使うには慎重に、自己責任で行ったほうがいいと思います。
無難な画像生成AIの使い方
私が画像生成AIを絵や写真のアイデア出しツールとして使用できるのは、私自身が絵を描いたり、写真を撮ったりすることに対するキャリアが長いためです。
だからそれをアイデアとして、自分の絵に取り入れたり、写真の構図の参考に出来るからです。
しかし、そんな人ばかりではありません。絵を描けない人は多くいますし、いい構図の写真が撮れる人が多くいるわけでもありません。
そんなが、画像生成AIを使う場合、以下のような方法があると思います。
単なるエンタメとして、個人だけで楽しむ程度に使う場合です。それをSNSなどのメディアに投稿しないのなら、何の問題も発生しないでしょう。私も生成していて、いろんな画像が出てくるのが、ガチャガチャのようで面白いなって思うときもあります。
デザイナーが自分のイメージの見本として生成し、それを見本にとしてプロのイラストレーターや写真家に渡して、描いてもらったり撮ってもらったりという方法です。画像生成AIが生成したものをそのまま使用することはないので、これも何の問題も発生しないでしょう。
ビジネスなどで絵が必要となった場合に、使いたいイメージのものを生成し、それを元にしてそれに似たフリー素材を検索して探して使う方法です。これも画像生成AIが生成したものをそのまま使用しないので、何の問題も発生しないでしょう。
画像生成AIは新しい技術で、権利問題など法整備が整っていないため、現時点では使うのは避けた方がいいでしょう。
絵を描く人も、将来を考えて、画像生成AIを勉強したほうがいい
絵を描く人や写真を撮る人にとって、画像生成AIの登場は、私も最初はそうでしたが、大きな衝撃であり、嫌悪感を感じたと思います。簡単に絵や写真を生成できるため、今までの自分の努力が無駄になるのではないか、仕事が奪われるのではないかという不安を感じる人もいるでしょう。
画像生成AIは多くの著作権を持つ画像を無断で学習しているため、権利の問題に対する不安があります。現時点では、権利の問題が解決されていないため、先ほど描いた通り、現時点では使うのは慎重に、自己責任で行うべきでしょう。
しかし、私は、将来的には法整備が進み、問題がクリアされると思っています。
私としては、著作権などは画像生成AIを開発している会社が全て持ち、使用者には使うことことは許可し、トラブル等の問題は全て画像生成AIを作っている会社が対処するのが好ましいと思っています。
そうなると、その際、画像生成AIを使ったちょっとしたカットの制作は一般的になるでしょう。
漫画やアニメ、ゲームといった商業作品に関しては、画像生成AIを作る会社に著作権などを持たれると利益が得られなく権利の問題も複雑になってしまうため、利益と著作権の観点から、漫画家やアニメーター、ゲーム制作会社がオリジナルを作るという従来通りの制作が続くと思っています。
そのため、絵を描く人や目指す人は、画像生成AIについて学んでおいたほうがいいと思っています。実際に絵を商売にする場合、AIと手描きの両方ができれば、仕事の幅が広がるからです。
一方、芸術としての絵に関しては、今まで通りの方法で、絵で描く撮ることが価値を持ち続けるでしょう。世界に1つしかない作品だからこそ、芸術としての価値があるからです。写真に関しては報道写真などは、今まで通りに写真は撮られるでしょう。でないと嘘の報道になってしまうからです。
将来的には、商業的な絵と芸術としての絵、報道としての写真がクッキリと区別される時代が来ると思っています。
将来的には、商業的な絵と芸術としての絵がクッキリと区別される時代が来ると思っています。
最後に…画像生成AIを、著作権などの問題を無視して紹介するブログや動画は信頼しない方がいい
なお、ブログや動画などで、画像生成AIの使い方を紹介しているものがあります。
しかしこれら制作者の多くは、絵を描く能力がなく、いい写真を撮る能力もなく単なる遊び感覚で画像生成AIを紹介している、又は画像生成AIを使ってお金儲けをしようという、単なる情報商材として作っています。
私は多くの画像生成AIの動画やブログを見ますが、単なる使い方だけを紹介しているけど、これをなんの問題もなく、仕事などに活用しているという人が多い気がして、見てて何の役にも立たないなって思ってしまいます。
これらの人間の大半は、物作りのプロではないため、物を作る上で必要な権利問題の知識がないため、それらに言及もできていない、どんな仕事に活用するかにも言及でしていません。
なので、その手のブログや動画を信頼して見るのは危険なので、これらを真に受けないで見るか、避けるかがいいでしょう。