Stable DiffusionのWebUI版を使って無料でAI画像生成してみた

AI

 

こんにちは、うさじん(@Rabi_Jin_)です。

昨日、導入したMidjourneyをいろいろと使ってみました。

Midjourney、楽しいですね。色々と調べながらpromptをいじってるうちに丸一日たってしまいました。

あれ時間溶けますわ。

 

関連記事

  こんにちは、うさじん(@Rabi_Jin_)です。 色々と話題になっているAI画像生成サービスの一つである、Midjourneyを使ってみました。 ちょっとやってみたいことがありまして、せっかくなのでサービスの導入か[…]

関連記事

  こんにちは、うさじん(@Rabi_Jin_)です。 前回記事にて使ってみましたMidjourneyを少し検証しながら使ってみました。 各生成ボタンによってどのような出力がなされるのか、その効果でどのよ[…]

 

promptに関して以下の書籍がかなり参考になるようです。

良かったら見てみて下さい。

 

【POD】Artificial Images Midjourney / Stable DiffusionによるAIアートコレクション (NextPublishing) [ 852話 ]

価格:2,310円
(2023/1/10 23:54時点)

 

 

さて、Midjourneyの無料プラン分をほぼ使ってしまったため、次はStableDiffusionを使ってみました。

Midjourneyと同様にテキストから画像生成ができるAIですが、
オープンソースであるため、有志の方々の独自のモデル開発が特に進んでいるようです。

 

  • テキストから画像
  • 画像(&テキスト)から画像
  • 高解像度化
  • テキストからビデオ 等など

 

使用方法は既に先人の方たちがいくつかのWebサービスを展開しています。

本記事では、GoogleColabで使うことができるStable DiffusionのWeb UI(AUTOMATIC111版)の導入についてご紹介します。

 

 

Google ColabでStable DiffusionのWeb UI(AUTOMATIC111版)を動かす

GoogleアカウントとGoogle Driveの開設

ここの項について、すでにGoogleアカウントとGoogle Driveを持っている場合は、
飛ばしても良いかもしれません。

ただし、Stable DiffusionのWeb UI版を使う場合はできるだけ
Google Driveの空き容量が多いアカウントが良いです。

最低12GBくらいの空き容量は確保します。

Googleアカウントを開設

 

アカウントを開設後、Google Driveに接続します。

 

Google Driveにアクセス

 

Google Driveの初期画面

 

ここからマイドライブを左クリック、順にColaboratoryまで選びます。

 

Colaboratoryを選択

 

Google Colabの使用準備が完了

 

これでGoogle Colabの使用準備が完了しました。

 

~広告~

 

Stable Diffusion WebUIの使用準備

Googleアカウントはログイン状態のまま、以下のサイトからWeb UIを使うためのノートブックを開きます。

AUTOMATIC1111:Akaibu Google Colab StableDiffusionUI-Voldemort V1.3.ipynb

Google Colab Stable DiffusionUI

 

自分のGoogle Driveに保存

 

保存すると、別のブラウザタブで自分のドライブに保存した同様のノートブックが自動で開きます。

元のオリジナルのノートブックは閉じても問題ありません。

保存すると自分のドライブにColab Notebooksのフォルダが作成され、ノートブックが保存されています。

 

アカウントのGoogle Driveをマウントするため、
自分のノートブックの一番上にコードセルを追加し、以下を入力します。

from google.colab import drive
drive.mount('/content/drive')

 

コードセルを追加し、入力する。

 

Google Driveのマウント

 

Google Driveがマウント出来ましたら、このセルの下の方にあるにコードセルを以下の用に修正します。

%cd /content/drive/MyDrive
!git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
%cd /content/drive/MyDrivestable-diffusion-webui
#@title SD1.5
# get a token from https://huggingface.co/settings/tokens
# user_token = "" #@param {type:"string"}
# user_header = f"\"Authorization: Bearer {user_token}\""
# !wget --header={user_header} https://huggingface.co/runwayml/stable-diffusion-v1-5/resolve/main/v1-5-pruned.ckpt -O /content/stable-diffusion-webui/model.ckpt
  1. 1行目 マイドライブをカレントにするコード
  2. 2行目 GithubにあるWebUIフォルダをクローンする
  3. 3行目 クローン先をマイドライブにする
  4. 4~8行目 「#」を入れ、コメントアウト

Stable Diffusion WebUIをマイドライブにコピーしてそこで運用しようぜ、ということです。

修正ができましたら、コードを実行します。

Github WebUIをクローン

 

学習済みのモデルのダウンロード

Stable Diffusionについての情報は、Hugging Face社のHPに掲載せれています。

そのサイトには学習済みのモデル(モデルカード Model Card)が公開されいます。

現時点での最新のモデルは「V1.4」のため、それをHPからダウンロードします。

Hugging Face モデルカード https://huggingface.co/CompVis/stable-diffusion-v-1-4-original

Hugging Face社 モデルカード

 

モデルカードのファイルサイズは4GBとすこしあります。まずはローカルのデスクトップや適当なフォルダにダウンロードします。

ダウンロード後、「sd-v1-4.ckpt」をGoogle Driveの以下のフォルダにドラッグ&ドロップします。

/content/drive/MyDrive/stable-diffusion-webui/models/Stable-diffusion
GoogleDriveにドラッグドロップする

 

4GBあるため、すこし待ちましょう。

Google Driveへのアップロードが完了したら、一旦このノートブックの役割は終了です。

名称変更、保存、タブを閉じましょう。

名称を変更し、保存し、ノートブックを閉じます

 

このノートブックはStable Diffusion WebUIを使用するための環境構築用です。

画像生成する推論用のノートブックは別に作ります。

 

 

推論用のノートブック(WebUI立ち上げ用)を作る。

再度、AUTOMATIC1111:Akaibuを開き、同じように自分のドライブにコピーして保存します。

AUTOMATIC1111:Akaibu Google Colab StableDiffusionUI-Voldemort V1.3.ipynb

新しいノートブックを作りましたら、「推論用」と名称を変更し、
一番上にコードセルを3個挿入し、順番に以下を入力します。

# Google Driveをマウント
from google.colab import drive
drive.mount('/content/drive')
# カレントディレクトリを「stable-diffusion-webui」に変更
# Githubの「stable-diffusion-webui」をpullで更新する
cd /content/drive/MyDrive/stable-diffusion-webui
!git pull https://github.com/AUTOMATIC1111/stable-diffusion-webui
# 実行
!COMMANDLINE_ARGS="--share --gradio-debug --gradio-auth me:qwerty" REQS_FILE="requirements.txt" python launch.py
推論用のノートブックを作成

 

3番目のセルを実行には5~10分ほどがかかります。(環境によってはもっと早い場合もある)

推敲用のノートブックを再度立ち上げた場合も、上記の1~3番のコードセルを再度実行し直して下さい。

以下の状態になればStable Diffusion WebUIの立ち上げが可能になります。

「public URL」の横にあるURLをクリックしましょう。

 

すると新しいタブ画面が開き以下のフォームが表示されます。

ログインフォーム

 

Usernameに「 me 」、Passwordに「 qwerty 」を入力し、Enterを押します。

その後、Stable Diffusion WebUIに移ります。

お疲れ様でした。

Stable Diffusion WebUI

 

画像作成してみる。

早速、画像を出力します。

左上のStable Diffusion chekpointをプルダウンし、「sd-v1-4.ckpt」に変更します。

タブは「txt2img」を選択したまま、promptのフォームにテスト用のpromptを入力します。

beautiful girl walking on the moon
その後、Generateをクリックします。
チェックポイントを「sd-v1-4.ckpt」に変更 → プロンプト入力 → 「Generate」

 

無事、画像が生成されました。

画像の生成

 

作成した画像は以下のGoogle Driveの以下フォルダに保存されています。

/content/drive/MyDrive/stable-diffusion-webui/models/Stable-diffusion/outputs/txt2img-images

 

注意点

本アプリケーションの使用について以下の注意事項があります。

  • Google Colabは使用に2時間の制限があります。ランタイムは2時間で切れるため、長時間使用する場合は、推敲用のノートブックを再度実行して下さい。
  • 画像を何度も出力していると「outputs」のフォルダのサイズが増加します。適宜、移動して下さい。
  • Stable Diffusion のライセンスは CreativeML Open Rail-M ライセンスです。要項をよく確認し、生成した画像の取り扱いに注意して使用して下さい。

 

以下のサイトがとても参考になります。ぜひ読んでみてください。

 

利用者に対してのStable Diffusionの立ち位置について

Midjourneyを超えた? 無料の作画AI「 #StableDiffusion 」が「AIを民主化した」と断言できる理由 https://www.businessinsider.jp/post-258369

著作権について

 Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権(その2) https://storialaw.jp/blog/8883

 

おわりに

いかがでしたでしょうか。

すこし専門的な内容でしたが、これでStable Diffusion WebUIを使用した画像生成が無料で利用できます。

Midjourneyも良いですが、有料となると二の足を踏みますよね。

これならpromptの試行錯誤も回数を気にせず出来ますし、何よりとても楽しいです。

今回はHugging Face社が公開しているモデルカードを使用しましたが、

様々な方がいろいろなモデルを作成しています。

私もお気に入りの画像を作成するため、本記事投稿後、またネットの海に潜ります。

promptについて、以下の書籍がかなり参考になるそうなのでよかったら購入してみて下さい。

 

【POD】AIとコラボして神絵師になる 論文から読み解くStable Diffusion (技術の泉シリーズ(NextPublishing)) [ 白井 暁彦 ]

価格:2,200円
(2023/1/10 23:53時点)

【POD】Artificial Images Midjourney / Stable DiffusionによるAIアートコレクション (NextPublishing) [ 852話 ]

価格:2,310円
(2023/1/10 23:54時点)

 

良きAIライフを!