こんにちは、うさじん(@Rabi_Jin_)です。
昨日、導入したMidjourneyをいろいろと使ってみました。
Midjourney、楽しいですね。色々と調べながらpromptをいじってるうちに丸一日たってしまいました。
あれ時間溶けますわ。
こんにちは、うさじん(@Rabi_Jin_)です。 色々と話題になっているAI画像生成サービスの一つである、Midjourneyを使ってみました。 ちょっとやってみたいことがありまして、せっかくなのでサービスの導入か[…]
こんにちは、うさじん(@Rabi_Jin_)です。 前回記事にて使ってみましたMidjourneyを少し検証しながら使ってみました。 各生成ボタンによってどのような出力がなされるのか、その効果でどのよ[…]
promptに関して以下の書籍がかなり参考になるようです。
良かったら見てみて下さい。
【POD】Artificial Images Midjourney / Stable DiffusionによるAIアートコレクション (NextPublishing) [ 852話 ] 価格:2,310円 |
さて、Midjourneyの無料プラン分をほぼ使ってしまったため、次はStableDiffusionを使ってみました。
Midjourneyと同様にテキストから画像生成ができるAIですが、
オープンソースであるため、有志の方々の独自のモデル開発が特に進んでいるようです。
- テキストから画像
- 画像(&テキスト)から画像
- 高解像度化
- テキストからビデオ 等など
使用方法は既に先人の方たちがいくつかのWebサービスを展開しています。
本記事では、GoogleColabで使うことができるStable DiffusionのWeb UI(AUTOMATIC111版)の導入についてご紹介します。
Google ColabでStable DiffusionのWeb UI(AUTOMATIC111版)を動かす
GoogleアカウントとGoogle Driveの開設
ここの項について、すでにGoogleアカウントとGoogle Driveを持っている場合は、
飛ばしても良いかもしれません。
ただし、Stable DiffusionのWeb UI版を使う場合はできるだけ
Google Driveの空き容量が多いアカウントが良いです。
最低12GBくらいの空き容量は確保します。
アカウントを開設後、Google Driveに接続します。
ここからマイドライブを左クリック、順にColaboratoryまで選びます。
これでGoogle Colabの使用準備が完了しました。
Stable Diffusion WebUIの使用準備
Googleアカウントはログイン状態のまま、以下のサイトからWeb UIを使うためのノートブックを開きます。
AUTOMATIC1111:Akaibu Google Colab StableDiffusionUI-Voldemort V1.3.ipynb
保存すると、別のブラウザタブで自分のドライブに保存した同様のノートブックが自動で開きます。
元のオリジナルのノートブックは閉じても問題ありません。
アカウントのGoogle Driveをマウントするため、
自分のノートブックの一番上にコードセルを追加し、以下を入力します。
from google.colab import drive
drive.mount('/content/drive')
Google Driveがマウント出来ましたら、このセルの下の方にあるにコードセルを以下の用に修正します。
%cd /content/drive/MyDrive
!git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
%cd /content/drive/MyDrivestable-diffusion-webui
#@title SD1.5
# get a token from https://huggingface.co/settings/tokens
# user_token = "" #@param {type:"string"}
# user_header = f"\"Authorization: Bearer {user_token}\""
# !wget --header={user_header} https://huggingface.co/runwayml/stable-diffusion-v1-5/resolve/main/v1-5-pruned.ckpt -O /content/stable-diffusion-webui/model.ckpt
- 1行目 マイドライブをカレントにするコード
- 2行目 GithubにあるWebUIフォルダをクローンする
- 3行目 クローン先をマイドライブにする
- 4~8行目 「#」を入れ、コメントアウト
Stable Diffusion WebUIをマイドライブにコピーしてそこで運用しようぜ、ということです。
修正ができましたら、コードを実行します。
学習済みのモデルのダウンロード
Stable Diffusionについての情報は、Hugging Face社のHPに掲載せれています。
そのサイトには学習済みのモデル(モデルカード Model Card)が公開されいます。
現時点での最新のモデルは「V1.4」のため、それをHPからダウンロードします。
Hugging Face モデルカード https://huggingface.co/CompVis/stable-diffusion-v-1-4-original
モデルカードのファイルサイズは4GBとすこしあります。まずはローカルのデスクトップや適当なフォルダにダウンロードします。
ダウンロード後、「sd-v1-4.ckpt」をGoogle Driveの以下のフォルダにドラッグ&ドロップします。
4GBあるため、すこし待ちましょう。
Google Driveへのアップロードが完了したら、一旦このノートブックの役割は終了です。
名称変更、保存、タブを閉じましょう。
このノートブックはStable Diffusion WebUIを使用するための環境構築用です。
画像生成する推論用のノートブックは別に作ります。
推論用のノートブック(WebUI立ち上げ用)を作る。
再度、AUTOMATIC1111:Akaibuを開き、同じように自分のドライブにコピーして保存します。
AUTOMATIC1111:Akaibu Google Colab StableDiffusionUI-Voldemort V1.3.ipynb
新しいノートブックを作りましたら、「推論用」と名称を変更し、
一番上にコードセルを3個挿入し、順番に以下を入力します。
# Google Driveをマウント
from google.colab import drive
drive.mount('/content/drive')
# カレントディレクトリを「stable-diffusion-webui」に変更
# Githubの「stable-diffusion-webui」をpullで更新する
cd /content/drive/MyDrive/stable-diffusion-webui
!git pull https://github.com/AUTOMATIC1111/stable-diffusion-webui
# 実行
!COMMANDLINE_ARGS="--share --gradio-debug --gradio-auth me:qwerty" REQS_FILE="requirements.txt" python launch.py
3番目のセルを実行には5~10分ほどがかかります。(環境によってはもっと早い場合もある)
以下の状態になればStable Diffusion WebUIの立ち上げが可能になります。
「public URL」の横にあるURLをクリックしましょう。
すると新しいタブ画面が開き以下のフォームが表示されます。
Usernameに「 me 」、Passwordに「 qwerty 」を入力し、Enterを押します。
その後、Stable Diffusion WebUIに移ります。
お疲れ様でした。
画像作成してみる。
早速、画像を出力します。
左上のStable Diffusion chekpointをプルダウンし、「sd-v1-4.ckpt」に変更します。
タブは「txt2img」を選択したまま、promptのフォームにテスト用のpromptを入力します。
無事、画像が生成されました。
作成した画像は以下のGoogle Driveの以下フォルダに保存されています。
注意点
本アプリケーションの使用について以下の注意事項があります。
- Google Colabは使用に2時間の制限があります。ランタイムは2時間で切れるため、長時間使用する場合は、推敲用のノートブックを再度実行して下さい。
- 画像を何度も出力していると「outputs」のフォルダのサイズが増加します。適宜、移動して下さい。
- Stable Diffusion のライセンスは CreativeML Open Rail-M ライセンスです。要項をよく確認し、生成した画像の取り扱いに注意して使用して下さい。
以下のサイトがとても参考になります。ぜひ読んでみてください。
利用者に対してのStable Diffusionの立ち位置について
Midjourneyを超えた? 無料の作画AI「 #StableDiffusion 」が「AIを民主化した」と断言できる理由 https://www.businessinsider.jp/post-258369
著作権について
Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権(その2) https://storialaw.jp/blog/8883
おわりに
いかがでしたでしょうか。
すこし専門的な内容でしたが、これでStable Diffusion WebUIを使用した画像生成が無料で利用できます。
Midjourneyも良いですが、有料となると二の足を踏みますよね。
これならpromptの試行錯誤も回数を気にせず出来ますし、何よりとても楽しいです。
今回はHugging Face社が公開しているモデルカードを使用しましたが、
様々な方がいろいろなモデルを作成しています。
私もお気に入りの画像を作成するため、本記事投稿後、またネットの海に潜ります。
promptについて、以下の書籍がかなり参考になるそうなのでよかったら購入してみて下さい。
【POD】AIとコラボして神絵師になる 論文から読み解くStable Diffusion (技術の泉シリーズ(NextPublishing)) [ 白井 暁彦 ] 価格:2,200円 |
【POD】Artificial Images Midjourney / Stable DiffusionによるAIアートコレクション (NextPublishing) [ 852話 ] 価格:2,310円 |
良きAIライフを!