2023-05-02

Stable diffusionでLoRAを使って驚いた

プロンプトをコネコネしても生成できない画像を簡単に生成してくれる「LoRA」を使ってみました（そして、驚いた！）のでログを残しておきます。

chilloutmix_NiPrunedFp32Fix + lora:akiraMotorbikeBATE_v02plus

LoRAとは
導入
- LoRAファイルをダウンロード
準備
- 1. 花札アイコンをクリックし、使用するLoRAを選択
- 2. プロンプトに"Trigger Words"を書く
画像生成
- 一番シンプルなプロンプト
- Chilloutmixモデル＋クオリティUPプロンプト
あとがき
おまけ

LoRAとは

ChatGPTさん曰く、

LoRAは、深層学習に基づく画像生成AIの一種で、畳み込みニューラルネットワークと呼ばれるアルゴリズムを使用して、画像を生成します。

通常、畳み込みニューラルネットワークは、入力された画像を小さな部分に分割して、それらの部分の情報を組み合わせて特徴量を抽出し、最終的に新しい画像を生成することができます。しかし、この方法は画像の詳細な情報を失う可能性があるため、生成された画像がリアルなものとして見えないことがあります。

LoRAは、この問題に対処するため、分割された画像の部分に、周囲の部分との関係性を考慮することができる「再帰型畳み込みニューラルネットワーク」というアルゴリズムを取り入れています。これにより、画像の詳細な情報をより正確に把握し、よりリアルな画像を生成することができます。

つまり、LoRAは、よりリアルな画像生成を可能にする、高度な深層学習技術の一つであると言えます。

ん～、何のことかわかりませんね (^^;

中学生レベルで答えてもらいました。

LoRAは、多くの絵を見て勉強をして、自分で新しい絵を描くことができるようになる

つまり、モデル（checkpoint）に無い（又は、不十分な）アニメのキャラクターであったり、人物、クルマなどの「特定の多くの絵（画像）」のみを学習させて新しい絵を描くことができるようにしたものが「LoRA」という解釈かなぁと考えてます。

ざっくり過ぎですかね (^^;

そのため、LoRAには「特定の絵」の学習データしか含まれていませんので、anythingなどのモデルに比べてファイルサイズが非常に小さいく数百MB程度しかありません。そして、様々なモデルと組み合わせることができるという特徴もあります。

導入

LoRAファイルをダウンロード

CIVITAIサイトでのダウンロート例を説明します。

civitai.com

CIVITAIサイトにアクセスし、"LoRA"で検索すると一覧が表示されます。

バイク好きの私としては、「AKIRA」の「金田バイク」をチョイスしました。

civitai.com

LoRAファイルは、右側の「Download」をクリックするとダウンロードされます。

ダウンロードした”akiraMotorbikeBATE_v02plus.safetensors”ファイルを下記フォルダに移動させて作業終了です。

stable-diffusion-webui\models\Lora

準備

LoRAを使用するには2点ポイントがあります。

花札アイコンをクリックし、使用するLoRAを選択する
プロンプトに"Trigger Words"を書く

1. 花札アイコンをクリックし、使用するLoRAを選択

注意）LoRAを選択するとプロンプトに"<lora:akiraMotorbikeBATE_v02plus:1>"が追加されます。これを消すとLoRAが無効になります。

言い換えると、この手順を踏まなくてもプロンプトに"<lora:akiraMotorbikeBATE_v02plus:1>"と書けばLoRAは有効になります。

2. プロンプトに"Trigger Words"を書く

"Trigger Words"は、ダウンロードサイトの「Details」の部分に記載されています。

ちなみに、今回使用しているLoRAの場合は、"AKIRABIKE"です。

プロンプトに"AKIRABIKE,"を書く。

画像生成

一番シンプルなプロンプト

プロンプト

AKIRABIKE, <lora:akiraMotorbikeBATE_v02plus:1>,

ネガティブプロンプト

easynegative

デフォルトの512x512だと全体像が表示されませんでしたので、800x512にサイズを変更しています。

何回か生成していると、おおっ、金田バイクが生成されました！！

プロンプトをコネコネしても作画できないデザインですね～

けど、もう少しクオリティが欲しい。。。

anything-v4.0, Sampler: Euler a, Seed: 4079068548, Size: 800x512

Chilloutmixモデル＋クオリティUPプロンプト

プロンプト

AKIRABIKE, <lora:akiraMotorbikeBATE_v02plus:1>,

vibrant details, hyperrealistic, beautiful background, octane render, 8k, best quality, masterpiece, illustration, an extremely delicate and beautiful, extremely detailed ,CG ,wallpaper, realistic, photo-realistic,Amazing, finely detail, best quality,

ネガティブプロンプト

easynegative

実写系モデル＋画質UPプロンプトでここまでリアルになりました！

chilloutmix_NiPrunedFp32Fix, DPM++ 2M Karras, Seed: 1589021419, Size: 800x512

なお、ChilloutMixの導入については下記備忘ログを参照してください。

hastaluegoblog.hatenablog.com

LoRAのダウンロードページにあるサンプルのプロンプトを参考にしながら、リアリティを出してみました。

プロンプト

closed - up, masterpiece, best quality, (full_body:1.3),best quality, (8k, RAW photo, best quality, masterpiece:1.2), (realistic, photo-realistic:1.4), ultra-detailed,1girl,perfect detail , (wearing a black racing outfit), (riding a orange akirabike In the ruins of a cyberpunk city after a thermonuclear war, broken neon signs hanging from buildings, neon signs)), (round scifi metal breastplate shining coldly), long legs, lots of exposed broken cables, Colorful glare and smoke, 1.5mm, smail face、illustration of a beautiful girl, detailed beautiful face, detailed hair, detailed human eyes, detailed mouth, detailed arms, detailed bust, looking far away, shot diagonally, artstation, deviantart, concept art, digital painting, award-winning, cinematic postprocessing, cinematic scene, cinematic composition, cinematic lighting, overexpose, ray tracing, 8K, <lora:akiraMotorbikeBATE_v02plus:0.7>, <lora:japaneseDollLikeness_v10:0.1>

ネガティブプロンプト

paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), dot, mole, lowres, normal quality, monochrome, grayscale, lowres, text, error, cropped, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, out of frame, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck, username, watermark, signature, (mole:1.4),nsFW, bad face

その他

Steps: 21,

Sampler: DPM++ SDE Karras,

CFG scale: 7,

Seed: 3084128988,

Size: 680x512,

Model: chilloutmix_NiPrunedFp32Fix,

Denoising strength: 0.7,

Hires upscale: 2,

Hires upscaler: Latent

リアリティがあり、世界観もマッチしてますね (^^

あとがき

LoRAを利用することで作画の幅がグッと広がりました。とはいえ、版権などの問題はありますので商用利用するには難があるかと思います。

しかし、頭の中のイメージを画像にすることでさらなる発想が生まれ、オリジナルの作画につながるのも事実です。先人たちのLoRAを活用させて頂き、更なる進化につなげましょう。

おまけ

「うる星やつら」のラムちゃんのLoRAを使って作画しました。

最近リメイク版が放送されてましたね～人気は衰えてないです。

civitai.com

2023-04-22

Stable diffusion拡張機能のControlNetを使ってみました

Stable Diffusion

写真やイラストからポーズなどの情報を取得してくれるStable diffusionの拡張機能「ControlNet」を使ってみましたのでログを残しておきます。

導入
モデルをダウンロード
元画像を入手
各モデルで画像生成
- 写真の登録
- canny
- depth
- openpose
- おまけ
あとがき

導入

「ControlNet」の導入については下記の備忘ログを参照してください。

hastaluegoblog.hatenablog.com

モデルをダウンロード

「ControlNet」を使うには、モデルを公式URLからダウンロードする必要があります。

huggingface.co

今回使用する「control_sd15_canny.pth」、「control_sd15_depth.pth」、「control_sd15_openpose.pth」の３ファイルをダウンロード。

ダウンロードしたファイルは、「ControlNet」導入時に自動作成された下記フォルダに置いてください。

stable-diffusion-webui\extensions\sd-webui-controlnet\models

元画像を入手

今回使用する写真は、「ぱくたそ」さんのフリー素材を使用させて頂きました。

www.pakutaso.com

しかし、このまま使用すると生成される人物が右寄り＆小さくなってしまいますので、ペイントソフトなどでトリミングして女性の位置を調整します。

では、各モデルで画像生成してみましょう。

各モデルで画像生成

写真の登録

GUIに「ControlNet」が追加されていますので、▼マークをクリックしてメニューを開きます。

メニューが開くと「ここに画像をドロップ　ーまたはー　ダウンロードしてアップロード」と表示されていますので、この部分にエクスプローラーからドロップするもよし、クリックしてアップロードするもよしです。

写真を登録するとこんな感じになります。

では、次に各モデルを使用してどんな画像が生成されるか見ていきましょう。

canny

このモデルは、元画像から線画を作成してくれます。

設定手順

①「ControlNet」を有効にするため「Enable」にチェック

②「Preprocessor」に「canny」を選択

③「Model」にダウンロードした「control_sd15_canny」を選択

④「Preview annotator result」をクリック

⑤ 線画が表示される

では、簡単なプロンプトを使って作画してみましょう。

Prompt

masterpiece, best quality, 1girl, street corner, hyperrealistic, 8k,

Negative prompt

easynegative, nsfw, bad anatomy, long_neck, long_body, longbody, deformed mutated disfigured, missing arms, extra_arms, mutated hands, extra_legs, bad hands, poorly_drawn_hands, malformed_hands, missing_limb, floating_limbs, disconnected_limbs, extra_fingers, bad fingers, liquid fingers, poorly drawn fingers, missing fingers, extra digit, fewer digits, ugly face, deformed eyes, partial face, partial head, bad face, inaccurate limb, cropped

既にお気づきと思いますが、「canny」は線画を元に作画するため元写真に近い画像が生成されます。服装も似てますね。

版権的には微妙になりますが(笑)、元画像そっくりに画像生成する時には非常に便利ですね。

depth

このモデルは、元画像から深度画像（遠近を明暗で表現）を作成してくれます。

設定手順

①「ControlNet」を有効にするため「Enable」にチェック

②「Preprocessor」に「depth」を選択

③「Model」にダウンロードした「control_sd15_depth」を選択

④「Preview annotator result」をクリック

⑤ 深度画像が表示される

では、「canny」と同じプロンプトを使って作画してみましょう。

「canny」とは異なり、ポーズや雰囲気は似ていますが、服装や鞄や帽子などが加わり、かなり雰囲気が異なった画像が生成されました。元画像をアレンジして画像生成する時には非常に便利ですね。

openpose

このモデルは、元画像からポーズ（骨格的なもの）を作成してくれます。

設定手順

①「ControlNet」を有効にするため「Enable」にチェック

②「Preprocessor」に「openpose」を選択

③「Model」にダウンロードした「control_sd15_openpose」を選択

④「Preview annotator result」をクリック

⑤ ポーズ画像が表示される

では、「canny」と同じプロンプトを使って作画してみましょう。

ポーズ以外は別物ですね。ポーズのみを利用したい場合はこのモデルを使うと便利ですね。プロンプトに「hatune miku」と付けると、ちゃんと「ミクさん」になります。

なぜかこの画像も帽子はかぶってますね？　手の位置がそうさせるのか。。

「openpose」の注意点としては、複雑なポーズだったり乗り物に乗っている場合などは正確にポーズ情報を抽出できないケースがあるようです。

ちなみに「depth」を使うと元写真に近い「ミクさん」になります。

元写真の影響を受けつつオリジナリティを出せる「depth」の利用価値は高く、個人的には「depth」がお気に入りです。

「canny」だと元画像そのまんまになったり、「openpose」だとポーズ情報が抽出できないような、バイクに乗っているシーンなどは「depth」が最適です。

深度画像はこんな感じ。

おまけ

あとがき

他にもモデルはたくさんありますが、確認が追い付かない状況です。

ChatGPTなどのAI系は時間単位で進化しているので、追い付くのは無理でしょうね(笑)

理解するより、ツールとして上手に使っていく方向で頑張っていきましょう(^^)b

2023-04-16

Stable diffusionの拡張機能のエラー対処方法

Stable Diffusion

写真やイラストからポーズなどの情報を取得してくれる拡張機能「ControlNet」をインストールする際に少しハマったのでメモしておきます。

自環境
エラー内容
- 拡張機能インストール手順
エラー原因
対処方法
あとがき

自環境

私の環境は以下の構成になっています。

メインPC（Windows11）：Stable diffusion稼働
サブPC（Mac Book pro）：普段使い

サブPCからも Stable diffusionを使用したいので、「web-ui.bat」には他のPCからもアクセスできるように赤字部分の設定が追加されています。

@echo off

set PYTHON=

set GIT=

set VENV_DIR=

set COMMANDLINE_ARGS=--listen

call webui.bat

今回は、この「--listen」オプションが悪さをしてました。

エラー内容

拡張機能をインストールする場合は、「Extensions」タブをクリック。

下記２つのどちらかを使用します。

「Available」：Stable diffusionに有効な拡張機能をインストール
「Install from URL」：GitHubなどに公開されている拡張機能をインストール

「ControlNet」は「Available」にも登録（名称：sd-webui-controlnet）されているので、クリックのみでインストールできます。

拡張機能インストール手順

① 「Extensions」タブをクリック

② 「Load from:」ボタンをクリック

③　拡張機能一覧が表示される

④　拡張機能一覧から「sd-webui-controlnet」を探す

⑤　右端の「Install」ボタンをクリック

しかし、インストールは進まず、Stable diffusionを起動しているコンソールに下記エラーが表示されます。

エラー原因

自環境のとこで触れましたが、「webui-user.bat」の「--listen」オプションによりStable diffusionは自宅内部ネットワークに接続できるようになっているため、内部ネットワーク内から拡張機能をが保存されているサーバを探しだそうとし、見つからなくてエラーになっているようです。

対処方法

単純に「webui-user.bat」の「--listen」オプションを消すことで問題なくインストール可能となります。

@echo off

set PYTHON=

set GIT=

set VENV_DIR=

set COMMANDLINE_ARGS=

call webui.bat

インストール後に「--listen」オプションの追加をお忘れなく。。

あとがき

「webui-user.bat」などの環境設定を変更しなければハマることもないのでしょうが、利便性＆生産性向上のためには変更も重要です。
Stable diffusionの場合、コンソールにきちんとエラーが表示されるので比較的解析も容易かと思います。

みなさま、自分好みにカスタマイズして画像生成AIライフを楽しみましょう！

2023-04-09

Stable diffusion にChilloutMixを導入

Stable Diffusion

実写系のリアルな画像を生成してくれる「ChilloutMix」モデルを導入してみました。

ChilloutMixとは
ChilloutMixのインストール
モデルのダウンロード
設定
画像生成
あとがき

ChilloutMixとは

下の画像のようにリアルな画像を生成してくれるモデルですが、商用利用不可や公開条件に制限がありそうです。最新のライセンス条件を確認して使用してください。

ChilloutMixのインストール

公式URL

civitai.com

ダウンロードはstable diffusionのモデル共有サイト「Civitai」からダウンロードする必要があります。そして、「ChilloutMix」の場合はログインが必要となります。

まず、公式URLアクセスすると下記画面が表示されますので、「Log in to view」をクリック

私の場合、「Discord」アカウントを使用しましたので「Discord」をクリック

「Discord」アカウントの「メールアドレス」、「パスワード」を入力して「ログイン」をクリック

「認証」をクリックしてログイン完了です。

ログインすると下記画面が表示されモデルがダウンロード可能となります。

※版権が分からなかったので、モザイクかけてます。

モデルのダウンロード

少し下にスクロールすると「Versions」という表示があり、その下に各モデルのバージョン一覧が表示されています。

ここで「ChilloutMix-Ni-pruned-fp32-fix」をクリック、右側の「Download」をクリックするとモデルのダウンロードが開始されます。

ダウンロードした「chilloutmix_NiPrunedFp32Fix.safetensors」ファイルを下記フォルダに移動。

stable-diffusion-webui\models\Stable-diffusion

なお、このモデルはVAEファイルを含んでいるため、別途、VAEファイルをダウンロードする必要はありません。

設定

①「Stable Diffusion checkpoint」に「chilloutmix_NiPrunedDp32Fix.safetensors」指定

②「Settings」タブをクリック

③ 左端の「Stable Diffusion」をクリック

④「SD VAE」に「None」指定

注）私の環境は④を行わないと正常な画像が得られませんでしたが、通常は②〜④の作業は不要かと思います。

画像生成

ダウンロードページのサンプルに私好みのサイバーっぽいのがありましたので、そのプロンプトを参考に猫型アンドロイドを幾つか生成してみました。

猫型サイボーグ１

プロンプト

complex 3d render ultra detailed of a beautiful porcelain profile cat android , cyborg, robotic parts, 150 mm, beautiful studio soft light, rim light, vibrant details, luxurious cyberpunk, lace, hyperrealistic, anatomical, facial muscles, cable electric wires, microchip, elegant, beautiful background, octane render, H. R. Giger style, 8k, best quality, masterpiece, illustration, an extremely delicate and beautiful, extremely detailed ,CG ,unity ,wallpaper, (realistic, photo-realistic:1.37),Amazing, finely detail, masterpiece,best quality,official art, extremely detailed CG unity 8k wallpaper, absurdres, incredibly absurdres, <lora:japaneseDollLikeness_v10:0.1>, <lora:koreanDollLikeness_v10:0.5>,

Negative prompt: easynegative, nsfw

Steps: 20, Sampler: Euler a, CFG scale: 7, Seed: 566464262, Size: 512x512, Model hash: fc2511737a, Model: chilloutmix_NiPrunedFp32Fix

猫型サイボーグ２

プロンプト

complex 3d render ultra detailed of a beautiful porcelain profile cat android , cyborg, robotic parts, 150 mm, beautiful studio soft light, rim light, vibrant details, luxurious cyberpunk, lace, hyperrealistic, anatomical, facial muscles, cable electric wires, microchip, elegant, beautiful background, octane render, H. R. Giger style, 8k, best quality, masterpiece, illustration, an extremely delicate and beautiful, extremely detailed ,CG ,unity ,wallpaper, (realistic, photo-realistic:1.37),Amazing, finely detail, masterpiece,best quality,official art, extremely detailed CG unity 8k wallpaper, absurdres, incredibly absurdres, <lora:japaneseDollLikeness_v10:0.1>, <lora:koreanDollLikeness_v10:0.5>,

Negative prompt: easynegative, nsfw

Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 6, Seed: 4107013248, Size: 512x512, Model hash: fc2511737a, Model: chilloutmix_NiPrunedFp32Fix

初音ミクぽいアンドロイド

プロンプト

hatune miku, cyborg, robotic parts, 150 mm, beautiful studio soft light, rim light, vibrant details, luxurious cyberpunk, lace, hyperrealistic, anatomical, facial muscles, cable electric wires, microchip, elegant, beautiful background, octane render, H. R. Giger style, 8k, best quality, masterpiece, illustration, an extremely delicate and beautiful, extremely detailed ,CG ,unity ,wallpaper, (realistic, photo-realistic:1.37),Amazing, finely detail, masterpiece,best quality,official art, extremely detailed CG unity 8k wallpaper, absurdres, incredibly absurdres, <lora:japaneseDollLikeness_v10:0.1>, <lora:koreanDollLikeness_v10:0.5>,

Negative prompt: easynegative, nsfw

Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 3163667480, Size: 512x512, Model hash: fc2511737a, Model: chilloutmix_NiPrunedFp32Fix

初音ミクぽい女子１

プロンプト

hatune miku riding a motorcycle, 150 mm, beautiful studio soft light, rim light, vibrant details, luxurious cyberpunk, lace, hyperrealistic, anatomical, facial muscles, cable electric wires, microchip, elegant, beautiful background, octane render, H. R. Giger style, 8k, best quality, masterpiece, illustration, an extremely delicate and beautiful, extremely detailed ,CG ,unity ,wallpaper, (realistic, photo-realistic:1.37),Amazing, finely detail, masterpiece,best quality,official art, extremely detailed CG unity 8k wallpaper, absurdres, incredibly absurdres, <lora:japaneseDollLikeness_v10:0.1>, <lora:koreanDollLikeness_v10:0.5>,smile, looking at each other,

Negative prompt: easynegative, nsfw

Steps: 21, Sampler: Euler a, CFG scale: 7.5, Seed: 270516056, Size: 512x512, Model hash: fc2511737a, Model: chilloutmix_NiPrunedFp32Fix

初音ミクぽい女子２

プロンプト

atune miku riding a motorcycle, 150 mm, beautiful studio soft light, rim light, vibrant details, luxurious cyberpunk, lace, hyperrealistic, anatomical, facial muscles, cable electric wires, microchip, elegant, beautiful background, octane render, H. R. Giger style, 8k, best quality, masterpiece, illustration, an extremely delicate and beautiful, extremely detailed ,CG ,unity ,wallpaper, (realistic, photo-realistic:1.37),Amazing, finely detail, masterpiece,best quality,official art, extremely detailed CG unity 8k wallpaper, absurdres, incredibly absurdres, <lora:japaneseDollLikeness_v10:0.1>, <lora:koreanDollLikeness_v10:0.5>,smile, looking at each other,

Negative prompt: easynegative, nsfw

Steps: 20, Sampler: Euler a, CFG scale: 7, Seed: 1232556131, Size: 512x512, Model hash: fc2511737a, Model: chilloutmix_NiPrunedFp32Fix

バイク女子

プロンプト

complex 3d render ultra detailed of a beautiful , Cyborg woman riding a motorcycle, robotic parts, 150 mm, beautiful studio soft light, rim light, vibrant details, luxurious cyberpunk, lace, hyperrealistic, anatomical, facial muscles, cable electric wires, microchip, elegant, beautiful background, octane render, H. R. Giger style, 8k, best quality, masterpiece, illustration, an extremely delicate and beautiful, extremely detailed ,CG ,unity ,wallpaper, (realistic, photo-realistic:1.37),Amazing, finely detail, masterpiece,best quality,official art, extremely detailed CG unity 8k wallpaper, absurdres, incredibly absurdres, <lora:japaneseDollLikeness_v10:0.1>, <lora:koreanDollLikeness_v10:0.5>, looking at each other,laug,

Negative prompt: easynegative, nsfw, bad fingers

Steps: 19, Sampler: DPM2 Karras, CFG scale: 5.5, Seed: 620172953, Face restoration: CodeFormer, Size: 512x512, Model hash: fc2511737a, Model: chilloutmix_NiPrunedFp32Fix

あとがき

このモデルは驚くべき高画質な画像を生成してくれますが、学習データに伴う著作権問題はかなり抱えているように感じます（私見）。

しかしながら、想像力を掻き立てられるモデルであることは間違いないです。

ライセンスに基づいて適切に使用すれば、とても有用なツールだと思います (^^)

なお、正確にライセンスを理解しているわけではありませんので、このブログに載せているが画像などに問題があればご指摘お願いいたします。

2023-04-02

Stable diffusion web UIにPastel Mixを導入

Stable Diffusion

パステル調の画像を生成してくれる「Pastel Mix」モデルを導入してみました。

Pastel Mixのインストール
画像生成
あとがき

Pastel Mixのインストール

公式URL

huggingface.co

モデルとVAEダウンロード

「Files and version」タブからモデルファイル「pastelmix-fp32.safetensors」とVAEファイル「pastel-waifu-diffusion.vae.pt」ダウンロード（ファイルサイズが表示されている部分をクリック）。

ダウンロードした「pastelmix-fp32.safetensors」ファイルを下記フォルダに移動。

stable-diffusion-webui\models\Stable-diffusion

VAEのファイル名変更

ダウンロードしたVAEファイル名をモデル名に合わせて変更（赤字部分）すると「Stable Diffusion Checkpoint」でモデルを変更した時、自動的にVAEを変更してくれます。

pastel-waifu-diffusion.vae.pt

↓↓↓

pastelmix-fp32.vae.pt

VAEファイルを下記フォルダに移動。

stable-diffusion-webui\models\VAE

Note：「pastelmix-fp32.safetensors」を保存しているフォルダに移動させても認識してくれるようです。

各種設定

公式URLの「Guide」に従って推奨の各種設定を行います。

Sampler: DPM++ 2M Karras
Steps: 20
CFG Scale: 7
Hires. Fix: On
Upscaler: Latent (MUST!)
Hires Steps: 20
Denoising Strength: 0.6

具体的にはこんな感じです。

画像生成

ちょうど桜の季節ということで (^^)

パステル調が桜に合う好みの画像が生成されました。

プロンプト

masterpiece, best quality, 1girl, cherry blossams,

Negative prompt: easynegative

Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 371288227, Size: 512x512, Model hash: 694fde43fc, Model: pastelmix-fp32, Denoising strength: 0.7, Hires upscale: 2, Hires steps: 20, Hires upscaler: Latent

もう一枚。

プロンプト

masterpiece, best quality,2girl are pressing their cheeks together, blue eyes,at night, cherry blossams , moon light,

Negative prompt: easynegative, cats, bad fingers, extra digit, bad hands,missing fingers

Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 2024003798, Size: 512x512, Model hash: 694fde43fc, Model: pastelmix-fp32

あとがき

リアル画像もいいですが、パステル調のイラストもなかなか良いものですね。

プロンプト次第で様々な画像が生成できる（といっても、かなりSeedに依存してますが。。）というのは本当に面白いです。気分転換にもなりますしね。

学習モデルを開発されている方々には感謝・感謝です。

2023-03-27

Stable Diffusion web UIでノーチラスをモチーフに作画

Stable Diffusion

私の大好きな（笑）「ノーチラス」をモチーフに適当に作画してみたところ、AIがいい感じに作ってくれました。

注１）あの「ノーチラス○」ではなく「オオムガイ」です (^^;

注２）プロンプトを入力しても同じものができないかも（理解が追いついてないです。すみません）

使用したモデル
化石っぽいもの（１）
- プロンプト
化石っぽいもの（２）
- プロンプト
貝殻っぽいもの
- プロンプト
新種の貝！？
- プロンプト
飛行船！？
- プロンプト
あとがき

使用したモデル

anything-v4.0だとイメージと違う画像しか生成してくれませんでしたので、wd-1-5-beta2-aesthetic-fp32を使用しました。

huggingface.co