Stable diffusionでLoRAを使って驚いた

プロンプトをコネコネしても生成できない画像を簡単に生成してくれる「LoRA」を使ってみました(そして、驚いた!)のでログを残しておきます。

chilloutmix_NiPrunedFp32Fix + lora:akiraMotorbikeBATE_v02plus

 

目次

 

LoRAとは

ChatGPTさん曰く、

LoRAは、深層学習に基づく画像生成AIの一種で、畳み込みニューラルネットワークと呼ばれるアルゴリズムを使用して、画像を生成します。

通常、畳み込みニューラルネットワークは、入力された画像を小さな部分に分割して、それらの部分の情報を組み合わせて特徴量を抽出し、最終的に新しい画像を生成することができます。しかし、この方法は画像の詳細な情報を失う可能性があるため、生成された画像がリアルなものとして見えないことがあります。

LoRAは、この問題に対処するため、分割された画像の部分に、周囲の部分との関係性を考慮することができる「再帰型畳み込みニューラルネットワーク」というアルゴリズムを取り入れています。これにより、画像の詳細な情報をより正確に把握し、よりリアルな画像を生成することができます。

つまり、LoRAは、よりリアルな画像生成を可能にする、高度な深層学習技術の一つであると言えます。

 

ん~、何のことかわかりませんね (^^;

中学生レベルで答えてもらいました。

LoRAは、多くの絵を見て勉強をして、自分で新しい絵を描くことができるようになる

 

つまり、モデル(checkpoint)に無い(又は、不十分な)アニメのキャラクターであったり、人物、クルマなどの「特定の多くの絵(画像)」のみを学習させて新しい絵を描くことができるようにしたものが「LoRA」という解釈かなぁと考えてます。

ざっくり過ぎですかね (^^;

 

そのため、LoRAには「特定の絵」の学習データしか含まれていませんので、anythingなどのモデルに比べてファイルサイズが非常に小さいく数百MB程度しかありません。そして、様々なモデルと組み合わせることができるという特徴もあります。

 

導入

LoRAファイルをダウンロード

CIVITAIサイトでのダウンロート例を説明します。

civitai.com

CIVITAIサイトにアクセスし、"LoRA"で検索すると一覧が表示されます。

 

バイク好きの私としては、「AKIRA」の「金田バイク」をチョイスしました。

civitai.com

 

LoRAファイルは、右側の「Download」をクリックするとダウンロードされます。

 

ダウンロードした”akiraMotorbikeBATE_v02plus.safetensors”ファイルを下記フォルダに移動させて作業終了です。

stable-diffusion-webui\models\Lora

 

準備

LoRAを使用するには2点ポイントがあります。

  1. 花札アイコンをクリックし、使用するLoRAを選択する
  2. プロンプトに"Trigger Words"を書く

 

1. 花札アイコンをクリックし、使用するLoRAを選択

注意)LoRAを選択するとプロンプトに"<lora:akiraMotorbikeBATE_v02plus:1>"が追加されます。これを消すとLoRAが無効になります。

言い換えると、この手順を踏まなくてもプロンプトに"<lora:akiraMotorbikeBATE_v02plus:1>"と書けばLoRAは有効になります。

2. プロンプトに"Trigger Words"を書く

"Trigger Words"は、ダウンロードサイトの「Details」の部分に記載されています。

ちなみに、今回使用しているLoRAの場合は、"AKIRABIKE"です。

 

プロンプトに"AKIRABIKE,"を書く。

 

画像生成

一番シンプルなプロンプト

プロンプト

AKIRABIKE, <lora:akiraMotorbikeBATE_v02plus:1>,

ネガティブプロンプト

easynegative

デフォルトの512x512だと全体像が表示されませんでしたので、800x512にサイズを変更しています。

何回か生成していると、おおっ、金田バイクが生成されました!!

プロンプトをコネコネしても作画できないデザインですね~

けど、もう少しクオリティが欲しい。。。

anything-v4.0, Sampler: Euler a, Seed: 4079068548, Size: 800x512
Chilloutmixモデル+クオリティUPプロンプト

プロンプト

AKIRABIKE, <lora:akiraMotorbikeBATE_v02plus:1>,

vibrant details, hyperrealistic, beautiful background, octane render, 8k, best quality, masterpiece, illustration, an extremely delicate and beautiful, extremely detailed ,CG ,wallpaper, realistic, photo-realistic,Amazing, finely detail, best quality,

ネガティブプロンプト

easynegative

実写系モデル+画質UPプロンプトでここまでリアルになりました!

chilloutmix_NiPrunedFp32Fix, DPM++ 2M Karras, Seed: 1589021419, Size: 800x512

なお、ChilloutMixの導入については下記備忘ログを参照してください。

hastaluegoblog.hatenablog.com

 

LoRAのダウンロードページにあるサンプルのプロンプトを参考にしながら、リアリティを出してみました。

 

プロンプト

closed - up, masterpiece, best quality, (full_body:1.3),best quality, (8k, RAW photo, best quality, masterpiece:1.2), (realistic, photo-realistic:1.4), ultra-detailed,1girl,perfect detail , (wearing a black racing outfit), (riding a orange akirabike In the ruins of a cyberpunk city after a thermonuclear war, broken neon signs hanging from buildings, neon signs)), (round scifi metal breastplate shining coldly), long legs, lots of exposed broken cables, Colorful glare and smoke, 1.5mm, smail face、illustration of a beautiful girl, detailed beautiful face, detailed hair, detailed human eyes, detailed mouth, detailed arms, detailed bust, looking far away, shot diagonally, artstation, deviantart, concept art, digital painting, award-winning, cinematic postprocessing, cinematic scene, cinematic composition, cinematic lighting, overexpose, ray tracing, 8K, <lora:akiraMotorbikeBATE_v02plus:0.7>, <lora:japaneseDollLikeness_v10:0.1>

 

ネガティブプロンプト

paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), dot, mole, lowres, normal quality, monochrome, grayscale, lowres, text, error, cropped, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, out of frame, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck, username, watermark, signature, (mole:1.4),nsFW, bad face

 

その他

Steps: 21,

Sampler: DPM++ SDE Karras,

CFG scale: 7,

Seed: 3084128988,

Size: 680x512,

Model: chilloutmix_NiPrunedFp32Fix,

Denoising strength: 0.7,

Hires upscale: 2,

Hires upscaler: Latent

 

リアリティがあり、世界観もマッチしてますね (^^

chilloutmix_NiPrunedFp32Fix + lora:akiraMotorbikeBATE_v02plus

あとがき

LoRAを利用することで作画の幅がグッと広がりました。とはいえ、版権などの問題はありますので商用利用するには難があるかと思います。

しかし、頭の中のイメージを画像にすることでさらなる発想が生まれ、オリジナルの作画につながるのも事実です。先人たちのLoRAを活用させて頂き、更なる進化につなげましょう。

 

おまけ

うる星やつら」のラムちゃんのLoRAを使って作画しました。

最近リメイク版が放送されてましたね~ 人気は衰えてないです。

civitai.com

うる星やつら ラムちゃん(二次創作)

うる星やつら ラムちゃん(二次創作)

うる星やつら ラムちゃん(二次創作)

うる星やつら ラムちゃん(二次創作)

Stable diffusion拡張機能のControlNetを使ってみました

写真やイラストからポーズなどの情報を取得してくれるStable diffusionの拡張機能「ControlNet」を使ってみましたのでログを残しておきます。

ControlNet使用

目次

 

導入

「ControlNet」の導入については下記の備忘ログを参照してください。

hastaluegoblog.hatenablog.com

 

モデルをダウンロード

「ControlNet」を使うには、モデルを公式URLからダウンロードする必要があります。

huggingface.co

 

今回使用する「control_sd15_canny.pth」、「control_sd15_depth.pth」、「control_sd15_openpose.pth」の3ファイルをダウンロード。

ダウンロードしたファイルは、「ControlNet」導入時に自動作成された下記フォルダに置いてください。

stable-diffusion-webui\extensions\sd-webui-controlnet\models

 

元画像を入手

今回使用する写真は、「ぱくたそ」さんのフリー素材を使用させて頂きました。

www.pakutaso.com

 

敬礼をする女性

 

しかし、このまま使用すると生成される人物が右寄り&小さくなってしまいますので、ペイントソフトなどでトリミングして女性の位置を調整します。

中央に移動させてトリミングした画像

では、各モデルで画像生成してみましょう。

 

各モデルで画像生成

写真の登録

GUIに「ControlNet」が追加されていますので、▼マークをクリックしてメニューを開きます。

 

メニューが開くと「ここに画像をドロップ ーまたはー ダウンロードしてアップロード」と表示されていますので、この部分にエクスプローラーからドロップするもよし、クリックしてアップロードするもよしです。

 

写真を登録するとこんな感じになります。

では、次に各モデルを使用してどんな画像が生成されるか見ていきましょう。

 

canny

このモデルは、元画像から線画を作成してくれます。

設定手順

①「ControlNet」を有効にするため「Enable」にチェック

②「Preprocessor」に「canny」を選択

③「Model」にダウンロードした「control_sd15_canny」を選択

④「Preview annotator result」をクリック

⑤ 線画が表示される


では、簡単なプロンプトを使って作画してみましょう。

Prompt

masterpiece, best quality, 1girl, street corner, hyperrealistic, 8k,

Negative prompt

easynegative, nsfw, bad anatomy, long_neck, long_body, longbody, deformed mutated disfigured, missing arms, extra_arms, mutated hands, extra_legs, bad hands, poorly_drawn_hands, malformed_hands, missing_limb, floating_limbs, disconnected_limbs, extra_fingers, bad fingers, liquid fingers, poorly drawn fingers, missing fingers, extra digit, fewer digits, ugly face, deformed eyes, partial face, partial head, bad face, inaccurate limb, cropped

control_sd15_cannyで作画

既にお気づきと思いますが、「canny」は線画を元に作画するため元写真に近い画像が生成されます。服装も似てますね。

版権的には微妙になりますが(笑)、元画像そっくりに画像生成する時には非常に便利ですね。

 

depth

このモデルは、元画像から深度画像(遠近を明暗で表現)を作成してくれます。

設定手順

①「ControlNet」を有効にするため「Enable」にチェック

②「Preprocessor」に「depth」を選択

③「Model」にダウンロードした「control_sd15_depth」を選択

④「Preview annotator result」をクリック

⑤ 深度画像が表示される

 

では、「canny」と同じプロンプトを使って作画してみましょう。

control_sd15_depthで作画

「canny」とは異なり、ポーズや雰囲気は似ていますが、服装や鞄や帽子などが加わり、かなり雰囲気が異なった画像が生成されました。元画像をアレンジして画像生成する時には非常に便利ですね。

 

openpose

このモデルは、元画像からポーズ(骨格的なもの)を作成してくれます。

設定手順

①「ControlNet」を有効にするため「Enable」にチェック

②「Preprocessor」に「openpose」を選択

③「Model」にダウンロードした「control_sd15_openpose」を選択

④「Preview annotator result」をクリック

⑤ ポーズ画像が表示される

 

 

では、「canny」と同じプロンプトを使って作画してみましょう。

control_sd15_openposeで作画

ポーズ以外は別物ですね。ポーズのみを利用したい場合はこのモデルを使うと便利ですね。プロンプトに「hatune miku」と付けると、ちゃんと「ミクさん」になります。

なぜかこの画像も帽子はかぶってますね? 手の位置がそうさせるのか。。

control_sd15_openposeで作画

「openpose」の注意点としては、複雑なポーズだったり乗り物に乗っている場合などは正確にポーズ情報を抽出できないケースがあるようです。

 

ちなみに「depth」を使うと元写真に近い「ミクさん」になります。

元写真の影響を受けつつオリジナリティを出せる「depth」の利用価値は高く、個人的には「depth」がお気に入りです。

control_sd15_depthで作画

「canny」だと元画像そのまんまになったり、「openpose」だとポーズ情報が抽出できないような、バイクに乗っているシーンなどは「depth」が最適です。

control_sd15_depthで作画

深度画像はこんな感じ。

control_sd15_depthの深度画像

 

おまけ

ミクさんライダー

 

あとがき

他にもモデルはたくさんありますが、確認が追い付かない状況です。

ChatGPTなどのAI系は時間単位で進化しているので、追い付くのは無理でしょうね(笑)

理解するより、ツールとして上手に使っていく方向で頑張っていきましょう(^^)b

 

Stable diffusionの拡張機能のエラー対処方法

写真やイラストからポーズなどの情報を取得してくれる拡張機能「ControlNet」をインストールする際に少しハマったのでメモしておきます。

ControlNet使用

目次

 

自環境

私の環境は以下の構成になっています。

  • メインPC(Windows11):Stable diffusion稼働
  • サブPC(Mac Book pro):普段使い

サブPCからも Stable diffusionを使用したいので、「web-ui.bat」には他のPCからもアクセスできるように赤字部分の設定が追加されています。

@echo off
set PYTHON=
set GIT=
set VENV_DIR=
set COMMANDLINE_ARGS=--listen
call webui.bat

今回は、この「--listen」オプションが悪さをしてました。

 

エラー内容

拡張機能をインストールする場合は、「Extensions」タブをクリック。

下記2つのどちらかを使用します。

  • 「Available」:Stable diffusionに有効な拡張機能をインストール
  • 「Install from URL」:GitHubなどに公開されている拡張機能をインストール

「ControlNet」は「Available」にも登録(名称:sd-webui-controlnet)されているので、クリックのみでインストールできます。

 

拡張機能インストール手順

① 「Extensions」タブをクリック

② 「Load from:」ボタンをクリック

③ 拡張機能一覧が表示される

④ 拡張機能一覧から「sd-webui-controlnet」を探す

⑤ 右端の「Install」ボタンをクリック


しかし、インストールは進まず、Stable diffusionを起動しているコンソールに下記エラーが表示されます。

Extensionsインストールエラー

エラー原因

自環境のとこで触れましたが、「webui-user.bat」の「--listen」オプションによりStable diffusionは自宅内部ネットワークに接続できるようになっているため、内部ネットワーク内から拡張機能をが保存されているサーバを探しだそうとし、見つからなくてエラーになっているようです。

 

対処方法

単純に「webui-user.bat」の「--listen」オプションを消すことで問題なくインストール可能となります。

@echo off
set PYTHON=
set GIT=
set VENV_DIR=
set COMMANDLINE_ARGS=
call webui.bat

インストール後に「--listen」オプションの追加をお忘れなく。。

 

あとがき

「webui-user.bat」などの環境設定を変更しなければハマることもないのでしょうが、利便性&生産性向上のためには変更も重要です。
Stable diffusionの場合、コンソールにきちんとエラーが表示されるので比較的解析も容易かと思います。

みなさま、自分好みにカスタマイズして画像生成AIライフを楽しみましょう!

 

Stable diffusion にChilloutMixを導入

実写系のリアルな画像を生成してくれる「ChilloutMix」モデルを導入してみました。

目次

 

ChilloutMixとは

下の画像のようにリアルな画像を生成してくれるモデルですが、商用利用不可や公開条件に制限がありそうです。最新のライセンス条件を確認して使用してください。

ChilloutMixで生成

ChilloutMixのインストール

公式URL

civitai.com

ダウンロードはstable diffusionのモデル共有サイト「Civitai」からダウンロードする必要があります。そして、「ChilloutMix」の場合はログインが必要となります。

 

まず、公式URLアクセスすると下記画面が表示されますので、「Log in to view」をクリック

 

私の場合、「Discord」アカウントを使用しましたので「Discord」をクリック

 

「Discord」アカウントの「メールアドレス」、「パスワード」を入力して「ログイン」をクリック

 

「認証」をクリックしてログイン完了です。

 

ログインすると下記画面が表示されモデルがダウンロード可能となります。

※版権が分からなかったので、モザイクかけてます。

 

モデルのダウンロード

少し下にスクロールすると「Versions」という表示があり、その下に各モデルのバージョン一覧が表示されています。

ここで「ChilloutMix-Ni-pruned-fp32-fix」をクリック、右側の「Download」をクリックするとモデルのダウンロードが開始されます。

 

ダウンロードした「chilloutmix_NiPrunedFp32Fix.safetensors」ファイルを下記フォルダに移動。

stable-diffusion-webui\models\Stable-diffusion

 

なお、このモデルはVAEファイルを含んでいるため、別途、VAEファイルをダウンロードする必要はありません。

 

設定

①「Stable Diffusion checkpoint」に「chilloutmix_NiPrunedDp32Fix.safetensors」指定

②「Settings」タブをクリック

③ 左端の「Stable Diffusion」をクリック

④「SD VAE」に「None」指定

注)私の環境は④を行わないと正常な画像が得られませんでしたが、通常は②〜④の作業は不要かと思います。

 

画像生成

ダウンロードページのサンプルに私好みのサイバーっぽいのがありましたので、そのプロンプトを参考に猫型アンドロイドを幾つか生成してみました。

 

猫型サイボーグ1

ChilloutMixで生成

プロンプト

complex 3d render ultra detailed of a beautiful porcelain profile cat android , cyborg, robotic parts, 150 mm, beautiful studio soft light, rim light, vibrant details, luxurious cyberpunk, lace, hyperrealistic, anatomical, facial muscles, cable electric wires, microchip, elegant, beautiful background, octane render, H. R. Giger style, 8k, best quality, masterpiece, illustration, an extremely delicate and beautiful, extremely detailed ,CG ,unity ,wallpaper, (realistic, photo-realistic:1.37),Amazing, finely detail, masterpiece,best quality,official art, extremely detailed CG unity 8k wallpaper, absurdres, incredibly absurdres, <lora:japaneseDollLikeness_v10:0.1>, <lora:koreanDollLikeness_v10:0.5>,
Negative prompt: easynegative, nsfw
Steps: 20, Sampler: Euler a, CFG scale: 7, Seed: 566464262, Size: 512x512, Model hash: fc2511737a, Model: chilloutmix_NiPrunedFp32Fix

 

猫型サイボーグ2

ChilloutMixで生成

プロンプト

complex 3d render ultra detailed of a beautiful porcelain profile cat android , cyborg, robotic parts, 150 mm, beautiful studio soft light, rim light, vibrant details, luxurious cyberpunk, lace, hyperrealistic, anatomical, facial muscles, cable electric wires, microchip, elegant, beautiful background, octane render, H. R. Giger style, 8k, best quality, masterpiece, illustration, an extremely delicate and beautiful, extremely detailed ,CG ,unity ,wallpaper, (realistic, photo-realistic:1.37),Amazing, finely detail, masterpiece,best quality,official art, extremely detailed CG unity 8k wallpaper, absurdres, incredibly absurdres, <lora:japaneseDollLikeness_v10:0.1>, <lora:koreanDollLikeness_v10:0.5>,
Negative prompt: easynegative, nsfw
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 6, Seed: 4107013248, Size: 512x512, Model hash: fc2511737a, Model: chilloutmix_NiPrunedFp32Fix

 

初音ミクぽいアンドロイド

ChilloutMixで生成

プロンプト

hatune miku, cyborg, robotic parts, 150 mm, beautiful studio soft light, rim light, vibrant details, luxurious cyberpunk, lace, hyperrealistic, anatomical, facial muscles, cable electric wires, microchip, elegant, beautiful background, octane render, H. R. Giger style, 8k, best quality, masterpiece, illustration, an extremely delicate and beautiful, extremely detailed ,CG ,unity ,wallpaper, (realistic, photo-realistic:1.37),Amazing, finely detail, masterpiece,best quality,official art, extremely detailed CG unity 8k wallpaper, absurdres, incredibly absurdres, <lora:japaneseDollLikeness_v10:0.1>, <lora:koreanDollLikeness_v10:0.5>,
Negative prompt: easynegative, nsfw
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 3163667480, Size: 512x512, Model hash: fc2511737a, Model: chilloutmix_NiPrunedFp32Fix

 

初音ミクぽい女子1

ChilloutMixで生成

プロンプト

hatune miku riding a motorcycle, 150 mm, beautiful studio soft light, rim light, vibrant details, luxurious cyberpunk, lace, hyperrealistic, anatomical, facial muscles, cable electric wires, microchip, elegant, beautiful background, octane render, H. R. Giger style, 8k, best quality, masterpiece, illustration, an extremely delicate and beautiful, extremely detailed ,CG ,unity ,wallpaper, (realistic, photo-realistic:1.37),Amazing, finely detail, masterpiece,best quality,official art, extremely detailed CG unity 8k wallpaper, absurdres, incredibly absurdres, <lora:japaneseDollLikeness_v10:0.1>, <lora:koreanDollLikeness_v10:0.5>,smile, looking at each other,
Negative prompt: easynegative, nsfw
Steps: 21, Sampler: Euler a, CFG scale: 7.5, Seed: 270516056, Size: 512x512, Model hash: fc2511737a, Model: chilloutmix_NiPrunedFp32Fix
初音ミクぽい女子2

ChilloutMixで生成

プロンプト

atune miku riding a motorcycle, 150 mm, beautiful studio soft light, rim light, vibrant details, luxurious cyberpunk, lace, hyperrealistic, anatomical, facial muscles, cable electric wires, microchip, elegant, beautiful background, octane render, H. R. Giger style, 8k, best quality, masterpiece, illustration, an extremely delicate and beautiful, extremely detailed ,CG ,unity ,wallpaper, (realistic, photo-realistic:1.37),Amazing, finely detail, masterpiece,best quality,official art, extremely detailed CG unity 8k wallpaper, absurdres, incredibly absurdres, <lora:japaneseDollLikeness_v10:0.1>, <lora:koreanDollLikeness_v10:0.5>,smile, looking at each other,
Negative prompt: easynegative, nsfw
Steps: 20, Sampler: Euler a, CFG scale: 7, Seed: 1232556131, Size: 512x512, Model hash: fc2511737a, Model: chilloutmix_NiPrunedFp32Fix

 

バイク女子

ChilloutMixで生成

プロンプト

complex 3d render ultra detailed of a beautiful , Cyborg woman riding a motorcycle, robotic parts, 150 mm, beautiful studio soft light, rim light, vibrant details, luxurious cyberpunk, lace, hyperrealistic, anatomical, facial muscles, cable electric wires, microchip, elegant, beautiful background, octane render, H. R. Giger style, 8k, best quality, masterpiece, illustration, an extremely delicate and beautiful, extremely detailed ,CG ,unity ,wallpaper, (realistic, photo-realistic:1.37),Amazing, finely detail, masterpiece,best quality,official art, extremely detailed CG unity 8k wallpaper, absurdres, incredibly absurdres, <lora:japaneseDollLikeness_v10:0.1>, <lora:koreanDollLikeness_v10:0.5>, looking at each other,laug,
Negative prompt: easynegative, nsfw, bad fingers
Steps: 19, Sampler: DPM2 Karras, CFG scale: 5.5, Seed: 620172953, Face restoration: CodeFormer, Size: 512x512, Model hash: fc2511737a, Model: chilloutmix_NiPrunedFp32Fix

 

あとがき

このモデルは驚くべき高画質な画像を生成してくれますが、学習データに伴う著作権問題はかなり抱えているように感じます(私見)。

しかしながら、想像力を掻き立てられるモデルであることは間違いないです。

ライセンスに基づいて適切に使用すれば、とても有用なツールだと思います (^^)

 

なお、正確にライセンスを理解しているわけではありませんので、このブログに載せているが画像などに問題があればご指摘お願いいたします。

 

Stable diffusion web UIにPastel Mixを導入

パステル調の画像を生成してくれる「Pastel Mix」モデルを導入してみました。

 

目次

 

Pastel Mixのインストール

公式URL

huggingface.co

モデルとVAEダウンロード

「Files and version」タブからモデルファイル「pastelmix-fp32.safetensors」とVAEファイル「pastel-waifu-diffusion.vae.pt」ダウンロード(ファイルサイズが表示されている部分をクリック)。

ダウンロードした「pastelmix-fp32.safetensors」ファイルを下記フォルダに移動。

stable-diffusion-webui\models\Stable-diffusion

 

VAEのファイル名変更

ダウンロードしたVAEファイル名をモデル名に合わせて変更(赤字部分)すると「Stable Diffusion Checkpoint」でモデルを変更した時、自動的にVAEを変更してくれます。

pastel-waifu-diffusion.vae.pt

↓↓↓

pastelmix-fp32.vae.pt


VAEファイルを下記フォルダに移動。

stable-diffusion-webui\models\VAE

Note:「pastelmix-fp32.safetensors」を保存しているフォルダに移動させても認識してくれるようです。

 

各種設定

公式URLの「Guide」に従って推奨の各種設定を行います。

Sampler: DPM++ 2M Karras
Steps: 20
CFG Scale: 7
Hires. Fix: On
Upscaler: Latent (MUST!)
Hires Steps: 20
Denoising Strength: 0.6

 

具体的にはこんな感じです。

画像生成

ちょうど桜の季節ということで (^^)

パステル調が桜に合う好みの画像が生成されました。

プロンプト

masterpiece, best quality, 1girl, cherry blossams,
Negative prompt: easynegative
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 371288227, Size: 512x512, Model hash: 694fde43fc, Model: pastelmix-fp32, Denoising strength: 0.7, Hires upscale: 2, Hires steps: 20, Hires upscaler: Latent

 

もう一枚。

 

プロンプト

masterpiece, best quality,2girl are pressing their cheeks together, blue eyes,at night, cherry blossams , moon light,
Negative prompt: easynegative, cats, bad fingers, extra digit, bad hands,missing fingers
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 2024003798, Size: 512x512, Model hash: 694fde43fc, Model: pastelmix-fp32

 

あとがき

リアル画像もいいですが、パステル調のイラストもなかなか良いものですね。

プロンプト次第で様々な画像が生成できる(といっても、かなりSeedに依存してますが。。)というのは本当に面白いです。気分転換にもなりますしね。

学習モデルを開発されている方々には感謝・感謝です。

 

Stable Diffusion web UIでノーチラスをモチーフに作画

私の大好きな(笑)「ノーチラス」をモチーフに適当に作画してみたところ、AIがいい感じに作ってくれました。

注1)あの「ノーチラス○」ではなく「オオムガイ」です (^^;

注2)プロンプトを入力しても同じものができないかも(理解が追いついてないです。すみません)

 

目次

 

使用したモデル

anything-v4.0だとイメージと違う画像しか生成してくれませんでしたので、wd-1-5-beta2-aesthetic-fp32を使用しました。
 

化石っぽいもの(1)

アイボリーとブラックのコントラストが映えてる感じがします。

 
プロンプト
Nautilus,RAW photo, best quality,realistic, photo-realistic, best quality ,masterpiece,an extremely delicate and beautiful, extremely detailed,2k wallpaper, Amazing, finely detail, 8k wallpaper,huge filesize , ultra-detailed, highres, extremely detailed,realistic, 8K, Ultra-High Definition, highest quality, ultra high resolution, (realistic:1.4), High quality texture,
Negative prompt: EasyNegative,
Steps: 20, Sampler: DPM++ SDE Karras, CFG scale: 6, Seed: 246450025, Size: 512x512, Model hash: 711cd95c77, Model: wd-1-5-beta2-aesthetic-fp32
 

化石っぽいもの(2)

ゴールドと貝の虹色っぽいのがアクセントになって映えてるかも。

 
プロンプト
Nautilus,RAW photo, best quality,realistic, photo-realistic, best quality ,masterpiece,an extremely delicate and beautiful, extremely detailed,2k wallpaper, Amazing, finely detail, 8k wallpaper,huge filesize , ultra-detailed, highres, extremely detailed,realistic, 8K, Ultra-High Definition, highest quality, ultra high resolution, (realistic:1.4), High quality texture,
Negative prompt: EasyNegative,
Steps: 20, Sampler: DPM++ SDE Karras, CFG scale: 6, Seed: 188131854, Size: 512x512, Model hash: 711cd95c77, Model: wd-1-5-beta2-aesthetic-fp32
 

貝殻っぽいもの

砂浜に転がっているよくわからない種類の貝殻かなぁ。。

 
プロンプト
Nautilus,RAW photo, best quality,realistic, photo-realistic, best quality ,masterpiece,an extremely delicate and beautiful, extremely detailed,2k wallpaper, Amazing, finely detail, 8k wallpaper,huge filesize , ultra-detailed, highres, extremely detailed,realistic, 8K, Ultra-High Definition, highest quality, ultra high resolution, (realistic:1.4), High quality texture,
Negative prompt: EasyNegative,
Steps: 20, Sampler: DPM++ SDE Karras, CFG scale: 6, Seed: 2945424871, Size: 512x512, Model hash: 711cd95c77, Model: wd-1-5-beta2-aesthetic-fp32
 

新種の貝!?

深海にいる新種の貝かなぁ。。なんか綺麗 (*^o^*)

 

プロンプト
Nautilus,RAW photo, best quality,realistic, photo-realistic, best quality ,masterpiece,an extremely delicate and beautiful, extremely detailed,2k wallpaper, Amazing, finely detail, 8k wallpaper,huge filesize , ultra-detailed, highres, extremely detailed,realistic, 8K, Ultra-High Definition, highest quality, ultra high resolution, (realistic:1.4), High quality texture,
Negative prompt: EasyNegative,
Steps: 20, Sampler: DPM++ SDE Karras, CFG scale: 6, Seed: 1777836212, Size: 512x512, Model hash: 711cd95c77, Model: wd-1-5-beta2-aesthetic-fp32

 

飛行船!?

ノーチラスの比率を下げて飛行船と掛け合わせてみました。がっ、ほとんどノーチラス感はありませんね (^^;

 

プロンプト
(nautilus: 1.5), airship floating in the sky, RAW photo, best quality,realistic, photo-realistic, best quality ,masterpiece,an extremely delicate and beautiful, extremely detailed,2k wallpaper, Amazing, finely detail, 8k wallpaper,huge filesize , ultra-detailed, highres, extremely detailed,realistic, 8K, Ultra-High Definition, highest quality, ultra high resolution, (realistic:1.4), High quality texture,
Negative prompt: EasyNegative,
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 6, Seed: 716228650, Size: 512x512, Model hash: 711cd95c77, Model: wd-1-5-beta2-aesthetic-fp32

 

あとがき

プロンプトを見ていただけるとわかりますが、「Nautilus」という単語以外は画質を上げるための呪文が書かれているだけで、ネガティブプロンプトも「EasyNegative」のみというシンプルなものとなっています。

しかしながら、画像生成AIが良さげな画像を作ってくれるのは感動ものですね。

今後もこの路線で色々作画していきたいと思います。

 

ChatGPTにトロッコ列車問題を聞いてみた

ChatGPTに答えが出ないトロッコ列車問題を聞いてみました。

 

トロッコ列車問題とは?

Wikipediaより

最もリスクの少ない選択は?

「何もしないことで責任をもつことはない」・・・ 

確かに、リスクの少ない選択肢としてはこれしかないように思いますが、何か複雑な気持ちですね。。

 

ChatGPTの選択は?

「可能な限り多くの人命を救う」・・・

これにはビックリしました。AIはリスクの少ない選択をすると思っていたのですが、なにやら「意思」のようなものを感じますね。

 

あとがき

トロッコ列車問題はシンプルですが、様々な背景や価値観などにより正解がない問題です。しかし、うろ覚えですが「レバーを半引きにしてトロッコ列車を脱線させる」という反則的な答えはありましたね(笑)

この答えの場合は「トロッコ列車に人が乗っていない」ことが前提になりますね。

 

もし、自動運転で危険回避する際、ドライバーの命を優先するのか、周辺にいる人を優先するのか。。答えは無いのかもしれませんが、クルマメーカーは何らかの答えを持って設計しているのか、していないのか、気になるところです。