「Stable Diffusion web UI」でつるつるドレスの美少女を生成したい(5)

AI画像生成

プロンプトをちょっと変えてみました

室内ではなく、ちょっと外での光景にしたいのでメインのプロンプトを以下のように変えてみました。

プロンプト
masterpiece, extremely detailed, RAW photo, highest quality, realistic, one girl walking on a sidewalk wearing a satin light blue dress, looking at viewer, 15 years old, standing, full body, small breasts, puff sleeves, fine lace

「one girl walking on a sidewalk wearing a satin light blue dress」は「歩道を歩く明るい青のサテンドレスを着た少女」と単語の羅列ではなく文章っぽくします。レースも好きなので「fine lace」も追加しました。その結果がこちら。

Stable Diffusion web UI Chilled remix V2

自然な感じで悪くないんですが、ドレスにボタンはいらないっす。またスカート部分をもっとふんわりした感じにしたいです。要するになんかちょっと違う。

また今まで触れていませんしたが「Stable Diffusion」はほぼガチャで、同じプロンプトでも同じ画像が生成されるとは限りません。なので何回も生成して気に入ったものを採用します。設定画面の下の方にある「Seed」の設定値が「-1」だと完全ランダムで画像を生成してくれます。気に入った画像が生成されたらこの「Seed」をリサイクルアイコンをクリックすることで固定できます。

プロンプトと格闘してここまでできた

で、ガチャをガンガン回しつつ、もう何十回も生成して下のプロンプトで落ち着きました。

プロンプト
(full body:1.3), masterpiece, extremely detailed, (one girl walking on a park wearing a satin light blue dress 1.6), puff sleeves, (very shiny dress,:1.2), 14 years old, natural makeup, black hair, cute kawaii girl, gigantic breasts, fine lace, beautifully ordinated, thin-waist, idol, high heels, waist ribbon, arms up,

上記のように括弧で囲んでコロンの後に1.2とか数字入れると、その語句で強調してくれるそうです。ただやみくもに数値を上げても良くないらしい。

そしてネガティブプロンプトは先人のお知恵を拝借してやたら長くなってしまいました。ぶっちゃけどれが効いているのかよく判らないのだけど、要らない語句を整理したら結果が変わりそうで試していません。

ネガティブプロンプト
anatomical nonsense, bad anatomy, bad breasts, bad camel toe, bad collarbone, bad cum, bad digit, bad ears, bad face, bad feet, bad gloves, bad hairs, bad hands, bad knee, bad mouth, bad proportions, bad shadow, bad shoes, bad tails, bad eyes, broken legs, disappearing arms, fused breasts, fused calf, fused collarbone, fused eyes, heavy breasts, heavy ears, huge breasts, collarbone, missing ears, missing feet, missing fingers, missing hand, missing legs, missing limb, missing thighs, missing breasts, morbid, more than 1 left hand, more than 1 right hand, more than 2 legs, more than 2 nipples, more than 2 thighs, more than two shoes, multiple breasts, Multiple males, Multiple women, mutated,mutated hands and fingers, mutation, mutilated, normal quality, obesity, one hand with less than 5 digit, one hand with less than5 fingers, one hand with more than 5 digit, one hand with more than 5 fingers, pony, poorly drawn, poorly drawn animal ears, poorly drawn breasts, poorly drawn ears, poorly drawn face, poorly drawn hairs, poorly drawn hands, poorly drawn mouth, poorly drawn shoes, poorly drawn thigh gap, poorly drawnfeet, QR code, short arm, signature, strong girl, text, text font ui, too longtongue, ugly, ui, uncoordinated body, unnatural body, watermark,worst quality, yellow teeth, button, Pannier, braided, corset, rococo dress, off shoulder,

太字の部分が私が追加した部分です。「braided」はドレスの編み込み表現が嫌だったので追加しましたが、単語的に正しいのかは判りません。

また全身を出したかったのですが、画像のアスペクト比が512x512の正方形では難しいことが判りました。縦長にしないと全身は描画してくれないみたいです。縦は512の倍数が良いみたいなので、1024にしてみました。

で、結果が以下です。

Stable Diffusion web UI Chilled remix V2

いや~良いのができました。こういうのを出したかったんですよ。ブログに貼るにはちょっとでかいので、上記の画像は解像度を半分にして貼ってあります。

もっと解像度を上げたい

拡大したものをトリミング

ですがもう少しドレスのディティールが欲しいです。全身を出すためには構図が引きになってしまうので、ディティールが失われるのは当然なのですが、もうちょっと質感を愛でたい。

そこで、解像度を2倍(1024×2048)で生成してみました。

なにこれ

なんじゃこれこっわ!(笑)。

むろんブログに貼るのに解像度は落としてあります。どうもピクセル数を高くすれば良いというわけではないようです。でもせっかく良い画像が生成できたのに、これを保ったまま解像度を高くする方法ないものでしょうか。

今回はここまで。
では。

コメント

タイトルとURLをコピーしました