【StableDiffusion】AIエロ画像情報交換31
■ このスレッドは過去ログ倉庫に格納されています
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512
AIに理想のエロ画像を生成させるためのノウハウについて語り合うスレ
単なる娘自慢も可、だが児ポはダメゼッタイ!
前スレ
【StableDiffusion】AIエロ画像情報交換30
http://mercury.bbspink.com/test/read.cgi/erocg/1692070086/
環境構築方法等の技術系の質問はこちらでお願いします
【StableDiffusion】画像生成AI質問スレ17
http://mevius.5ch.net/test/read.cgi/cg/1693401315/
【初めての人は読んでね】テンプレまとめ・編集コード「5ch」
https://rentry.co/pinkaiero
次スレは>>980が立ててください
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured >>619
白黒になっちゃったけどこんな感じならできた
group shot, mass of girls in straight lines are sitting on gym ground 〜
みたいな感じ
https://i.imgur.com/3n7cOQg.jpg braが2.3、Chillは2.8次元くらいなイメージ おジャ魔女どれみのloraからエロ画像を生成してみてこれ生成していいのかと困惑している
まぁ生成するんだけど >>628
でぇじょうぶだ
おジャ魔女のエロ同人やイラストがいくつ世の中にあると思ってる
胸張ってシコれ キャラものとか生成してて表情や表現が色々出てくるとメジャー作品だなと思い、プロンプトどういじくろうが似たような絵ばっか出てくるとマイナー作品なんだな……と微妙に凹む >>624
センターの子のぱんつどうなってるんだ? >>622
SDのプロンプトは根本的にそういうことをやるのに向いてないのよね
人物を個別に認識するみたいな概念がないし
プロンプトに色々文章書いても内部的にはタグの羅列的なものに変換されて一列に処理されるから
すごい端折って動作を説明すると
右の人物はスカート、左の人物はズボン と書いたとして
スカートというタグを持つ絵、ズボンというタグを持つ絵、右の人物以下略、左以下略の学習情報を参照して
なんとなく1枚の絵をそれっぽく仕上げるということしかしてない
右の人物とプロンプトに書いても、画面の右にいる人物を表すんじゃなくて
「右の人物というタグを持つ絵の画面全体のピクセル情報」を参照するだけ >>633
モデル改善とかじゃなくまずここを改善してほしいよな
苦手とかじゃなく原理的にできないのおかしいよほんと そこはSDの完全なる次世代、または新たな別技術の登場を待つしかないわな
今の生成は画面全体を1つのノイズとしてとらえてそこに各種変数を掛けていくってやり方だからどうしてもプロンプトが混ざってしまう
最初のノイズの時点で任意の個数と形に設定できるなら今のSDでもできるのかも知れんけど latent couple系がそこそこ使えるし
ABG Removerとかで背景透明画像のレイヤーを作って手動で重ねていくとか
inpaintするとか効率を落として頑張る手もあるが
抱き合ったり色んな体位となると厳しいねんな 大分前、latent coupleと使えなくなってすぐの頃のregional prompterは期待通りにLoRA適用できたけど
その後ずっと駄目だわ >>634
原理的には既にできてるはずなんだけどな
例えば〇〇する男と△△する女と書けば、TextEncoder的にはTransformerのAttentionがちゃんと各単語について必要な単語の方に向いて理解できるはずなので、それをちゃんとUNetに伝えればそういう絵ができるはず
なんでできないのかは分からんが 画質PTやNGで除外されて狭まってしまうのが大きいと思う 原理的にできるのかどうかわかってる時点ですごいわ
できないという現実の前に解明する方法が今は存在しないんだと思ってた ちょうど上から頭首肩胸と並んでるのが当たり前で
逆立ちはほぼ書けないみたいにこの単語はこの位置ってのがあるんよな
で、漠然と男女と言っても人間でも位置関係分からん
おまけにlatent coupleを使って男と女を描けと言っても
1人を描くのが癖らしく時々片側だけ胸がある人間を描いたりする 学習段階でもっと詳細なタグをつけてやれば基本何でもできるんじゃね?
ただその学習データを用意するコストが大変なことになりそうだけど annotation is all you need テキストエンコーダはちゃんと理解してるってほんとかよ
ならなんで色移りとか起きるんだ?
「全てのプロンプトが全体に影響するようにしか解釈できないから」だと思ってたが違うのか?
空と人物、とかの全く違うものが混ざらないのは、それらが混ざった絵を学習してないってだけじゃないのか? 同プロンプト同設定でバッチ回数指定で
AnimateDiffの動画生成ガチャ実験してみた
↓mm_sd_v14 で25連ガチャ
https://dotup.org/uploda/dotup.org3050221.mp4
↓mm_sd_v15_v2 で10連ガチャ
https://dotup.org/uploda/dotup.org3050222.mp4
POV視点で、草の上に仰向け(on grass)で正常位(missionary sex)
という意図でプロンプト設定したんだけど
mm_sd_v15_v2 の方は、仰向けに寝てくれない・・・
mm_sd_v14の方は仰向けになってくれる確率高いけど
足が生えたり手が生えたりで、惜しいのが多いかんじ
とりあえず、一番よさげだったやつ↓(3倍速60FPS)
https://dotup.org/uploda/dotup.org3050223.mp4 ついでに、POVのgang_rape系のプロンプトで
CFG=7とCFG=14との比較↓
https://dotup.org/uploda/dotup.org3050227.mp4
今度はmm_sd_v15_v2の方が足が伸びたり引っ込んだり・・・ >>622
俺の実験(実験野郎Aチーム)ではプロンプトは画面の左から右へと適用される
もちろん100%じゃないけど大まかな流れとして Regional Prompterってどうなのかな
使ったことないけど >>646
色移りについてはその色の単語(トークン)のそれ以外の各単語(トークン)に対するAttentionの重みが100:0じゃなくて、まだらな確率分布になるからあり得るかなとは思う
翻訳とかだと結果的に最大確率のものを1つ選ぶから混ざるってことは起きづらいけど、画像だとむしろ混ざらないと雰囲気描写の副詞や形容詞が効かないから択一にならずに確率分布を汲んで描画されるんじゃね?たぶんだが
まあ、それ以外のことででTEはちゃんと理解しているはずなのにおかしいじゃんってことあるから、結局よくわからんのは変わらんが animatediffすごいけどエロアニメやAVの代わりになるにはまだ足りない
でも人間のエロパワーってのはすごいから1年もしないうちにプロンプトだけで実用レベルのエロ動画作れるようになるんだろうな 出始めは新鮮で抜ける
慣れたら抜けない
だからまた次を生み出す
この繰り返しで今の文明があるからな ワイ英語全くわからん勢なのだが
SDのおかげでどんどん英単語覚えていく これはAI学習でって試みなんだろうけど
3Dモデリングとかと組み合わせて
人物モデルとか衣装とかポーズとか背景とか選べて
破綻なく決め打ち出来て
それでいて写真と見分け付かないくらいリアル
みたいなのを望むけど
そんな素晴らしい物を無償提供して欲しいなんて
厚かましいよね きっと >>654
今まで碌に使うことなんて無かった
翻訳サイトめっちゃ使う様になったな 我々がSDを調教してるんじゃない
SDが我々を調教してるんだよ 我々の方がSDに最適化されていると考えるのも面白いな 指定しないと中韓っぽい服装になりがちなのがゲンナリ >>651
>重みが100:0じゃなくて、まだらな確率分布になる
>択一にならずに確率分布を汲んで描画される
これはやっぱり複数の対象を個別に修飾することは「原理的にできない」と言ってるように聞こえる
black cat and white dogと書いて白黒の犬っぽい猫とかが生成されるのは、
どの単語がどの単語を修飾するか確率でしか判断してないってことなんだろ?
black cat, white dogにすれば改善されるけど確率が上がるだけで混ざることはあるし、
catとdogじゃなくて両方catにて修飾を増やしたりするとまるで制御できない
更に現実としてほとんどの人がプロンプトを文じゃなくて単語や句の羅列で書いてるわけで、
この書き方だとそもそも"black hair" "big breasts" "white shirt"などがそれぞれどの"girl"を修飾するのかAIに伝える方法自体無い ベクトル計算で示された所に一致する物がある事はまず絶対に無く、どれだけ近い所に近似値があるかの問題てわけでも無いのか >>660
原理的にはできるよ
黒い猫と白い犬の写った様々な種類の画像を用意してblack cat and white dogってキャプションで学習すればいい
現状は黒い猫、白い犬単体を生成する方法しか高い精度では学習できてないから混ざることもある Adobe Photoshop Elements 「選択ツール」⇒「色の置き換え」
これで選択ヵ所の色合いは自由自在、SDの画像は素材にすぎないのだ つまり「黒髪で白いシャツと赤いスカートを着てベッドに寝ている女の子の上に金髪で制服を着た女の子が座っている」絵を描かせようと思ったら
A girl with dark hair, wearing a white shirt and red skirt, sitting on a bed on top of a girl with blonde hair and wearing a school uniform(DeepL翻訳)というキャプションでそういう絵そのものを学習させれば良い、ってことか?
これで「原理的に可能」って言うならそうだけど…
ていうかこの場合"white shirt"だの"blonde hair"だの"sitting on a bed"だのの要素を個別に学習させてはいけない(すると混ざる)のでは
となるとそもそもこんな長文にする意味はなく、"abcdef"みたいな意味の無い文字列に関連付けて学習させるか、その絵を描く専用のモデルにすべき
つまり「専用のLoRA作ればどんな絵も描けます」ってだけの話かね こういうのって「余計なものを描かせない」と「必要な物を余さず描かせる」の両立が必要じゃん?
そのパターン網羅して全部学習させたモデルとか何Gどころか最低でもTまで行くと思うんだけどどうなの? >>659
お洒落な服装に仕上げてるの見ると
いったいどんなpromptなのか
loraなのかと気になります 何枚も同じキャラクタを生成→
メガネのプロンプトを追加→
メガネのキャラクタが生成される→
メガネのプロンプトを削除→
メガネプロンプト追加前ではいくら生成してもメガネは描かれなかったのに
メガネプロンプト追加のあと削除した後はたまにメガネありのキャラクタを生成するようになった
ネガティブにメガネ追加すれば生成されなくはなるが不思議 >>665
◯んこしか学習してないLoRAを被せると年齢とか指定しなくとも勝手に全身その◯んこの年齢に沿った物になるから
BBAの垂れ乳とか一部分のLoRA作ると良いのかも >>660
現状のCLIPじゃあ結構難しいってことになるんかなぁ
GPT3や4くらいの分量を学習させれば、この形容詞はこの名詞を修飾してるはずとか、この副詞は文章全部にかかっているとかを、文法じゃなくて経験則で覚えるはずだから、そいう意味で原理的には出来るとは思うんだけど、
CLIPは文章と画像のセットを学習させるので、何でもかんでも突っ込めばいいGPT系と違って学習素材の準備が面倒なんだと思う、たぶん >>669
SDの仕様だね、再現性あるからバグではなさそう
スマホに例えると先読み変換みたいなものだな、ユーザー補助の一種とゆーか
こういう目立たない部分の処理が地味にすごいんだこのソフト たんに人工知能を作るとお猿さんになったりアホの子になったりするわけで
じゃあ「頭の良さ」とはなんだと、要は「気が利く」ってことなんだな
ところがこれは未来予測だから難しい、過去のデータをもとに傾向管理することになる
それを前代未聞のtxt2imgでやるには相当な苦労があっただろうなと・・・ >>669
再現性のあるバグじゃねーの?
セッティングのとこでSDチェックポイントをアンロードすれば直ったりする
UIリロードだとチェックポイントが読み込まれてないから変な画像が生成される
なのでモデルチェンジして元のモデルに戻せば同じ画僧になるはず 君の脳内にしかない機能に勝手に苦労話を見出されましても 考察どころか妄想と感想でしかないわな
エロい特殊なシチュを再現するのにLoraはありがたいけど、どうしてもLoraの画質の影響を受けるから極力プロンプトのみで出すようになってきた
povでバックから突っ込みつつおケツに指入れて、入れられた方が(fucked silly,orgasm:2.0)くらいで悶えてるやつくらいならLora要らない事にようやく気付いた… 流れが流れだけに擬人化したLORAのバックから指を突っ込む頭のおかしい奴かと空見したわ AIの定義を議論する?
知ったかドヤは止めた方が恥をかかんで済む グラボ性能が後何倍になったら違和感皆無の動画作れるんだろう
2年以内に現在最強の10倍性能もったやつが出る可能性何%だろう ワイは他人に見せるわけでもなく
自分用のおかず生成専用だから違和感を麻痺させて問題解決や
指の本数なんか気にしなくなったわ
ところでお尻に指入れるプロンプト教えて下さい お願いします 人体動画なんかは3Dモデル作って動かしたほうが早いんじゃないのって思えてくるな
口や目を実写同然に動かす技術は10年前からあるわけだし....、、
それだと違和感皆無でより実写かがテーマになるだけだし。 グラボじゃなくて生成技術そのものに革新的なことが起きないと無理では 3DモデルをAIで作ってそれを動かすで良いんじゃね
完璧な3Dモデルさえ作ればノイズとか皆無なわけだし GPT-3からGPT-4までは3年かからなかった
つまりそういうことだ 3Dモデルがあればいいってのは誰でも思いつくことで実際各業界で何十年も前から試行錯誤されてきた
でも実際やってみるといろいろと悪い面も見えてきて全面的に置き換わるまでには至ってなかった
そこにAIで絵を直接生成するって技術が出てきて今は試行錯誤が始まったばかりの段階
現状の問題点だけ見て諦めるのは大分気が早い >>687
いつ見ても同じ顔だなw
あの色盲絵師のガイジが描いた絵と同じで
馬鹿みたいに口開けてる絵ばっかりw >>687
お前さん、児童ポルノとして報告されてんぞ
最近のPINK警察厳しすぎやろ >>690
おお、いつも見てくれてるのかありがとう!
>>691
えー児童の範囲広いな
まあ、検閲・密告・相互監視こそデストピア国家の理想やから
その理想に向けて頑張ってるんやろな 通報受けた方もチェック大変だな
こんなありふれた画像通報する方が業務妨害で捕まればいいのに この一年間で削除依頼のうち8割を出してると言ってる
マジモンのキ印だから話が通じないんだよね >>695
8割ってすごいな
被害者のいる本物の児ポ画像がUPされたときに
発見しづらくなるだけやん
いわゆる無能な働き者ってやつか 「このスレは俺が守る」
↓
おめーが荒らしてんだよ!
↓
「フッ NGしてるから見えないぜ」
↓
反応してんじゃねーよ!
↓
くりかえし 話の内容からしてHou Toブログをググってはコピペしてるだけのガイジ
実運用の話いっさいできないからSDすらインスコしてないエセユーザー Trap streetを知ってるか? ブロガーはパクリ防止として情報に嘘を混ぜ込む
他のブログに転載されたとき根拠とするためだ ブログのネタを2回線使って 「これはどうなの?」 「ああそれはね○○だよ!」
マジキチ SDを擬人化して愛でるのは人の勝手だけどそれを周りに布教し始める行為はもうマジモンなんですよ JK体格の巨乳で児ポとか笑うしかないな
どうせ純潔カルトの工作員だろ ブログの情報だけが命綱だもんな
ブログ情報と少しでも異なる流れになるとお手上げだから必死になるわな
「それは間違った情報だー!」 「俺が正しいんだー!」
そのブログ情報からして嘘満載だっつーの 対話とPINK警察と人力BOTとキが同一個体だと分かって安心した
こんなのがうじゃうじゃ居てたまるかってな 別にブログ側の肩を持つわけでもなく、また会話が通じるように思えないが
数あるブログの中で少なくともスクリーンショット等で図示して閲覧者が再現可能な情報を流している所と、
本人の憶測や経験で物証を明らかにせず、匿名掲示板で喚き散らしている輩とではどちらが信頼性が高いかというと 彼と比較すればSDは話が通じるし
彼目線では間違ってないのかもしれん もしかして今までの全部騙りで聞きかじりを繋ぎ合わせてただけのエアプ? 「 (nsfw:1.2) この1.2の後に半角スペースあるとバグるんよ〜」 「え?まじ!?」
ありえんだろうよ・・・実際に運用してたらありえんだろうが!
プロンプト選択してctrl+上下でSDが勝手に記述するからだよ!
SD使ってねーのにブログコピペで知ったかオゲッタ君だからよ!! 「ああなんかもうSDあきたわ」
そーゆーときはプロンプトに fetish くっつけるんだよ!
large tits fetish, とか pussy fetish, みたいにおまえの性癖に fetish くっつけろ!
SDちゃんがおまえをナメた行動に出ておもろいだろうが! (←なにキャラ?) 生活保護だと通信費は出るがPC買えん(監査がある)からスマホ人生だわな
そりゃスレに張り付いて複数回線で煽りまくるしかないだろうよ >>716
数字直入力のほうが早いし楽だろうが
lbwも使ってなさそうだし
とんだエアプだよ 通報キチガイさんの主張は
制服や体操服は子供が着るもの!
学生を連想させる服装はロリ!
PINKはエロ掲示板だから貼られている物はエロ目的の画像!!
だから合わせてロリエロで児ポだ!! Hou toって入力してしまうやつもいるからな
入力ミスや手癖くらいあるだろうな issuesでなかなか見つからなくてreleasesに書いてあるのを早く気付くべきだったわ、数字の後のうんぬんはもう直っているんじゃないかな、ってそういう事じゃないだろうけど
1.6.0: prompt editing and attention: add support for whitespace after the number ([ red : green : 0.5 ]) (seed breaking change) (#12177)
https://github.com/AUTOMATIC1111/stable-diffusion-webui/pull/12177 ■ このスレッドは過去ログ倉庫に格納されています