俺の場合の梢は6枚+3Dモデルのキャプ16枚だった
プロンプト調整前の時の画像だし手が高確率でぐにゃるけどアップスケール無しなら一応こんな感じ
https://files.catbox.moe/gop41d.jpg
https://files.catbox.moe/qydaxw.jpg
https://files.catbox.moe/p4czju.jpg
https://files.catbox.moe/27jusv.jpg
https://files.catbox.moe/lle0o7.jpg
学習素材10枚あればそこそこ再現出来るとは思う
気になるのは
・キャプションの付け方が問題無いか(そもそもキャプション有りで学習してるか)
・学習素材の背景を消しているか(特に他の人が映ってないか)
後者はやっとけばマシになるかな程度
CFGが高いと崩れるなら過学習ぎみってことかな?
だったらCFG下げるんじゃなくてウェイトを下げるかLoraを層別適用の方が多分良いんじゃないかなー
個人的な意見だとプロンプトの言う事聞かなくなるからCFGはデフォの7よりはあまり下げたくない