先月くらいから画像生成を先にやりはじめてここにたどりついて何スレかROMってたんだけど質問させてくだされ
「テキスト生成させてその時の雰囲気に合わせた画像をチョイスして表示」じゃなくて
「画像からテキストを生成させる」ってできそう、だと思うけどイマイチ核心の情報を見つけられない、やってるひといる?
なんなら「画像からメタデータを出力させてそのプロンプトの単語から文章を作成」とかでもいいんやが・・・SDのdanbooru語やから変換がめんどいねんな