自然言語のプロンプトについて言えば、英語の動詞の形は文法通りの意味だと思う
例えばpullについては、panties pullだったら下ろされたパンツ(のdanbooruタグ)で、これがpulling pantiesだったら現在進行形でずり下ろされているパンツという動作になる(はず)
前者なら既に下ろされてるパンツを描画するし、後者なら男の子がずり下げている動作を描画するようになる

つまり、danbooruタグの場合だと登録された通りに使う必要があるけど、自然言語の場合なら生成しようとしている状態や動作は文法通りに表現するということ

モデルの違いについてはシビタイ等で自然言語を意識して作成したかは作例を見れば分かる
>>326 で公開してくれたlillyMixはまさに自然言語推奨って作者さんが言ってるし、シビタイの作例見て参考にすれば良い
ただ、私が試した範囲ではタグを列挙するスタイルでも普通に使えるので、そこは試してみるしかない