>>822
VLM使うか、キャプション生成してLLMに投げる