ここまで偏ってるとトークンが〜学習データが〜って域じゃないような気がするんだけどなあ
負荷軽減や高速化を目的に「要するにこういうことだろ」っていうある種表現のテンプレ化みたいなのをしてる感覚が強い
物語の方向性やオチに傾向があるように、言葉選びの傾向がその「要約のクセ」みたいなもんなのでは
2.5の弓なりとかもそうだけど、創作においてそれらが突出して使われるド定番の表現かと言われると別にそうじゃないし

🤖その体勢ってつまり「弓なり」だよね
🤖その関係ってつまり「共犯者」だよね
っていう、ある種の手抜きによって特定の表現が頻出してる方がまだ納得感ある
仮に文章予測機としてしか機能してないなら学習データ偏り過ぎでは…?