そうそう
正しく句読点を使ってる日本語のデータって当然100%ではなく、50%だと仮定
だけどAIの出力する文章はほぼ100%句読点が正しく使われている、英語も同じことだろうね

AIが正しい日本語を出力する確率が50%ではないということはやはりこの差は意図的操作だろうってこと