大葉で、チャットごとに増えていくcontextが、n_ctxの値に近づく(あと500程度)と、
次の生成が無茶苦茶遅くなるのは、溜め込んだcontextに対して何か処理をしているんだろうけれど、
どの様な処理をしているんでしょう?
単純に古いのを忘れるだけなら、こんなに時間はかからないと思うんだけど。