>>775
どれくらい遅いかは比較するGPUによるけど、ここに具体的な数値でまとまってる
https://github.com/XiongjieDai/GPU-Benchmarks-on-LLM-Inference