0723名無しさん@ピンキー (ワッチョイ 0f11-w0m+)2024/04/25(木) 13:35:45.93ID:l61WUoRK0 今X見てたらnvidiaのGPUだとprompt evalにかかる時間(≒最初のトークン出力にかかる時間)がプロンプト長と比例しないっていうポストを見たんだけど、本当なの? 俺はApple siliconだからわからんのだけど、感覚的にでいいから実際どうなのか教えて欲しい