0436名無しさん@ピンキー (ワッチョイ 7332-s35p)2025/12/24(水) 02:55:23.28ID:12j5rJkL0 テンソル並列で動かせればPCIe5.0のx8接続の2台でも1.8倍以上は出るよ llama.cppよりはvLLMやik_llama.cppを使うのがいいけど
0437名無しさん@ピンキー (シャチーク 0C97-Fga2)2025/12/24(水) 07:54:13.13ID:QIkAw9r0C >>431 おおいいね コンテキストサイズはどれくらいまでいける?