なんJLLM部 避難所 ★9
レス数が950を超えています。1000を超えると書き込みができなくなります。
llamacppのqwen next対応時間かかっとるね
あのprは動くようにするの最優先でパフォーマンスは別prにするって言ってたけど
レビュー段階に入ってからなんだかんだパフォーマンスの部分も手つけ始めとるな nemotron-nanoも計算に細かいバグがあるんじゃない?って言われてるみたいだし
ハイブリッドモデルは全体を正しく計算できるように設計するのが難しいみたいだね レス数が950を超えています。1000を超えると書き込みができなくなります。