なんJLLM部 避難所 ★8
0436名無しさん@ピンキー (ワッチョイ dbe7-RXbr)2025/06/21(土) 16:25:10.78ID:LDsXYAvs0
釈迦に説法だけども備忘録がてらedge galleyの遊び方を書いておく

ポイントは2つで
1. gpu駆動にすれば体感で4token/secくらい出る。cpuだとゴミ(xiaomi 11T pro)
2. gpu駆動にするには自分で.taskファイルをローカルに落としてedge galleyに読み込ませる必要がある

edge galleyは次からapkを落とす

https://github.com/google-ai-edge/gallery/releases

.taskは次から。これは2B。4Bはまだ試してない。

https://huggingface.co/google/gemma-3n-E2B-it-litert-preview/blob/main/gemma-3n-E2B-it-int4.task

import modelの際にはsupport imageのトグルとcompatible accelaratorにgpuを選ぶのを忘れない

https://i.imgur.com/1sUMFkt.jpeg
https://i.imgur.com/naNdlex.jpeg
0439名無しさん@ピンキー (ワッチョイ 0f91-WwHV)2025/06/21(土) 21:50:52.29ID:BVoATOzy0
kobold.cpppのSYCLバックエンド対応来てくれー
0440名無しさん@ピンキー (ワッチョイ 0f91-WwHV)2025/06/21(土) 23:40:52.52ID:BVoATOzy0
コンテキスト増やすためにkvキャッシュの量子化したら、それだけでちょっと頭が悪くなってるな。
そりゃそうだよな量子化したんだし。
レスを投稿する


ニューススポーツなんでも実況