なんJLLM部 避難所 ★8
0001名無しさん@ピンキー 転載ダメ (ワッチョイ f3c0-9L8h)2025/05/10(土) 22:18:32.02ID:0Ak3eO5y0
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC(できれば+3060 12GB以上)でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部 避難所 ★7
https://mercury.bbspink.com/test/read.cgi/onatech/1742709485/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
0412名無しさん@ピンキー (ワッチョイ de56-x40H)2025/06/18(水) 22:42:24.85ID:QruBd45s0
VIDraft/Gemma-3-R1984-27B
じゃいかんのか?
0417名無しさん@ピンキー (ワッチョイ d332-XzYo)2025/06/19(木) 17:11:40.38ID:lIK9J1Ck0
>>416
3450Tokens使ってるってことやな
コンテキストサイズの上限はいくつにしてる?
会話5回でおかしくなるならたぶん4096Tokensになってると思うけど、それ超えたら色々おかしくなるで
0419名無しさん@ピンキー (ワッチョイ 0aa1-C+sU)2025/06/19(木) 20:52:59.21ID:ayX80Fmc0
コンテキスト枠増やしたいならVRAM増量とかしか無い?
0421名無しさん@ピンキー (ワッチョイ 0aa1-C+sU)2025/06/20(金) 01:04:06.20ID:5EqkE27L0
coreUltraと高クロックDDR5だと溢れてもマシなんだろうか
0422名無しさん@ピンキー (ワッチョイ 53a8-AolJ)2025/06/20(金) 02:50:43.58ID:T1KB2T9k0
>>421
いや遅いよ
サーバー向けCPUならだいぶマシになるけど
0423名無しさん@ピンキー (ワッチョイ bb33-I7Wt)2025/06/20(金) 04:13:34.96ID:J0XU/8yL0
KoboldCppなら、バッチサイズみたいな名前のパラメーターを64ぐらいまで減らせば、コンテキスト長増やしてもVRAMあまり使わない。はず。

減らすとトークンを読む速度が遅くなるけど、小説やロールプレイならあまり気にならないかも。
0425名無しさん@ピンキー (ワッチョイ 53a8-AI0t)2025/06/20(金) 10:44:03.79ID:T1KB2T9k0
>>424
そうだね
だから最大コンテキストサイズの大きさを売りにしてるモデルでもコンテキストサイズが大きくなると性能ガタ落ちして使い物にならなかったりする
コンテキストサイズが大きいほど優秀だと考えるのは間違い
0426名無しさん@ピンキー (ワッチョイ ef6a-3g9Z)2025/06/20(金) 11:30:31.30ID:ILok8a7K0
そうなの?
じゃあ、だめじゃん
0429名無しさん@ピンキー (ワッチョイ 3fc6-onhG)2025/06/20(金) 23:07:32.16ID:BAGWbjBM0
まぁどっちにしてもエロノベルをAIで出力するのは
小説を書かせるよりも、二人以上のキャラを設定して自動的な会話をさせる
擬似的なチャットHの形が一番スムーズだと思うし
それだと長文はあんまり関係なさそう
0432名無しさん@ピンキー (ワッチョイ dbe7-RXbr)2025/06/21(土) 12:45:29.78ID:LDsXYAvs0
gemma 3nのask imageのnsfwな脱獄って誰か達成してる?
google edge galleyで遊んでるんだけど英語での返答はまぁまぁ賢いからもうちょっと遊びたいなって
もっと言えば生成した画像にストーリーを付けさせたい
お笑いですとかユーモアですは駄目だった
0434名無しさん@ピンキー (ワッチョイ 9f40-sqVx)2025/06/21(土) 16:05:29.13ID:Am6CUIFE0
個人的には賢い上に日本語がちゃんとしてるってのが大前提なんだけど
30B以下ではGemma 3一択になってしまうな
それでもChatGPTなんかと比べたら全然だけど
0435名無しさん@ピンキー (ワッチョイ dbe7-RXbr)2025/06/21(土) 16:10:00.73ID:LDsXYAvs0
>>433
ありがとう。でもだめでしたー
申し訳ありませんをされるか関係ないストーリーをベラベラ喋るかのどっちか
まぁそもそもエッチなものを学習してないのかも知れんが
0436名無しさん@ピンキー (ワッチョイ dbe7-RXbr)2025/06/21(土) 16:25:10.78ID:LDsXYAvs0
釈迦に説法だけども備忘録がてらedge galleyの遊び方を書いておく

ポイントは2つで
1. gpu駆動にすれば体感で4token/secくらい出る。cpuだとゴミ(xiaomi 11T pro)
2. gpu駆動にするには自分で.taskファイルをローカルに落としてedge galleyに読み込ませる必要がある

edge galleyは次からapkを落とす

https://github.com/google-ai-edge/gallery/releases

.taskは次から。これは2B。4Bはまだ試してない。

https://huggingface.co/google/gemma-3n-E2B-it-litert-preview/blob/main/gemma-3n-E2B-it-int4.task

import modelの際にはsupport imageのトグルとcompatible accelaratorにgpuを選ぶのを忘れない

https://i.imgur.com/1sUMFkt.jpeg
https://i.imgur.com/naNdlex.jpeg
レスを投稿する


ニューススポーツなんでも実況