なんJLLM部 避難所 ★10
レス数が1000を超えています。これ以上書き込みはできません。
0001名無しさん@ピンキー 転載ダメ (ワッチョイ dfc7-Jvli)2025/11/23(日) 22:55:29.17ID:kt2SGedd0
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC(できれば+3060 12GB以上)でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部 避難所 ★8
https://mercury.bbspink.com/test/read.cgi/onatech/1746883112/
なんJLLM部 避難所 ★9
https://mercury.bbspink.com/test/read.cgi/onatech/1755924738/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
0952名無しさん@ピンキー (ワッチョイ 7e23-tJMc)2026/02/09(月) 16:39:13.73ID:cFDFamMz0
>>943
redditではベンチ番長やなくてかなり好意的な意見が多いみたい
lmstudioでもダウンロードできるようになってるし使ってみる
0953名無しさん@ピンキー (ワッチョイ f6a0-cHUB)2026/02/09(月) 18:38:44.69ID:pmRjuvly0
SDでだいぶ出したい絵を出せるようになってきた。
衝突して崩壊してたんだなって感覚が重要だわ

LoRAと重みとdanbooruと順番と、全部ちゃんと理解しないと絵にならない
何が悪いのか原因を見つけるスキルが必要
0955名無しさん@ピンキー (ワッチョイ 3ec8-OQoE)2026/02/11(水) 10:24:18.02ID:CqqxVzne0
最近grokは使い難いな。
デッドロックというか、自分の出力した文章内容に不適切な内容があると続きを書かなってしまうみたいな事が起きてる。
0957名無しさん@ピンキー (ワッチョイ 1224-soK/)2026/02/11(水) 17:11:46.81ID:KPjbPQAh0
Heretic-Qwen3-VL-235B-A22B-Instructいい感じなんだけど読点句読点とか鉤括弧がめちゃくちゃ多いのはモデルの特徴なんかな
いい感じに抑制したいけど適当に指示すると今度は全く使わないで文章書こうとしだすから難しい
0958名無しさん@ピンキー (スッププ Sdd2-v0/K)2026/02/11(水) 17:37:03.98ID:ctMDnveAd
>>957
Qwen3 235Bはひと昔前のGeminiやClaudeに迫る性能だが
現行バージョンほどのプロンプト追従性は無いな

GeminiやClaude向けのRPプロンプトがまともに動くこともあればダメな時もある

Qwen3 Next 235Bが待たれる
0959名無しさん@ピンキー (スッププ Sdd2-v0/K)2026/02/11(水) 17:44:16.28ID:ctMDnveAd
俺のVRAM40GB環境では70B〜80BならギリVRAMに乗るが
235BはVRAM128GB級でないとVRAMに乗り切らない

⚙70B〜80B…チャット、リアルタイムアプリ
⚙235B〜…バッチ処理

と用途別に使い分けるのが現実解
MoEのエキスパート配置が賢くなればVRAM32GB以下でも235Bがサクサク動きそうだが現状では夢物語
0960名無しさん@ピンキー (ワッチョイ 9f21-MYmM)2026/02/11(水) 17:48:41.51ID:FDNSgGOl0
見栄張んなよ
本当は8GBとかのグラボ使ってんだろw?
0962名無しさん@ピンキー (ワッチョイ 9f21-MYmM)2026/02/11(水) 18:02:21.40ID:FDNSgGOl0
>>961
>>960
0964名無しさん@ピンキー (ワッチョイ 76a9-cHUB)2026/02/11(水) 18:18:49.85ID:DcHcFl3L0
量子化のビット数小さくするのは元々パラメータ数小さいのとはまた違ったところが劣化する感覚があるんよな
パラメータ数小さいのはドジっ子なんだけど量子化で小さくしすぎると認知症みたいな
なんかうまく説明できないんだけど

コーディング用だとこの辺が結構聞いてくるんよなぁ
パラメータ数にかかわらずQ4はどのモデルもコーディングで使えない
0966名無しさん@ピンキー (ワッチョイ b2ec-lZWY)2026/02/11(水) 18:56:42.22ID:X0y/9hKJ0
VRAM12GB+LM Studio(RAM96GB)環境で16GBに交換したんやが
モデルのサイズはVRAMに全部入る容量を選ぶべきか、gguf版で少しVRAMの空きを残した方が良いのかどっちなんやろか
会話のやり取りがそこそこ続くようならVRAMは数GB開けた方が良いんやろか
数回限りのやりとりならギリギリ15GBぐらいのモデルとかのほうが精度優先にしたほうが良い?
0967名無しさん@ピンキー (ワッチョイ 1224-soK/)2026/02/11(水) 19:20:18.63ID:KPjbPQAh0
>>964
パラメータ数小さいけど量子化ビット数は大きいモデルはアホの子なんだけどやってることは納得できるしガイドしてやればちゃんと仕事してくれるイメージ
QWEN3ぐらい小説書ける100B〜150BぐらいのMoEモデルがあればQ6とかでいい感じの文章をストレス無く書いてくれそうなんだけどなぁ
0970名無しさん@ピンキー (ワッチョイ 32b1-ulj2)2026/02/12(木) 03:02:12.39ID:ejMhmS6d0
GLM5きたぞ
0972名無しさん@ピンキー (オッペケ Sr37-S1MQ)2026/02/12(木) 10:30:51.96ID:fvChrZS2r
安いコーディングaiて意味あんの?
0973名無しさん@ピンキー (ワッチョイ 32b1-ulj2)2026/02/12(木) 11:17:21.43ID:ejMhmS6d0
安いのが需要無くなることある?
0974名無しさん@ピンキー (オッペケ Sr37-rGR4)2026/02/12(木) 11:29:56.42ID:4uao824Lr
単独で使うものではないんでは
アシスタントで使うかオーケストレーションで使うかでないの
Vide codingの時代から事前プランニングの時代に一気に変化しつつあるから、合否/採点が容易なタスクは全部切り出して安いコーディングLLMでループさせる形になりそう

SOTAモデルで採点カンストするまで回したカンストSkillsをGLMに使わせる、とかになるのかな
0975名無しさん@ピンキー (ワッチョイ f636-81f9)2026/02/12(木) 12:31:17.54ID:blfUyIva0
コーディングは一度でもClaudeかCodexの手軽さを味わったらローカルに戻れないよ
ほんとに小さいスクリプト単位なら使用の余地はあるんだろうけど
ローカルがClaudeに追いつける日はくるのだろうか
中華LLM + openclawに期待するしかなさそう
0976名無しさん@ピンキー (オッペケ Sr37-S1MQ)2026/02/12(木) 13:21:48.09ID:fvChrZS2r
安いので試してだめだったら高いの使う、という手間がもうめんどいので最初から高いやつ使うよね
0978名無しさん@ピンキー (ワッチョイ 1259-S3dw)2026/02/12(木) 13:44:14.31ID:PwEbN11/0
>>977
待てるならvramいっぱいにモデルを詰めていいし、そうでないならkvキャッシュ用に空けておくべき
モデルによってkv量子化だったりオフロードしなかった時の精度や速度が違うから試しながら調節してみ
0984名無しさん@ピンキー (ワッチョイ b2ec-lZWY)2026/02/12(木) 16:54:46.72ID:q5Z4ATkX0
>>978
サンガツやで
これcontext長=kvキャッシュなんやろか
事前に確保するとVRAM量が増えるからkvキャッシュと思ったんやが会話が長くしたいなら12GB(model)+4GB(KVcache)
数回のやりとりで良いなら15GB(model)+1GB(KVcache)なんかなと思ったけど考え方はあってるやろか
0986名無しさん@ピンキー (ワッチョイ b2ec-lZWY)2026/02/13(金) 01:56:00.63ID:1/JfPHUt0
>>985
サンガツ4GB増えた分だけエロもどれだけ変わるかわからんがまだmugnum v4の8GBやわ
今は良いのが出てるかも知れんけどスレでnsfwで検索しても0件でワイむせび泣く
0987名無しさん@ピンキー (スッププ Sdd2-v0/K)2026/02/13(金) 02:04:29.65ID:xDrc197od
エロに何を求めるかで話が全く違ってくるからな

セックスシーンさえあればいいならQwen235bとかの中華モデルでも脱獄すれば余裕で出るが
エロシーンの描写に厚みを持たせたいならGrokみたいな既知外学習したモデルを使うかプロンプトで補充するしかない

古臭い24B以下のモデルに固執するのは画像生成でSD1.5に固執するのと同じでスレ民の共感は得られないだろう
0988名無しさん@ピンキー (ワッチョイ b2ec-lZWY)2026/02/13(金) 02:12:50.11ID:1/JfPHUt0
>>987
いや、古いのに固執してなくて浦島なのでモデル何か無いかなと
nsfwで検索したら0件だったが本文じゃなくて名前欄で検索してたわ
と言うことで出てきたaratakoなどやってみるわ
0989名無しさん@ピンキー (スッププ Sdd2-v0/K)2026/02/13(金) 02:24:48.98ID:xDrc197od
>>988
よっぽどのモノ好きしかLLMの日本語エロチューンなんかやらんからな
実質aratakoニキだけやないか

ワイはGrokがプンルーで無料Alphaやってた時にあらゆるエロシーンを100本以上抜いとるから
そのうち脱獄中華モデルでチャンク化してRAGに放り込むつもりや
0990名無しさん@ピンキー (ワッチョイ 3b6a-S3dw)2026/02/13(金) 16:04:33.94ID:rFsQOMk10
おすすめの日本語対応ローカル大規模言語モデル
https://local-llm.memo.wiki/
0992名無しさん@ピンキー (ワッチョイ cfa0-18k2)2026/02/14(土) 06:08:12.23ID:MipIXaIK0
SDの方はいろんなLoraだの拡張機能だのすごくあるだが、LLMも考え方は同じだろうから、もっと細かくピンポイントにエロ表現の特化とかできるはずだよね
需要が少ないだけで
と言うかSDの需要が異常なんだろうな
0996名無しさん@ピンキー (ワッチョイ ffac-+cxS)2026/02/14(土) 16:18:15.41ID:RgK7UIU40
今の5090の値段を見てたら、PRO 5000 48GBあたりもアリじゃないかという気がしてくるな
画像生成AIでは不利っぽいけど4090くらいの速度はあるみたいだしVRゲームもしっかり動く?っぽいしどうなんだろ?
5090とか4090しか話題にならないけど最近PROの方も気になる
ただ、VRAMをそこまで増やしても、そもそも、賢いモデルが公開されてるのかって問題もありそうだけどどうなんだろ?
今VRAM32GBで色々試してるけど別のモデルなのに同じところで間違えたりWikipediaに乗ってるレベルの情報でも込み入った話だとかなり適当なこと言ってくる
あと昔はGPUに5万円とかでもクソビビってたのに、最近はGPUの価格が50万円でも言うほど高いと思わなくなってきてるヤバイわ
0997名無しさん@ピンキー (ワッチョイ 4332-A3Xy)2026/02/14(土) 16:33:51.65ID:g2ld0hSO0
ソースありなのに適当なことを言うのはGPTでもGeminiでも同じだからローカルLLMの性能なんて推して知るべし
0998名無しさん@ピンキー (スッププ Sd1f-l7bU)2026/02/14(土) 16:35:04.08ID:ax4AchcId
>>996
80bや235bでもパラ数はクラウド最先端モデルの数分の1〜10分の1や
RAG無しで細かい知識を問うのはローカルでは無理やぞ

知識量を問わない用途かRAGとかドメイン特化DBありきでの用途が出てきたらWS向けGPUを買えばええ
1000名無しさん@ピンキー (スッププ Sd1f-l7bU)2026/02/14(土) 16:44:26.68ID:ax4AchcId
Wikipediaで言えばWeb検索MCPを入れるかWikipediaのダンプを落としてRAGを作れば
少なくともWikipediaの範囲ではハルシを起こさないはずや

知らないことを答えられないのは人間もLLMも一緒やで
10011001Over 1000Thread
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。
life time: 82日 17時間 48分 58秒
10021002Over 1000Thread
BBSPINKの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。


───────────────────
《プレミアム会員の主な特典》
★ 専用ブラウザからの広告除去
★ 過去ログを取得
★ 書き込み規制の緩和
───────────────────

会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。

▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/

▼ 浪人ログインはこちら ▼
https://login.bbspink.com/login.php
レス数が1000を超えています。これ以上書き込みはできません。

ニューススポーツなんでも実況