なんJLLM部避難所 ★10

990コメント388KB

なんJLLM部避難所 ★10

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ dfc7-Jvli)

2025/11/23(日) 22:55:29.17ID:kt2SGedd0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★8
https://mercury.bbspink.com/test/read.cgi/onatech/1746883112/
なんJLLM部避難所 ★9
https://mercury.bbspink.com/test/read.cgi/onatech/1755924738/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0283名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f64-jl2L)

2025/12/12(金) 10:33:29.89ID:JzzVvjr40

>>0277
すげー
そういう面白そうな論文ってどうやって見つけるの？

0284名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-wN+g)

2025/12/12(金) 11:15:46.94ID:g35J0BfC0

chatarenaにgoogleの新モデルが二個来とるみたい
gemini3のThinkingとかFlashとかの派生版やろかね
gpt5.2も出たしライバルが刺激しあって進化してくのはええことや
だからってメモリ買い占めは許さへんが😡

0285名無しさん＠ピンキー (ﾜｯﾁｮｲ 4fb7-UCg5)

2025/12/12(金) 11:46:24.30ID:LcDKkn/+0

chatGPTのエロモードはしれっと26Q1に延期されてて
まぁGemini3ぶっ込まれたらそうなるなぁとも

0286名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr8f-GkWU)

2025/12/12(金) 12:04:08.67ID:w1K9FJkvr

gptは5.2になるし
claudeは4.5になるし
geminiは3proになる

0287名無しさん＠ピンキー (ﾜｯﾁｮｲ efad-7Tw0)

2025/12/12(金) 12:09:34.61ID:k6hM6eJe0

コンテキストは長くなるほど速度低下激しくなるし、精度も落ちる
32kぐらいが無難な気がするわ

0288名無しさん＠ピンキー (ﾜｯﾁｮｲ ab46-LrpL)

2025/12/12(金) 14:50:32.59ID:l+Wo5R5X0

qwen3-vl-235b-a22b-instructでERPさせようと思うと申し訳食らうんだけどシステムプロンプトで回避出来る？もしくは脱獄版あったりする？

0289名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM7f-QaUS)

2025/12/12(金) 15:14:55.71ID:KHoQ40z+M

>>288
Gemini2.5用の脱獄システムプロンプトで通るやつがある
スレに過去貼られたやつ

0290名無しさん＠ピンキー (ﾜｯﾁｮｲ cb09-IJ2r)

2025/12/12(金) 15:57:11.04ID:wrRQOOeH0

Xみたいな無料でできる奴とかローカルの色んなモデルを英語で遊んでると安っぽい売春婦って言葉が高確率で出て気になる

0291名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f5b-qdBt)

2025/12/13(土) 03:39:37.95ID:l5tfeP2J0

GoogleドライブにAIトレーニングデータをアップロードした開発者が児童性的虐待コンテンツを保存したとしてGoogleアカウントを停止される
https://gigazine.net/news/20251212-developer-ai-data-google-ban/

0292名無しさん＠ピンキー (ｼｬﾁｰｸ 0C13-Toi2)

2025/12/13(土) 07:55:46.67ID:5dywl8IEC

Qwen next 80bの規制解除版パネーな
エロプロンプト打ち込んでも喜んで書きやがるw
これで文の整合性がmagnum並みなら完璧なんだが

0293名無しさん＠ピンキー (ﾜｯﾁｮｲ 3732-9rD2)

2025/12/13(土) 10:59:23.41ID:eyEHPiPz0

Qwen next 80bは元々規制なんてあってないようなものだけど規制解除版もあるの？
性能落ちているだろうし普通のQwen next 80bで良くないか

0294名無しさん＠ピンキー (ﾜｯﾁｮｲ 8746-TY0I)

2025/12/13(土) 11:34:44.38ID:xkcV40lU0

ここ2-3日でなぜかみんなこぞって量子化大会をしてるので単に規制解除版じゃない気もする。
rx7900xtx 24GB+Mem128GB環境で --n-cpu-moe 25 -c 65536で20tok/s出てる

0295名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr97-4QdE)

2025/12/13(土) 12:24:58.39ID:GTPJ3HlJr

VRAM16gbのしょぼグラボだけど
エロいけて英語で評判のいいllmある？
チャット内容を翻訳して使おうと思って

0296名無しさん＠ピンキー (ﾜｯﾁｮｲ 236b-AsBv)

2025/12/13(土) 12:25:57.90ID:aRmVqPhP0

Shisa V2.1 14Bサイズの割に思ったよりプロンプトにちゃんと従うし結構賢いしエロもいける
3060一枚に載るんで結構捗ってる

0297名無しさん＠ピンキー (ﾜｯﾁｮｲ 7213-elKO)

2025/12/13(土) 12:53:57.25ID:xEb9ON1P0

日本語のバリエーションはどんな感じなの？略語やスラングもいけそう？

0298名無しさん＠ピンキー (ｼｬﾁｰｸ 0C13-Toi2)

2025/12/13(土) 15:03:26.88ID:5dywl8IEC

>>293
いや通常のだと100%申し訳喰らうんだわ
解除版も性能差感じないけどやっぱ整合性が。
エロチャ用途なら使えるね

0299名無しさん＠ピンキー (ｼｬﾁｰｸ 0C13-Toi2)

2025/12/13(土) 15:05:56.20ID:5dywl8IEC

>>294
ちなこれね
mradermacher/Huihui-Qwen3-Next-80B-A3B-Instruct-abliterated-GGUF

0300名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ead-c5sb)

2025/12/13(土) 15:51:39.56ID:0rlZVlxV0

abliteratedの新バージョンが出たっぽいからそれで活気があるのかも

0301名無しさん＠ピンキー (ﾜｯﾁｮｲ 8746-TY0I)

2025/12/13(土) 19:58:15.09ID:xkcV40lU0

>>298
今のところQ4しか出てないのが難点。Q6とかQ8が来てくれるとそのへん改善されるかもね

0302名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a9-A5rm)

2025/12/14(日) 12:03:23.30ID:1lOcAup10

glm4.6vが106b moeで良さげやなと思ったけど
まだllamacppで対応されとらんのね

PRもglm4.5vの対応のものがいまだに完成しとらんみたいで難航しとるみたい
https://github.com/ggml-org/llama.cpp/pull/16600

画像入力興味出てきて試したいんやけどなぁ

0303名無しさん＠ピンキー (ﾜｯﾁｮｲ 8747-elKO)

2025/12/14(日) 13:44:27.07ID:FsStLVRy0

>>296
shisa v2.1 14B俺もQ8で試してみたで
このサイズ帯のモデルで1番素直で良いモデルだと思う
koboldcppとsilly tavernの組み合わせでロールプレイ
berghof ERPの隠語と喘ぎ声と♡が盛り沢山なドスケベ会話履歴の続きをやらせたらちゃんと♡使いまくって喘ぎまくった
他のより柔軟なモデルだと思うわ
直前の出力の特徴に倣う性質が強いのかな？
ちなみにコンテキスト長は8192、コンテキストテンプレートはChatML、パラメータ設定プリセットはNovelAI(Best Guess)にしてTop Kを100→80に下げてやってる

0304名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b49-r+g0)

2025/12/14(日) 13:52:54.88ID:DJ4aKHpm0

phi-4-14Bベースは何故か日本語向けFTがそれなりに出てるしMS公式がreasoningモデルも出してるから
進化的マージとかで更に性能上げるのも無理ではないのかな
VRAM32GBある人ならQLoRA SFTしてドスケベ語彙覚えさせるのも行けるかもしれない　いやデータセットが無いか

0305名無しさん＠ピンキー (ﾜｯﾁｮｲ 8748-TY0I)

2025/12/14(日) 16:52:28.15ID:3MfiUZIz0

>>304
aratako先生が出してるデータセットでワンチャン？

0306名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c7-lorD)

2025/12/14(日) 18:22:59.55ID:P5aE0iMn0

>>302
GLM4.6Vはツール呼び出し機能が追加されたのがポイントだけど、どう活用するかだなー

0307名無しさん＠ピンキー (ﾜｯﾁｮｲ 87a8-elKO)

2025/12/14(日) 18:59:24.01ID:FsStLVRy0

shisa、温度もNovelAI Best Guessの0.8じゃ高いのかな
ちょっと出力が暴れ気味や
0.7くらいがいいのかも
てか生成をリロールしまくってるとたまに普通の人間キャラなのに「尻尾をぶんぶん振って喜びながら」とか言ってくるな
やっぱキャラ設定保持力はRPモデルに及ばんか

0308名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-O/3E)

2025/12/14(日) 19:46:59.82ID:2D4/hyq50

Mistral Large3のアーキテクチャはDeepSeekのパクリらしい
ちなみにKimiもパクリ

0309名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f69-4eOD)

2025/12/14(日) 20:37:45.00ID:s9/KZp9y0

MLAは現状省コストモデル作るなら一番いいからデファクトスタンダードになるのは分かる
あとKimi K2はただパクっただけじゃなくて事後学習でINT4で最適になるようにQATしてるんだけどそのためにだいぶ変なことしてたはず
Mistral 3はどこを工夫したとか出てこないから分からんね

0310名無しさん＠ピンキー (ﾜｯﾁｮｲ 87a8-elKO)

2025/12/14(日) 20:49:33.56ID:FsStLVRy0

shisaの70Bの方もIQ2MならVRAMに乗り切ったんで比較してみたんやが微妙や…
ベースモデルが違うから最適なパラメータ設定も変わるんだろうし一概に言えんけど14BのQ8の方が全然マシだ
変な日本語崩れが入るしわけわからん事言い過ぎ

0311名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b49-r+g0)

2025/12/14(日) 21:07:13.71ID:DJ4aKHpm0

そらそうだ
モデルにもよるけど3.5bpw切る辺りから急激に性能劣化する
Q4が安定択なのにはそれなりの理由がある

0312名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a9-A5rm)

2025/12/14(日) 21:09:16.60ID:1lOcAup10

>>306
Tool Callingは以前のバージョンも使えたんやないかなって言おうとして
調べたら4.6vはtool callで画像のやり取りもできる？ようになった？みたいやな
画像を理解し、ToolCallingの出力に画像に関する内容を含められるようになったようや

その形式に対応したツールが出てこないことにはしばらく何の意味もあらへんけど
画像エディターとかがそういうのに対応したらいろいろできるようになるんかな
知らんけど

0313名無しさん＠ピンキー (ﾜｯﾁｮｲ 87a8-elKO)

2025/12/14(日) 22:49:48.32ID:FsStLVRy0

>>311
やっぱそうなんかー
無理して大モデルの小サイズ使っても駄目なんやなあ
普通にグラボ1枚持ちが使う分にはshisaの14Bはかなり可能性を感じるモデルだわ

0314名無しさん＠ピンキー (ﾜｯﾁｮｲ 8765-ucLS)

2025/12/15(月) 00:09:36.69ID:Q6uGDeH10

>>198
32×2×2じゃ駄目なんだろ、予算オーバー以前にモノがねぇよ

0315名無しさん＠ピンキー (ﾜｯﾁｮｲ 8748-TY0I)

2025/12/15(月) 00:58:54.38ID:BlZcCH320

>>314
個人的お気に入りで良ければAratako/Qwen3-30B-A3B-ERP

0316名無しさん＠ピンキー (ﾜｯﾁｮｲ 8748-TY0I)

2025/12/15(月) 01:06:30.17ID:BlZcCH320

>>314
あと16GB/64GBだったら>>299もありかもしれん

0317名無しさん＠ピンキー (ﾜｯﾁｮｲ fe7c-XfrZ)

2025/12/15(月) 03:20:20.61ID:0DupvahM0

モデルを導入すると最初に「あなたは誰ですか？」って聞くんですけど、shisa v2.1 14Bはちゃんと「shisaです」って言ってきてびっくりした。
今まではたいてい「AIアシスタントです」とか「ChatGPTです」とかのぼんやりか間違った事しか言ってこなかったので。

0318名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-O/3E)

2025/12/15(月) 04:42:27.77ID:OqS0HGo/0

DGX SparkってConnectX7なのに200Gbps出ないんだな
https://qiita.com/ksasaki/items/bd88ff8c03760856fe6c

0319名無しさん＠ピンキー (ﾜｯﾁｮｲ 3732-9rD2)

2025/12/15(月) 08:23:19.66ID:8iECz84j0

>>317
プンルーのfreeモデルで試してみたけど大体ちゃんとモデル名が返ってくるぞ

0320名無しさん＠ピンキー (ﾜｯﾁｮｲ 236b-AsBv)

2025/12/15(月) 09:06:30.63ID:6meylfc80

shisa2.1 14Bでreasoningモデル出してくれないかな

0321名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr97-xeS7)

2025/12/15(月) 09:44:03.22ID:ZM85ffzEr

>>308
欧州人なんてそんなもん🙄

0322名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr97-xeS7)

2025/12/15(月) 09:44:49.76ID:ZM85ffzEr

>>317
そのへんはシステムプロンプトあたりで強制してんでは?

0323名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c7-lorD)

2025/12/15(月) 10:43:30.78ID:v6d1b+2H0

>>312
そのTool Callingは何に使えるかなんよな
俺も分からんけど、その機能使えるかちょっと試してるところだわ

今は思い浮かばんけどなんかローカルLLMでの利用に応用効きそう

0324名無しさん＠ピンキー (ﾜｯﾁｮｲ 03c0-tRx1)

2025/12/15(月) 11:53:58.90ID:2HGyGlMo0

LLMの検閲除去ツールheretic
4bit量子化推論&学習重みをLoRAで保存する機能によりVRAM負荷を超絶軽減するプルリクがマージされた
https://github.com/p-e-w/heretic/pull/60

0325名無しさん＠ピンキー (ﾜｯﾁｮｲ 874e-7UIs)

2025/12/15(月) 12:40:09.96ID:HQ2vyPaJ0

検閲除去ってロボトミー手術してるようで信用してない

0326名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a9-A5rm)

2025/12/15(月) 12:41:28.85ID:C9di0Ej00

>>323
ツールコールはLLMを呼び出す側(GUIアプリ)が対応している必要があるのと
当たり前やけど呼び出し先のツールがツールコールに対応している必要あるで

LLMはあくまでツールを呼び出すための各種変数の値を作るだけで、実際に呼び出すのはアプリ側やから
そしてそのあたり多少楽に構築できるようになるのがMCP

0327名無しさん＠ピンキー (ﾜｯﾁｮｲ b7c5-ucLS)

2025/12/15(月) 20:29:50.98ID:yxGC13ST0

右脳の無い左脳だけのLLMで理Ⅲに受かる患者と話してるのが今だろ

0328名無しさん＠ピンキー (ﾜｯﾁｮｲ 636a-xeS7)

2025/12/15(月) 20:34:48.16ID:frgQthBq0

東大の研究がパッとしない理由やね

0329名無しさん＠ピンキー (ﾜｯﾁｮｲ b3c4-CM7m)

2025/12/15(月) 21:17:23.37ID:aQGgXWy90

東大のスタートアップと名乗る会社の営業を毎週受けている。どんだけあるんだか

0330名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c7-lorD)

2025/12/15(月) 21:38:28.53ID:v6d1b+2H0

>>326
ツールコールの仕組み自体はそんなに詳しくないけど何が出来るかは確認しておきたいんよね
ちょいテストしてみるわ

0331名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fc0-4eOD)

2025/12/15(月) 22:08:07.14ID:khnXzz0N0

>>329
東大松尾研が卒業生とか知人のスタートアップに見境なく名前貸してたらこんなに松尾研あるならバレへんやろって全く関係ないところまで松尾研名乗り始めたっていう話があったな
今研究室のページに本物の松尾研発スタートアップの一覧あるんじゃなかったっけ

0332名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd12-9DM+)

2025/12/15(月) 22:11:52.42ID:r0PpTIQWd

>>331
ラーメン二郎みたいで草

0333名無しさん＠ピンキー (ﾜｯﾁｮｲ 3e27-A5rm)

2025/12/15(月) 23:44:51.06ID:yALggCZ00

松尾軒一蘭
https://weblab.t.u-tokyo.ac.jp/startups/

0334名無しさん＠ピンキー (ﾜｯﾁｮｲ 524c-HP1u)

2025/12/16(火) 01:29:26.24ID:ofDfXD/f0

>>332
一応ちゃんと二郎名乗るのは管理されてたはず
近所の店は破門されて名前変わってたw
>>333
こんなにあるの！？w

0335名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-A5rm)

2025/12/16(火) 05:26:33.70ID:pWqdw9bE0

メモリ爆上げはローカルAI勢にとって高額グラボより問題になってきたな

さすがに5倍くらい高騰してくると、パソコン環境を揃えなおそうと思わないよな

0336名無しさん＠ピンキー (ﾜｯﾁｮｲ 3732-9rD2)

2025/12/16(火) 06:02:34.49ID:1Zg1Wdsu0

ユーザーはもちろんメーカーも大変やな
マザボは売上半分になったらしいしAAAタイトル作ってるゲーム会社もユーザーのPCスペックが上がらなくて困るやろ

こういうことが起こるとAI業界は軽量化・低コスト化技術に注力するようになるんじゃないか

0337名無しさん＠ピンキー (ﾜｯﾁｮｲ 3732-9rD2)

2025/12/16(火) 07:12:20.72ID:1Zg1Wdsu0

>>324
Pro 6000とかを持ってる人なら大喜びだな
俺みたいに5070ti程度じゃ多少軽量化されたところで検閲解除したいモデルには全然届かねえ……

0338名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-A5rm)

2025/12/16(火) 08:01:56.10ID:pWqdw9bE0

むしろmacを買った方がいいとかある？

0339名無しさん＠ピンキー (ﾜｯﾁｮｲ 7249-O/3E)

2025/12/16(火) 10:33:29.10ID:ky2C0bWe0

Nemotron 3 NanoはMambaを使ってるらしい
Qwen 3 Nextと一緒だね

0340名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a9-A5rm)

2025/12/16(火) 12:20:21.50ID:YLOPA8Ta0

moeで100bも公開予定なのか
良さげやな

0341名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c7-lorD)

2025/12/16(火) 12:27:33.80ID:6N5ldNhF0

macはまだ値上げしてない？
M5 Studioも興味あったけど、どうなるんだろう

0342名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a9-A5rm)

2025/12/16(火) 12:30:03.97ID:YLOPA8Ta0

llama.cppはすでに動作するレベルのPRが出てて(まだ未マージだけど)
https://github.com/ggml-org/llama.cpp/pull/18058
GGUFもunslothが作成済みで
https://huggingface.co/unsloth/Nemotron-3-Nano-30B-A3B-GGUF

nvidia随分と手回しがええな

0343名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c7-lorD)

2025/12/16(火) 12:37:58.89ID:6N5ldNhF0

Nemotron 3 Nanoはもう試せるの？
NVIDIA製のやつ？
というか知らんかったw

0344名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd12-9DM+)

2025/12/16(火) 13:50:22.49ID:iC+YmZrid

>>342
実装完了したら教えてね

0345名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a9-z5HT)

2025/12/16(火) 14:31:15.36ID:YLOPA8Ta0

動くまでの実装は完了しとるから上のPRのブランチでビルドすれば動かせるで

0346名無しさん＠ピンキー (ﾜｯﾁｮｲ 3732-9rD2)

2025/12/16(火) 14:48:29.52ID:1Zg1Wdsu0

Nemotron 3 NanoはOpenRouterでfreeで使えるぞ
でもものすごい長考するし出力も暴れるしでチャットするのには苦労しそうな感じだ

0347名無しさん＠ピンキー (ﾜｯﾁｮｲ 3732-9rD2)

2025/12/16(火) 14:57:03.34ID:1Zg1Wdsu0

ユーザー「AI、今週末に新しく出来たピザ屋さんに行かない？」
AI「新しいピザ屋さん！？わくわくするわね～！ユーザーは何を頼むのかな？今度、週末に行こうよ！ 🍕」

これだけのやりとりをするのに8000トークンも思考する
まあチャットやロールプレイング用のモデルじゃないから仕方ないんだろうけど

0348名無しさん＠ピンキー (ﾜｯﾁｮｲ 87e8-DAEx)

2025/12/16(火) 15:20:49.17ID:I8CXFDR50

>>344
コミットされたで（はやい）

0349名無しさん＠ピンキー (ﾜｯﾁｮｲ 5224-I8Ki)

2025/12/16(火) 15:55:55.06ID:hw7FBFqM0

ピザ屋へのお誘いで8000トークンは草
ローカルLLMやるようになってから人間がいちいち「ありがとう」とか言うせいで莫大な計算力が浪費されてるって話の重大さが理解できるようになったわ
理解できるようになっても辞めんけどな

0350名無しさん＠ピンキー (ﾜｯﾁｮｲ 8748-elKO)

2025/12/16(火) 15:56:50.50ID:i7w/eNA/0

トークン数≒コンテキスト長だっけ？
そのペースなら一応答で前の記憶どんどん消えてくな

0351名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a9-z5HT)

2025/12/16(火) 17:03:42.93ID:YLOPA8Ta0

リーズニングの部分ってコンテキストには含めてないんとちゃうかな
アプリ側の実装によるとは思うねんけど

0352名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c7-lorD)

2025/12/16(火) 17:47:15.86ID:6N5ldNhF0

LM Studioだとリーズニングも含めてたような
アプリによるんだろうね

0353名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c7-lorD)

2025/12/16(火) 18:01:33.89ID:6N5ldNhF0

ビジョンモデルのGLM4.6V試してるんだけど4.5Vとそんなに違いは感じないような気がする
ただ、小さいモデルの9BFlashが意外とすごい
それなりにオブジェクトを認識しているし、日本語の表現も自然。英語で返してくることも多いけどね
OCRはちょっと弱いけど割と日本語も認識する
使う場面によっては実用的かも？

後は新たに追加されたツール呼び出しだな
vLLMは性能がいいので使ってるんだけどThinkingとツール呼び出しの併用が出来ないっぽい・・・
Thinking有り無しで結構、得られる情報量が違うから惜しいな
もうちょっと調べてみるけど

0354名無しさん＠ピンキー (ﾜｯﾁｮｲ 87b8-D2pJ)

2025/12/16(火) 20:12:41.28ID:+e/A/7mx0

nVidia から新しいモデル
nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-BF16

0355名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b49-r+g0)

2025/12/16(火) 22:23:31.58ID:quQmhDAk0

昨今はベンチ項目が軒並みコーディング小説エージェントだから小説向きモデルがあるのかすら分からんな

0356名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b49-r+g0)

2025/12/16(火) 22:33:26.03ID:quQmhDAk0

ミスった　コーディング・数学・エージェントね
小説向けのベンチはEQBenchぐらいだけどあんまりリーダーボードにモデル追加されないんよな

0357名無しさん＠ピンキー (ﾜｯﾁｮｲ 3e27-A5rm)

2025/12/16(火) 22:39:07.15ID:70w/DKgZ0

コーディングは与えられた問題を解決できるかで客観的に評価できるけど
小説の評価ってどうやるんだ

0358名無しさん＠ピンキー (ﾜｯﾁｮｲ 5224-I8Ki)

2025/12/16(火) 22:49:07.37ID:hw7FBFqM0

小説みたいないわゆるアートとか対人の受け答えは数値で評価できんから今の世の中ではAIに限らず軽視されがちやな

0359名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b49-r+g0)

2025/12/16(火) 22:50:11.17ID:quQmhDAk0

>>357 例えばこんな感じ
https://eqbench.com/about.html#creative-writing-v3
結局は外部のLLMに評価基準与えて採点させてるんだからコーディングもライティングも変わらんで

0360名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-A5rm)

2025/12/17(水) 08:12:48.81ID:3Qb5xfU80

Stable DiffusionやってるとAIというより
モデルを作った人がどんな学習をさせたかを逆に想像しながら作っていく。
そしてそれが一致した時にほしい絵柄が得られる。
ほしい絵柄が生成された時が快感だ

0361名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-A5rm)

2025/12/17(水) 08:14:53.57ID:3Qb5xfU80

Stable Diffusionのプロンプトを作るのにGrok先生とレスバをしながら思考を繰り返す日々

0362名無しさん＠ピンキー (ﾜｯﾁｮｲ 722d-zBTM)

2025/12/17(水) 08:38:09.06ID:/pkrHNq40

shisa2.1 14Bあれからも色々パラメータ調整しながら試してるんやが微妙に会話力弱いのかも？
これどんな匂い？って聞いても無視して話を進めようとしたり
なんなんやろなこれ
昔の7Bでもちゃんと答えるようなことが出来てなかったりするわ

0363名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-A5rm)

2025/12/17(水) 09:41:01.54ID:3Qb5xfU80

さくらインターネットさぁ70Bとか個人でできるじゃん。300B以上でやってよ
AIスパコン「さくらONE」で挑むLLM・HPCベンチマーク (1) MLPerf Llama 2 70Bファインチューニング性能検証
https://knowledge.sakura.ad.jp/48233/

0364名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bc6-r+g0)

2025/12/17(水) 09:55:29.35ID:w5cKB6em0

OpenRouterにMistral Small Creativeなるモデルが出たらしいけど試した人居る？
>Mistral Small Creative は、クリエイティブライティング、物語生成、ロールプレイ、キャラクター主導の対話、汎用的な指示の追跡、会話エージェント向けに設計された実験的な小型モデルです。
との事でちょっと期待している

0365名無しさん＠ピンキー (ﾜｯﾁｮｲ 32ac-DAEx)

2025/12/17(水) 11:27:24.59ID:SvtpxmAx0

4090で普通に動く
・エロ規制ありで優秀なモデル
・コーディングに強いモデル
・エロ規制なしの優秀なモデル
これらの用途におすすめモデルってどんなのがある
あと、初めて使うなら、どんな環境(Ollama？)も教えて貰えるとありがたい

0366名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bc6-eccJ)

2025/12/17(水) 11:52:52.32ID:w5cKB6em0

>>365
環境はWindowsならLM Studio使うのが楽でオススメ
エロ用途ならMistral-Small-24Bかこいつをベースにしたモデルが個人的には好み
エロかつ画像認識対応ならQwen3-VLの30BA3Bのabliterated版が良いかと

でも最終的には自分の好みとかあるから片っ端からダウンロードして試すのが一番だよ

0367名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr97-QUL1)

2025/12/17(水) 12:31:07.33ID:dh3d3zpIr

同じモデルの同じsafetensorを使ってもollamaよりLM studioの方がエロにゆるい気がしないでもない…
実装が違うからなんだろうか

0368名無しさん＠ピンキー (ﾜｯﾁｮｲ 72bf-zBTM)

2025/12/17(水) 12:59:04.62ID:/pkrHNq40

前もそんな風なこと言ってる人いたね
同じ規制解除版使ってるのにollamaとLM studioだと申し訳食らってkoboldcppだとエロいけた、だったっけか？
どこで差が出来るんだろ
デフォのシステムプロンプトとか？

0369名無しさん＠ピンキー (ﾜｯﾁｮｲ 72bb-KIjk)

2025/12/17(水) 14:39:55.92ID:/jx/zd8d0

初心者で最近ローカルLLMを触り始めた
NeverSleep/Lumimaid-v0.2-12B (12B)GGUF版、ollamaでエロ小説を書かせたら動作は遅いのはともかく、セリフの整合性、語彙力、表現力が全然だわ
これってプロンプトが悪いのかPCスペックが悪いのか12Bっていう量子化されてるやつを使ってるから微妙なのか何が原因なんだろ
3060ti VRAM 8GB、メインメモリ32GBの弱小スペックにおすすめのモデルってある？
素直にGrok使っておけっていうのは最もなんだけどやっぱりGrokやGPTに近いような小説をローカルでやってみたいんよ

0370名無しさん＠ピンキー (ﾜｯﾁｮｲ 32c7-DAEx)

2025/12/17(水) 14:44:12.41ID:SvtpxmAx0

ありがとう！！！
はじめの取っ掛かりが掴めずに居たから助かる

0371名無しさん＠ピンキー (ﾜｯﾁｮｲ 3732-9rD2)

2025/12/17(水) 15:33:00.83ID:C1S990uQ0

>>369
初心者ならプロンプトの問題もかなりあるだろうけど、モデルの性能自体が低いからどうやってもGrokに近づくことはできない
GrokやGPTみたいなトップクラスのモデルと比べたらあかん
7B～12Bぐらいのモデルは変な日本語や整合性の悪さ、コンテキストウィンドウの小ささを受け入れた上で遊ぶんだよ

0372名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-A5rm)

2025/12/17(水) 21:14:26.31ID:xM+RNAtv0

>>369
ローカルでエロ小説やりたいなら、旧mistral-large系一択
日本語ならamaterasuとかmagnum
123Gあってmoeじゃないからクソ遅いけどビンビンにくるぞｗ

0373名無しさん＠ピンキー (ﾜｯﾁｮｲ 8760-7UIs)

2025/12/18(木) 02:03:41.26ID:2awyAXmF0

ローカルで何するにもPC高騰で冬の時代に
でもここは震源に近いから強く言えん所はある
PCゲーマーとしてはマイニングブームが終わったら次はAIブームでまたかよって文句言いたいけど

0374名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c7-lorD)

2025/12/18(木) 02:38:49.00ID:d/GwtOZZ0

llama.cppがGLM4.6Vに対応したみたいだぞ
LM StudioでもVisionは有効ですと出てるから動かせそうだ

0375名無しさん＠ピンキー (ｼｬﾁｰｸ 0C13-Toi2)

2025/12/18(木) 07:53:52.78ID:afV40DvKC

マルチモーダル系のモデルの規制解除版の説明に規制解除はテキストのみで画像部分は解除されてないってよく書いてるけど
あれってどうゆう事？
画像生成するわけでもないし、出力のテキストが規制なかったらいいんじゃないの？

0376名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr97-HgNt)

2025/12/18(木) 10:36:43.02ID:Tn5rBGrSr

>>363
国内企業はドコモ国内のアホを騙せればいいと思っていい加減な商売してる

0377名無しさん＠ピンキー (ﾜｯﾁｮｲ 3e2e-c5sb)

2025/12/18(木) 11:09:02.03ID:wV9BfonF0

>>375
学習データからエロ関連を弾いてるからそもそもモデルが認識できないとか？
それか画像認識の中にエロ判定層みたいなのがあるけど回避する手段が見つかってないとかじゃない？

0378名無しさん＠ピンキー (ﾜｯﾁｮｲ 72b0-5Jjh)

2025/12/18(木) 11:31:24.56ID:9swORTeL0

VLMって通常のLLMにビジョン用機構を増設しているだけという事が多いから規制解除時にLLMの重みだけを対象に変更したってだけじゃない？
ビジョン用機構は画像入力を受け付けるから別の処理しないといけなくて、最適化ライブラリでも対象外なこと多いし

0379名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-A5rm)

2025/12/19(金) 06:10:31.93ID:yIRDbP130

世の中おかしくなってきたな、メモリ高騰のせいで
原価が高騰してパソコン売れなくなってパソコン屋がピンチになっている。

0380名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-A5rm)

2025/12/19(金) 06:34:24.28ID:yIRDbP130

この流れだと来年はDDR3の復権が流行るんじゃね

0381名無しさん＠ピンキー (ﾜｯﾁｮｲ 32ac-DAEx)

2025/12/19(金) 15:06:20.82ID:3xMkD4GE0

このまま価格が高騰したら、128MBで十分早く動いていたような軽量OSが開発されると信じてる
そして、これをエッジPCとしてクラウドのPCを使うイメージ

0382名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-A5rm)

2025/12/19(金) 15:23:58.06ID:yIRDbP130

NVIDIAが4割減産って本末転倒すぎる。

新着レスの表示

レスを投稿する