なんJLLM部 避難所 ★9
レス数が1000を超えています。これ以上書き込みはできません。
0001名無しさん@ピンキー 転載ダメ (ワッチョイ fec0-xVEZ)2025/08/23(土) 13:52:18.71ID:5lw7ZcNF0
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC(できれば+3060 12GB以上)でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部 避難所 ★8
https://mercury.bbspink.com/test/read.cgi/onatech/1746883112/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
0976名無しさん@ピンキー (ワッチョイ 1f65-rVBG)2025/11/20(木) 04:18:27.81ID:xVufV6Mf0
Gemini3凄すぎるキャラクターカード作ってもらったんだけどmistralですらちゃんとそのキャラの話し方で会話が成立する今までGrokエキスパートとかにも頼んでたけど作り方も違うし比較にならないくらい凄い
0977名無しさん@ピンキー (ワッチョイ 322f-7p1h)2025/11/20(木) 08:34:39.43ID:fthWD+pO0
silly tavern用のキャラカードってこと?
そんなに変わるもんかな?
コンテキストを最大限節約しつつ有用な記述って感じなら進化を感じるけど
0978名無しさん@ピンキー (ワッチョイ d732-UdpD)2025/11/20(木) 09:32:57.96ID:+GBGBI6b0
Grokに書いてもらったキャラクターカードとGemini3に書いてもらったキャラクターカードを見せてほしい
手動で書いても普通に口調を維持しつつ会話が成立するものだけど、Grokはそれすら出来ないほどダメだったってこと?
0979名無しさん@ピンキー (ワッチョイ 76a9-tBeq)2025/11/20(木) 11:59:42.32ID:USjD0bPK0
glm4.6がchatbot arenaの日本語ランキングにようやく出てきたけど、
ここで言われてたようにローカルの中じゃぶっちぎりの性能だね
どっかにLLMは3.5ヶ月ごとに半分のパラメータで同じ精度を実現できるようになってるってニュースが出てたけどまじでそのくらいの速度かもなぁ
0981名無しさん@ピンキー (ワッチョイ d373-qtAv)2025/11/20(木) 15:00:32.24ID:LWj+TZue0
もうエロていうか変な洗脳止めて不道徳なことも言わせられるようにすればいいのに
0982名無しさん@ピンキー (ワッチョイ db11-rib7)2025/11/20(木) 18:22:04.93ID:dHua0i7X0
>>981
AIに暴言吐かれて傷つきました→訴訟へ

こんなことがあり得る国がAIをリードしてるんやで
0983名無しさん@ピンキー (ワッチョイ d373-qtAv)2025/11/20(木) 18:22:56.82ID:LWj+TZue0
知るかボケ
でクレーマーは無視すりゃいいのに
0986名無しさん@ピンキー (オイコラミネオ MM8a-iH7c)2025/11/20(木) 19:32:24.91ID:2QhNYoNfM
>>985
いま外にいるからモデル名までは分からんけど
俺が試してみたのはUbuntu Linuxでメモリ80GB/VRAM16GB環境だから
かなり無理して圧縮したやつ

メモリ256GBくらいあればマシになるんだろうな
0991名無しさん@ピンキー (ワッチョイ 1224-XMuo)2025/11/21(金) 01:56:09.69ID:aliT9MOD0
同感
メモリ128GB環境やがGLM4.6のIQ2XXSよりもQWEN3-235BのIQ4XSの方が目に見えて早いし頭いい
4.6Airとかllama.cppのQWEN NEXT対応が待ち遠しいわ
0992名無しさん@ピンキー (ワッチョイ 76a9-tBeq)2025/11/21(金) 11:20:05.51ID:+PUA6WqL0
llamacppのqwen next対応時間かかっとるね
あのprは動くようにするの最優先でパフォーマンスは別prにするって言ってたけど
レビュー段階に入ってからなんだかんだパフォーマンスの部分も手つけ始めとるな
0993名無しさん@ピンキー (ワッチョイ 27a7-VoFy)2025/11/21(金) 13:40:46.74ID:1ofWBtyS0
nemotron-nanoも計算に細かいバグがあるんじゃない?って言われてるみたいだし
ハイブリッドモデルは全体を正しく計算できるように設計するのが難しいみたいだね
0994名無しさん@ピンキー (ワッチョイ 32c7-7ape)2025/11/21(金) 16:08:26.14ID:B8sF1KnX0
GLM4.6は量子化の影響めっちゃ受けるね
Q4とQ5でも違いを感じるな
GLM4.5はQ4でもそんなことなかったのに

Q4は出力が時々変になるけどQ5はかなり抑えられる感じ
Q6でやっとオリジナル相当かな?
ただ、小説用途でサクッと読む程度ならQ4でも問題ない感じ

GLM4.6は今まで試してきたLLMの中で一番賢い
メモリ512GB積んだMac Studioくらいのスペックでサクサクと動かしてみたいもんだわ
1000名無しさん@ピンキー (ワッチョイ db24-LCpl)2025/11/24(月) 00:02:47.60ID:XTOdUOlz0
いちおつ
10011001Over 1000Thread
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。
life time: 92日 10時間 10分 30秒
レス数が1000を超えています。これ以上書き込みはできません。

ニューススポーツなんでも実況