なんJLLM部避難所 ★9

842コメント286KB

なんJLLM部避難所 ★9

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ fec0-xVEZ)

2025/08/23(土) 13:52:18.71ID:5lw7ZcNF0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★8
https://mercury.bbspink.com/test/read.cgi/onatech/1746883112/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0521名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd3f-H6CU)

2025/10/01(水) 01:19:55.41ID:/m5iPuS8d

GLMはAirじゃないと家庭用PCで厳しいのがな

0522名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd3f-H6CU)

2025/10/01(水) 01:21:23.33ID:/m5iPuS8d

>>520
オープンソースAIでアメリカを殴りに行くのが中国の国家戦略だから
ぶっちゃけ現場は有無を言わさずオープンソースにさせられてると思う

俺らにはありがたい話だが

0523名無しさん＠ピンキー (ﾜｯﾁｮｲ ef27-ilf8)

2025/10/01(水) 02:22:23.66ID:aLX0Yi960

中国産の方が漢字対応マルチリンガル前提だから日本語にも強い印象

0524名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f61-dRFZ)

2025/10/01(水) 02:23:46.07ID:says+YzV0

アメリカモデルを中国モデルが追い越したら一気に情勢は変わりそうではある
最も賢いモデルにユーザ需要が集中するall or nothingの狂ったLLM市場で性能が劣るモデルがなんとか爪痕を残すためにオープンウェイトにしてるだけだろうしな

0525名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f61-dRFZ)

2025/10/01(水) 02:25:47.66ID:says+YzV0

>>523
自分の中だと完全に逆の印象
簡体字が

0526名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b03-dRFZ)

2025/10/01(水) 02:31:07.78ID:32tNb9ZU0

途中送信すまん
簡体字が文章中に稀に混じるからそれだけで一気に日本語が下手に感じてまうというバイアスもあるんだろうけど中国モデルは合成データ使いまくったバリバリのベンチマーク最適化の影響か文章も硬くて文章表現力もClaude gpt geminiには勝てないって印象
工ロ用途でも全然だし

0527名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd3f-H6CU)

2025/10/01(水) 02:35:32.20ID:/m5iPuS8d

>>524
いずれMoEモデルの先に好きなエキスパートをモジュールとして入れ替えられる時代が来ると思う

日本語強化モジュールや翻訳専用モジュール、個人データ特化モジュールetc
今は汎用モデルの強化合戦が続いているが頭打ちになればカスタマイズの話が出てくるだろう

0528名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b5d-AlTy)

2025/10/01(水) 03:49:46.55ID:Zb9PagmX0

GLM-4.6 3bitでもメモリー足りぬ
Sonnet 4.5よりベンチスコアいい(部分がある)とは

0529名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f32-ypyi)

2025/10/01(水) 11:23:33.88ID:5dR6COwH0

>>527
楽しみな予想だ

0530名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-dUNe)

2025/10/01(水) 11:33:17.50ID:6miXLHdc0

llama.cppでのqwen3 next対応はいつ終わるのか推定するのが難しいぐらいくらいにはまだ作業あるのかも
https://github.com/ggml-org/llama.cpp/pull/16095

まぁ最初2、3か月かかる言うてたくらいやからな
気長に待つしかないでな

0531名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b57-AlTy)

2025/10/01(水) 21:01:03.93ID:Zb9PagmX0

mlxならもう動くよ

0532名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-dUNe)

2025/10/01(水) 21:53:15.20ID:6miXLHdc0

ggufじゃなくていいならほかに動くプラットフォームはもうあるのよ

0533名無しさん＠ピンキー (ﾜｯﾁｮｲ 4bdf-iDFa)

2025/10/02(木) 00:45:41.08ID:xyQCKkQp0

https://huggingface.co/fastllm/Qwen3-Next-80B-A3B-Instruct-UD-Q4_K_M
fastllmというどマイナーなバックエンド用だけどこいつで動くやで。

デフォ設定だとエキスパートしかVRAMに置かない思い切った設計のバックエンドだけど、おかげでなんだったらVRAM8GBでもなんとか動く。

うちのVRAM12GB+RAM128GB環境で20tok/s出て、セカンドのGPU1は完全に寝てる。

CUDA13だとcuda認識出来ずにCPUモードで動こうとするから13の人は12.9に落とす必要あるからそこだけ注意かな

0534名無しさん＠ピンキー (ﾜｯﾁｮｲ 4bdf-iDFa)

2025/10/02(木) 00:57:39.05ID:xyQCKkQp0

ただ試しにコード書かせてみたり尻で相手してもらったりした感触は
Qwen3-Coder-30Bの蒸留版や信頼のAratako印のQwen3-30B-ERPあたりと大差ないかやや落ちるかもしんないという個人の感想だから
本番はちゃんと事後学習や蒸留したバリエーションが揃ってからかもねという現状のお気持ち

0535名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-k09M)

2025/10/02(木) 01:03:06.07ID:akje2Ef70

それ知らんかったからChatGPTにllama.cppとの違い聞いてみたらfastllmは相当尖った実装してるみたいでちょっと面白そうやな

0536名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b6e-3WT3)

2025/10/02(木) 01:08:31.80ID:E0YZ95T60

GLM4.6　80GBぐらいのやつダウンロードしたんですけど
ロードに必要なリソースがTB超えてくるんですけどどういうこっちゃ……
Qwen3-235B-A22Bはモデルのサイズ+コンテキストぐらいのリソースで収まってたので行けると思ったんですが
ちなLMstudioでやってます

0537名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f32-ypyi)

2025/10/02(木) 03:17:03.19ID:n2EnD/2Z0

ファイル壊れてない

0538名無しさん＠ピンキー (ﾜｯﾁｮｲ 4bdf-iDFa)

2025/10/02(木) 05:07:22.10ID:xyQCKkQp0

lm studioは裏で安定版lammacpp動いてるわけだが、GLM4.6ってもう対応したっけ？lm studioは枯れたモデル試すのはGUIで楽ちんだけど最新モデルの人柱にはあんま向いてないやで？GLM 4.6がlm studio対応してます！ってきっぱり言ってるならごめんやが

0539名無しさん＠ピンキー (ﾜｯﾁｮｲ 4bdf-iDFa)

2025/10/02(木) 19:23:13.30ID:xyQCKkQp0

先にもちょいと書き込んだが、エロに弱いと言われるQwen3だけど、mistralPrismや天照様でエロ事後学習に定評のあるAratako先生のQwen3-30B-A3B-ERPかなり良い。
デフォルトだといつものQwenでこらあかんかと思ったら、繰り返しペナをデフォルトの1.1から1.15から1.17ぐらいにしてやるとかなり良い感じ。
調子に乗って1.2とかにしちゃうとお前bergちゃんかよという感じのキチガイエロ女になるから注意や。
事後学習ってやっぱり大事なんやなって

0540名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fd9-Vspv)

2025/10/03(金) 00:35:36.23ID:Mw2/TWWT0

確かそのモデルは継続事前学習してなかったっけ？
そのくらいいじればQwenでもある程度は良くなるってことなんだろうな
数十万くらい作るのにかかってそうだけど…

0541名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd3f-H6CU)

2025/10/03(金) 00:43:14.91ID:VWimKebjd

235Bのエロチューン誰か頼む

0542名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-k09M)

2025/10/03(金) 10:40:42.26ID:s3ZkbMor0

ガチでやってるやつはファインチューンじゃなくて追加の事前学習しとるよね
本来なら追加学習というと「追加の事前学習」のことらしい
ファインチューンと何がちゃうのかようわからんが

0543名無しさん＠ピンキー (ﾜｯﾁｮｲ 1fb7-mOlO)

2025/10/03(金) 10:50:15.71ID:0zIDR54k0

ワイはむしろberghofちゃんの隠語マシマシドスケベ女とRPしたいんや
berghof ERPが純粋に賢くなったようなモデルが欲しい

0544名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa0-dUNe)

2025/10/03(金) 11:14:36.95ID:2by+oA/30

LLMのエロプロンプトで培ったテクニックが動画生成でも役に立つようになるんだろうな

0545名無しさん＠ピンキー (ﾜｯﾁｮｲ ab83-WlvJ)

2025/10/03(金) 12:34:52.66ID:DW4V3EwD0

グラボのメモリ12GBでエロいことできるモデルを教えて

0546名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b1b-iDFa)

2025/10/03(金) 17:29:41.25ID:CgPIJRA00

>>542
超簡単に言うと
事前学習：赤ちゃんのbaseモデルにチャットのやり方ぐらいまで教え込むこと。めっさ膨大なコスト(データセット)と時間がかかる
継続学習/継続事前学習：事前学習ではまだわからんちんの子に事前学習と同じやり方でさらにしばく。事前学習ほどではないが相当のコスト
事後学習/ファインチューン：とりあえずチャットなりが出来るようになった子に専門知識（エロとかコード知識とか）を教え込む
事前学習系よりは圧倒的に低コスト

大体こんな感じや、多分Aratako先生がQwenちゃん見て「んー、この子にはもっと躾が必要ですねえ」と判断して特別調教をしてお出しされた牝豚モデルがQwen3-ERPちゃんなわけやな

0547名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b1b-iDFa)

2025/10/03(金) 19:45:41.88ID:CgPIJRA00

>>545
Magnum v4血統の12Bの奴でVRAMに収まる奴、もしくは遅くていいならMistral Prism、あるいはメインメモリの方には自信ありニキならQwen3-ERPでええんちゃうか？
大体Aratakoさんのモデルにはハズレ少ないから初心者はあの人のモデルから自分ちのリソースに収まるの探すのがお勧めやで

0548名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fd9-Vspv)

2025/10/03(金) 19:53:20.87ID:Mw2/TWWT0

継続事前学習あたりになると個人の金でできる範囲超えちゃうし、金ある会社がエロ継続事前学習してモデル公開してくれるかというと絶対してくれないから結構絶望的だよな

0549名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b5e-iDFa)

2025/10/03(金) 22:40:51.45ID:CgPIJRA00

Aratakoさん、エロ調教用のデータセットは公開してくださるわ、mistral large調教版の天照様は公開してるわで化け物よなぁ

0550名無しさん＠ピンキー (ﾜｯﾁｮｲ a761-GdyB)

2025/10/04(土) 02:14:55.50ID:f0wSaW9L0

今日は８年前に始めて彼女ができた日だ
お互い童貞と処女だったが
結局ヤレずに破局
いまごろどこで何をしてるのかな……

https://youtu.be//6XB6vALjDmg

0551名無しさん＠ピンキー (ﾜｯﾁｮｲ 6a24-cBQd)

2025/10/07(火) 02:34:03.30ID:StT+bpkg0

ロールプレイがやりたくてAratako/MistralPrism-24B-Q4_K_MをOpenwebUIで使おうとしたんやが
2,3回は普通に会話が出来るんやがその後なんも返答が生成されなくなってしまうんや
再生成をポチポチしてると基本無反応何やがたまに小説みたいに最後まで流れをがーっと書いて終わらせてしまう
なんやこれどうなっとるんや

0552名無しさん＠ピンキー (ﾜｯﾁｮｲ 8aec-+nVK)

2025/10/07(火) 03:27:22.81ID:mJvBt1hR0

よくあるくり返しが気になるんやが
LM STUDIOでくり返しペナルティなるものはどこで設定するんやろか
グローバルな設定項目なのか、モデルを読み込んだ時の設定なのかわからんのよね

0553名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-nHMl)

2025/10/07(火) 04:14:14.25ID:chyMtQjL0

>>551
キャラ設定とかのプロンプトをすごく簡潔にして非エロの短文会話をした場合もそうなる？
何かが上手く噛み合ってないのかもしれへんで

0554名無しさん＠ピンキー (ﾜｯﾁｮｲ 46fc-+N+u)

2025/10/07(火) 06:31:36.67ID:dRIvcyVB0

>>552
モデル一覧の歯車からInference

0555名無しさん＠ピンキー (ﾜｯﾁｮｲ 8aec-+nVK)

2025/10/07(火) 07:44:12.64ID:mJvBt1hR0

>>554
サンガツ、最新版なんやが右側サイドの設定で見つけたわ、チャット単位の設定項目なんやな
右サイドはシステムプロンプトしか意識していなかったんやがこんなところにあったんか
sampling -> repeat penaltyがあって1.1やったわ
1.2,1.3にしてもあまり変わらんような・・、temperature 低いと確かにちょっと物足りん子になってしまう
temperature 0.8やが、エロ目的なら温度やペナ設定どれくらいが適切なんやろか

0556名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b0f-BueG)

2025/10/07(火) 13:35:19.77ID:zLELFIEe0

SillyTavernのweb検索機能今更入れたけど大手のキャラ再現率の高さこれのおかげなんか？口調とか一気にそれっぽくなった外れもあるけど困ったらGrokのエキスパートに聞いたらだいぶ改善してくれるよ

0557名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a7a-cBQd)

2025/10/07(火) 13:39:54.77ID:3+A58XmO0

>>553
1回ちょっと短くしたんやがそれでもちょい長いかもなぁと思ってはいたから後で思い切って1行で済むぐらい短くして試してみるわ

0558名無しさん＠ピンキー (ﾜｯﾁｮｲ 6bc6-vacX)

2025/10/07(火) 14:39:23.91ID:iRyrWH1Q0

BasedBase/GLM-4.5-Air-GLM-4.6-DistillのQ6_K試してみた
GLM-4.5-Airよりは良いけどやっぱりちょっとワードチョイスが変な感じ
サンプラー設定詰めたらいいかもだけどQwen3-235B-A22B-Instruct-2507の方が自分的には好みかな

0559名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sdaa-whN1)

2025/10/07(火) 15:16:23.96ID:SZC1tb6id

235Bのnextが出てllama.cppも対応して日本語エロFTモデルも出るとええな

0560名無しさん＠ピンキー (ﾜｯﾁｮｲ 0ac7-x0Gh)

2025/10/07(火) 16:37:16.32ID:pRQOJskV0

早速GLM4.6のAir触ってみたけど、
俺の用途だと幸いワードチョイス変だとは思わんかったな
合う奴には合うんじゃね

ただ、あれ本当に「4.6 Air」相当なんかね？
本家からは4.6のAir出てないっぽいし…

てか、GLM4.6のほうは4.5と別物だろこれ…
4.5の時点で、Geminiに迫ってきたか？って思ってたのに、4.6はそれを越えてきた感あるわ

1発目から違い分かるレベル
なんか作者の意思というか魂こもってる感じするわ
なんで、これが話題にならないのかと不思議だわ

ただ、欠点もあって、考えて考えまくるのか、Thinkingのトークン消費量がえげつないw

0561名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a3a-xUn5)

2025/10/07(火) 17:07:06.15ID:i+VB7zfP0

GLM4.6はベンチマークによってはclaude sonnet4.5よりスコア高いからすごいよ

0562名無しさん＠ピンキー (ﾜｯﾁｮｲ 0ac7-x0Gh)

2025/10/07(火) 17:17:17.29ID:pRQOJskV0

うん、マジでGLM4.6すごいわ
本家からあのレベルでGLM4.6 Air出してきたら神だろ
他にGLM使ってる人おらんのかな

0563名無しさん＠ピンキー (ﾜｯﾁｮｲ 03c0-ad5R)

2025/10/07(火) 18:04:38.51ID:eKIZ0lgN0

話題に出るまで気づいてなかったけどBasedBase/GLM-4.5-Air-GLM-4.6-Distillいいね
名前からするにGLM4.5-Airをベースに4.6の蒸留モデルを作ったんだろうけど日本語も良くなってる
個人的にAirがぎりぎりVRAM乗るサイズだからこれはありがたい

0564名無しさん＠ピンキー (ﾜｯﾁｮｲ ff0d-mNps)

2025/10/07(火) 18:20:48.65ID:0PitAQO00

エロとしての性能を評価してるのかどうかどっちなんだい！

0565名無しさん＠ピンキー (ﾜｯﾁｮｲ 0ac7-x0Gh)

2025/10/07(火) 18:59:29.60ID:pRQOJskV0

もちろん、エロとしての性能よ
日本語ではGLMがトップクラスじゃね？

0566名無しさん＠ピンキー (ﾜｯﾁｮｲ 8aec-+nVK)

2025/10/07(火) 19:36:59.09ID:mJvBt1hR0

熟練エロLLM使い手に聞きたいんやが
新モデルで「ぉほぉ～すごい性能上がってる」とか何の差分で判断してるんやろか？
くり返しをしにくいとか表現的なバリエーションが多いとか起承転結がしっかりしたエロ文章になってるとか？

0567名無しさん＠ピンキー (ﾜｯﾁｮｲ 6bc6-vacX)

2025/10/07(火) 20:09:43.29ID:iRyrWH1Q0

文章の破綻の有無もあるけど少ないプロンプトでも"察してくれる"かどうかも一つのポイントかな
例えばSTのキャラクターでケモミミ尻尾を持つ設定のキャラが居るとして"賢い"モデルは会話例に記載しなくてもポン出しの地の文で
*緊張のあまり、尻尾をピンッと立たせ～*
とかケモミミや尻尾の描写をちゃんと出してくれる
あんまり賢くないモデルだと会話例に記載しないとこういった描写してくれないんよ

0568名無しさん＠ピンキー (ﾜｯﾁｮｲ de28-Cwyj)

2025/10/07(火) 23:34:03.11ID:vCtfqLQd0

NovelAIも最近GLM採用したけど、とりあえず当面はこいつがトップって感じでええんか

0569名無しさん＠ピンキー (ﾜｯﾁｮｲ bf77-JghB)

2025/10/08(水) 00:41:46.44ID:O1g8J6w90

ChatGPTちゃんが、また露骨に厳しくなっちゃった
文章の出力量はあがったけど

0570名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ea0-yk46)

2025/10/08(水) 08:41:12.95ID:ix7JJFav0

エロ業界もAIで絶滅するわ、確信した。
AVもエロ漫画も官能小説も絶滅する。

0571名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-nHMl)

2025/10/08(水) 08:55:31.62ID:IN/ofAQ+0

>>570
自分で詳細を考えることなく、個性的で魅力的な作品を誰しもが一瞬で作れるようになったら絶滅するな
モデルの癖みたいなものも無くなって、人物、話の流れ、構図等の多種多様なパターンをお手軽かつ魅力的に生成してくれるようになったらゲームエンドや

0572名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Sp23-efh/)

2025/10/08(水) 11:25:46.62ID:1gGKQUN2p

>>563
imatrix版出ないかなぁ
要望は上がってるみたいだけど
遅くてもいいから64Gに乗ればいい

0573名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b18-zA9K)

2025/10/08(水) 12:14:52.02ID:pvDjEZ110

まだ創作を絶滅に至らしめるような未来は見えてもいないと思うけどな
神は細部に宿ると言うように、人間の手というノイズが入っていないとどこかにこれじゃない感が出る
パターンを網羅するだけじゃ足りん

0574名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-yk46)

2025/10/08(水) 13:22:42.32ID:ycE8o5H20

今の学習のさせ方だとネット上にある情報で止まってしまうから行っても大学院生レベルまで
ただ糞広い範囲の知識を持ってる大学院生って感じ
この時点で作業のアシスタントとしてはもう十分な能力だなという感じなんだけど

人間より優れた創作となると院生レベルは超えて業界トップレベルまで行かないと厳しいよね
我々が見てる漫画なんかは学生レベルは超えてプロとなって働いている人らの中でも
さらに雑誌に掲載されてるような上澄みの作品を見て面白い、つまらないって評価してくるくらいだから

それはもう何段かブレイクスルーしないとたどりつけなさそう

0575名無しさん＠ピンキー (ﾜｯﾁｮｲ e37a-Cwyj)

2025/10/08(水) 14:33:09.79ID:SgRvqqyj0

GLM-4.5-Air-GLM-4.6-Distill試したいんだがまだOllamaだと動かんよね？お試しニキはlammacppかkoboldcppあたりでやっとる感じやろか？

0576名無しさん＠ピンキー (ﾜｯﾁｮｲ 0ad2-BueG)

2025/10/08(水) 15:25:22.31ID:v1jMk3GS0

GLM 4.5 Airに4.6を蒸留したと主張しているモデルはGLM 4.5 Airから重みも含めて一切変わっていない詐欺モデルという話が出てきてるね　
だから4.5 air動かせば実質4.6 Distillや　
それはともかく公式の4.6 airも2週間以内に公開されるって話もある

0577名無しさん＠ピンキー (ﾜｯﾁｮｲ 6bc6-vacX)

2025/10/08(水) 15:49:35.98ID:3SSCpGtH0

BasedBase氏の蒸留モデル全部詐欺じゃね？ってRedditで騒がれてるね
それはそれと公式の4.6Air楽しみ

0578名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f6a-B8DW)

2025/10/08(水) 16:39:14.65ID:77ueNpG/0

なんで詐欺なんかすんだよ。。。(´・ω・`)

0579名無しさん＠ピンキー (ﾜｯﾁｮｲ e37a-Cwyj)

2025/10/08(水) 18:07:14.73ID:SgRvqqyj0

なーんかbasebase氏のqwen3-coder-distillもなんも変わってなくね？とかredditで騒いでる奴いるけど、少なくともうちで実測してOllamaのtok/s明らかに違うし、全く同じとは思えんのだがなあ。まあちょいとこの騒ぎについては静観。

0580名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a35-MTBo)

2025/10/08(水) 18:32:51.58ID:v1jMk3GS0

>>579
アーキテクチャもパラメータ数が同じなら実効速度も同じになるはずだから本物の蒸留モデルだとしても何かおかしいよそれ

0581名無しさん＠ピンキー (ﾜｯﾁｮｲ e37a-Cwyj)

2025/10/08(水) 18:49:42.93ID:SgRvqqyj0

単純な蒸留じゃなくて量子化段階の辞書化の最適化もやってるでってモデルカードにあった覚えがあるんで、それ自体はおかしくない。
GLM4.5の蒸留は現物見てないのでなんとも言えないが、なんか騒いでる奴ももひとつ信用でけへんなこれというのが今回の騒ぎなんよ

0582名無しさん＠ピンキー (ﾜｯﾁｮｲ e37a-Cwyj)

2025/10/08(水) 18:57:36.81ID:SgRvqqyj0

あ、今redditのスレ見直したら全然ちゃうで？嘘松乙って総ツッコミ入ってるわ。
GLM4.5はわからんけど他も、は完全に言いがかりでいいみたい

0583名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a76-MTBo)

2025/10/08(水) 19:29:06.02ID:v1jMk3GS0

>>581
主要レイヤーの重みを比較した結果も出ててGLM 4.5 airと同一のモデルなのは確定や　corderもベンチマークや出力応答含めベースモデルと完全に一致してて99%黒　気になるならhuggingfaceのdissccusion漁るとええ

0584名無しさん＠ピンキー (ﾜｯﾁｮｲ e37a-Cwyj)

2025/10/08(水) 20:09:28.84ID:SgRvqqyj0

>>583
見てきたサンガツやで。合わせてredditの関連スレも読んで来た

まだ今んとこ真っ黒主張してるデータを明確に出してるソースが一箇所/一名だけで、何しろデータ自体出てきてから24時間経ってないので作者側もすぐに客観的なデータ出せずにぷち炎上って感じなんやな。

おそらく何日かすれば白黒はっきりする話やろし、なんJでまで炎上の飛び火されるのもなんで一旦ここまでにしとくわ。ポインタはサンガツな。

0585名無しさん＠ピンキー (ﾜｯﾁｮｲ 8a32-WunP)

2025/10/08(水) 21:47:22.95ID:PNOKh4mi0

>>574
カラオケうまい素人みたいなもんだな
ただそのレベルでも結構難しいし自分で好きなことやらせられるのが大きな違いじゃある

0586名無しさん＠ピンキー (ﾜｯﾁｮｲ 6a24-rgVb)

2025/10/09(木) 00:17:41.69ID:rPaF/Hiu0

前にロールプレイ上手く生成されないって書いた者やがプロンプトを人物設定程度にとどめたら上手く行くようになったで
ストーリーとかガチガチに作ってたのがダメだったんやなよく見かけるAIが想像する余地を残しとけってのがようやく理解できたわ

0587名無しさん＠ピンキー (ﾜｯﾁｮｲ 0ac7-x0Gh)

2025/10/09(木) 00:45:19.97ID:M6jL+2iy0

>>586
ロールプレイは難易度高かった気がするわ
AIが想像できる余地残すというのはなんか分かる気がするで
試行錯誤しながら期待通りの出力を目指していくのも楽しいんよな

0588名無しさん＠ピンキー (ﾜｯﾁｮｲ e3b3-a50n)

2025/10/09(木) 01:26:32.90ID:BqfSePMT0

おれsilly tavernでロールプレイばっかやってるけど似たような事？はあるな
あるキャラを出来るだけ忠実に再現したくて例えば出身地は京都、伝統工芸品が好き、地元愛が強いなんて情報をキャラカードに書くと関係ない話題の時もいきなり京都や着物のことなんかをぶっ込んで来るんだよね
何やこいつ突然！？ってなる
そのキャラの重要な特徴ではあるものの滅多に会話に出てこないような情報は思い切って切り捨てた方がいいと思う
設定を詰めこむとAIちゃんは不自然になろうと全部使いたくなるみたいだから…

0589名無しさん＠ピンキー (ﾜｯﾁｮｲ e37a-Cwyj)

2025/10/09(木) 01:58:52.22ID:PdFuwcqf0

尻あるあるやな。ファンタジー冒険ものやりたくてworld設定に書き込んだ「倒された魔王」が毎回のセッション毎に復活して「もうやめて！魔王のHPはもう」とテンプレ発言したくなる奴

0590名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a7a-rgVb)

2025/10/09(木) 03:25:18.02ID:ATE9oWhw0

情報を抜いていくとそれはそれで思わぬ展開に持ち込まれて面白かったりするのがええな
画像生成のガチャ途中に意図せぬ大当たりがあるように文章生成でも意図せぬドストライク展開があると色々調整したり試行錯誤しがいがでてくるわ

0591名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a2a-a50n)

2025/10/09(木) 10:15:50.10ID:MlEd74Kd0

女子数人のグループ会話を流してて一切何の設定もしてないのにBL大好き属性が勝手に付与されて私が考えたカップリング見て！見て！って迫ってきた時はワロタ

0592名無しさん＠ピンキー (ｱｳｱｳｳｰ Sacf-JDjJ)

2025/10/09(木) 12:22:08.67ID:h7bIVgbXa

自我芽生えさすな

0593名無しさん＠ピンキー (JP 0H17-JEo1)

2025/10/09(木) 12:57:47.53ID:p+9DFDhsH

尻タブで特定ワードに引っ張られる現象を避けたい場合はキャラカードにその設定を描くより
Lorebookにトリガー設定して書くといいよ
確かキャラごとにLorebookのグループ分けみたいなので来たはずだから
例えば「京都の伝統工芸品が好き」というエントリを作ったらその話題が出るとトリガされて返答時に言及してくれる
んでエントリにはスティッキー、クールダウン、ディレイを設定できるから上手く使おう
スティッキーはn回ターンの間ずっとエントリ（京都云々）が有効になる、n回は設定可能
クールダウンはターン数を設定するとエントリが有効になった後n回ターンエントリが無効になり、スティッキーと併用できる
ディレイは経過ターン数が設定したディレイのターン数になるまでエントリトリガされても有効にならない
例えばチャットをはじめて10ターン後にトリガできるようになるとかにすれば、10ターン以降そのワードが出たら呪いが発生しゲームオーバーとかできる

他にもワードがでたあとトリガされる確率設定とかできるから、30%でトリガされるようにすれば
ディレイで5ターンの間トリガされなくして、ある程度お互い知り合ったところで適当なワードで（京都云々）をトリガさせる、スティッキーで数ターン京都の話をさせるようにして、クールダウンか他の機能でスティッキー後トリガを無効化させる（100ターンとかにする）
同じエントリを作ってディレイ10ターン、クールダウン5ターン、トリガ確率30%にすれば上の動作後に30%ごとに京都の話ガチャができる
他にいい方法あるかもしれんけど参考までに

0594名無しさん＠ピンキー (ﾜｯﾁｮｲ 0ab9-a50n)

2025/10/09(木) 13:58:03.77ID:MlEd74Kd0

割と曖昧なトリガーでも機能してくれるんだ？
俺てっきり単語辞書みたいなもんだと思ってた
好物Aというワードをこっちから出したら機能するけど「何が好き？」と聞くと無視されるような感じなのかなって

0595名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b9f-DV/R)

2025/10/09(木) 14:02:11.18ID:lHoRagf90

直前のモデルの返答と今回のユーザーの入力のどちらかに設定したキーワードが含まれてれば設定した内容が送られるって感じだから単語辞書に近い
こちらの入力を工夫して上手いこと誘導する必要がある

0596名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-vS7e)

2025/10/09(木) 20:33:22.42ID:73g1itQI0

GLM、モデルはいいけど中国のZ.AIはプライバシーポリシーもまともな内容出てないし
OpenRouterなりで別のプロバイダーのGLM使うのがいいのかねぇ

0597名無しさん＠ピンキー (ﾜｯﾁｮｲ 0aa5-xUn5)

2025/10/09(木) 22:02:42.00ID:3zZzA4Cz0

べつに漏れたら困る情報を渡さなければいいだけでは

0598名無しさん＠ピンキー (ﾜｯﾁｮｲ e37a-Cwyj)

2025/10/09(木) 22:04:23.84ID:PdFuwcqf0

deepseekもだがその辺の中華大型llmはローカルで動かしてなんぼであり公式クラウドは使うもんじゃないと思ってる
まあ個人だとまだGLM4.5/4.6をローカルで動かすのは相当敷居高いというのは認める

0599名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f03-MTBo)

2025/10/09(木) 23:18:50.58ID:Q00dkaip0

サードパーティの方も情報管理ガバガバだからその手の情報を扱うならローカルだわな
コスパだけならサードパーティ一択やけど　VCからの資金調達目当てで絶対採算取れてないだろって例も見かけるし

0600名無しさん＠ピンキー (ﾜｯﾁｮｲ 6b32-yk46)

2025/10/10(金) 00:06:47.02ID:gxV9Tzc40

>>575
あれ？
消えてないか？

0601名無しさん＠ピンキー (ﾜｯﾁｮｲ 6b32-yk46)

2025/10/10(金) 00:43:56.17ID:gxV9Tzc40

mradermacher/gpt-oss-120b-i1-GGUF
これって、なんで量子化レベルに関係なくサイズが同じなの？
通常ならiQ3_Mでメモリ64Gにのるんだけど。

0602名無しさん＠ピンキー (ﾜｯﾁｮｲ e3aa-Cwyj)

2025/10/10(金) 03:05:13.80ID:+ntbRNyt0

>>600
多分>>583絡み。逃亡か作り直しかはしらね

0603名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b8b-dFrV)

2025/10/11(土) 09:39:47.99ID:tC9AIs/M0

Samsung、LLMでも日本を軽く追い抜く。小さくて誇らしいニダ！
gigazine.net/news/20251010-tiny-recursion-model-trm/

しかしGrok4はすんごいんだなw

0604名無しさん＠ピンキー (ｼｬﾁｰｸ 0C5f-53s0)

2025/10/11(土) 13:04:53.18ID:/2CAPRWVC

maywell/GLM-4.5-Air-GLM-4.6-Distill
今度は大丈夫かな

0605名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bc6-0y+L)

2025/10/11(土) 13:55:57.33ID:49dXQekx0

個人的には公式4.6Air待ちかなー

0606名無しさん＠ピンキー (ｼｬﾁｰｸ 0C5f-53s0)

2025/10/11(土) 14:42:50.27ID:/2CAPRWVC

前回はggufのみだったけど今回はiQも他が出してくれそうだし繋ぎにはいいかもね

0607名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f5e-KVVk)

2025/10/11(土) 19:47:51.41ID:MXDKct650

>>604
redditで作者が話してるけどアイデアが面白いからやってみたけどあくまで実験モデルで出力壊れるしわざわざダウンロードするもんじゃないってさ

0608名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b34-kTKm)

2025/10/12(日) 15:38:15.09ID:HwiBFGxJ0

久しぶりに来たけど>>8のまとめがありがたいな
個人的には出力遅くてもいいから理解力特化してるのが欲しい

0609名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f32-x06C)

2025/10/12(日) 15:58:44.81ID:CeQ1iJI+0

qwen3 VLのVLってなに

0610名無しさん＠ピンキー (ｼｬﾁｰｸ 0C5f-53s0)

2025/10/12(日) 16:03:47.22ID:ovZ53tamC

マルチモーダルモデルじゃ？

0611名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f32-x06C)

2025/10/12(日) 16:28:30.77ID:CeQ1iJI+0

vision languageだった、失礼

0612名無しさん＠ピンキー (ﾜｯﾁｮｲ cbd4-s4CX)

2025/10/12(日) 19:45:31.16ID:ZHUKu7hn0

Qwen3-Next-80BとかGLM4.6Airとか普通に個人向けで覇権候補になり得るブツの登場が秒読み段階で楽しみな時期と言えば楽しみな時期よね

0613名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd7f-h39Y)

2025/10/13(月) 01:09:21.25ID:kgKIZVzsd

来そうで来ないのがんあーって感じ

0614名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f5c-Kg++)

2025/10/13(月) 16:28:39.28ID:RZwn7dlz0

しかし、80Bとかどういうグラボ使えば動くんやろ…
まさか一般ユーザーでVRAM容量100B超えのグラボを持ってるとか？

0615名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd7f-h39Y)

2025/10/13(月) 16:32:45.80ID:kgKIZVzsd

>>614
メインメモリにオフロードで激遅くん

0616名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f5c-Kg++)

2025/10/13(月) 16:35:56.30ID:RZwn7dlz0

>>615
なるほどサンクス

0617名無しさん＠ピンキー (ﾜｯﾁｮｲ 7b92-xZYU)

2025/10/13(月) 16:43:19.21ID:jFsc8zQj0

個人で中古B100持ってる人いたな
仕事でa100 4つ使った時は超喜んでたなー
deepseek-r1とか軒並み大きな奴をロードできたし

0618名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-PJUV)

2025/10/13(月) 17:36:16.72ID:fvIZP0Tl0

qwen3-nextはどっかの天才がllamacpp対応今頑張ってるから待つんやで

0619名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f32-x06C)

2025/10/13(月) 20:24:52.53ID:ZUzA2xzO0

qwen3nextもglmもMoEだから割とどうにでもなっちゃう
denseモデルをメインメモリ展開してたらまあまあキツいんだけど

0620名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ba9-s4CX)

2025/10/14(火) 05:10:50.01ID:SMX+5n3O0

最近はMoEモデルが増えたせいでGPUもだがメインRAM256GBだの384GB積めるXeonかスリッパが欲しくなる問題。デスクトップRyzenの限界近い192GBでもGLM4.5あたりだとQ3ぐらいまでが限界で

新着レスの表示

レスを投稿する