なんJLLM部避難所 ★9

トップページ⇒オナテク(仮)＠bbspink掲示板

647コメント220KB

なんJLLM部避難所 ★9

0628名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-CQ64)

2025/10/14(火) 13:33:23.33ID:oIeb68Aq0

JNVAスレで聞いてきたらええよ
多分そもそもタグあるだろうし、なかったとして、出すための方法はおそらくもう確立してる
慣れるとすごい楽よdanbooruタグ

0629名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fdf-1ZYa)

2025/10/14(火) 16:21:57.48ID:WxprrGhe0

因数分解みたいな要領で出せるのも結構あるよね
だいしゅきホールド = hug + leg cross + missionary

0630名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd7f-h39Y)

2025/10/14(火) 17:52:22.89ID:7eCBt9jkd

danbooru語への翻訳をLLMにやらせればいい
danbooru語の辞書はネットに転がってるからRAGで食わせればいい

0631名無しさん＠ピンキー (ﾜｯﾁｮｲ 1b32-PJUV)

2025/10/14(火) 19:36:35.52ID:/nYGiacK0

kobold.cppで、overridetensorsを有効にしようとして
koboldcpp\koboldcpp.exe --overridetensors --gpulayers 24
で起動させたら落ちるんだけど、やり方間違ってる？
メモリ64G VRAM12G

0632名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ba9-s4CX)

2025/10/14(火) 19:37:40.91ID:SMX+5n3O0

>>622
DDR5 64GBになると割高過ぎてXeon買った方が良くね？になっちゃうからなあ。

0633名無しさん＠ピンキー (ﾜｯﾁｮｲ dbca-KVVk)

2025/10/14(火) 21:10:35.56ID:uJMWXNZI0

>>631
システムメモリフォールバックなしを優先にしてないよね？
それやって落ちた経験あらあるやり方をAIに聞いた方が早そう

0634名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fc7-UC4l)

2025/10/15(水) 05:18:34.98ID:AK5+3i4t0

>>632
確かにそうだよな
DDR4も2倍近く上がったわ

192GBでGLM4.6の動かんのだっけ？

0635名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f27-oOwG)

2025/10/15(水) 10:41:05.99ID:es2b6e2F0

なんか最新のLLMモデル軽くなった？
gpt-oss:120bで久々にローカルLLM入れたけど
5-6token/secが昔のllama:120bとかは限界だったのに

gpt-ossだと普通に思考4-5秒で20~token/secで出力されるし精度がgptと変わらんやん
Mac StudioM1Ultraの128GB環境だけどモデル側でこんな変わるんかって感じ

0636名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f32-x06C)

2025/10/15(水) 10:53:15.39ID:QsNWszVk0

うん

0637名無しさん＠ピンキー (ﾜｯﾁｮｲ 1b32-53s0)

2025/10/15(水) 10:54:30.62ID:UyKbVRRh0

そういやgpt-oss:120bのggufって何であんなにデカいん？
メモリ64Gに乗らないやん

0638名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f04-iD00)

2025/10/15(水) 11:26:18.43ID:WXX2Ugeo0

チャッピー12月にエロ解禁らしい

0639名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fe9-eRny)

2025/10/15(水) 11:54:02.19ID:JZDrNw2x0

ChatGPT、成人向けコンテンツを12月に解禁へ
https://japan.cnet.com/article/35239194/

ほんまか知らんけど

0640名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-CQ64)

2025/10/15(水) 11:57:20.58ID:nO9EZyoQ0

>>635
gpt-oss-120bはアクティブ5bだから
moeの仕組みは前からあるけど最近はそれが主流になりつつある

0641名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-CQ64)

2025/10/15(水) 12:06:36.78ID:nO9EZyoQ0

ここ最近このスレでmoeのことをわかってない人が急に増えた気がするんやが外でこのスレ紹介されたりしたんやろか
llamacppがcpumoe実装してからモデルがmoeかどうかは個人でLLM動かす人には超重要事項になっとるで

0642名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f32-x06C)

2025/10/15(水) 12:33:02.59ID:QsNWszVk0

必要なスペックも書かずにglm4.6で個人がここまでのai使える！みたいなの言ってる記事は伸びてたな…

0643名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f27-oOwG)

2025/10/15(水) 12:55:14.54ID:es2b6e2F0

>>640
なるほどなー
magnum v4 123bでシコってた頃から随分進化したもんや
gpt-oss abiliteratedがかなり期待外れだったからmagnumとかの生成早くなってるやつがあったらかなり良さそう

0644名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b7c-s4CX)

2025/10/15(水) 12:57:15.70ID:NIWsAMFT0

lammacppのrocm対応が進んで今だとQwen3-coder-30BならradeonでもRX7900XTXなら80tok/sぐらい出るようになったし、MoEの成熟も進んで春先あたりの頃の常識がだいぶ変わったよな

0645名無しさん＠ピンキー (ﾜｯﾁｮｲ 5ffb-xebt)

2025/10/15(水) 13:16:34.80ID:c2WDOR3F0

俺が一番シコれる文章を生成してくれるのは
QuantFactory/Berghof-NSFW-7B-GGUF
だけなんだよな
他のモデルは文章こそ滑らかかも知れんけどチンポにズドンとくる文章じゃなくて惜しい

0646名無しさん＠ピンキー (ﾜｯﾁｮｲ db71-CQ64)

2025/10/15(水) 13:39:44.20ID:bySYBhM10

chatgptがエロ解禁だってさ

0647名無しさん＠ピンキー (ﾜｯﾁｮｲ cb22-Z99m)

2025/10/15(水) 13:50:43.68ID:NCAaGl2s0

最近grokが申し訳する

新着レスの表示

レスを投稿する