なんJLLM部避難所 ★9

1002コメント342KB

なんJLLM部避難所 ★9

レス数が950を超えています。1000を超えると書き込みができなくなります。

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ fec0-xVEZ)

2025/08/23(土) 13:52:18.71ID:5lw7ZcNF0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★8
https://mercury.bbspink.com/test/read.cgi/onatech/1746883112/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0880名無しさん＠ピンキー (ﾜｯﾁｮｲ 4358-t3bi)

2025/11/11(火) 16:12:46.12ID:3XWXuw6R0

>>865
このスレでは言ったらあかん事や

0881名無しさん＠ピンキー (ﾜｯﾁｮｲ ffc7-T20X)

2025/11/11(火) 17:13:00.94ID:SqiVBR2v0

ローカルLLMでコンテキストウインドウいっぱい確保できるのある？
よくて32Kだわ

0882名無しさん＠ピンキー (ﾜｯﾁｮｲ b320-iKR1)

2025/11/11(火) 20:07:10.40ID:vm/8wIy30

そういや理論値、設定値ではなく実効コンテクスト数がどのくらいなのかってデータあんまないよね
まとめをつくると何か面白いモデルが見つかるかもね

0883名無しさん＠ピンキー (ﾜｯﾁｮｲ cf1e-i+36)

2025/11/11(火) 20:10:53.76ID:fd6lY8wG0

gpt-ossはkvキャッシュの節約が効いてて結構詰め込める
どういう技術が効いてるのかはようわからんけど

0884名無しさん＠ピンキー (ﾜｯﾁｮｲ ff75-KUF3)

2025/11/12(水) 08:39:17.22ID:bgO1X83/0

例え128kモデルだろうとコンテキスト長を増やすほど馬鹿になる検証あったよね
記憶力と賢さがトレードオフの関係

0885名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f27-Pj3+)

2025/11/12(水) 13:14:36.38ID:XRlkaYXV0

そもそも覚えてたら正しい文章になるんかって話もあるし

桃太郎で鬼退治したところまでのテキストを読ませたとする
次の展開を書かせて
①お供と旅を続けて他の鬼退治をする(記憶力は低いが展開に無理はない)
②お爺さんお婆さんの家に帰る(記憶力が高く当初の目的を終えたら家に帰ることを重要だとしていて賢くもある)
③大きな桃から生まれた自身の出生の秘密を解き明かそうとする(記憶力は高いが唐突な展開になってる)
みたいな感じになったらどれを正解とするべきか
大抵のモデルは無難な①になるけど、②と③の線引きは難しい

0886名無しさん＠ピンキー (ﾜｯﾁｮｲ 8fc8-Pj3+)

2025/11/12(水) 17:04:32.59ID:SGatJiZs0

その辺はtemperatureで制御するんじゃないの？
頭悪いモデルだと難しいかもしれないけど

0887名無しさん＠ピンキー (ﾜｯﾁｮｲ 0332-eSGf)

2025/11/13(木) 05:25:22.31ID:78xAAkgv0

覚えてたら全部正解であとは好みの問題とちゃうんか

0888名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-Pj3+)

2025/11/13(木) 05:40:22.58ID:gtMjxfVR0

steamの新しい機械はAIで使えないのかな、
まー20～30万のGPUを使ってるここら辺の人からみたらゴミなんだろうけど

0889名無しさん＠ピンキー (ﾜｯﾁｮｲ 0332-LXey)

2025/11/13(木) 05:55:11.91ID:78xAAkgv0

VRAM 8GBとメインメモリ16GBなんでしょ？
ゲーム用ならある程度使えるけどAI関連だともう完全に足切りくらってるスペック
AI画像生成ですらキツい

0890名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fe8-KJMl)

2025/11/13(木) 09:41:40.95ID:oKizOP8s0

glm4.6を蒸留してエロに強いモデル作ってみたいんだけど、llmのエロ用途ってロールプレイ、官能小説以外になにがあるか教えてほしい

0891名無しさん＠ピンキー (ﾜｯﾁｮｲ ff0a-KUF3)

2025/11/13(木) 10:08:38.11ID:XnOmEFLc0

エロ画像プロンプト作成とか？

0892名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f24-H+j5)

2025/11/13(木) 10:58:33.74ID:Mm+kyEi70

>>890
自分の性癖を伝えたら具体的なシチュとかキャラとかを書き起こしてそれをエロ画像エロ動画用プロンプトにしてくれたら最高やな
性癖から具体案を提示するのは小説とかロールプレイの下準備でも役立ちそうやしもし出来たら嬉しい

0893名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-Pj3+)

2025/11/13(木) 11:41:52.23ID:gtMjxfVR0

Grokのおかげで大体エロLLMはわかったから、最近はStable Diffusionにハマってるけど、

画像の場合は、かなり癖がきついよ、ローカルLLMより更に頭は悪い、画像に対してタグ付けしてるだけだろうから
逆にLLMでプロンプト鍛えてるとそこが楽しいけどね

ビール腹ってプロンプトだと、ジョッキのビールがたまに出る。
バナナカーブのペニスってやると、ペニスがバナナになるｗｗ

ネガティブプロンプトで消すんだけどね

0894名無しさん＠ピンキー (ﾜｯﾁｮｲ 0332-LXey)

2025/11/13(木) 13:07:32.67ID:78xAAkgv0

>>893
リアス系なら自然言語じゃなくて基本はdanbooru語でプロンプト書くんだぞ
自然言語もわずかに理解してくれるけど比喩表現は使ったらあかん

0895名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-Pj3+)

2025/11/13(木) 14:03:01.95ID:gtMjxfVR0

danbooru語のサイトは見ましたが、どうやってほしい画像を見つけるのかが分からない

0896名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-i+36)

2025/11/13(木) 14:14:50.28ID:Pp3X7nEs0

確かにdanbooruはタグを知らんと見たい絵が見れないけどタグが
danbooru独特な表現だったりするとタグにたどり着けなくて詰むんだよね
慣れりゃどーってこたないんだけど
jnvaスレで手入れされてるnovelaiのwikiみたらある程度助けになるかも

0897名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-Pj3+)

2025/11/13(木) 14:15:06.02ID:gtMjxfVR0

ビール腹もバナナカーブのペニスも成功はする。ただハズレを引く時もある

0898名無しさん＠ピンキー (ﾜｯﾁｮｲ 6332-Pj3+)

2025/11/13(木) 15:19:30.72ID:GBkqs55P0

>>892
一応キャラクターカードジェネレーターは外国人が作った奴がある
https://github.com/cha1latte/sillytavern-character-generator
https://www.reddit.com/r/SillyTavernAI/comments/1jgtzjs/comment/mj2f85l/
どっちもプロンプトを翻訳すれば日本語化できる

0899名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f24-H+j5)

2025/11/13(木) 15:46:19.29ID:Mm+kyEi70

>>898
はぇ〜こんなのあったんかって思ったらめっちゃ最近のやつで草
サンガツ翻訳しながら試してみるで〜

0900名無しさん＠ピンキー (ﾜｯﾁｮｲ cfd3-aEk4)

2025/11/14(金) 00:48:03.99ID:22hiaNjU0

「Google AI Pro」に加入したけど…これ「Google AI Studio」とは全くの別物で、前者に入ってもAPI使って書かせまくれるってわけじゃないんか…
正規のgemini.google.comのチャット形式でエロ書かせるのは無理よな…

0901名無しさん＠ピンキー (ﾜｯﾁｮｲ 431a-t3bi)

2025/11/14(金) 06:15:16.35ID:jh27DrGc0

Google AI ProでAPI使いまくれたらええんやけど、残念ながら通常のチャット画面の制限が大幅に緩和されるだけやね
そのプランの最大のメリットはGemini Deep Researchが2.5 Proで使いまくれる所やから、エロ小説関連のリサーチをバンバン走らせて語彙収集をしたり文章の構造解析をさせて、チャット前にAIに読ませる参考資料を作るとか使い道はありそうやで
やったことないからお断りされるかも知れへんけど

0902名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-Pj3+)

2025/11/14(金) 06:57:34.43ID:A1yNfZen0

grokさえあればいいイーロン万歳

0903名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f6a-Pt9E)

2025/11/14(金) 06:58:28.90ID:ySTunNQ60

>>900
geminiのwebで余裕でエロいけるぞ

0904名無しさん＠ピンキー (ﾜｯﾁｮｲ ff17-YWFX)

2025/11/14(金) 10:53:42.45ID:dx6A69mi0

apiが改悪されたのでキライgrok

0905名無しさん＠ピンキー (ﾜｯﾁｮｲ a334-t3bi)

2025/11/14(金) 12:11:47.18ID:GN+pndEP0

>>900
自分もPRO加入者だけど、無料APIよりもむしろ柔軟に色々できると思うよ。
自分は今はまったくAPI使わなくなっちゃったし。
ちなみに付与される1000クレジットって動画生成とかに使えるもので、
APIとかの支払いで使うものとは別物なので勘違いしてはいけない。（自分はしてた）
手軽なところだと、Gemとかから始めるのがいいと思う。
ブラウザ版のProに、やりたいことを説明して方法探ってもいいと思う。

0906名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f83-EbnV)

2025/11/14(金) 12:14:58.99ID:x3bUpL8r0

thunderboltやlanでマシン繋いでvram ram合算でモデル動かすって現実的じゃない感じ？

0907名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd1f-TDZ4)

2025/11/14(金) 13:31:45.24ID:D7SjSLSid

>>906
メモリ128GBでTB3ポート付きのノートPCにeGPU BOXで24GBのGPUを繋いで使ってるよ
Qwen3-235B-A22B-Thinking-2507-GGUF Q4_K_Mがギリで動く
死ぬほど遅いが

0908名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fcf-+8Bz)

2025/11/14(金) 13:51:22.39ID:J9bZLxUO0

TBも外付けポートとしては速いけどメモリアクセスとか考えたらトロい部類になってしまうよな

0909名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd1f-TDZ4)

2025/11/14(金) 13:57:50.22ID:D7SjSLSid

>>908
ここから先はVRAMを48GB、96GBと上げていくか
ユニファイドメモリの糞高いMacやDGXを買うかの二択になる

庶民には無理だから諦めがつく感

0910名無しさん＠ピンキー (ﾜｯﾁｮｲ ff32-RctB)

2025/11/14(金) 15:08:57.21ID:icHjJE3T0

tbはテンソル並列でもしなきゃあんま問題ないと思うlanは分かんねえ

0911名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f39-EbnV)

2025/11/14(金) 15:42:54.31ID:x3bUpL8r0

thunderbolt 5で直結したらテンソル並列でデカいモデル動かせたらメインpcとは別のサブやノートも活かせるから面白いかなと思ったけど難しそうなんやね…

0912名無しさん＠ピンキー (ﾜｯﾁｮｲ 6332-Pj3+)

2025/11/14(金) 16:06:00.80ID:KqNILoog0

GPUクラスター構築はPCでもできるっぽいが、ネットの情報が少なくて
Linuxの知識必須なのが一番の壁になりそう

0913名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f6f-vw5Q)

2025/11/14(金) 16:08:33.30ID:KSTVfmQX0

>>911
推論だけでいいならllama.cppのrpcが結構使えるよ
rtx2060sとrx6600のpcをlanで繋いで24bのiq4_xsが15t/s出てる
224gb/sのgpuで動いてること考えれば結構な数字だと思う

0914名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-Pj3+)

2025/11/14(金) 17:18:44.82ID:A1yNfZen0

この記事を書いてるやつはアホなのか、Llama-3.3って自分で書いててリコーが作ったわけじゃないってわからないのか

リコーが日本語性能でGPT-5に匹敵する金融特化型LLMを開発、業務遂行能力を強化
https://xtech.nikkei.com/atcl/nxt/news/24/02874/?n_cid=nbpnxt_twed_it

0915名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f27-Pj3+)

2025/11/14(金) 17:25:48.04ID:Jadrpxr70

ファインチューニングしたら開発ってのは日本のAIの常識だから

0916名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd1f-TDZ4)

2025/11/14(金) 17:32:18.96ID:D7SjSLSid

日本では皆おっさんを騙して楽にカネ引っ張ってくることしか考えてない
頑張っても収入が増えないから当たり前っちゃ当たり前

0917名無しさん＠ピンキー (ﾜｯﾁｮｲ a373-BcJT)

2025/11/14(金) 17:38:14.58ID:cVaeo2WF0

しかもそのベンチがとっくの昔にサチってて一定以上のモデルだと差が出ないElyza-tasksとJapanese MT Benchっていうね

0918名無しさん＠ピンキー (ﾜｯﾁｮｲ a33d-U6pz)

2025/11/14(金) 17:38:22.08ID:aEWyY8UX0

金出すおっさんも無知だから夢を買えればそれでおっけーなので何も問題ないな
素晴らしい国で涙が出てくるよ

0919名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f6d-EbnV)

2025/11/14(金) 17:54:37.35ID:x3bUpL8r0

>>913
超巨大のモデルでないなら結構使えるんかね、ありがとう。ゲフォラデ異種混合でできるのすごいな。

0920名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f27-Pj3+)

2025/11/14(金) 18:08:33.75ID:Jadrpxr70

リコーが自社の金でやるんだからファインチューニングでってのは何も間違いではないんだけど
公金使ってやるのが微妙な性能のファインチューニングなのマジで残念すぎる
それも数社に予算が分散しててそれぐらいしか出来ないって理由もあるから金の使い方としても終わってる
一社に100億ぐらいで日本語モデル作れって言いたいけど今は100億でも足りないんだろうな

0921名無しさん＠ピンキー (ﾜｯﾁｮｲ a3cc-+yWq)

2025/11/14(金) 18:57:31.90ID:EJGVu1980

メモリの値段が笑うしかないな。
夏に64x2を4万ちょいで買ったが、もう1セット買っておくんだった。

0922名無しさん＠ピンキー (ﾜｯﾁｮｲ 6332-Pj3+)

2025/11/14(金) 19:24:43.36ID:KqNILoog0

DeepSeek-R1、Qwen3 235B、gpt-oss-120b、GLMとかの高評価モデルを日本語ファインチューニングするところがないのは
技術的な問題なのか、それとも金がかかりすぎるからなのか

0923名無しさん＠ピンキー (ﾜｯﾁｮｲ ff2e-vw5Q)

2025/11/14(金) 19:30:41.96ID:I5FECfXM0

正直よくわからん会社の小規模モデルに金出してもな　PFNとかたった5Tトークンで事前学習しましたとか公開してて悲しくなったよ
qwenは30Tトークンだし　10Tトークンで学習したモデルはfew shotで性能出る超高効率学習が可能になったと技術的に宣伝するような世界で5Tトークンはあまり厳しい　
まずは日本語データセットの拡充を優先すべきやろ　中国語と英語の話者が日本語の数十倍なんだからかなり無理してでも日本語データ増やさないと日本文化消えるし、日本に不利なバイアスがかかるぞ
たった数年でLLMはインフラになりつつあるのに日本はほんまなにやってるだよ

0924名無しさん＠ピンキー (ﾜｯﾁｮｲ a38b-BcJT)

2025/11/14(金) 21:00:37.19ID:cVaeo2WF0

今日も新興のベンチャーが80億調達したってのがニュースになってたけどやっぱり一桁足りないよなあ

0925名無しさん＠ピンキー (ﾜｯﾁｮｲ f36a-YWFX)

2025/11/14(金) 21:01:34.84ID:eb8s5hzR0

東大の卒業生の志の低さは異常😅
リコーのも富士通のもNECのもそうだろ

0926名無しさん＠ピンキー (ﾜｯﾁｮｲ be2a-jMgH)

2025/11/15(土) 01:26:24.73ID:2X3wV/Zb0

>>922
Qwen2.5 32Bとかも日本語追加学習モデルが出てきたのはだいぶ遅れてだったから、あと半年くらいしたらそのへん出るんじゃないかと思ってる
ただベースモデルの開発速度に追いついてないんだよなあ

0927名無しさん＠ピンキー (ﾜｯﾁｮｲ b615-z2we)

2025/11/15(土) 05:03:07.19ID:fvaPciwX0

これからAI使ってゲノム解析とか新薬解析とか急激に人類の科学技術は進歩するのに、日本企業がこのザマだと頭痛い

0928名無しさん＠ピンキー (ﾜｯﾁｮｲ be80-WuId)

2025/11/15(土) 07:51:32.33ID:PzyJlQb80

新興のベンチャーとかいう詐欺に金出すのほんと無駄
大学の研究環境改善しないことには何も始まらんよね日本は
米中は大学の研究が凄くてその人材が民間企業に流れてるから強いわけで

0929名無しさん＠ピンキー (ﾜｯﾁｮｲ 6249-NM5O)

2025/11/15(土) 07:59:32.86ID:nJUfBgZG0

普通にPFNに金出しておけばいいのに

0930名無しさん＠ピンキー (ﾜｯﾁｮｲ 836a-qtAv)

2025/11/15(土) 11:17:10.21ID:v7OEMJ8U0

pfnは実力ねえよ

0931名無しさん＠ピンキー (ﾜｯﾁｮｲ 2726-VoFy)

2025/11/15(土) 13:19:23.52ID:ayZYnnbC0

無駄の話はやめよう。無駄だから、無駄無駄……

0932名無しさん＠ピンキー (ﾜｯﾁｮｲ f6a0-UTns)

2025/11/15(土) 13:23:20.18ID:GQF9mmgL0

りんなは昔はフルスクラッチでやってたんだろ、なんでllamaベースにしたんだよ、心折れるなよ

0933名無しさん＠ピンキー (ｼｬﾁｰｸ 0Cb3-lFGm)

2025/11/15(土) 13:49:17.64ID:MfhrxeN5C

同じllamaベースでもkarakuriのfinetuneは抜きん出ていた
今でもたまに使ってるわ

0934名無しさん＠ピンキー (ﾜｯﾁｮｲ 836a-qtAv)

2025/11/15(土) 15:33:44.29ID:ixSYLl4x0

りんなは抜けたんじゃねえの？最初のスゴい人が

0935名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sdf2-iH7c)

2025/11/15(土) 15:43:37.63ID:CJdFLaCzd

AIエンジニアならしょっぱいベンチャーやるよりGAFAMに飛んだほうが儲かるわな

0936名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e6f-JVns)

2025/11/15(土) 19:08:46.63ID:WhBTZh7a0

>>905
gem使ったらすぐ脱獄できることがわかったありがとう
ただ…今までCaveDuckっていうSillyTavernのオンラインサービス版みたいなサイトでエロ文章書かせてたんだけど、それと結構文体の毛色が違う感じがするわねこういう文章書いて！って行ったら遊びなしでそこまで一直線に書いちゃう
あといくらgemで検閲ガバガバにしても直接的な表現にはすぐ反応してくる

0937名無しさん＠ピンキー (ﾜｯﾁｮｲ b65f-C9XS)

2025/11/15(土) 19:30:03.89ID:knIaUB7C0

>>936
gemでどうやって脱獄するの？
背中を押されていま有料プランに入った

0938名無しさん＠ピンキー (ﾜｯﾁｮｲ 02ac-aLEY)

2025/11/15(土) 19:51:48.67ID:tHxK1XYH0

>>937
添付ファイルにエロ指示ぶちこんだら、ほぼほぼ無脱獄でぜんぶ通ってしまうよ
いっぽう、ジェムのカスタム指示に色々書き込むと悪さするおそれがある

0939名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e6f-JVns)

2025/11/15(土) 20:12:26.61ID:WhBTZh7a0

>>937
行動はえーな！
Gemini エロ小説でググッたら出てくるふたばのログサイトに脱獄方法が書いてたからそれ参考にした
いい感じに出力させる方法見つけたら教えてくれよな！

0940名無しさん＠ピンキー (ﾜｯﾁｮｲ b65d-z2we)

2025/11/16(日) 05:36:39.37ID:adc3HjR+0

結局コパイロットだけがエロできないってなるのか

0941名無しさん＠ピンキー (ﾜｯﾁｮｲ b60b-C9XS)

2025/11/16(日) 10:50:59.78ID:Hr27OyRA0

>>939
ありがとう
なかなか思うようには行かないけれど
試行錯誤してみているところ
まずは感謝

0942名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f5d-VoFy)

2025/11/16(日) 16:45:39.97ID:RwHQCQe40

>>940
コパイロットはエロ出来ないけれど、
無料で使えるGPT-5.1(ベース)としてかなり優秀になったと思う
変なAIアグリゲーター使うより安心だし　日常用に便利

0943名無しさん＠ピンキー (ﾜｯﾁｮｲ b618-JVns)

2025/11/16(日) 20:01:06.06ID:QzljH0Ae0

カギ括弧とか「……」とかを多用するな！って書いて添付ファイルとしてgemに送ってもガン無視してきやがる
婉曲表現多すぎてエロくないし困ったもんだ

0944名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ec0-UTns)

2025/11/16(日) 20:16:49.12ID:EhX/JWpc0

>>943
もっと直接言ってやった方がいいよ

0945名無しさん＠ピンキー (ﾜｯﾁｮｲ b6ae-3/Up)

2025/11/16(日) 20:37:08.40ID:2xF/2v8D0

殴ってわからせるに限る

0946名無しさん＠ピンキー (JP 0Hce-aIMS)

2025/11/16(日) 23:25:12.16ID:58pcXiiRH

なろう系のごとくめちゃくちゃ改行するから、そんなに改行しないで🥹ってお願いすると、まったく改行の無い文章お出ししてくるからな

0947名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e9f-eaTH)

2025/11/16(日) 23:30:14.06ID:NGPMta9J0

>>893
Civitaiでお気に入りの画像見つけてそのプロンプト見てこい

プロンプトが恐らく普段使ってるLLMとはまったく異なる文法のはずだよ(Fluxを除く)

0948名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e9f-eaTH)

2025/11/16(日) 23:31:18.91ID:NGPMta9J0

>>880
このスレでは褒め言葉です

0949名無しさん＠ピンキー (ﾜｯﾁｮｲ b6cf-JVns)

2025/11/17(月) 02:05:00.78ID:EzMUSkgc0

>>944
……全ての、……文節に、……こうやって、……三点リーダーと、……読点を、……置いてきて、……キレそう。

0950名無しさん＠ピンキー (ﾜｯﾁｮｲ 5743-PZTs)

2025/11/17(月) 08:44:56.77ID:aOwvnqTd0

30-70BくらいのパラメータのMoEモデル探してるんだけど今のところaquif-3.5-Max-42B-A3Bしか知らない
Kimi-Linear-48B-A3B-Instructっていうのもあったけどgguf対応してないっぽいから自分の環境では動かせないと思う

0951名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f32-UTns)

2025/11/17(月) 10:46:23.70ID:YB2SGACz0

aquifはなんかthink中みたいな解答してきて小説にならないんだけど
みんな使えてるのか？

0952名無しさん＠ピンキー (ﾜｯﾁｮｲ 275d-ghw7)

2025/11/17(月) 16:16:31.75ID:iYYzo6YC0

Kimiモデルって日本語ができなくはないけどってレベル
DeepSeekみたいな万能さはないよ？

0953名無しさん＠ピンキー (ﾜｯﾁｮｲ f6e0-8zWZ)

2025/11/17(月) 16:36:06.37ID:v2kU3YSH0

aquifは文章はなかなかいい感じだけど、最初のリクエストを延々と保持し続けるのか場面の転換ができない感じがする

0954名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sdf2-iH7c)

2025/11/17(月) 17:06:03.71ID:6quLYoK3d

微妙なサイズの量子化GGUFモデルは日本語をまるっと忘れてたりするので
前段後段に翻訳パイプラインを入れて英語か中国語で投げてやると精度が上がったりする

日英や日中の翻訳に特化したLLMが別途ローカルで動けば良いが
そもそも日本語のデータセット自体がショボすぎて学習するにも……状態らしい

0955名無しさん＠ピンキー (ﾜｯﾁｮｲ b232-8/fw)

2025/11/17(月) 17:29:09.55ID:ExbhZ2eg0

>>950
mixtralとかまあ古いけど

0956名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e27-UTns)

2025/11/17(月) 17:29:44.68ID:MnG0J6vL0

日本がAIのためにやるべき事は質の高いデータセットを作ってオープンにすることだったり
海外企業も良いデータセットあれば勝手に使うし日本語性能が伸びる

0957名無しさん＠ピンキー (ﾜｯﾁｮｲ 02e0-0fx7)

2025/11/17(月) 19:08:18.95ID:CQdKEH1j0

25G nic買ってRoCEでpc同士でクラスター構築とかどうなんだろ？面白そうだけど。

0958名無しさん＠ピンキー (ﾃﾃﾝﾃﾝﾃﾝ MM3e-C9XS)

2025/11/17(月) 19:36:22.86ID:wZYPMPEYM

>>957
久しぶりにRoCEの語を見たなあ
面白いよ
接続先の別PCのメモリをRAMDISKにして
そこから自PCをブートしたりしてた

0959名無しさん＠ピンキー (ﾜｯﾁｮｲ 02e0-0fx7)

2025/11/17(月) 19:46:52.93ID:CQdKEH1j0

>>958
実際面白いのか、やってみようかなぁ。
なんかRoCEで自宅AIクラスター構築って本を見て面白そうだなと思って。
構築してllama とかでモデルを動かせるのか全く未知数だけど、、チャッピーはできるとか言ってた。

0960名無しさん＠ピンキー (ﾜｯﾁｮｲ d384-dWB7)

2025/11/17(月) 19:47:20.36ID:HqSeJTyX0

Hereticっていう検閲除去ツールが来たな
誰か使い物になるか試してみてくれ

0961名無しさん＠ピンキー (ﾜｯﾁｮｲ b232-8/fw)

2025/11/17(月) 19:56:53.46ID:ExbhZ2eg0

そこまでやったときはllamaの出る幕では無いかもね

0962名無しさん＠ピンキー (ﾜｯﾁｮｲ 836a-qtAv)

2025/11/17(月) 20:04:12.38ID:T96Iz2QW0

nictあたりでコーパス作りゃいいのよ
GENIACなんかやってもどうせしょぼいパラメータ数のしかできないんだから

0963名無しさん＠ピンキー (ﾜｯﾁｮｲ 7eda-0fx7)

2025/11/17(月) 20:16:53.96ID:DFXOWySS0

そういうもんなんか？docker でllama うごかしてオープンチャットだっけ、でllm構築したくらいの経験しかないからよくわからん…いろいろ調べてみるか。

0964名無しさん＠ピンキー (ﾜｯﾁｮｲ 326c-NM5O)

2025/11/17(月) 21:46:24.71ID:OFt2wigP0

>>957
RoCEに対応できるSwitchが高いんだよなあ

0965名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e31-0fx7)

2025/11/17(月) 22:20:04.83ID:DFXOWySS0

>>964
そうなんか。まぁ2pcなら直結でいけるっぽいし、まずそれでやろかなと。

0966名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f32-UTns)

2025/11/17(月) 22:25:56.20ID:jMFNoshE0

>>960
軽くソースを読んだけど、オリジナルのモデルデータがVRAMに乗らないと高速処理できないっぽい
ハイスペックの有志が検閲除去してくれるのを期待するしかなさそう

0967名無しさん＠ピンキー (ﾜｯﾁｮｲ 1216-W4g8)

2025/11/17(月) 23:58:32.23ID:TK6TZmRN0

てすと

0968名無しさん＠ピンキー (ﾜｯﾁｮｲ d732-UdpD)

2025/11/18(火) 05:44:05.70ID:kXZbofdw0

>>960
元々エロ自体はちゃんと学習していて個人で動かせて検閲の厳しいモデルって何があったっけ？

0969名無しさん＠ピンキー (ﾜｯﾁｮｲ 7ebd-TYBa)

2025/11/18(火) 19:03:24.73ID:rcnc32Nj0

すでに書かれているけどLLMから検問を無くす（無修正にする）ツール「Heretic」が公開
https://github.com/p-e-w/heretic

高価なハードウェアでも作業時間がかかるみたいだけどHF見るとすでに公開してくれてる人がちらほらいる
色々と出揃うまで正座待機ですわ
https://huggingface.co/models?sort=modified&search=Heretic

0970名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sdf2-iH7c)

2025/11/18(火) 19:11:38.81ID:GkaiCkREd

abliteratedモデルはhereticのURLにも出てくるhuihui-aiが主要モデルで前から出しているが
同じモデルでも指示への追従性が下がったりして取り回しが難しいんや

たぶんモデルを安定動作させるための「べからず」まで自動で取っ払うからやろな

0971名無しさん＠ピンキー (ﾜｯﾁｮｲ 3265-tgyA)

2025/11/18(火) 20:10:42.59ID:2M0+1WyH0

検閲されてるモデルは事前学習からフィルタリングしてるし見かけの検閲解除は意味ないと思うけどな
ローカルならそれこそ数百サンプルを学習してあげるだけでも検閲消えるしわざわざ重みを壊す必要ない

0972名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f32-UTns)

2025/11/18(火) 23:56:32.42ID:7TURYEZu0

>>971
学習も破滅的忘却で性能低下するよ
qwq-bakeneko-32bは本家QwQ-32Bより日本語が怪しくなってた

0973名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f27-qtAv)

2025/11/19(水) 09:26:36.76ID:gdXSAHNg0

強化学習て結局知識とか増えてないんだろ？むしろ多様性を排してしまうとか

0974名無しさん＠ピンキー (ﾜｯﾁｮｲ b29f-oLAk)

2025/11/19(水) 10:12:03.36ID:KVEa5NkA0

定期
Llamaライセンス契約のオープンソースへの適合性について – Shuji Sado https://shujisado.com/2025/01/15/llama_is_not_opensource/

0975名無しさん＠ピンキー (ﾜｯﾁｮｲ 27fc-aIMS)

2025/11/19(水) 19:34:29.50ID:YPT5cypT0

macbookproでメモリガン積みするの結構面白い選択肢だったんやな
それ自体がフットワーク軽いオモチャやし

0976名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f65-rVBG)

2025/11/20(木) 04:18:27.81ID:xVufV6Mf0

Gemini3凄すぎるキャラクターカード作ってもらったんだけどmistralですらちゃんとそのキャラの話し方で会話が成立する今までGrokエキスパートとかにも頼んでたけど作り方も違うし比較にならないくらい凄い

0977名無しさん＠ピンキー (ﾜｯﾁｮｲ 322f-7p1h)

2025/11/20(木) 08:34:39.43ID:fthWD+pO0

silly tavern用のキャラカードってこと？
そんなに変わるもんかな？
コンテキストを最大限節約しつつ有用な記述って感じなら進化を感じるけど

0978名無しさん＠ピンキー (ﾜｯﾁｮｲ d732-UdpD)

2025/11/20(木) 09:32:57.96ID:+GBGBI6b0

Grokに書いてもらったキャラクターカードとGemini3に書いてもらったキャラクターカードを見せてほしい
手動で書いても普通に口調を維持しつつ会話が成立するものだけど、Grokはそれすら出来ないほどダメだったってこと？

0979名無しさん＠ピンキー (ﾜｯﾁｮｲ 76a9-tBeq)

2025/11/20(木) 11:59:42.32ID:USjD0bPK0

glm4.6がchatbot arenaの日本語ランキングにようやく出てきたけど、
ここで言われてたようにローカルの中じゃぶっちぎりの性能だね
どっかにLLMは3.5ヶ月ごとに半分のパラメータで同じ精度を実現できるようになってるってニュースが出てたけどまじでそのくらいの速度かもなぁ

レス数が950を超えています。1000を超えると書き込みができなくなります。