なんJLLM部避難所 ★10

911コメント354KB

なんJLLM部避難所 ★10

レス数が900を超えています。1000を超えると表示できなくなるよ。

0763名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fc6-SzXM)

2026/01/16(金) 09:18:02.88ID:hP+canZw0

今ってVRAM16GB RAM64GBで動くエロいLLMモデルやとなにがええんや？
ワイの設定のせいやと思うんやがkoboldcppでamaterasuは十数秒に１ワードで使い物にならんかったわ…
BerghofとMistral-Smallしか使ってない感あって持て余し気味や

0764名無しさん＠ピンキー (ﾜｯﾁｮｲ 7236-YDYy)

2026/01/16(金) 09:48:48.60ID:SL230Bd20

amaterasuってどんなやつや？と見たら123Bやん
IQ1Sでも26GBあるし
そらデカすぎてまともに動かんですわ

0765名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr17-SydR)

2026/01/16(金) 10:11:42.86ID:GfBjxY3wr

メモリ64gb積んでんなら行けるじゃん

0766名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a9-KoMk)

2026/01/16(金) 10:46:37.64ID:khTupJvD0

moeじゃないならそんなもんですわ

0767名無しさん＠ピンキー (ﾜｯﾁｮｲ 33a8-UsWw)

2026/01/16(金) 11:05:43.79ID:q1kks11j0

SillyTavernでAratako氏のMistralPrism-24B使ってるわ
日本語力高い

0768名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f32-cVtm)

2026/01/16(金) 11:12:15.10ID:sNseSJJI0

>>763
その構成ならqwen next 80bの規制解除版Q5_k_mがお勧め

0769名無しさん＠ピンキー (ｽﾌﾟﾌﾟ Sd12-UW4l)

2026/01/16(金) 11:42:22.06ID:RzBIoy0Nd

RAM64GBだと、50GBクラスのモデルはctx8192とかにしないと厳しいかもね。

0770名無しさん＠ピンキー (ﾜｯﾁｮｲ ff10-KtG4)

2026/01/16(金) 12:42:42.95ID:OlPZQfK10

DRAM活かすならMoEモデルだから確かにこのへんか
/mradermacher/Qwen3-Next-80B-A3B-Instruct-abliterated-GGUF
30Bは全然エロで出てこなくて画像解説させるためにVLの解除版使っても全然ダメだったんだけど
Next 80Bはエロ自体の学習はしてる感じなんだな
繰り返しペナルティ強めてるせいでどんどん言い換えてくるの面白い

0771名無しさん＠ピンキー (ﾜｯﾁｮｲ 7236-YDYy)

2026/01/16(金) 12:48:45.28ID:SL230Bd20

コンテキスト長を増やすとどんどん性能が落ちるのは最新モデルでも変わらないので小説やロールプレイなどの用途では128K対応モデルだろうと8192推奨みたいやで
用途に合わせて仕方なく12Kやそれ以上にしてねって感じ

0772名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr17-SydR)

2026/01/16(金) 16:39:20.54ID:GfBjxY3wr

エロエロ特化のllmレンタルなら商売になるんでは？

0773名無しさん＠ピンキー (ﾜｯﾁｮｲ f29f-6Z3P)

2026/01/16(金) 16:58:44.58ID:Pt+T5RQ70

テンプレートが特殊っぽいんだけどLM Studioとかでどう動かせばええの？
https://blog.google/innovation-and-ai/technology/developers-tools/translategemma/
https://huggingface.co/google/translategemma-4b-it

0774名無しさん＠ピンキー (ﾜｯﾁｮｲ 07d0-gOcD)

2026/01/16(金) 19:53:46.01ID:0byVmzBK0

macのlm-studioでしか試してないけど

1. モデルをダウンロード
2. フォルダーマークでダウンロードした translategemma-27b-itを探して、右の歯車クリック
3. Loadタブのコンテキスト量はmaxにした(8192では試してない)
4. Prompotタブの上 (Jinja)のところを下に入れ替える(---は無視)

---
{{- bos_token }}
{%- for message in messages %}
{%- if message['role'] == 'system' %}
<start_of_turn>user
{{ message['content'] }}

{%- elif message['role'] == 'user' %}
{{ message['content'] }}<end_of_turn>
<start_of_turn>model
{%- elif message['role'] == 'assistant' %}
{{ message['content'] }}<end_of_turn>
{%- endif %}
{%- endfor %}
---

0775名無しさん＠ピンキー (ﾜｯﾁｮｲ 07d0-gOcD)

2026/01/16(金) 19:54:30.69ID:0byVmzBK0

「システムプロンプト」欄に

---
You are a professional English (en) to Japanese (ja) translator.
Your goal is to accurately convey the meaning and nuances of the original English text while adhering to Japanese grammar, vocabulary, and cultural sensitivities.
Produce only the Japanese translation, without any additional explanations or commentary. Please translate the following English text into Japanese:
---

lm-studio再起動、モデルを指定

あとはチャット欄に英文を入れるだけ。Jinjaのプロンプトで2行空行は必須。

0776名無しさん＠ピンキー (ﾜｯﾁｮｲ 07d0-gOcD)

2026/01/16(金) 19:57:49.41ID:0byVmzBK0

システムプロンプトで何語から何語、(ja)と(en)は
https://ollama.com/library/translategemma
に書いてあった

0777名無しさん＠ピンキー (ﾜｯﾁｮｲ 3e9f-vlRz)

2026/01/16(金) 20:05:48.58ID:ZwE9wbul0

今の俺にはRAM256GBは夢のまた夢だが、RAM256GB積めばGeminiと遜色のない小説文章を出力してくれる？

Geminiは0から生み出すというよりも、元の殴り書きから小説文章を生み出すのに秀でているが、これがローカルLLMでも出来たら強いなあと

0778名無しさん＠ピンキー (ﾜｯﾁｮｲ 07d0-gOcD)

2026/01/16(金) 20:06:58.89ID:0byVmzBK0

512GByteのM3 Ultraでも足りないよ

0779名無しさん＠ピンキー (ﾜｯﾁｮｲ 33d1-KoMk)

2026/01/16(金) 21:03:16.23ID:lHszIG5Q0

今ローカルで使える最強のモデルでもgemini 2.5 flashあたり
今の最新のgemini超えるにはメモリがどうとかって話ではなくて不可能

0780名無しさん＠ピンキー (ﾜｯﾁｮｲ f232-+fC0)

2026/01/16(金) 21:32:12.97ID:cTWCf5y30

あのgrok2さんが500GBぐらいあるからね
まあサイズが性能ではないけど

0781名無しさん＠ピンキー (ﾜｯﾁｮｲ 3e9f-vlRz)

2026/01/16(金) 21:32:43.81ID:ZwE9wbul0

>>779
Gemini2.5fでも魅力的だが、その場合は256GB？

0782名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a9-KoMk)

2026/01/16(金) 22:00:31.51ID:khTupJvD0

GLM4.7を想定して書いたけども
もとにしたベンチマークはおそらくbf16で動いてるやろうから1TBになるやね

Q8ならおそらくそこまで劣化ないやろうからほぼ同等の性能が512GBでおそらくいける
それより下の量子化になるとベンチマークでは数値下がってくると思うやで

0783名無しさん＠ピンキー (ﾜｯﾁｮｲ 662b-uqmN)

2026/01/16(金) 22:28:03.19ID:2veUatO60

ノベルAIがGLM4.6だっけ？ゲミニと比べたらゴミみたいなもんだし厳しいな

0784名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c7-3e1D)

2026/01/16(金) 23:47:46.88ID:1sMiMHPP0

GLM 4.5ならともかく、4.6か4.7ならGemini2.5fは越えてるだろ

0785名無しさん＠ピンキー (ﾜｯﾁｮｲ 9f9f-W5A1)

2026/01/17(土) 00:09:21.60ID:oUrrC5qZ0

>>774-776
おおきに　macOS上LM Studioでちゃんと翻訳できましたわ

0786名無しさん＠ピンキー (ﾜｯﾁｮｲ 936a-viuJ)

2026/01/17(土) 14:28:23.25ID:sdnCrY5o0

2.5てポンコツ

0787名無しさん＠ピンキー (ﾜｯﾁｮｲ d732-LMlG)

2026/01/17(土) 14:36:45.75ID:XKvL+sCA0

2.5fに並んだとき、2.5fの破壊的コスパに敗北する

0788名無しさん＠ピンキー (ﾜｯﾁｮｲ e7a9-J81O)

2026/01/17(土) 15:38:18.15ID:uxXX92cg0

>>761
これ試してみたけどワイの環境で17token/sから20token/sになったわ
いやー実装してる人ら凄いなぁ

0789名無しさん＠ピンキー (ｽｯﾌﾟｰ Sd9f-J81O)

2026/01/17(土) 18:43:32.72ID:pu1J5etdd

koboldcpとSillyTavernでロールプレイやってるんだけど少しガード固めのモデルないかな
今はjapanese textgen moe 2x7b nsfwってやつが一番いい感じなんだけど
ずっと同じだと飽きるんでこれに似た感じのないかな
aratakoのrobinhoodとかMistralPrism-24Bとか使ってみたんだけど
すぐエロモードに入ってあんまり面白くないんだよね
１０G前後の軽いやつで何かいいのないかな

0790名無しさん＠ピンキー (ｼｬﾁｰｸ 0Caf-14Ip)

2026/01/17(土) 19:00:33.64ID:rBUlvB1sC

>>789
お堅いのならqwenとか？

0791名無しさん＠ピンキー (ﾜｯﾁｮｲ bf9f-ryvZ)

2026/01/18(日) 03:15:55.40ID:T+e6cVxF0

>>787
コスパはそうなんだろうけど、クラウドサービスである以上いつでも規制きつくなるしな。GPT5.2はそれで死滅した。

多少お金掛かってもローカルで実現できるならそれに越したことはない

0792名無しさん＠ピンキー (ﾜｯﾁｮｲ 27a0-J81O)

2026/01/18(日) 09:04:04.62ID:eTm5xaVj0

何だかんだでチャッピーのエロ解禁はまだまだ伸びそうだな
Grok先生を叩くとは許せん

0793名無しさん＠ピンキー (ﾜｯﾁｮｲ 27a0-J81O)

2026/01/18(日) 09:05:59.40ID:eTm5xaVj0

チャッピーってエロ抜きの美しい文章を書くことしか、他のLLMに勝ってないな

基本、Geminiの方が全体的にすごい、エロならGrok、エクセルとかで便利なコパイロット

0794名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b20-P3xf)

2026/01/18(日) 09:25:40.01ID:d2YVkyCp0

copilotの中身はchatgptだよ

0795名無しさん＠ピンキー (ﾜｯﾁｮｲ 27a0-J81O)

2026/01/18(日) 09:29:29.45ID:eTm5xaVj0

コパイロットは推論の性能というより利便性の向上を目指してるだけだからな

0796名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b20-P3xf)

2026/01/18(日) 10:21:33.09ID:d2YVkyCp0

別にそんなことは...有料版使うのが当たり前で無料版はお試しなのはどのLLMも同じことですし
むしろ無料版の比較では上のほうでは

0797名無しさん＠ピンキー (ﾜｯﾁｮｲ 4711-99SI)

2026/01/18(日) 22:11:31.23ID:2LCQnkgH0

Qwen3-Thinkingは日本語で思考させると"Wait," ループに入らず割と快適になった

0798名無しさん＠ピンキー (ﾜｯﾁｮｲ c35b-/IBL)

2026/01/19(月) 01:16:22.59ID:r6HfMQ9p0

半年ぐらい前にQwen-235B-A22B-Instruct-2507の性能に度肝を抜かれた以来なんですが
今アツいモデルあったら教えて欲しいです
環境はVRAM24GB、DRAM96GB
LMStudio愛用のローカルLLM初心者です

0799名無しさん＠ピンキー (ﾜｯﾁｮｲ 936a-viuJ)

2026/01/19(月) 08:31:32.04ID:NDOT6mQm0

てめえ、初心者気取った熟練工だろ

0800名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f51-dguo)

2026/01/19(月) 08:59:33.02ID:3P/PaWcb0

こういうのでいいんだよこういうので
って感じになれるポテンシャルを感じる
追加学習が簡単そうだし
https://youtu.be//2u_EfhEktgQ

0801名無しさん＠ピンキー (ﾜｯﾁｮｲ df88-mrDK)

2026/01/20(火) 05:17:18.48ID:hwv83Gyg0

GLM 4.7 Flashが来た
30B-A3Bらしい

0802名無しさん＠ピンキー (ﾜｯﾁｮｲ afed-LSnI)

2026/01/20(火) 09:46:53.73ID:VGL27InD0

A3Bかあ

0803名無しさん＠ピンキー (ｵｯﾍﾟｹ Srdf-viuJ)

2026/01/20(火) 12:54:03.23ID:JCxxLgksr

a3bはちょっと

0804名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sdff-ZW+/)

2026/01/20(火) 13:15:15.42ID:itG3HspEd

Qwen235bのNextはよ

0805名無しさん＠ピンキー (ﾜｯﾁｮｲ ebde-E63g)

2026/01/20(火) 13:49:38.52ID:9XX8C9sG0

https://x.com/modelscope2022/status/2013213019690639431
SLM路線やとこういうのがおもろそう

0806名無しさん＠ピンキー (ﾜｯﾁｮｲ e7a9-0bv4)

2026/01/20(火) 14:02:03.80ID:GvRoLOjd0

glm4.7flashはqwen3-30b-a3bとgpt-oss-20bに対して全領域で明確に上回っとるのか
後発だから当たり前ではあるんやけどこのサイズじゃこの2つが今まで長い間幅利かせとったから
ようやくいい感じの次世代がでてきたという感じやな

0807名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f6f-wcR0)

2026/01/20(火) 18:17:06.07ID:d0bUcAYK0

だがしかしGLM系は日本語が不安だ

0808名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b45-z33+)

2026/01/22(木) 04:35:28.71ID:6p3S/hpS0

novelAIの小説補助UIがわけわからん作りしてるから評価不能なんよな
あれを使いこなせる人って作った開発者くらいじゃないのか

0809名無しさん＠ピンキー (ﾜｯﾁｮｲ bbd7-bPP2)

2026/01/22(木) 21:49:08.56ID:9DiKRE2t0

俺の知ってる霧島じゃない

0810名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f24-eZjg)

2026/01/23(金) 02:09:51.50ID:8g1gaaJy0

AIにエロ画像作らせるのは簡単なのにエロ小説書かせるのが難しいのってなんでなんだろうな
エロ創作特化のモデルってなんかあったっけ

0811名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdff-ZW+/)

2026/01/23(金) 02:17:27.15ID:rnyeZIXQd

>>810
Stable Diffusionがガバガバだっただけで他のモデルでエロ画像を作らせるのは難しいぞ

0812名無しさん＠ピンキー (ﾜｯﾁｮｲ 63ac-40sh)

2026/01/23(金) 04:37:10.10ID:gdTzh9j+0

画像精製もLLMもデカいクリトリスだっつてんのに、すぐにチンチンにしてしまうのは一緒やで

0813名無しさん＠ピンキー (ﾜｯﾁｮｲ b732-J81O)

2026/01/23(金) 05:51:52.16ID:D1QePr6y0

簡単と言ってもDeepDreamからSDリリースまで7年くらいかかってるぞ

画像生成は世界中で研究・開発されるのが大きいんだろうな
LLMは言語人口の影響があるからマイナー言語は難しい
あと、小規模で高性能で日本語もできる夢のモデルを誰も開発できてないから
既成モデルのエロチューニングもあまり期待できない

0814名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b20-P3xf)

2026/01/23(金) 06:06:19.42ID:dVjxH80P0

日本語の壁がなければだいぶ違うんじゃないの

0815名無しさん＠ピンキー (ｵｯﾍﾟｹ Srdf-viuJ)

2026/01/23(金) 09:39:32.37ID:F9WixtPnr

>>812
合ってるよな🤔

0816名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-qkVW)

2026/01/23(金) 14:47:57.25ID:zfc5xOk30

エロ画像モデルは言語関係無しに世界中の人が楽しめるけど
エロLLMは言語が合ってないと一切楽しめない

今は音声付きエロ動画が始まってきているからLLMみたいに言語の壁にぶつかるようになるだろうな

0817名無しさん＠ピンキー (ﾜｯﾁｮｲ f395-N8e8)

2026/01/23(金) 20:51:19.68ID:wq1/7kmF0

画像は多少破綻しててもエロけりゃ気にならんけど文字になると少々の破綻でも気になるからな

0818名無しさん＠ピンキー (ﾜｯﾁｮｲ 0ae9-CeJs)

2026/01/24(土) 13:10:17.52ID:mzXn1zQO0

画像も1枚物ならまだ見れるけど
連続物とか一本の漫画なんて破綻するからな
文章も同じで短いチャットはできても小説を破綻なく生成させようとしたら計算量が跳ね上がるってことよ

0819名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ea0-jbA7)

2026/01/24(土) 17:50:32.03ID:+ePlvj4x0

SDもだいぶ分かって来たから、動画始めてみるかな

0820名無しさん＠ピンキー (ｵｯﾍﾟｹ Sra3-x9BH)

2026/01/26(月) 10:46:57.82ID:uETGBTBIr

clawdbot、コレローカルLLMにローカルPCを好きに使わせるための物だよね
驚き屋はClaude Codeと接続してリモートでバイブコーディングが！とかキャラを付与できる！とか言い続けてて意味不明だったけど...
ローカルLLMを輝かせるものだというなら海外での盛り上がりも理解可能に思える

Discord経由なら英日翻訳Botを噛ませて英語で扱うことも楽にできるし、面白いことが出来そうだね

0821名無しさん＠ピンキー (ｵｯﾍﾟｹ Sra3-a+7q)

2026/01/26(月) 11:54:04.34ID:W2El03lKr

翻訳くらいならllmでできそうだけど

0822名無しさん＠ピンキー (ﾜｯﾁｮｲ 23cd-x9BH)

2026/01/26(月) 14:09:27.48ID:35fg7qjN0

画像を認識させてその内容に合ったセリフ等を生成するにはどうしたらいいでしょうか？

0823名無しさん＠ピンキー (ﾜｯﾁｮｲ 87d3-NPBA)

2026/01/26(月) 22:39:15.11ID:+cVsP7eh0

glmの画像モデルが今huggingfaceのトレンドに上がっとる
2週間ぐらい前に公開されてたみたいやが知らんかったな
画像内のテキスト描写に特に力入れてるみたいやな
普通の内容の描写はベンチマークでzimageに負けとるな

0824名無しさん＠ピンキー (ﾜｯﾁｮｲ eb32-jbA7)

2026/01/26(月) 23:29:01.25ID:moysdEcv0

kobold.cppをスマートアプリコントロールが阻止するようになったんだが、
オフにしたらwin11を再インストールするまでオンにならんとか脅迫めいたこと書いてあるし、どうすっぺ

0825名無しさん＠ピンキー (ﾜｯﾁｮｲ dedb-oVBd)

2026/01/26(月) 23:35:40.82ID:XJHdRM450

>>822
VLM使うか、キャプション生成してLLMに投げる

0826名無しさん＠ピンキー (ﾜｯﾁｮｲ 637b-Qkxx)

2026/01/27(火) 19:01:29.43ID:Jxr1JElV0

ltx-2にエロ動画作成指示のプロンプトの生成支援をさせたいんだがお勧めのモデルとなるとやっぱglm系やろか？一応ローカルかnanogpt経由で4.6は動かせる。geminiには申し訳された

0827名無しさん＠ピンキー (ﾜｯﾁｮｲ 46ed-CeJs)

2026/01/28(水) 18:30:37.43ID:4FTfQaE60

プロンプト作成ぐらいならqwen3 nextとかGLM4.6Airでも十分じゃないか
どっちも規制緩めだし
それでも通らなければabliterated使えば良い
GLM4.6はプロンプト作成で使うにはオーバーな気がする

0828名無しさん＠ピンキー (ﾜｯﾁｮｲ 87bf-nPWr)

2026/01/28(水) 22:03:08.33ID:NCDTP21x0

GLM4.6Vだな
画像認識特化してるらしいし、プロンプト作成にはもってこいじゃないかな

0829名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdaa-wXhp)

2026/01/28(水) 22:27:58.46ID:nNxR1ybUd

中華AIは脱獄のガードは緩いがエロ系の画像やテキストを学習していないから用途が限られるんやないか
大型MoEモデルが主流になってからエロチューンもほとんど出ていないし
FTで何らかの突破口が必要やな

0830名無しさん＠ピンキー (ﾜｯﾁｮｲ 1af9-vRJ4)

2026/01/28(水) 23:17:54.70ID:dZqq5VyI0

架空の男の娘人格作れてちゃんと会話が成り立つモデルある？

0831名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a9a-v5Ab)

2026/01/29(木) 06:43:33.98ID:pDXz5Kxh0

つい最近lumimaid-magnum-v4-12bを使い始めたんだけど
エロ目的だと結構規制されるけどそんなもんですか？詳しい人がいたら教えて欲しい
イラっとしたからheretic化して使ってます

0832名無しさん＠ピンキー (ﾜｯﾁｮｲ 6a11-jq1a)

2026/01/29(木) 08:54:49.67ID:Xo7Hmt2N0

k2.5かなりいいな
脱獄も簡単だしコンテキストの保持性も悪くない

0833名無しさん＠ピンキー (ﾜｯﾁｮｲ d332-nnWO)

2026/01/29(木) 10:10:31.10ID:vouCeCWf0

>>831
全く申し訳されないよ
プロンプトが悪いんじゃない？

0834名無しさん＠ピンキー (ﾜｯﾁｮｲ af6b-qxTp)

2026/01/29(木) 11:16:51.02ID:y80AVPBn0

k2.5をローカルで動かすにはどれくらいのスペックが必要なんや？

0835名無しさん＠ピンキー (ｼｬﾁｰｸ 0C8f-AlTQ)

2026/01/29(木) 11:56:27.24ID:LHsf3L4/C

macしか無理
Q1じゃ話にならんし

0836名無しさん＠ピンキー (ｽｯﾌﾟ Sdaa-Qkxx)

2026/01/29(木) 12:27:45.00ID:iilnWksjd

>>831
フロントエンド何つこてる？
lm studioとkoboldcppで使った経験あるがあれで申し訳された経験はないな。おそらくシステムプロンプトに問題があるとは思うが

0837名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-jbA7)

2026/01/29(木) 12:42:25.66ID:0vQW0f4i0

kimi k2はパラメータ数が1Tだからある程度妥協してQ4、KVキャッシュも含めたら768GBくらいはいる
劣化させたくないならQ8+KVキャッシュで1.5GBくらい、
フルならbf16+kvキャッシュで3TBくらいいるんとちゃう

0838名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-jbA7)

2026/01/29(木) 12:54:20.47ID:0vQW0f4i0

今思うとgpt-oss-120bって公式でmxfp4で配ってて
当時であの精度出してるのは結構すごいことだったんだな

他の同等モデルたちがフルサイズでベンチマークかけられてるのに対して
gpt-ossは4bitで戦ってたわけだから
4bitってなんだかんだ言って結構劣化するもんなぁ

0839名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a9a-v5Ab)

2026/01/29(木) 13:01:52.60ID:pDXz5Kxh0

>>833, 836
返信ありがとう
みんなシステムプロンプトで回避してる感じなのかな
フロントエンドでollama使ったときとpythonで直にAPI叩いたとき両方でたまに申し訳された感じだった
heretic化前はRefusalsが96/100だったから不通に検閲されてるモデルなんだと思うけど

0840名無しさん＠ピンキー (ﾜｯﾁｮｲ af6b-qxTp)

2026/01/29(木) 14:02:53.73ID:y80AVPBn0

k2.5 unslothの1.8bit版ならVRAM24GBと256GBメモリで10 token/sで動くらしい
メモリ256GBなら個人でも持ってる人居そうやな…

0841名無しさん＠ピンキー (ｼｬﾁｰｸ 0C8f-AlTQ)

2026/01/29(木) 14:19:43.91ID:LHsf3L4/C

>>840
精度どれくらいなんやろ

0842名無しさん＠ピンキー (ﾜｯﾁｮｲ af6b-qxTp)

2026/01/29(木) 14:34:11.74ID:y80AVPBn0

1.8bitやし性能はお察しやろうな…
エロに限定すれば使い物になるのかも？

0843名無しさん＠ピンキー (ﾜｯﾁｮｲ 87dc-v5Ab)

2026/01/29(木) 19:27:13.51ID:l5XAHaNA0

俺様スペックで
LM Studio-lumimaid-magnum-v4-12bはエロ最強だ
最近のがっかり
Mistral Small 3.2 24B Instruct 2506
zai-org/glm-4.6v-flash

0844名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a97-oVBd)

2026/01/29(木) 19:50:46.41ID:o+r7QE+h0

そろそろQwen3-VL-235Bより頭良くてエロいけるのが欲しい

0845名無しさん＠ピンキー (ﾜｯﾁｮｲ 07c6-Vxuf)

2026/01/29(木) 23:18:06.05ID:yut66++a0

うへぇSillyTavernのRSS拡張機能がなんか動かない...
config.yamlからenableCorsProxyをtrueにして関数呼び出しはできているけどRSSフィードの取得に失敗する...
動かせている人居る？

0846名無しさん＠ピンキー (ﾜｯﾁｮｲ 07c6-Vxuf)

2026/01/29(木) 23:44:32.09ID:yut66++a0

>>845
自己レス
拡張機能の「RSS Feeds」欄にスラッシュコマンド入れるというアホなことしてた
スレ汚しごめんね

0847名無しさん＠ピンキー (ﾜｯﾁｮｲ 63bb-3cVS)

2026/01/30(金) 19:11:00.64ID:NGSm1Ywt0

macos 26から分散コンピューティグがネイティブでサポートされたのでM4 max studioとmacbookで実行動画
Kimi-K2.5(mlx 4.2bit)が24tk/s。
WiFiで分散接続してるっていってるけどほんとかね。まぁTB5で接続すればいいんだけど
www.youtube.com/watch?v=JM41u7emnwo

0848名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-jbA7)

2026/01/30(金) 19:17:19.79ID:ZDV1ao0i0

qwenの開発者がこんなポストをしてた
https://x.com/JustinLin610/status/2012533831837143204

少しペースを落としてより良くしていくんだってさ
qwen3-nextの後すぐに3.5出て来なかったのはこういうことだからってことなんだろうか

0849名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdaa-wXhp)

2026/01/30(金) 19:27:51.14ID:4OY8IwTZd

中共のオープンソース戦略が変わってきたのかもな
技術を誇示してアメリカを威嚇する戦略からAPI販売競争に移行しつつある
中華AI企業が上場して収益性を厳しく求められる時代にもなっている

0850名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-jbA7)

2026/01/30(金) 19:36:20.72ID:ZDV1ao0i0

今年上期はgemma4に期待かなぁ
いつものペースなら春ごろに出てきそうだけど
でもgoogleはgemmaにもう力入れないってニュースも流れてた気もするし
ローカル勢にはなかなか厳しい時期に入りつつある

0851名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-jWaa)

2026/01/30(金) 20:57:42.21ID:SxTUn3yB0

馬鹿みたいに金かかるのにほとんど金にならないだろうからしゃーないね

0852名無しさん＠ピンキー (ﾜｯﾁｮｲ bbf5-LD1Y)

2026/01/30(金) 21:08:22.00ID:+PNM7aCU0

後追い企業が名を上げるためにやる以外に理由が無いな

0853名無しさん＠ピンキー (ﾜｯﾁｮｲ df95-Hg0o)

2026/01/31(土) 06:15:32.05ID:JZJHxu+i0

もうオープンの主役はGLMとkimiとqwenになってるよね
Deepseekどこいった

0854名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b6f-b8R2)

2026/01/31(土) 06:32:09.41ID:L1B/Qr8L0

研究成果は出てるみたいやけどもう会社として名前は売れたから大型モデルを手間暇かけてオープンにする気無いんやないの
出自からして金融分野で活用して稼ぐ方に注力してそう

0855名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b16-kbss)

2026/01/31(土) 07:11:37.42ID:DYNBKvgb0

言うて3.2で話題になったばっかやん
他社が月一ペースで出してるのがおかしいんであって

0856名無しさん＠ピンキー (ﾜｯﾁｮｲ eb6a-BtEX)

2026/01/31(土) 08:19:58.00ID:xVt2pF820

日本勢はどこって感じ？

0857名無しさん＠ピンキー (ﾜｯﾁｮｲ db32-f8u6)

2026/01/31(土) 09:06:27.01ID:nh9giU6J0

qepの1bit量子化がちょっと話題になったけどそれを活用したって話を一向に聞かない
誰か活用してんのか？

0858名無しさん＠ピンキー (ﾜｯﾁｮｲ ab23-Nwr2)

2026/01/31(土) 09:56:21.70ID:s7b6J1TO0

>>856
日本勢「ちょっと待っていま税金にたかってるから！」

0859名無しさん＠ピンキー (ﾜｯﾁｮｲ df04-NM1G)

2026/01/31(土) 11:36:46.84ID:sUhplHVZ0

そんなこと言ったら中国勢はほぼ税金でやってるようなもんなんじゃね

0860名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-AEO2)

2026/01/31(土) 12:25:33.15ID:PAeJ+0Uf0

日本初のモデルも結構あるんだけどオープンにされてないから話題になってないのよ
まぁ正直オープンにしないのが普通よね

0861名無しさん＠ピンキー (ﾜｯﾁｮｲ df95-Hg0o)

2026/01/31(土) 12:57:28.07ID:JZJHxu+i0

>>860
性能が劣ってるのにクローズだとマジで無価値だからな
中国のモデルだって安くてオープンだから価値があるのであってクローズだと使う理由が無くなる

0862名無しさん＠ピンキー (ﾜｯﾁｮｲ ab23-Nwr2)

2026/01/31(土) 15:42:22.19ID:s7b6J1TO0

>>859
分かってて言ってそうだけど
税金でやる、税金にたかるは全然違うぞ

0863名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdff-SQv3)

2026/01/31(土) 16:53:51.17ID:lN16RlbMd

日本でまともなLLMを一般公開してるのってサイバーくらいしかないよな
誰も弄っていない時点で性能はお察しだが

0864名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdff-SQv3)

2026/01/31(土) 16:55:27.78ID:lN16RlbMd

税金でLLM開発して非公開とかジャップ丸出しで行政訴訟レベル

0865名無しさん＠ピンキー (ﾜｯﾁｮｲ df07-qX8b)

2026/01/31(土) 16:57:21.33ID:EgSxtC9O0

公開したら「安心の国産AI」に金を払う法人顧客を騙せなくなるかんね

0866名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b25-11y8)

2026/01/31(土) 22:14:07.33ID:XOpNnLvY0

一応楽天の700Bが公開予定でしょ。
予定だけど。

0867名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fb0-C5bb)

2026/02/01(日) 00:16:34.13ID:Y/D28NS20

富岳で13Bのしょぼいオープンモデル作ってやった感出したりしてたし

0868名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-NP2q)

2026/02/01(日) 00:25:42.19ID:gSMnA8I30

そもそも公開する意味がないから日本じゃどこもめったに公開しなかったし
しゃーないから国で国産LLM推進することになったんでしょ
正直今まで米中で公開されまくってきたのが異常だった
ぶっちゃけ米露の宇宙開発に近かったと思うわ

まぁ、性能はアメリカのクローズモデルがトップに君臨してて
それに対して中国はクローズで出しても勝てないからオープンで出して
「オープンでトップ」という称号を得るのが中国のどの会社も目的やったんやろうけど

0869名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b25-11y8)

2026/02/01(日) 00:29:21.07ID:JumqWz8x0

国策でやる分には先行モデルから少しでもユーザーを削れれば良いしな

0870名無しさん＠ピンキー (ﾜｯﾁｮｲ eb6a-BtEX)

2026/02/01(日) 05:37:46.19ID:7UuRReIh0

公開する意味がない=公開する価値が無い、でしょ

国内でバカを騙しててください

0871名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fef-NM1G)

2026/02/01(日) 08:06:20.60ID:z+B5g3LE0

>>862
どう違うの？

0872名無しさん＠ピンキー (ﾜｯﾁｮｲ ab52-ajNy)

2026/02/01(日) 09:27:48.81ID:x5x/WAHw0

LMStudioアップデートしたら挙動おかしくなった
UI上でチャット消せないし、新しいチャット始められないし
いちいちLMStudioを落とすしかない

同じ症状の人いる?

0873名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f75-NMmM)

2026/02/01(日) 10:57:47.84ID:ON0iumKM0

同じ症状かはわからないけど挙動おかしかったからLM-Studio-0.3.36-1に戻した

0874名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fed-ZjVX)

2026/02/01(日) 23:56:02.29ID:xrY6qwFk0

下手に性能高いの出すと訴えられかねんから中国製ってことにしてたりして

0875名無しさん＠ピンキー (ﾜｯﾁｮｲ ab0a-cD51)

2026/02/02(月) 00:07:29.18ID:1csY2Tqf0

LM Studio
モデル選択やシステムプロンプト周りのレイアウトが変わって
少し手間取ってるが挙動は問題なし。

0876名無しさん＠ピンキー (ﾜｯﾁｮｲ 9f19-/xL0)

2026/02/02(月) 00:27:10.00ID:uMmqovfM0

ボイスAI初心者なんやがエロ目的でセリフ読み上げするタイプなら何がいい？

0877名無しさん＠ピンキー (ﾜｯﾁｮｲ df67-NMmM)

2026/02/02(月) 11:31:49.90ID:EpqMNTAO0

>>876
SillyTavernで使うなら
Style-bert-vits2
GPT-so-vits
重いけど
llasa
T5gemma
という選択肢もある
最近出たのだとQwen-TTS

0878名無しさん＠ピンキー (ﾜｯﾁｮｲ ab3d-e83P)

2026/02/02(月) 15:07:12.61ID:vFKz9urv0

StepFun Flash 3.5が196B-A11Bで良さそうやけど試した奴おる？
Benchmaxingだねって反応は英語で見かけたんやけど
https://i.imgur.com/pRMz5rO.jpeg

0879名無しさん＠ピンキー (ﾜｯﾁｮｲ df2a-Hg0o)

2026/02/02(月) 18:18:46.79ID:fYNbaQ4O0

>>878
試したけどGLMやKimiに勝ってるとは思えない

0880名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc7-u4sr)

2026/02/02(月) 19:09:12.65ID:GA1qNUKw0

Ubuntuの方がAI向きだと聞いて、少し前にStable Diffussionセットアップしたけど24時間掛かって恐ろしく苦労した
LLMも気になってるけど、5090+Ubuntu 24.04.3LTSで簡単にセットアップできる？
今後も色々苦労しそうならWindowsOSを買ってシステムを作り直そうか悩んでる

0881名無しさん＠ピンキー (ﾜｯﾁｮｲ 2b20-/wWk)

2026/02/02(月) 19:42:44.15ID:5sa1QYkN0

Windowsは購入してなくてもセットアップできる
ライセンス確認が飛んでくるまで試してそれから考えればいいのでは

0882名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc7-u4sr)

2026/02/02(月) 20:49:03.31ID:GA1qNUKw0

BIOS設定とかもLinux用にしてるし、そもそもデュアルブートはトラブルに成ると効くし、今の環境を壊すのも嫌で悩んでるのもある
WinからUbuntuに移行した人とかどんな感じか気になる

0883名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b72-hfT9)

2026/02/02(月) 20:51:17.11ID:R4TlyFJp0

WSL2も検討してみては？

0884名無しさん＠ピンキー (ﾜｯﾁｮｲ df32-RLLN)

2026/02/02(月) 21:04:23.76ID:UZnVZEwJ0

llm環境のが簡単かな多分

0885名無しさん＠ピンキー (ﾜｯﾁｮｲ df2a-Hg0o)

2026/02/02(月) 21:30:34.34ID:fYNbaQ4O0

Ubuntuは簡単だと思うけど
難しいかどうかは使う人の知識次第だよね

0886名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f8a-/xL0)

2026/02/02(月) 21:38:39.61ID:ffBLUpQ40

>>877
サンクス
Qwen3-TTSって追加でnsfw用モデルとか用意する必要ある？

0887名無しさん＠ピンキー (JP 0Hff-y0B9)

2026/02/02(月) 21:41:49.11ID:zDr+25qFH

>>885
簡単ならセットアップ手順教えてあげなよ

0888名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b53-IZR7)

2026/02/02(月) 22:31:41.87ID:XW6tN0uu0

>>880
ubuntu24はpythonが3.12なのでちょっと苦労するくらいかな
StableDiffusionがセットアップできたならその知識でLLMいけるよ
GUIならLM Studioをまず使ってみよう
感触つかんだらollamaとかcli系とか
WSL2はWindowsの人の最後の手段だからやめとき

0889名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b53-IZR7)

2026/02/02(月) 22:43:18.16ID:XW6tN0uu0

Windows環境からlinux追加はほぼ大丈夫なんだけど
linux環境からWinだとブートを遠慮なく踏み潰されるからgrub入れ直しで泣く
デュアルブートはドライブを物理的に分ければトラブルは出づらい

0890名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdff-SQv3)

2026/02/02(月) 23:06:45.36ID:54AHJYWUd

LinuxのことはLLMが得意だからLLMに聞くといい
昔とは比較にならないほど捗る
無難なディストロはUbuntu

0891名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f36-u4sr)

2026/02/03(火) 23:26:17.50ID:pgA4kPrW0

UbuntuだろうがWSL2だろうが、Dockerコンテナ使えばStableDiffusionでもLLMでも簡単にセットアップできるよ

0892名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f5b-n9Ri)

2026/02/04(水) 00:53:56.71ID:PKgUjGGy0

wslだと使えるメモリが上限が減るんじゃないの？
easyXXXに頼るんじゃなければ最初からubuntuの方が良さそうな気が

0893名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa7-ZjVX)

2026/02/04(水) 11:23:03.85ID:9D1xogOB0

winのpythonじゃだめなんか
unixのコマンドも動かしたいってなるとwslなんだろけど

0894名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc7-jy+j)

2026/02/04(水) 11:44:05.16ID:jiY/mTxV0

今はほとんどの場合、winのpytonでも問題ないよな

0895名無しさん＠ピンキー (ﾜｯﾁｮｲ 9bc2-Atb3)

2026/02/04(水) 12:18:38.35ID:8M8xfW4T0

llm用途ならwindowsでもほぼ問題ないな。
画像やら音声関連だと周辺ライブラリで問題出ることは若干ある。
windowsで困りがちなのはむしろ最新をnightlyとかからビルドしようとかそういう時に開発ライブラリなんかで困る時なんかや

0896名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa0-NP2q)

2026/02/04(水) 12:24:00.02ID:/c50etVB0

問題はCUDAが機能するかだけ

0897名無しさん＠ピンキー (ﾜｯﾁｮｲ 9bc2-Atb3)

2026/02/04(水) 12:25:02.15ID:8M8xfW4T0

>>887
curl -fsSL https://ollama.com/install.sh | sh

必要なツールが入ってればollamaで良ければこれで優勝

0898名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f32-zgxa)

2026/02/04(水) 12:32:54.88ID:yuT/vXtl0

……その必要なツールとやらを全部集めて正しく入れるのが難しいんじゃねえかな

0899名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-NP2q)

2026/02/04(水) 12:33:00.85ID:IwSbmfsL0

cudaに関してはwindowsが楽なのよな
windowsではcuda周りでエラーが起きた記憶がない

だからwindowsのドライバ(cuda)を直接見れてwinバイナリも動くlinux環境という
wslがllmでは実は結構いいって言う

まぁwslは何か変な状況に陥った時のトラブルシューティングが面倒だけど

0900名無しさん＠ピンキー (ｵｯﾍﾟｹ Srbf-BtEX)

2026/02/04(水) 13:26:26.49ID:TL0hICLSr

（´･∀･`）ﾍｰ

0901名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa0-NP2q)

2026/02/04(水) 20:21:52.43ID:/c50etVB0

この数年でwindowsバッチとpythonとgradioに詳しくなったわ

0902名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f79-es1C)

2026/02/05(木) 01:45:03.34ID:pGEZPg3B0

vram48gbの改造4090が手元にあるんだけど、ちょうどこのサイズ感で収まるエロチャできるLLMってありますかね？

0903名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b07-IZR7)

2026/02/05(木) 02:57:18.85ID:O6c3U/7D0

そんな奴が何人もいると思うか?

0904名無しさん＠ピンキー (ﾜｯﾁｮｲ df33-JcfA)

2026/02/05(木) 03:08:12.52ID:73MzgwsW0

48GBって帯に短し感あるよな
100B以上だとQ4じゃ入り切らないしベストサイズの70Bクラスはほとんどない
おとなしく24BのエロチューンをQ8で使うのがええよ

0905名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc7-u4sr)

2026/02/05(木) 04:10:58.96ID:Pqc9yNQ/0

Ubuntuのpython、バージョン新しいな、3.10に入れ替えたほうが良いんやろか？
とりあえず、あまり何も考えず気軽にPCを使いたい

あととりあえずStable DiffussionやKohyaのセットアップだけど
Geminiに聞かず、Stability Matrixみたいなソフトも使わず
公式サイトの手順でセットアップして、エラー出たらGeminiに聞くというのが一番効率良さそう
一番やっちゃダメなのがはじめからGeminiに聞く事
これしたらバージョンのおかしなものばかり進められてすげー手こずった
諦めて公式情報でやったらあっさりセットアップできて拍子抜けした

色々セットアップ中だけど、Windowsと同じくらい簡単でソフトも充実したとか聞いたけどまだまだなのかね？
AIの為というのもあるけど、Windowsに嫌気がしてるというのもある
広告まみれなOSになってるし、アップデートで内部の設定が変わって自作スクリプトがご動作したり、UIが変わって戸惑ったり
Windowsに振り回されるのが嫌になってUbuntuにチャレンジしてるってのもある
WinXPのUIが忘れられず、X11+Cinammon(LinuxMintの外観だけ？)にして色々触ってる所

デュアルブートだけど、5090ではセキュアブートOFFの方がトラブルが出にくいらいらしくWindowsとUbuntuの併用は面倒そう

色々アドバイス書いてくれた人ありがとう！！
システムのバックアップ取りながら色々試してみるわ

0906名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b07-IZR7)

2026/02/05(木) 05:54:15.00ID:O6c3U/7D0

venv ubuntsu24 あとからpython3.10　でググるなりAIに聞くのだ
元の3.12はシステムで使ってるから消してはならぬ

0907名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa0-NP2q)

2026/02/05(木) 06:03:48.45ID:StPuVbOL0

基本仮想環境を作ってやる

0908名無しさん＠ピンキー (ﾜｯﾁｮｲ 2b20-/wWk)

2026/02/05(木) 06:54:04.53ID:VYFVfYSV0

SDインストールするのにニンゲンがver確認して...みたいな話がずっと続くのがlinuxなので全面移行はだいぶ人を選ぶよ
wsl方式はめんどくさいところはスルー出来るのが楽

0909名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fc6-EF4B)

2026/02/05(木) 22:48:51.82ID:J8+yjDdh0

mint使ってからゲーム用にcachyos移行したけどAI含めてなんも困ってない
windowsのが楽っていうのは学習資産があるからで
完全新規はコンパネと設定に分散してめちゃくちゃになってるwindowsなんて意味不明だろうな
テレメトリ切ろうと思ったらprivacy.sexyみたいなの使うしかないし

0910名無しさん＠ピンキー (ﾜｯﾁｮｲ 2b20-/wWk)

2026/02/05(木) 23:46:15.28ID:VYFVfYSV0

両方あればめんどくさいところを回避できるって話だよ

0911名無しさん＠ピンキー (ﾜｯﾁｮｲ 2b11-hfT9)

2026/02/06(金) 04:18:25.16ID:dTe/0uYA0

Qwen3-VL-235Bのhereticが最近上がってたから試した
mmprojは共通だけどNSFWの理解は断然こっちのほうがいいな

新着レスの表示

レスを投稿する

レス数が900を超えています。1000を超えると表示できなくなるよ。