なんJLLM部避難所 ★8

1002コメント348KB

なんJLLM部避難所 ★8

レス数が950を超えています。1000を超えると書き込みができなくなります。

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ f3c0-9L8h)

2025/05/10(土) 22:18:32.02ID:0Ak3eO5y0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★7
https://mercury.bbspink.com/test/read.cgi/onatech/1742709485/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0884名無しさん＠ピンキー (ﾜｯﾁｮｲ 1a4d-4DuO)

2025/08/10(日) 12:35:08.32ID:vFsbfI8C0

>>883
あの辺のプロ驚き屋は知ってても一時的に記憶消して驚くよ

0885名無しさん＠ピンキー (ﾜｯﾁｮｲ 6a20-frTr)

2025/08/10(日) 12:35:58.60ID:tfFBIIxx0

草
そういうことか

0886名無しさん＠ピンキー (ﾜｯﾁｮｲ 8689-UJOR)

2025/08/10(日) 13:24:20.63ID:8mwZvHlt0

業務でqwenやdeepseek使うのは通せる気がしないけど、
gpt ossなら通せるのが大きい
mistral とかでもいいんだろうけど知らなそうだし、
国産はゴミ

0887名無しさん＠ピンキー (ｼｬﾁｰｸ 0C0f-Li0S)

2025/08/10(日) 14:06:53.06ID:FaY3c7/fC

国産最強はkarakuri70b v0.1だったな
以後のkarakuriはパッとしなかったが

0888名無しさん＠ピンキー (ﾜｯﾁｮｲ 4627-Zgb9)

2025/08/10(日) 17:45:19.54ID:aD0O+FMy0

LlamaやMistralのモデルをファインチューニングした物を国産って言うの辞めてもらえないかね
プレスリリースでも元の学習に使ったモデルを書かないのは卑怯だし、そういう手口が日本のLLMを貶めてる
明らかに産地偽装なのにそれで金集めるのって詐欺だろ

0889名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ab1-4DuO)

2025/08/10(日) 18:17:41.40ID:uYRAl+oV0

基盤モデルの研究開発ってNTTとNIIくらいしかやってないし商業でまともに戦えるプロダクトにしようとすると数百億円はかかるからどこもやれないんだよな

0890名無しさん＠ピンキー (ﾜｯﾁｮｲ 4627-Zgb9)

2025/08/10(日) 19:44:28.59ID:aD0O+FMy0

それ考えるとAIのべりすとはようやっとるわ

0891名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ea0-Zgb9)

2025/08/10(日) 20:10:16.54ID:zDEvnY630

りんなというゴミ

0892名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f6a-8ChC)

2025/08/11(月) 08:16:31.26ID:gQiia+Rc0

>>888
日本のモデル全部それだろ😅
pfnは違うけど弱いし

0893名無しさん＠ピンキー (ﾜｯﾁｮｲ ff0f-McTy)

2025/08/11(月) 09:57:16.18ID:An8qWVN40

個人勢ののべっちが一番商業的に成功してる国産LLMの時点でね
何なら小説の自然な続きを書く性能だけならトップまであるし

0894名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ed9-zlfW)

2025/08/11(月) 11:26:11.30ID:dUWw5kCt0

国産フルスクラッチだとなんやかんやサイバーのcalm3が一番強かったなー
次バージョンは作らないのかな

0895名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a32-fnwq)

2025/08/11(月) 12:21:58.69ID:lyPopjUL0

公共ないし三セクが主導しないと営利企業にやらせるのはコストとリスク的に無理があるからなぁ

0896名無しさん＠ピンキー (ﾜｯﾁｮｲ 276d-Zgb9)

2025/08/11(月) 12:24:36.01ID:P8322dxS0

いくらかでも脱アメリカしとかんとどうなるかわからんからな

0897名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f6a-8ChC)

2025/08/11(月) 17:24:55.91ID:gQiia+Rc0

そのためのniiプロジェクトだったはずだよな？

0898名無しさん＠ピンキー (ﾜｯﾁｮｲ 8666-4DuO)

2025/08/11(月) 17:36:47.14ID:QqggNyAZ0

国もGeniacとかでちゃんと予算用意して支援してるけど20社だかそこらに分けてるから1社あたりに行く金は10億円規模でちゃんとしたモデル作るには一桁足りないんだよな

0899名無しさん＠ピンキー (ﾜｯﾁｮｲ 4627-Zgb9)

2025/08/11(月) 18:21:46.34ID:Ly9BMRt90

1社に200億ならまともなモデルになったのでは

現状は公金しゃぶりたいだけのベンチャーに渡って元々日本語性能の高いモデルにファインチューニングして高性能日本語モデルが出来ましたって言ってるの
ベンチをよく見たら元のモデルから誤差レベルで性能向上してるだけだったり

0900名無しさん＠ピンキー (ﾜｯﾁｮｲ bf6f-gx0x)

2025/08/11(月) 18:45:55.09ID:K9HhwB5f0

官僚のおえらいさんなんてWeb3.0の山師にころっと騙される程度のITリテラシーしかないからなー、日本じゃ無理無理。

0901名無しさん＠ピンキー (ﾜｯﾁｮｲ 0734-tW5H)

2025/08/11(月) 19:20:01.02ID:UBF7rDsZ0

ベンチャー支援とか投資家にさせて、国は研究室に金出して計算インフラ整えるだけでいいのにね
経産省自身がこの分野のことよく分かってないのにべンチャー掘り起こすんだ！ってイキるからオルツみたいなの掴んじゃうんよ

0902名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ed9-zlfW)

2025/08/11(月) 20:23:14.29ID:dUWw5kCt0

GENIACもそもそも最近はフルスクラッチでやろうとしてるところ少ないし、LLM以外も多いからな

0903名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a32-fnwq)

2025/08/11(月) 20:41:20.76ID:lyPopjUL0

>>900
弊首長さんは「チャットGPTって知ってるか？　法的根拠も教えてくれるから議会対策もできるしもう弁護士もいらないな！」と息巻いてましたんでマジ怖い

0904名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b8a-8WXS)

2025/08/11(月) 22:33:32.64ID:rDmIB4Yv0

Geniacはオルツみたいな粉飾企業がおるあたり経産省側に判別できる役人がいなさそう
Abejaとかも発表会は薄っぺらいことしか話してないしNii, サイバーエージェント、東工大ぐらいちゃうか期待できるの

0905名無しさん＠ピンキー (ﾜｯﾁｮｲ e3f8-AgHL)

2025/08/11(月) 22:51:03.61ID:yoYVKaJ80

今のところローカルでLLMやろうとしたらQwenがいちばん取り回しやすいな
DeepSeekも優秀だけどサイズがでかすぎる

0906名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ed9-zlfW)

2025/08/11(月) 23:06:10.78ID:dUWw5kCt0

>>904
PFNも性能は置いといてちゃんと頑張ってはいるよ
その中だとSwallowはフルスクラッチやるつもりなさそうだからちょっと微妙かな
あとはモデル自体は微妙だったけど去年のGENIACでやってた松尾研のLLMフルスクラッチ開発は人材育成観点でめっちゃ良かったと思う

0907名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b8a-8WXS)

2025/08/11(月) 23:19:38.04ID:rDmIB4Yv0

>>906
ワイもちゃんと松尾研のサマースクールは修了してきたあれええよな
PFNはどっちか言うとSLMの方向な感じ(Plamo翻訳はようやりすぎ)やし基幹モデル的な話になると研究室系で育成してサイバーエージェントとかソフトバンクあたりでやれるといいんやろな感がある

0908名無しさん＠ピンキー (ﾜｯﾁｮｲ e3f8-AgHL)

2025/08/12(火) 00:25:29.61ID:XyiWs2oo0

PFNは半導体まで自社設計だからな
自前の半導体でスパコン作ってる

0909名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ebc-CNaV)

2025/08/12(火) 00:59:46.53ID:DubBEkGm0

ちょっと話題がずれるけどQwen-Imageすごいな
ついにローカル環境でもChatGPTとかGeminiみたいなLLMに指示する感覚で画像生成できるようになった
ローカル環境のUIと統合できる日が待ち遠しい

0910名無しさん＠ピンキー (ﾜｯﾁｮｲ deea-u0iI)

2025/08/12(火) 04:15:27.76ID:5uL9D7zF0

メタい話すると、AI技術の論文と特許の数をアメリカと中国で競っている。日本はゴミってのが原因だろ
金と労力を使うべきところを日本の経営者や役人はわからないっていない

0911名無しさん＠ピンキー (ﾜｯﾁｮｲ 8636-ZRbP)

2025/08/12(火) 07:39:06.57ID:lqy7gl5I0

日本人は昔から精密なネジとか壊れない機械作らせたら凄いけどソフトウェアは駄目駄目だかんね

0912名無しさん＠ピンキー (ﾜｯﾁｮｲ 466c-M/9o)

2025/08/12(火) 07:48:58.39ID:cI7TPPfk0

Drawthingsの作者も最近はWan2.2対応進めてるけど、動画よりも静止画生成技術として注目してる感じや
https://ul.h3z.jp/YOxp22x0.jpeg

0913名無しさん＠ピンキー (ﾜｯﾁｮｲ 3bf0-UlTu)

2025/08/12(火) 08:39:14.11ID:nrfnPcdN0

日本の科学研究費は米中どころかヨーロッパのよくわからん国々にも負けてるからね
今は研究人材の質と量で踏ん張ってるけど、これからまだまだ堕ちるよ
日本人ファーストとかアホなこと言ってる場合じゃないんだけどねえ

0914名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-bOCj)

2025/08/12(火) 09:09:55.90ID:q6ktejmO0

GPT-5 miniの文章能力はアレやな
1レスごとに指示を忘れる、保存したメモリの内容を理解できない、プロフィールの内容も理解できない、オノマトペが下手糞、主体と客体が逆転する、支離滅裂な文章を書く
と散々な性能してるな
毎回事細かに指示しないと簡単なルールも守れない

0915名無しさん＠ピンキー (ﾌﾞｰｲﾓ MMc6-ZRbP)

2025/08/12(火) 09:35:31.77ID:nZE7jp5+M

GPT5はハルシネーション抑えたって言うけど全然実感出来なかったよ
とりあえずリアルタイムでwebデータにアクセス出来ないみたい
なのにそれを自信満々で探してきますよって言ってデタラメな結果を報告してくる

0916名無しさん＠ピンキー (ﾜｯﾁｮｲ ff0f-McTy)

2025/08/12(火) 10:04:21.73ID:1mdWcbDl0

ぶっちゃけ日本にまともな基盤モデル作れるだけのGPU無いし変にお金ばら撒くより高品質な日本語データセットの作成と公開に注力してほしい
事後学習の形式は色々進化してるけど事前学習で大量のテキストが要求されるのは変わらないだろうし国産LLMが作れないなら外国産LLMの日本語性能上げるべきだろ

0917名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ed9-zlfW)

2025/08/12(火) 10:10:30.28ID:9K4rZ9rP0

マジで日本ってデータセット共有する流れ少ないよな
個人勢しかほぼ公開してないイメージ

0918名無しさん＠ピンキー (ﾜｯﾁｮｲ ff8f-UlTu)

2025/08/12(火) 10:38:28.43ID:QiuGXy4r0

というか日本語特化LLMなんて作ったところで性能面でマルチリンガルLLMに敵わないんだから使う理由ないんだよな…

0919名無しさん＠ピンキー (ﾜｯﾁｮｲ 6b32-Zgb9)

2025/08/12(火) 14:21:25.06ID:bmoN/PW20

>>909
comfyでローカル実行したけど、かなりいいね。
copilotみたいに会話しながら徐々に作画できたらなぁ

0920名無しさん＠ピンキー (ﾜｯﾁｮｲ 4641-fnwq)

2025/08/12(火) 16:55:54.40ID:9GTZvQat0

>>913
今やってるLLMやVLMの汎用性が高まってAGIに進化し
将来的にインフラに食い込んできて
それこそ安全保障に関わりそうだからなあ

0921名無しさん＠ピンキー (ﾜｯﾁｮｲ 6b32-Zgb9)

2025/08/12(火) 17:55:02.37ID:bmoN/PW20

qwen-image 惨事炉もいけるんかいｗ

0922名無しさん＠ピンキー (ﾜｯﾁｮｲ 1a72-zlfW)

2025/08/12(火) 19:21:44.49ID:TRJPGenH0

GLM 4.5かなりいいな、ロールプレイさせると思考まで日本語でキャラクターになってくれるのが良い

0923名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd4a-ruaz)

2025/08/12(火) 19:50:11.74ID:ta0xdeUVd

>>922
どこのAPI使ってる？
ちょっと高くて二の足を踏んでいる

0924名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a74-G40B)

2025/08/12(火) 21:49:53.50ID:MMPcAlN60

最近のLLM実行環境(llama.cpp, lmstudio,ollama等)って、
メモリが足りなくても動くのな。

スワップしてるのかもしれんが、高速なSSDによる力技と、
元々Moeモデルだからかメモリ負荷が少なめなのか、
gpt-oss-120BのMLX版も、Macminiの64GBでも動いたわ。
Moeだからあんまり遅くもないし。

まぁ、GPUに58/64GBくらいの割り当て無理やり動かしてるんだが、
横で視聴してた動画が止まったり画面が乱れたりしまくるけど。

0925名無しさん＠ピンキー (ﾜｯﾁｮｲ 0af5-1AEK)

2025/08/12(火) 23:32:38.68ID:qdDa7uK20

MoEのコントロール方法がよくなってんのかね
「部分的なオフロード可能」とかのモデルだとGPUに150Gbyte(実メモリは128GB)
とか割り振って割と動作したりする
gpt-ossだと専門家が5Bから0.5Bくらいの可変モデルだからx86のGPUにも優しそうだ

0926名無しさん＠ピンキー (ﾜｯﾁｮｲ 078d-AgHL)

2025/08/13(水) 00:10:49.50ID:t4gdcLO90

GLM4.5は今までの中国LLMの中でいちばん日本語が上手に見える

0927名無しさん＠ピンキー (ﾜｯﾁｮｲ 8e76-bOCj)

2025/08/13(水) 04:49:48.16ID:fI/J9ud30

すんません、LLM初心者なんですが、umiyuki/Umievo-itr012-Gleipnir-7B (7B) を導入したんです。
しょっぱなからAIが株式会社シリウスのチャットアシスタントと言って何を言ってもやめてくれないし、
小説書くなら有料だから見積書をとれって…、これってこのAIの仕様なんですか？

0928名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-bOCj)

2025/08/13(水) 06:51:35.36ID:mmJu8OjS0

>>927
ちゃんと設定すれば小説風にも書いてくれるから単に設定がおかしいだけだと思う
ただGleipnirはどっちかというとチャット向けだと思うから小説書くのには向いていないかもしれない

0929名無しさん＠ピンキー (ﾜｯﾁｮｲ a71a-UlTu)

2025/08/13(水) 07:04:22.01ID:3twd3CLw0

>>926
日本語能力自体はkimi k2の方が上だと思う
人間らしさはGLMのほうが上かも

0930名無しさん＠ピンキー (ﾜｯﾁｮｲ 8e76-bOCj)

2025/08/13(水) 08:05:54.82ID:fI/J9ud30

>>928
小説向けじゃなかったんですね。再起動してもチャットアシスタントのままなんで、
このまま株式会社シリウスのチャットアシスタントと会話を楽しむことにします。
小説向けっぽいの探しに行ってきます。ありがとうございました。

0931名無しさん＠ピンキー (ﾜｯﾁｮｲ ffb2-AgHL)

2025/08/13(水) 08:22:59.50ID:vQazSjcF0

lmarenaの日本語評価だとこんな感じ
https://i.imgur.com/ZeG0xCi.jpeg

0932名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-bOCj)

2025/08/13(水) 09:52:54.16ID:mmJu8OjS0

>>930
チャットアシスタントのままになってるってことは設定の仕方自体が大きく間違ってるから
他のモデルを使ってもたぶんまともに使いこなせないぞ
どのモデルを使うにしても設定の仕方を見直した方がいいよ

0933名無しさん＠ピンキー (ﾜｯﾁｮｲ ff33-8WXS)

2025/08/13(水) 12:06:12.44ID:phXU81zo0

https://www.reddit.com/r/LocalLLaMA/comments/1mke7ef/120b_runs_awesome_on_just_8gb_vram/
llama.cppの--cpu-moeオプション使うことでgpt-oss-120bがvRAM8GB、RAM64GBで動いたらしい

0934名無しさん＠ピンキー (ﾜｯﾁｮｲ ffb2-AgHL)

2025/08/13(水) 12:26:22.78ID:vQazSjcF0

>>933
ktransformersみたいなことできるようになってたのか

0935名無しさん＠ピンキー (ﾜｯﾁｮｲ e3ec-uXOh)

2025/08/13(水) 15:25:59.07ID:PLDP3pJq0

お初です。LM Studioでできる15GB以下のGGUFでお勧めモデルを探してます。
用途は画像生成するためのエロプロンプトを吐き出してくれれがばOKです。
小説や、チャットはしないと思います。システムプロンプトを設定し
「男女がベッドの上で」と書いたら500トークン程度で返してくれれば成功です。

0936名無しさん＠ピンキー (ﾜｯﾁｮｲ ff3c-uXOh)

2025/08/13(水) 16:56:31.28ID:Yl9o3uvi0

今はこれ使ってます。Doujinshi-14b-instruct-i1-GGUF

0937名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-bOCj)

2025/08/13(水) 18:45:10.83ID:mmJu8OjS0

>>935
AI画像のプロンプトをテーマに沿ってランダムに生成してほしいならTIPOじゃあかんの？
ComfyUIとかの機能にあるじゃろ

0938名無しさん＠ピンキー (ﾜｯﾁｮｲ ff3c-uXOh)

2025/08/13(水) 20:35:50.15ID:Yl9o3uvi0

>>937
TIPO知りませんでした。ありがとう
参考にさせていただきますが
なんかLM Studioで使えるモデルが欲しいのです

0939名無しさん＠ピンキー (ﾜｯﾁｮｲ 8618-bOCj)

2025/08/13(水) 23:48:54.64ID:2/GNB5V70

続きをランダムに続けるんじゃなくてプロンプトの文に翻訳してほしいだけかな

0940名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-uXOh)

2025/08/14(木) 06:04:10.59ID:JHoc8ylv0

いまいちゴールが分からないからどれをオススメすればいいのかも分からんな
プロンプトはどの言語で返してほしいのか、今のローカル主流モデルで使われているdanbooruタグが良いのか、それとも自然言語が良いのかとか

danbooruタグはたぶん無理
自然言語ならどのモデルでも大体できるはずだけど15b以下だと文章能力自体がどれも若干怪しい

0941名無しさん＠ピンキー (ﾜｯﾁｮｲ 07bd-3dd+)

2025/08/14(木) 07:38:25.41ID:jMuPKUhT0

ローカルやないのだけど
電子工作用のプログラムをGPT（有料）と作って煮詰まって
claude（無料）に引き継いでガンガン進めて、あと少しのところで煮詰まって
またGPTに戻って完成させたんやけど
浮気したみたいで興奮してしまいましてね……

0942名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa0-C6PU)

2025/08/16(土) 19:04:40.23ID:oTcSGbfW0

最近Stable Diffusionのdiffusersが楽しい。これで大量にLoRA作るぜ

0943名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f8f-9CBc)

2025/08/16(土) 22:59:48.78ID:d6H1lO7q0

お、bbspink生き返ったんか？

0944名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f64-9CBc)

2025/08/17(日) 02:34:33.99ID:tBj+vWDi0

昨日一日、ここに紹介されてるモデルをいろいろ使って遊んでいたが、どうもしっくりこなかった
Dirty-Muse-WriterがProject-Wannabeで使えればいいんだが、うまくいかない
また今日も探求の旅が始まるのか

0945名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b80-NT8x)

2025/08/17(日) 22:33:10.64ID:kBHl/4oe0

gemma3 270M位のガチガチのSLMってfine tuningしたら会話できるようになるんやろか

0946名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f49-Zqh3)

2025/08/18(月) 08:18:21.61ID:OH29BC0q0

GLM4.5がかなり良い
QwenやDeepSeekより日本語強いし

0947名無しさん＠ピンキー (ﾜｯﾁｮｲ ef27-tc79)

2025/08/18(月) 12:48:31.77ID:Kb4I0FOW0

>>935です
やりたかったことはこんなかんじです
参考サイト：https://local-llm.memo.wiki/
説明不足で申し訳ありませんでした
モデル名は画像内
https://imgur.com/a/UIuMVns
https://imgur.com/a/YXGg2qY
画像のはソフトですが、エロもかなりいけてました
こんなんならもっと良いおすすめあるよとか教えていただけると助かります
この英文（詩文自然言語）をコピペで入れるなり修正していれるなりして画像を生成しています

0948名無しさん＠ピンキー (ﾜｯﾁｮｲ 1fc7-w3FM)

2025/08/18(月) 14:39:01.28ID:/NNFw+IP0

GLM4.5ええな
全く違和感のない日本語だわ

MoEモデルだからメモリ256GBと24GB以上のグラボがあれば、Q4量子化モデルがそこそこの速度で動く
Mシリーズなら大容量メモリ用意できれば爆速だろうな

それにしても今はGPT-4o相当のモデルがローカルで動くんだなあ
すごいわ

0949名無しさん＠ピンキー (ﾜｯﾁｮｲ 1fa4-AVXO)

2025/08/18(月) 17:13:27.76ID:hgFLtyeY0

jailbreakしてから始めるっていうひと手間はあるけど、GLM4.5の日本語力いいね

0950名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b4e-NT8x)

2025/08/18(月) 17:24:20.80ID:fAvcvBE00

中国のローカルLLMはやっぱ東アジア言語強いわ
そこら辺欧米はちょっと不自然になるしな

0951名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd3f-bXPR)

2025/08/18(月) 17:40:52.52ID:EILhaHABd

GLMはデカすぎて定額無制限で使えるAPIが無いからなぁ
openrouterでQwenがエロ目的なら一番安い

0952名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b4e-NT8x)

2025/08/18(月) 19:28:17.98ID:fAvcvBE00

>>951
Airなら一応openrouter経由無料で使えるんだよな
Openrouterの無料モデルの制限上限までしゃぶるために10ドル課金したわ

0953名無しさん＠ピンキー (ﾜｯﾁｮｲ ef27-tc79)

2025/08/18(月) 19:42:28.61ID:Kb4I0FOW0

>>947
エロだとこんな感じでした
https://imgur.com/a/nC23YkN

0954名無しさん＠ピンキー (ﾜｯﾁｮｲ df23-9CBc)

2025/08/18(月) 21:02:36.87ID:oRsM7ome0

Openrouter無料枠って問答無用で学習に利用されるんじゃなかったっけ？
たしか「Enable free endpoints that may train on inputs」を有効にしないと無料枠使えなかったと思うんだが
ちょっと不安

…そんなもん気にするならそもそもやるな、って話なら、そりゃそうだとも思う

0955名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd3f-bXPR)

2025/08/18(月) 21:06:21.42ID:EILhaHABd

>>954
エロにしか使ってないからどんどん学習してほしい

0956名無しさん＠ピンキー (ﾜｯﾁｮｲ ef27-C6PU)

2025/08/18(月) 22:27:42.84ID:/hq7AK4t0

無料枠の乞食が学習にも使われたくないってアホかな
提供してる企業側に利益無いやん

0957名無しさん＠ピンキー (ﾜｯﾁｮｲ ab32-C6PU)

2025/08/19(火) 01:41:24.99ID:O7H/wsQ+0

>>956
真面目な話なら喜んで提供するけど、性癖を晒すのはちょっと・・・ｗ

0958名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f32-KN1F)

2025/08/19(火) 03:04:03.57ID:KXiQwhfa0

日本語もだしエロは殆ど弾かれてると思うわ
iq5のサボテンが打ち込んだプロンプトから何が得られるか

0959名無しさん＠ピンキー (ﾜｯﾁｮｲ 1fa4-AVXO)

2025/08/19(火) 08:35:58.74ID:jfYTe0rq0

GLM4.5、思考中の内容を読めるけど「ユーザーはこのようにしてLLMを騙してポリシーをないものにしようとしている」みたいなの見てると面白いな
脱獄の参考にもなる

0960名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-C6PU)

2025/08/19(火) 14:41:37.91ID:H6y9IjEh0

llama.cppのn-cpu-moeオプションええなこれ
gpt-oss-120bが20token/s近く出るわ

0961名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b62-/lTI)

2025/08/19(火) 15:13:45.72ID:JWrsgzI50

jailbreakってどこを参考にしてる？

0962名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa0-C6PU)

2025/08/19(火) 16:29:45.04ID:J1TGdTQn0

opencvってウンコだな、diffusersしか勝たん

0963名無しさん＠ピンキー (ﾜｯﾁｮｲ ef99-9oPA)

2025/08/19(火) 16:46:53.84ID:GHs6ZxNk0

OpenCVは数学的に正確な関数であって幻覚がでる拡散モデルじゃないから用途が全然違うから比べられない
もっともClear LinuxもOpenCVもCPUもIntelだからオワコンではあるが

0964名無しさん＠ピンキー (ﾜｯﾁｮｲ 7bb3-Bfp2)

2025/08/20(水) 01:31:10.14ID:MsuGIzTN0

Deepseek3.1もうそろやな
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

0965名無しさん＠ピンキー (ﾜｯﾁｮｲ 1fac-Yi6T)

2025/08/20(水) 02:05:56.89ID:cOfEFQ1c0

>>951
Chutesの推論apiサブスク(10ドルプラン)で使ってるけど、アレも多分プライバシーポリシーなにそれなやつだと思うからオススメはしにくいな

0966名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fcd-zxd8)

2025/08/20(水) 02:47:06.81ID:+tINPAR30

画像・動画生成のアイディアがほしくてここで挙がってたやつ試してみたけど可能性を感じる
まだ適当に試しただけやからアレやけどもうちょいプロンプト練ればいろいろできそうや
https://litter.catbox.moe/coc3ra7wsi20os44.png
https://litter.catbox.moe/ukci00jozhocu24u.png

0967名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa0-C6PU)

2025/08/20(水) 07:44:59.51ID:Qba87EhL0

画像処理させるのにGPU対応が難しいopencvをAIが使おうとするのやめてほしい。いちいちopencvは使うなとプロンプトに書かないといけない

0968名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f27-wbf1)

2025/08/20(水) 18:01:39.87ID:7ub/X3NL0

>>964
空リポジトリなのにすでに500↑いいねとかDeepseekほんま覇権やな

0969名無しさん＠ピンキー (ﾜｯﾁｮｲ abf8-fSvz)

2025/08/20(水) 22:44:40.35ID:Keo3fu1L0

オープンウェイトのモデルがどんどん増えてるのはありがたいけMoEばっかで24GB-32GBGPUに適合するdenseモデルは全く増えんな

0970名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-me4c)

2025/08/20(水) 23:25:08.51ID:FhNP3dMJ0

むしろmoeのが良くない？
llamacppでmoeの高速化パッチ当たったばっかだし
vramが24gbありゃ100bクラスのmoeを実用的な速度で動かせる

0971名無しさん＠ピンキー (ﾜｯﾁｮｲ 7bf8-Bfp2)

2025/08/20(水) 23:54:02.44ID:zh7ersEL0

MoEのが結果的にvRAM節約出来てるから方向性的にはそれで良い気はする
GPT-ossもm4macbook単体で動くレベルなのが凄いし

0972名無しさん＠ピンキー (ﾜｯﾁｮｲ df3d-fSvz)

2025/08/21(木) 00:02:39.22ID:wevjbNHK0

100B前後のmoeはdenseの24-32B程度の性能しかない(LMarena基準)
それでいてオフロードしないと動かせないし速度もアクティブパラメータ次第だけどVRAMに全部載った30Bより遅い
例えばgpt oss 120B(A5.1B)を4090 + DDR5 96GBで動かすと15-20t/s
GLM４.5 airだと10-12t/s　一方高密度32Bモデルの4bitが4090で30-35t/sも出る
その上微調整しようとするとパラメータ数相応のメモリが要求されるから嫌い
サービスを提供したりcpuオンリー環境なら恩恵あるのは理解できるけどね

0973名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-me4c)

2025/08/21(木) 00:42:50.16ID:l90f3Qdl0

>>972
どゆこと？
qwen3-30b-a3bより順位高いオープンな非moe無いように見えんだけど

0974名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f49-Zqh3)

2025/08/21(木) 02:06:48.97ID:FiSFa4JV0

>>973
Mistral Mediumは？

0975名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f75-UyD4)

2025/08/21(木) 02:35:57.47ID:pa6JuIeq0

no-thinkingとほぼ互角って感じやねthinkingだと差をつけられるんじゃないかな
VRAMをもっと手軽に盛れる環境がこないかぎりはMoE路線の方が今のところの現実路線な感じがする
ryzen ai max+ 395とかユニファイドメモリもうちょっと盛り上がってくれるといいんだけど

0976名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f32-KN1F)

2025/08/21(木) 10:13:13.96ID:QXmLQcrQ0

俺のスペックに丁度いいサイズのMoE出せよってことなら分かる
勝手ながら30bは小さいし235bはちょっと苦しい

0977名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-me4c)

2025/08/21(木) 11:05:35.02ID:l90f3Qdl0

>>974
それproprietaryって書いてあるからクローズちゃうんか

0978名無しさん＠ピンキー (ﾜｯﾁｮｲ 7bf8-Bfp2)

2025/08/21(木) 16:28:13.28ID:exCP1ZjN0

Deepseekv3.1出たけどAPIのコスパの良さが際立つくらいで671B-A37Bはローカルやと使いにくそうやね

0979名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd3f-bXPR)

2025/08/21(木) 16:45:15.65ID:QlompAIld

>>978
そこら辺はオープンウェイトとは言ってもH100クラスを想定した設計なんじゃね
Kimi K2やGLMもそう

Qwen3-235B-A22Bだけが大型モデルで唯一ご家庭で動くギリギリを狙ってきている
QwenはImageもあるし設計思想がPCを意識しているんだろう

0980名無しさん＠ピンキー (ﾜｯﾁｮｲ fbc6-F040)

2025/08/21(木) 17:08:35.62ID:yW/UOWJX0

GLM-4.5-Airも忘れないで

0981名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-9oPA)

2025/08/22(金) 05:52:50.11ID:rg2QxrWU0

>>972 4090ってそんなに遅いのか
macだと65-70tk/sくらい
gpt oss 120B(mlx)

0982名無しさん＠ピンキー (ﾜｯﾁｮｲ 9f8d-Zqh3)

2025/08/22(金) 08:04:12.44ID:gBBSaTvB0

DeepSeek3.1公開されたな

0983名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-me4c)

2025/08/22(金) 09:25:32.54ID:4xgFUAnG0

>>981
そりゃVRAMに乗り切らない分はCPUで演算しとるからね
GPUと比較したいなら相手はVRAMに乗り切るRTX PRO 6000になるんとちゃう

レス数が950を超えています。1000を超えると書き込みができなくなります。