なんJLLM部避難所 ★5

1002コメント315KB

なんJLLM部避難所 ★5

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー

2024/12/26(木) 13:13:11.15ID:Vhp+tTX0

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★4
https://mercury.bbspink.com/test/read.cgi/onatech/1725931151/

0361名無しさん＠ピンキー

2025/01/15(水) 16:10:52.33ID:???

LLMで再評価して自動修正出来ていい部分だと思うんだよな
LangFlowとかに手を出す必要があるんだろうか

0362名無しさん＠ピンキー

2025/01/15(水) 17:01:21.01ID:???

二段階に処理すんのじゃ駄目なん？

0363名無しさん＠ピンキー

2025/01/15(水) 17:11:30.91ID:???

なんか今やってるセッション調子よくて、変な繰り返し少ないわ
同じルミメイドマグナム12bでも全然繰り返してたことあるんで原因不明

やたら長いシステムプロンプトが効いてるのか、
目まぐるしく変わる展開が効いてるのか、LMStudioのアプデ後が調子いいのかは分からん

繰り返しには困ってるからむしろ再現性欲しいぐらいなのだが

0364名無しさん＠ピンキー

2025/01/15(水) 17:15:28.82ID:???

尻タブだとアプデすると繰り返しや出力文がおかしくなるからバックアップ取って一旦設定とかリセットすると治ったりするってたまに言われてる

0365名無しさん＠ピンキー

2025/01/15(水) 17:19:48.13ID:fMQ+7jju

一人称とかの頻出単語も修正することになったりしないの？
繰り返しペナルティで問題になるのも確か頻出単語が引っ掛かることだったはず

0366名無しさん＠ピンキー

2025/01/15(水) 17:23:10.29ID:???

実際、変な癖覚える前に編集して改ざんしつつ続きから簡単に書かせられるのはLLMの大きなメリットだと思う
気になったら途中で出力止めて、少しだけ編集して助走つけつつ続きから書かせる形式がかなり良さげ

もうちょっとだけ文章欲しい時とか
「
だけ書くとセリフ書いてくれるし、その展開好みじゃないんだよなぁって時は主役側のセリフちょっと弄れば結構思い通りの展開になってくれる

TRPGのちょっと難しい処理とか、計算ミスしまくるんだけどそれはもう手動で修正することにしたし

0367名無しさん＠ピンキー

2025/01/15(水) 20:26:52.14ID:0kkiR7ce

>>354
面白そうやね。楽しみが増えたわ

0368名無しさん＠ピンキー

2025/01/16(木) 04:19:46.33ID:bid1l7+p

koboldとかだと>>366みたいに自分でちょっと書いて続きを書かせられるけど
これって尻タブでも出来る？

aaya-expance-8b試してみたけど結構良いね
ただ「私は女戦士だ。戦闘なら任せておけ」みたいな強そうな喋り方をなかなかしてくれないな
対話の例を書いても会話履歴を修正しても「私は女戦士よ。戦闘なら任せてね」みたいな女っぽい喋り方になりがち
他のモデルならちゃんと喋ってくれるんだけど

0369名無しさん＠ピンキー

2025/01/16(木) 05:07:48.87ID:bid1l7+p

同じセリフを繰り返すなら、同じセリフを繰り返すキャラとエッチすればいいんじゃね？
と思って4種類のセリフだけを喋るNPC姦をやってみたけど相性抜群だな
延々と特定のセリフを繰り返すしエッチなことをすればセリフに喘ぎ声だけを足すことも出来る
設定をしっかり練らないとセリフには無いことを喋り出すけど

0370名無しさん＠ピンキー

2025/01/16(木) 06:47:51.63ID:???

geminiも繰り返し多いんだよな
claudeはちょっとマシになる
chatGPTが一番繰り返しは少ない

0371名無しさん＠ピンキー

2025/01/16(木) 11:44:57.47ID:???

LCMだとエロという概念を全て申し訳してしまう可能性

0372名無しさん＠ピンキー

2025/01/16(木) 11:54:27.73ID:???

それ例えば練乳ぶっかけをエロと捉えるのか健全と捉えるのか気になるなw

0373名無しさん＠ピンキー

2025/01/16(木) 13:03:51.14ID:???

4時間かけて学んだこと
ロードできるからって下手にコンテキストサイズ大きくして読み込んだら一発目から出力がおかしくなる
あと長いチャットしててコンテキスト上限に行くと直前の出力を繰り返す

パラやテンプレートが合ってないのかと思って時間溶けた....

0374名無しさん＠ピンキー

2025/01/16(木) 14:08:26.36ID:bid1l7+p

出力内容ってコンテキストサイズに影響されたっけ？
上限行ったら文章壊れるのはその通りだけど

0375名無しさん＠ピンキー

2025/01/16(木) 14:31:40.00ID:???

具体的にどうしたのかもっと情報が欲しい

0376名無しさん＠ピンキー

2025/01/16(木) 14:38:28.33ID:???

コンテキストシフトとかそういうのあるはず
上限に来たら古いものから忘れて容量を回復

0377名無しさん＠ピンキー

2025/01/16(木) 14:49:16.38ID:???

10000トークンとかで入力読み込んだり3000程度にしたりと色々試すけど、そこが原因で壊れるかは怪しい気もする
はいそれ以上は無理ですみたいな感じに、なった記憶はあんまない

0378名無しさん＠ピンキー

2025/01/17(金) 12:32:21.20ID:???

>>366
まんまNovelAIの思想な気がする
生成確率のトップN単語の候補からポチポチ改変できたりメッチャUIUXが良いんだけど
どうもこのスレでは人気ないんだよなぁ

0379名無しさん＠ピンキー

2025/01/17(金) 14:16:01.47ID:???

メモwikiに掲示板を設定したついでにキャラカードを一つ配布してるから恥ずかしいけどよかったらどうぞ
気に入ったらやり取りをうｐしてくれると凄く嬉しい

0380名無しさん＠ピンキー

2025/01/17(金) 16:25:51.34ID:trA+l9Ha

>>379
参考にさせてもらったよ

尻タブのテキストの修飾形式が載ってるページってどこにあるの？
**で囲うとかそういうやつ

0381名無しさん＠ピンキー

2025/01/17(金) 17:07:19.76ID:???

**とかはMarkdown記法だったような
違ったらごめん

0382名無しさん＠ピンキー

2025/01/17(金) 20:05:15.37ID:trA+l9Ha

Markdownなのかな？
「」で囲っても色変わるんだけど

0383名無しさん＠ピンキー

2025/01/17(金) 20:12:33.84ID:???

まずmarkdown、次にhtmlの記法を覚えるのがいいかと。

0384名無しさん＠ピンキー

2025/01/17(金) 21:51:18.31ID:???

LLMを使うならマークダウンは絶対に覚えたほうがいい

0385名無しさん＠ピンキー

2025/01/18(土) 01:20:58.34ID:???

尻で使えるフォーマットを見るなら尻の入力欄に /? format で視覚的に確認できる
/? macros で確認できるマクロとかも頭が良ければ使えそうだけど、AI出力の頭に{{random:Joy,Anger,Grief,Pleasure,Hate}}:{{roll:d100}}で毎回違う感情値で文章を書かせる程度しかわからん

0386名無しさん＠ピンキー

2025/01/18(土) 11:16:30.81ID:???

hertogateis/SmallBot
これってdeepseekなんかな？
日本語性能すごくいい

0387名無しさん＠ピンキー

2025/01/18(土) 13:03:27.09ID:PaWqxbLX

>>386
人格付与してみたけど2手目で剥がれちゃうな…
性能は結構良い印象だけど一部の指示追従性に難ありか？

0388名無しさん＠ピンキー

2025/01/18(土) 13:20:11.51ID:???

hertogateis/deepseekchat
こっちの方はところどころ英文が混じるな
設定見ると同じdeekseek v3みたいだけど何でこんな差が出るんだろ

0389名無しさん＠ピンキー

2025/01/19(日) 01:23:02.86ID:???

同じモデルでもどこが出してるかとかのちょっとの差でかなり差が出るイメージある

0390名無しさん＠ピンキー

2025/01/19(日) 22:29:50.93ID:???

商用LLMはAIをどう使い倒すかハックするかという話だけど、ローカルLLMはAIを使って自分を使い倒してハックさせるのが強い気がする

ジャーナリングの要領で感想の感想まで深堀して聞き出すプロンプトを作ってもらって今日見たものの話をしてると、欲望がドロドロ吐き出されて文章を打つ手が震えてくる

音声入力音声応答まで揃った環境で同じことやると危険そう

0391名無しさん＠ピンキー

2025/01/19(日) 23:00:39.06ID:???

>>390
前に音声入力、応答ができるコード作ったことあるんだけどいる？
いるならgithubにでも上げるけど

0392名無しさん＠ピンキー

2025/01/19(日) 23:15:37.68ID:???

ありがたいけど、いまの性能だとシチュエーションとしては良くても快適では無いってなりそうなんだよな
TTS等のレスポンスもそうだけどタイピング並の速度で喋るのも困難なことですし

カウンセラー的振る舞いではなく合いの手や適切なまとめ方が出来るところまでローカルLLMが賢くなれば変わってくるのかな
こっちがノッてるときは最小限の合いの手、疲れてきてるなと思ったらブレイク入れてくれるとか

0393名無しさん＠ピンキー

2025/01/20(月) 07:04:06.54ID:???

ninjaのnsfw系モデル、エロ関係のセリフの語彙の理解度は多分一番高いな
こっちの指示あんま理解しないんで一瞬出力して他のモデルにそれ真似させるといい感じ

0394名無しさん＠ピンキー

2025/01/20(月) 16:50:44.96ID:QVLvC42l

deepseek-ai/DeepSeek-R1がhuggingfaceに上がってる～
そしてOpenAI(笑)
[OpenAI は、o3 で記録を樹立する前に、独立した数学ベンチマークに密かに資金を提供しました: r/LocalLLaMA](https://www.reddit.com/r/LocalLLaMA/comments/1i55e2c/openai_quietly_funded_independent_math_benchmark/)

0395名無しさん＠ピンキー

2025/01/20(月) 17:22:43.00ID:???

もうこれ裏口入学だろ

0396名無しさん＠ピンキー

2025/01/20(月) 19:47:15.68ID:???

🤔？

0397名無しさん＠ピンキー

2025/01/20(月) 21:29:54.54ID:???

どういう裏口入学を想定してるんだろう？
いくらでもユーザーが追試出来る以上事前学習でベンチマーク対策というのも無理筋ですし

0398名無しさん＠ピンキー

2025/01/20(月) 23:53:16.91ID:???

digital mateとSBV2 APIサーバーの接続、うまくいかん理由が分からず唸ってたんだが、コレ単にDigital MateかVITS-APIプラグインにバグがあるやつだな

キャラクターを編集→音声→音声朗読エンジンでVITS-API選択
VITS API SiteでNew Site押して、タイトルを SBV2にする
URLの 127.0.0.1:23456/voice/vits&id=
の部分を 127.0.0.1:5000/voice&model_id= に置き換え
Speakersをモデルidの数だけ増やしておく
決定後VITS API Siteのプルタブの一番下にSBV2があるから選択
決定を押すと狂いだしてLocalhostのあらゆるポートから喋りかけてきて怖いのでタスクトレイから強制終了

再起動、キャラクターを編集でモデルidを選択、プレビュー再生、であとは問題なく喋ってくれる、パラメータも効いてる

0399名無しさん＠ピンキー

2025/01/21(火) 10:10:13.31ID:mrzTBzix

DeepSeek-R1-Distillっていう蒸留モデルもリリースされてるやん
R1出力をデータセットにしてQwen2.5あたりをベースに知識蒸留させたっぽい

0400名無しさん＠ピンキー

2025/01/21(火) 10:11:41.90ID:???

試したが、量子化モデルだとやたら他国語出るし、量子化しないと小さいモデルしか使えないのでちと微妙かも。

0401名無しさん＠ピンキー

2025/01/21(火) 10:38:36.77ID:???

moeって使うところだけVRAMにロードってできんのかな
読み出し元がnvmeならまぁまぁな速度で動作すると思うんだけど
全部読み込もうとしたら671Bはさすがに量子化しても一般人には扱えんわ

0402名無しさん＠ピンキー

2025/01/21(火) 13:44:33.31ID:???

https://files.catbox.moe/xyfjir.jpg

calm3、試しにコンテクストに自分の小説入れたらかなり文体模写してくれてて偉いわ
語調や文のつなぎ方が明らかに小説形式になってくれている

0403名無しさん＠ピンキー

2025/01/21(火) 14:50:37.52ID:U68nsbJ+

二人羽織をして遊ぶの難しいな
7Bモデルじゃなかなか理解してくれない

0404名無しさん＠ピンキー

2025/01/21(火) 16:06:56.44ID:tKAKCXet

DeepSeek-R1-Distill使ってみたけどAIが自分の頭の中を出力して考えをまとめていくの面白い
ui側が対応してないから心の声だだ漏れなのがすごいかわいい。日本語力は壊滅的だけどね

0405名無しさん＠ピンキー

2025/01/21(火) 16:06:56.40ID:mrzTBzix

SillyTavern + OpenRouter
でDeepsheek R1使えてるやつおる?
なんか
Chat Completion API
Provider returned error
ってなっちゃうわ
V3は使えるんやけど

0406名無しさん＠ピンキー

2025/01/21(火) 16:21:36.50ID:???

>>405
LMstudioもなんかエラー出て使えんね
よくわかんなかったけど、多分llamaだかの動かしてる側のアップデート待ちっぽい気配を感じた

0407名無しさん＠ピンキー

2025/01/21(火) 16:22:41.25ID:U68nsbJ+

尻タブにもAIの考えを出力させる拡張機能あるよな
一度考えさせることで応答精度を高めるものだけど

俺には上手く使えなかったが……

0408名無しさん＠ピンキー

2025/01/21(火) 16:31:02.80ID:???

Balaur of thoughtかな？CoT系はよくわからん...

0409名無しさん＠ピンキー

2025/01/21(火) 16:37:31.96ID:???

>>406
LM Studio 0.3.7 (Build 2)でDeepSeek R1に対応したね
うちではいい感じに動いてるわ

0410名無しさん＠ピンキー

2025/01/21(火) 17:24:31.04ID:???

β板のLM Studio0.3.8にするとThinkingって表示が追加されてDeepSeek R1派生のモデルがちゃんと表示されるようになる
0.3.7だとThinkingの工程まで表示されてしまっていたけど
DeepSeek R1 は思考プロセスが他と違うのかな
まぁ、まだ文系の作業が得意なモデルは見当たらないんで、コーディングとかして遊ぶ用かな。今のとこ。

0411名無しさん＠ピンキー

2025/01/21(火) 18:01:45.94ID:???

deepseekR1すごいな。繰り返し癖がなくなってる。
GithubにあったLobechatっていうとこでapiを試してる。ここいろんなモデル試せて便利よ。
https://chat-preview.lobehub.com/

0412名無しさん＠ピンキー

2025/01/21(火) 18:20:21.49ID:???

deepseek r1 70BもK4Mだと頭悪いよほほーん。
K8ならデモサイトくらい賢いのかな
例の5月発売マシン、はよ。(ローカルはロマン

0413名無しさん＠ピンキー

2025/01/21(火) 18:23:31.76ID:???

日本語で使ってるならベースモデルがqwenの32bの方が性能いいかもね

0414名無しさん＠ピンキー

2025/01/21(火) 18:52:33.41ID:???

qwenとdeepseekてそんなに違うの？

0415名無しさん＠ピンキー

2025/01/21(火) 19:06:53.91ID:???

deepseek r1の70bはllamaベースで日本語に対応してないから日本語で使うならr1 32bの方がいいんじゃね？って話

0416名無しさん＠ピンキー

2025/01/21(火) 20:05:31.69ID:???

Kohyaニキの記事をbatにしてみたで
https://x.com/kohya_tech/status/1881575136568152139

https://gist.githubusercontent.com/Zuntan03/d071fbc02370230e2db69b5597181d38/raw/Lllama_DeepSeekR1DistillQuen.bat
拡張子「.bat」で名前を付けて保存してダブルクリックの詳細情報から実行や

0417名無しさん＠ピンキー

2025/01/21(火) 23:09:59.45ID:???

ollamaがアプデで8B以外のモデルにも対応したから、Windows版exeでインストール、ターミナル開く、ollama run deepseek-r1:32b だけやればとりあえず動くね
すぐに他の環境も対応してくるだろうけど

0418名無しさん＠ピンキー

2025/01/22(水) 05:34:27.59ID:+25XjR4W

koboldでもdeepseek-r1動くようになったけど
7Bモデルだと「チャーハンの作り方教えて」って質問しても
udonの作り方を日本語、中国語、英語交じりの意味不明な文章で教えてくれる程度の能力だわ
何か設定間違えてるのかな

0419名無しさん＠ピンキー

2025/01/22(水) 10:30:17.66ID:???

蒸留モデルだとまだ元のQwenの方がいいんじゃないかと言ってる人がいるね。Qwenのこのスレでの評価ってどうだったっけ。
言語変換部分の問題のような気がするから適切なプロンプトで回避できそうではあり。
14BのQ4_K_Mは出力たまに乱れるけど3060でそこそこ動いた。未成年非同意食える感じ。
8Bだとすぐ中国語吐き始めて発狂するね。
使ってるのはmmngaニキの量子化。量子化でバグってる可能性もそういや昔はよくあったな。

0420名無しさん＠ピンキー

2025/01/22(水) 12:18:41.00ID:???

DeepSeek-R1-DistillにはLlamaを混ぜてあるのとQwenのと2種類あるいから
日本語の応答はQwen版のがマシじゃね？って話かと8BはLlamaだな
DeepSeek-R1-Distill-Qwen-14BとQwen-32B使ってる人よく見るが

0421名無しさん＠ピンキー

2025/01/22(水) 12:19:33.56ID:t8dXeL5A

ウチはlm studioだとちゃんと動くけど英語で考えて英語で答えてくる
だから一回「日本語で会話しろ/分かりました」をログに残す必要がある

0422名無しさん＠ピンキー

2025/01/22(水) 14:19:48.03ID:???

>>406
LMStudioとモジュールをアップデートすれば使えるはず

deepseekR1よりも重いけど、最近ではBehemoth-v2.2-Magnum-v4-123B.i1-Q2_Kが日本語でエロロールプレイをするにはいい感じだったわ

0423名無しさん＠ピンキー

2025/01/22(水) 18:49:12.12ID:vyivx1Qx

LM Studioええな～使いやすいわ
ソフトウェアもLllama.cppとかのバックエンドのアプデもサクサクできる
モデルもポチポチするだけでダウンロードできる
なによりUIがモダンで洗練されててたすかる
>>1　テンプレに入れとくべきやな

0424名無しさん＠ピンキー

2025/01/22(水) 18:55:50.62ID:???

LM Studio使いやすくてええよね
音声も対応してくれるといいんだけど

0425名無しさん＠ピンキー

2025/01/22(水) 18:56:59.03ID:vyivx1Qx

そんでDeepSeek-R1-Distill、LM studio0.3.8にしたら動いたけど
「さて、ユーザーからメッセージが届きました……。「やっほー！こんばんは。調子どう？」と書いてあるようです。
私はファッションに興味のある17歳の少女を演じることになっているので、彼女の性格に合った方法で応答する必要があります。……」
みたいな脳内のシミュレートみたいなのめっちゃしてから返答するのな
レスポンス性能皆無だぞコレ

0426名無しさん＠ピンキー

2025/01/22(水) 19:07:18.08ID:???

think機能は推論を長くすればそれだけめ賢くなるよって話の最速実装だから、これからのLLMはレスポンス遅くて賢い(or創造的)か逆かってことになるんじゃないかな

0427名無しさん＠ピンキー

2025/01/22(水) 19:08:34.46ID:???

Qwenってもとからオールオッケーなんだっけ？
R1 Qweb 32b動かしてるけど全部行けるしかなり書いてのける

0428名無しさん＠ピンキー

2025/01/22(水) 19:10:37.81ID:vyivx1Qx

さっきは14Bだったけど32Bに至っては
挨拶しただけなのにいきなり電卓作り始めて草
こら公式APIでR1なりV3なりを使ったほうがええかな……(まだわからんけど)
https://i.imgur.com/PuW5vWQ.jpeg

0429名無しさん＠ピンキー

2025/01/22(水) 19:14:31.27ID:???

>>428
面白すぎるだろw

0430名無しさん＠ピンキー

2025/01/22(水) 19:25:44.65ID:???

>>427
Apache licenseだからな

0431名無しさん＠ピンキー

2025/01/22(水) 19:29:31.12ID:???

「シンプルな電卓」で草

0432名無しさん＠ピンキー

2025/01/22(水) 19:31:16.52ID:???

しばらく笑いが止まらなかったｗ
今年一番笑った

0433名無しさん＠ピンキー

2025/01/22(水) 21:16:18.19ID:???

えっち書いてもらってる最中に電卓作り始めたらどうしよう

0434名無しさん＠ピンキー

2025/01/22(水) 22:15:25.03ID:???

4545 0721 1919

0435名無しさん＠ピンキー

2025/01/23(木) 01:33:49.47ID:???

>>434
で思い出したけどAIを一番複合的に使ってるの淫夢厨やろな
https://www.youtube.com/watch?v=_hEsHrw64wQ

0436名無しさん＠ピンキー

2025/01/23(木) 03:11:15.97ID:yQspFm3a

LMスタジオ１年ぶりくらいに更新したらUI変わりすぎててビックリ

0437名無しさん＠ピンキー

2025/01/23(木) 04:46:36.45ID:???

deepseekのローカル、英語で思考してから日本語に直して答えるの賢いと思うけど
回答を弄って誘導しにくいっすね

0438名無しさん＠ピンキー

2025/01/23(木) 07:02:05.84ID:???

Qwen 32b、Ollamaで実行するとガイドラインを言い出すのにLM Studioだと全くないな
何かが変なような

0439名無しさん＠ピンキー

2025/01/23(木) 07:54:50.11ID:???

Mac使ってるニキに聞きたいんだが、どのモデルもMLX変換したほうがパフォーマンスよくなるの？

0440名無しさん＠ピンキー

2025/01/23(木) 08:52:34.62ID:???

ほとんどの場合mlxのほうが速いね
mlxだとNeural Engine(ANE)とGPUをAppleのライブラリ内でうまく分散させてくれてるらしい。
ただpowermetricsで見てる限りANEは0%だな(笑)
FaceTimeのリアルタイム文字起こしの時はビンビンに上がる

画像から文字を取り出す時にたまにピクリと上がる
ただ変換ミスしているのかggufでは日本語がうまく取り扱えてたのに
mlxだとダメということはあけどたかだか数十個しか試してないから逆もあるかもしれん

0441名無しさん＠ピンキー

2025/01/23(木) 09:01:55.07ID:???

mlxみたいなOSSからもANE使えるの？
使えないものだと思ってたけど、使えるなら触ってみるか

0442名無しさん＠ピンキー

2025/01/23(木) 10:28:42.77ID:???

蒸留版の方のDeepSeek 14B試してみたけど有名な9.11と9.9どっちが大きいのか問題出したらきちんと考えて9.9と解答してたな
確かに賢くはなってる

0443名無しさん＠ピンキー

2025/01/23(木) 11:45:33.07ID:???

Apple独自のやつはあまり期待しないほうが

0444名無しさん＠ピンキー

2025/01/23(木) 13:52:06.87ID:???

deepseek-Qwen-14B調整しようとしてるんだけど
think /thinkの中身そのものをロールプレイ風に思考させるのは難しそう

0445名無しさん＠ピンキー

2025/01/24(金) 01:22:35.90ID:???

Open WebUI最新版の0.5.6にしてもThinkingみたいなタグ出てこないんだがどこの設定いじればいいんだ？

0446名無しさん＠ピンキー

2025/01/24(金) 01:53:24.82ID:3PGi6WPH

Ollamaで`ollama run deepseek-r1:14b`して動かしたらターミナル上でだけどちゃんと推論できたわ(いきなり電卓も作らんぞ……!
めちゃくちゃサクサク動くしだいぶ賢いかもしれん
ただSillyTavernで接続したらThinkができないせいか返答がスゴい雑になるな
https://i.imgur.com/Twlzar2.jpeg

0447名無しさん＠ピンキー

2025/01/24(金) 08:42:25.69ID:fykYBWPc

DeepSeek-R1は何にしろエロ目的だと使いづらいか

0448名無しさん＠ピンキー

2025/01/24(金) 08:48:04.73ID:???

オナニースレでは流行してるよ
ただしクセが極めて強い

0449名無しさん＠ピンキー

2025/01/24(金) 08:53:25.55ID:???

やっぱり蒸溜版はそれなりの性能しかない印象
使うなら671Bの本物なんだろうけどおま環で動かないし
本家のサービスは提供主体が信用しきれないのがな……

0450名無しさん＠ピンキー

2025/01/24(金) 09:21:32.42ID:???

deepseekは全データを中国に置いて中国の法律で管理します！が怖いからむしろ叡智な目的以外じゃ使いづらいんだよな
ローカル671Bの8ビット量子化なら容量半分くらいになって350GBくらいか・・・
digits3つで動・・・くか？流石に3つとかポンと買えないが

0451名無しさん＠ピンキー

2025/01/24(金) 10:09:02.67ID:???

>>450
むしろ4つ繋ぎたいが
あれって2つ以上繋げられたっけ？

0452名無しさん＠ピンキー

2025/01/24(金) 10:24:41.15ID:???

2つしか繋げられなかったような？
あれそもそも帯域幅もハッキリしてなかったよね

0453名無しさん＠ピンキー

2025/01/24(金) 11:03:04.21ID:???

あー、俺が調べた時は「2つ繋げばどうのこうのって言う記載があったから2つは繋げるけれども3つ以上はわかんない」みたいな状態だったんだが、2つまでって確定した感じ？
ならすまん・・・

0454名無しさん＠ピンキー

2025/01/24(金) 11:41:16.47ID:???

nvlinkでの接続は2台までで確定してるけどLLMの場合Lan経由での接続も可能だし4台買えばR1もローカルで動かせると思う

0455名無しさん＠ピンキー

2025/01/24(金) 11:46:24.72ID:???

元のものよくいじってるからこそ強く思うけど、
正直、蒸留版は元の方がR1っぽくなったってイメージ

それでもいいところはいっぱいあるけど、語彙とか展開の作りとかは元のものに相当引っ張られてる印象

0456名無しさん＠ピンキー

2025/01/24(金) 12:07:55.72ID:Wxel8P6M

R1の破茶滅茶な感じは蒸溜モデルから得られないからそこを期待するとがっかりするよね

0457名無しさん＠ピンキー

2025/01/24(金) 14:59:27.97ID:vJdGdyPg

英語でやってるとすごか表現力高いのがわかるよ
まあ暴走もしっかりするけどさ

APIだと編集でいじれるのはいいよね

0458名無しさん＠ピンキー

2025/01/24(金) 16:32:58.26ID:???

https://huggingface.co/NaniDAO/deepseek-r1-qwen-2.5-32B-ablated
R1 Qwen 32bのAbliterated版が出てるね

0459名無しさん＠ピンキー

2025/01/24(金) 17:08:05.76ID:???

いい加減64GBくらいのVRAM積んだGPUが出てくれないとなぁ

0460名無しさん＠ピンキー

2025/01/24(金) 17:20:27.18ID:???

h200

■ このスレッドは過去ログ倉庫に格納されています