なんJLLM部 避難所 ★5
■ このスレッドは過去ログ倉庫に格納されています
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC(できれば+3060 12GB以上)でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降
本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部 避難所 ★4
https://mercury.bbspink.com/test/read.cgi/onatech/1725931151/ ワークステーション向けだが、RTX 6000 Blackwellは96GBのGDDR7だってさ 安定の100万越えだが >>770
LMstudioっていうか音声もマルチモーダルで対応してるようなLLMはないんじゃない
確かGoogleのAI studioが音声入力出来るから書き起こしてくれそうだけどローカルでやりたいならkotoba-whisperv2使って書き起こすのがベターだと思う むしろ96gbの帯域1.8Tで100万なら格安やろ(感覚麻痺) 32GBの5090が50万円前後なんだし格安じゃんdigits を2つ買えると考えたら悩むけど 6000 ada 48GBでmsrp 6800$だしRTX 6000 Blackwellは最低でも9000$は取るから日本だと200万弱だろな
それでもダイサイズ的にH100より性能出る場面もあるだろうしお買い得なのは間違いない そもそもなんだけど6000adaの時点で今150万くらいしてない? >>763
4090+メモリ64GB環境だけど遊びには実用レベル
Content Length・GPUオフロード等設定にもよるけど10〜20sec/tokは出てる
このチャットではプラグインやキャラ設定ファイル読ませてるので、モデル単体ではこうならない 100万以下で売ってるのはアカデミック以外で見たことないな >>737
どこまで書けばいいのかわからないけど
openwebuiで指示を入力したらpipelinesって機能でpython実行あとはほぼpython上でやる
pipelinesは上手くインストール出来なかったからdockerにインストールした
langchainでLMstudioのLLM読み込み、キャラ設定とかのドキュメントテキスト読み込み
SentenceTransformersでドキュメントからRAG構築して入力文から検索
入力と検索結果をLLMに渡して出力してuiで表示、ここまでが普通のLLMとRAGの実装
その後で入力と出力をLLMに渡して短い要約を生成させる
入力・出力・要約を対応させた状態でpython側で保持、必要なら何かしらの形式で保存
次以降は入力・検索結果・前回の出力・全ての要約を渡して生成
全ての要約と今回の入出力を渡して、要約を考慮しつつ今回の入出力を要約って指示する
これでコンテキスト4kでも12kぐらいは生成出来た、渡す要約の量とか工夫して伸ばしたり、逆に要約の質をあげたりで変わると思う
プロンプトとかの毎回渡すのが2kだと要約の残りが2kぐらい、そうだとしたら6kなら12kの2倍ぐらいは行けそう
要約の分は生成時間増えるけど短くしてるからそこまで負担にはならない感じ、LLMがちゃんと要約すればだけど
最終的には要約の要約とか、過去ログのRAG化は必要になるね 赤ちゃん質問で恐縮だけど、近所のドフでQuadro RTX5000/16GBが手が出る値段で転がってたんだが、これをRTX3060/12GのPCにぶっさせばLLM用途に限れば28GB相当になるって認識でおk?
123Bとかは無理でもそれなりの恩恵はある感じ? device_map=”auto”にしとけば取り敢えず動くとは思うまぁまぁ遅くなるかもしれないけど コンテキスト長くできたり音声や画像等の他AIも一緒に起動できるから結構便利よ
速度は大して変わらんけどね >>784
なるほど、結構コンテキスト稼げるんだね
とても参考になったよ、ありがとう
>>785
VRAMに全部乗せられるようになるのが13Bから32B程度にはなるんじゃない >>785
中古GPU買う時は、おみくじ感覚でハズレても泣かない覚悟でな。 いろいろサンガツ!それなりの恩恵ありそうだから凸ってみるわ!
>>789
「業務用なので簡単な動作確認のみ。ジャンク扱い」物件でオクとかより相当安い感じだし、外観は綺麗だったのでハズレだったらパチで大負けしたとでも思うわw 初カキコ失礼します
海外ではSilly Tavernなどに使うキャラクターカードをDLできるサイトがありますが、日本にはそういったサイトや配布場所はないのでしょうか?
DLもしたいし配布もしたい... 俺も昔調べたけれどないよ
普通に英語のカードをDLして日本語化してもいいし、口調だけ日本語にしてもいい
というか、シチュエーション系のカードはむしろ英語の方が指示を理解してくれるからいいまであるぞ 「日本語ローカルLLM関連のメモWiki」さんとこに一応キャラクターカード掲示板があるけど、今見てきたらwiki主さんのサンプル1枚と誰かが1枚貼ってたぐらいかな。
逆に言うと今ならそのまま代表的な日本語Hubになりそうだから、妙に分散する前にあそこお借りしてしまっていいとは思うけど SlaughterHouse試したいけど量子化されてないんか TextGenのmodelフォルダでgit cloneしてやればtransformerで動くようになるけど、なにか特殊なことをやろうとしてるモデルに見える
ドキュメントもないし未完成くさい >791
英語版作るのは一瞬で出来るから、Character Tavernあたりに間借りして日本語版と英語版を同時にULしとけばいいのでは
両方ある方が日本語圏のひとも英語圏のひとも嬉しいはず
URLだけ貼ってフィードバックやコミュニケーションを担当する場はあってもよさそう DeePSeekで<think></think>って概要整理みたいの出るの消せないのでしょうか nitky/RoguePlanet-DeepSeek-R1-Qwen-RP-32B
RP版はthinkしないからこれを使う手もある
日本語モデル全部マージしてみた、みたいなモデルだからthink無しでも優位点あるかもしれない >796
ごめん、コレもう一回試したら普通に動いた 改めてLumimaid-Magnum-12B-Q4_K_Sを使ってみてるけどすごく良いな
色んな7BモデルのQ6を試してきたけど、ほぼ同サイズなのにそれよりも断然表現力や理解力が高いわ
でもLumimaid-Magnum-v4-12Bは何か文章がおかしい気がする
同じ設定じゃダメなのかな deepseekってwindowsで回らんlinux用みたいやけど今動かしとる勢はクラウドのインスタンス使っとるんかな https://lab.wallarm.com/jailbreaking-generative-ai/
DeepSeekのシステムプロンプト出たわね
本当にあってんのか知らんけど
APIから生成する場合こういうプロンプト指定しない限りナマのモデル出力になるんかね
もしそうだとしたらこの流出プロンプトを指定すればWEB版の挙動と一致させるのに役立つんやろうか?🤔 R1は数学で強化学習してあると言われてて、そのせいか文章の細部に影響されがち
てことは、まずは環境を整えて揃えるのが制御しやすさに繋がるかもね
世界で一番分かってる人間が書いたプロンプトなわけだし アハモーメントって
あっ・・・とかそれに続く分でも同じことだよな
何かに気づいたタイミングの思考力の強まった部分だけ抽出すれば自ずと賢い答えになる lm studioてのを初めて使ったよ
deepseek-r1の量子化を試したけどやたら考えるね😅 研究者のひとの解説だと、V3に数学の問題だけを突っ込んで強化学習させたのがR1zeroとR1
らしい
1. 巨大モデルは解き方を教えなくても数学を解いてのけることがある
2. 数学なら正解か否かを容易に判断できる
2. 正解を出したらその考え方に報酬を与えて使われ易くする
のループを回すだけで、自己学習を繰り返してどんどん解決できるようになる(=aha moment)し、なぜか分からんが数学以外も解決出来るようになる、という 論理的思考には数学の力が必要と言われてるけど
AIにも同じことが言えるってことなのかな Windows環境でやってるけどLinuxの勉強は必要だと痛感する Linuxの分からないことはLLMが教えてくれるぞ🥴 >>802
Lumimaid-Magnum-v4-12BのGGUF番だと、量子化職人さんの腕でかなり反応変わる印象。
うちではUndi95さんの奴使ってるけど悪くないよ
>>803
窓のLMStudioでDeepSeek R1動いてるよ。量子化モデルだから偽物って言われちゃうとごめんだが Project DIGITSって一般販売されるんやろうか
放送大学に入って情報理論も学びながらアカデミック扱いを検討すべきか? 放送大学ってアカデミックなメアド貰えるんか?もらえたらそのまま買えちゃいそうだけど 学割では常套手段だけど放送大学の学生証でdigitsを買う権利は手に入るんだろうか 放送大学入るのに費用いくらかかるんだ?
ロハできんの? 使えるなら余裕でペイだけど学生生協とか大学のメールアドレスが必要だったりするから放送大学で適用されるかは分かんないAppleで使える報告はあるからMacを10台くらい買うなら超得かもね 放送大学の学割の有効活用が今号のラジオライフで特集されてた気がする
立ち読みだからどれくらい掛かるか覚えてないけど元を取るのは大変そうだった @campus.ouj.ac.jpのメアドが貰えるらしいね。映画をよく見る人とか、アマプラやadobeやofficeで学割が使えるから悪くはないかも。reddit見る限りpeople大とかでもメアドが貰えそう。国際学生証ISICだけど。 日本でも注目されてるくらいだから海外ではもっとだろうし
大きな需要が確認されれば販路を限定する理由が無いから普通に買えそう(買えるとは言っていない) 需要が大きければ、本当に必要なところに行き渡らなくなるからこそ販路を絞ると思うが。 五月に出てくるわけだから、ニーズがあっても生産数を増やすことは不可能なんでは
ニーズあればあるほど販路は限定されそう
一年くらいまてば変わってくるだろうけど なんか良いキャラ設定はないかと思って同人音声の台本をSTの対話例にぶちこんだら
なかなか良い感じの変態女になってくれた それ良さそうだな
なんなら音声から文字起こしする事も出来ますし deep researchでエロ小説書いてるニキはおらんのか? >>828
STの対話例について詳しく
どのファイル? >>831
ここはローカルメインだからgptスレで聞いてみた方がいいよ
>>832
キャラ設定からAdvanced Definitions(本のマーク)押して出るExamples of dialogueじゃない? >>832
>>833の言う通りやで
この本のマークをクリックして左側に表示されるところの一番の下
https://ul.h3z.jp/3ofOkfQe.jpg
<START>
{{user}}:
{{char}}:
っていう形式で書き込むところや これエロに強そうだけどどんなもんかな
https://huggingface.co/ValueFX9507/Tifa-Deepsex-14b-CoT-GGUF-Q4
> Deepseek-R1-14Bに基づいて、このモデルは深く最適化されており、Tifa_220Bによって生成されたデータセットは、
> トリプルトレーニング戦略を通じて、ロールプレイング、新規テキスト生成、および思考チェーン(CoT)機能を大幅に強化します。
> これは、長期的なコンテキストの関連付けが必要なオーサリング シナリオに特に適しています。 日本語出力はできるけど、コンテンツポリシーを超える描写は「申し訳ありませんが、そのリクエストには対応できません。」されるわ
丁寧に脱獄していけば大丈夫かもしれないけど、日本語もそこまでしっかりはしていないなぁ 今んとこ紳士向けST用途ではLumimaidもしくはLumimaid-Magnum v4超えのブツはあんまりなさそう。
Lumimaid-Magnumの作者Undi95氏がUndiMixという新作出してたけどこれも日本語がびみょかった 日々大量のモデルがあって見切れないから、試しでもオススメされるのは助かるってもんよ >>842
joybod/RoguePlanet-DeepSeek-R1-Qwen-32B-RP-Q4_K_M-GGUF
LM STUDIO+Silly Tavern Staging+noass extension+Pixibot weep Prompt >>843
サンガツ!extensinは試したことないな。入れてみるか
mradermacher/Ninja-V3-nsfw-enhance-GGUF試したけど悪くないな。bergofの強化版という感じのドスケベモデルだ。Q8でも9GB前後だから12〜16GB環境でもサクサクで良い Dolphin3.0 R1 mistral 24bが出てるな
Mistral 24bにR1蒸留させたものみたいだけど、長文癖が付いてて長文think長文出力が出しやすいように感じる
英語オンリーだけど規制なし
CTX長をあっという間に使い果たすけど、これはこれで使い道あるのでは 普通のゲーミングPCで動くようなLLMってもう性能的に頭打ちなんやろか?
話題のモデル色々試したけど結局vecteusでよくねって感想なんやが 小さいモデルでも賢く作る技術は色々出てきているみたいだけど
それがローカルのエロLLMに降りてきている様子はほとんどないな そしてローカルでは123bが一般pcで動かせる最強 そもそも性能の評価が他人と一致しない感じがする
日本語能力と言った場合でも人によって指してるものがズレてるような
流暢さを指してるひとと、理解力を指してるひとと、文章構造を指してるひとがいるのかな 俺なんてそもそもモデルごとの最適なシステムプロンプトが全く分からん >>852
確かにそうかも
ワイの評価は実用的なエロ小説をこちらの意図を正確に汲み取って多彩なセリフ回しで矛盾ないストーリーを正確な日本語で時には露骨な表現も使いながら作成してくれるモデルを高評価にしてるわ デカいLLM動かすにはヘボいPCでも一定以上の成果だしてくれるモデルがあるのは本当にありがてえよ >>853
まずはバニラでいくつかプロットを試すんだ
で、良さげと思ったら強化プロンプトぶち込んだりしてみるといいよ
初めから使うと正確に評価できんから おおお
koboldがMulti-pass websearchにも対応してさらにwebsearchが使い勝手よくなった 最終的には指示に従うけど適度に恥ずかしがったり嫌がったりするキャラ作りが難しく難航中 ローカルはシステムプロンプト以前にTop-P Top-KとかInstruct Tag Presetで全然出力が変わるし未だになんも正解がわからないぞ俺
何を基準にすればいいのやら >>859
とりあえずkoboldのデフォ設定でいいんじゃない? >>860
Top‑PとTop‑Kが高すぎると一貫性が失われやすくて実際ローカルLLMは頭が悪い割にすぐめちゃくちゃなこと言い出して指示に従わないことがあるから
体感的には下げたほうが方向修正の回数が減って楽になったんだけどいじらないのが普通なの? >>861
自分はずっとデフォにしてるけど、特に問題なかったかな >>862
用途にもよるんかな?ワイはクソ長い設定渡してロールプレイさせてる
EasyNovelだと安定する内容がKoboldだと不安定になったりするからなんか特別な設定が必要なのかなと思ってる silly tavernの場合は設定のプリセットがたくさん入ってるから適当に選んで比較してみるといいよ
と言っても俺はやっぱりよく分からんかったけど やっぱりみんなよく分かってないのか
コンテキストテンプレートもよく分かんねえや
モデルごとに尻タブでのオススメ設定が書いてあればいいのに >>865
尻とkobold連携させる時はプリセットだと上手くいかなかったからkoboldのデフォ設定と同じにして使ってたな わかんないとこをばんばん投げるのが良い気がする
koboldcppについてるウェブ応答画面はkobold ai liteのキャラ設定が動いてるっぽいけど外す方法がわからん、とか
Ai lite側の規制で申し訳出してきやがるんだよな >>868
あのアイコンの代わりに好きな画像表示すればいいじゃない 好きな女の顔で胡乱なことを言われるのが嫌なので龍アイコンのままにしてる 版権キャラでチャット遊びする時はそのキャラの画像にしてるw ■ このスレッドは過去ログ倉庫に格納されています