なんJLLM部 避難所 ★3
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@ピンキー 転載ダメ (ワッチョイ 93c0-oLG6)2024/06/09(日) 07:37:14.82ID:???0
!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC(できれば+3060 12GB以上)でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部 避難所 ★2
https://mercury.bbspink.com/test/read.cgi/onatech/1714642045/

-
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured
0589名無しさん@ピンキー (ワッチョイ 4b54-35Um)2024/07/23(火) 17:42:33.69ID:???0
少なくとも日本の法律じゃエロ文章で逮捕されることはない
たとえそれがペドロリでも(文章には児ポ判定無し)
できることはせいぜいBANくらいだけど、openaiもanthroも返金されるので、banされたところで特に痛くもない
犯罪系や自殺系は知らんが
0590名無しさん@ピンキー (ワッチョイ 0bc0-s/UN)2024/07/23(火) 19:59:50.18ID:???0
ChatGPTで〜のスレとか見てるとようあんな性癖全部盛りのプロンプトを検閲されたり学習されたり可能性あるよそさまのサーバーにしこたま送りつけるよなと思ってしまうわ
ある意味男気あふれてて感心する
0593名無しさん@ピンキー (ワッチョイ bb87-3SVq)2024/07/23(火) 22:18:16.97ID:WTarfT0L0
Mistral-Nemo-InstructをQ4_K_Mに量子化してみたけどけっこう賢くて良い感じだわ
Q4だしさすがに精度は低いけど、3万字くらいの長文読ませても壊れないでちゃんと返答してくれるし
そこからキャラなりきりもできるのはほんと進歩を感じる
0594名無しさん@ピンキー (ワッチョイ 5f1e-G/Qc)2024/07/24(水) 00:45:09.02ID:v0jtOIDf0
赤ちゃん質問で申し訳ない
SillyTavernでclaude3 APIに接続する方法ってどこかに載っとる?
調べても英語ばっかりだし翻訳してもよくわからん
0596名無しさん@ピンキー (ワッチョイ 6f69-G/Qc)2024/07/24(水) 02:31:24.98ID:89UGJXd20
APIキー既に取得済みって前提になるが
https://imgur.com/a/QsCkPSG
この一番上のAPIでChat Compilation選ぶとChat Compilation SourceからClaude選べんか?
あかんか?
0598名無しさん@ピンキー (ワッチョイ 1bbe-G/Qc)2024/07/24(水) 05:55:27.51ID:???0
>>597
poeとかはわざと緩くしてるだけだよ
サービス元によって同じモデルでも明らかに申し訳される度合いが違う
そもそも入力そのものをAIでチェック出来るから本気で検閲されたら全部アウトになる
0603名無しさん@ピンキー (ワッチョイ 8bc7-3QTr)2024/07/24(水) 06:59:12.86ID:???0
RAGも大葉のLoraも
なりきりでやって欲しいキャラのセリフと設定入れたら(セリフ集にユーザーとのやり取りも入れてる)
どのモデルも何故かユーザー役になりきるんだが
オススメの知識の入れ方ってある?
0604名無しさん@ピンキー (ワッチョイ 0fdc-V2rD)2024/07/24(水) 08:45:43.79ID:???0
llama3.1がgroqで触れるので70b版を触って来たけど最低限日本語っぽいものが返ってくるレベルやな 
脱獄プロンプト入れればエロプロンプトも通るけど誤字や簡体字混じりの文章でなにかのトリガーで同じフレーズを繰り返し始めるしなかなか厳しい
command r+くらいの性能はあると期待してたけど設定が悪いんかな
0605名無しさん@ピンキー (ワッチョイ 1f5e-G/Qc)2024/07/24(水) 10:04:08.93ID:VZ5aVPvs0
>>603
尻タブなら>>153周辺参考にしてもらえればなんやけど、大葉ってcustom stopping strings的な機能あったかわからん
あると思うが名称違うかもしれん
0608名無しさん@ピンキー (ワッチョイ 5fb3-x6+9)2024/07/24(水) 10:24:30.47ID:???0
perplexityで405B使えるけど、控えめに言ってゴミ
指示を理解してない上にそれを差し引いても表現ができてない
出力の質はGPT4oどころかGPT3.5にも劣る
0618名無しさん@ピンキー (ワッチョイ 9b32-srET)2024/07/24(水) 12:21:43.72ID:???0
>>608
しかも3より規制きついな
日本語能力は対象外になってるのでまあ、御察し
ただ、推論力は高い
英語での質問に生徒会恋愛問題を完全とは言わないが正解に近づいけていた
日本語での質問はダメだったがw
0620名無しさん@ピンキー (ワッチョイ dffb-3SVq)2024/07/24(水) 12:51:22.01ID:???0
生徒会恋愛問題とは一体・・・・うごごっ

誰かマルチモーダル試している人居ないか?
画像を読み込ませて解析させるChatGPTとかでお馴染みの機能
大葉は拡張設定が面倒でkoboldcppで試したけど上手く行かん

画像生成のCILPに該当するllava mmprojのモデルに汎用性が無い?
ninjaやエロLLMで使おうとしたら壊れた文章しか出さなかった
llavaとセットのllmで動かしたら低性能だけど一応は動いた
0622名無しさん@ピンキー (ワッチョイ 5f74-1Aj4)2024/07/24(水) 14:40:38.30ID:???0
そもそも3.0からどれくらい性能アップしとるんやろな

3.0 70bはgemma2 27bよりも英語では性能低いから
3.1 70bが多少性能上がったところで日本語特化モデル作るならgemma2 27bと思うんやな
0627名無しさん@ピンキー (ワッチョイ 4b09-PUYf)2024/07/24(水) 20:40:38.12ID:???0
現状ローカル寄りというのは正しいけど、それはwebサービスで満足できない奴がより深い所に辿り着く結果ローカルの話になっているだけだと思う。
webサービスにより良いもの、新しいものが出現したら話題がそっちに流れる事はありうる。(405Bの話の様に)
0632名無しさん@ピンキー (ワッチョイ 0fd5-upSA)2024/07/25(木) 04:21:16.00ID:V89ZaqLA0
>>629
llama-3.1とELYZAの悪魔合体モデルか
0633名無しさん@ピンキー (ワッチョイ 0fd5-upSA)2024/07/25(木) 04:22:54.23ID:V89ZaqLA0
Ninjaにllama-3.1追加してください
0634名無しさん@ピンキー (ワッチョイ bbbb-TapC)2024/07/25(木) 04:31:57.45ID:G9bWACJA0
>>629
はえーな
こんなでかいモデルのファインチューニングそんなすぐできるもんなのか
0638名無しさん@ピンキー (ワッチョイ 5f9f-YxOV)2024/07/25(木) 09:14:19.76ID:???0
https://huggingface.co/aixsatoshi/Meta-Llama-3.1-8B-Instruct-plus-Swallow
>Swallow-8Bは追加の日本語継続事前学習により日本語が大変流暢なLlama-3派生モデルです。
>このBranchとLlama3との差分ベクトルを、アップグレードされた新しいMeta Llama-3.1-8B-Instructに移植しました。
>Meta-Llama-3.1-8B-Instruct + 0.7*(tokyotech-llm/llama-3-Swallow-8b - meta-llama/Meta-Llama-3-8B)
0644名無しさん@ピンキー (ワッチョイ 5f74-cRQS)2024/07/25(木) 11:22:43.26ID:???0
chat arena見てたらいつの間にか言語別のランキング見れるようになってるな
結局日本語でもローカルで使えるモデルで一番高いのgemma2 27bだけど
日本語投票数少ないからもっと日本語でやらなあかんな
0647名無しさん@ピンキー (ワッチョイ 5f30-XTc+)2024/07/25(木) 12:27:14.89ID:kmDdavSa0
llama3.1に「山崎春のパン祭り」の説明させても不正解でがっかり
nemotronはシールと景品に言及できるあたり知識ベース自体はしっかりしてんのかな
0649名無しさん@ピンキー (ワッチョイ 4b09-PUYf)2024/07/25(木) 13:09:05.83ID:???0
たまに話に出てるMedSwallow-70B使ってみたけど、それなりに賢いしなんかエロい。
ただ書かれてる通り挙動がおかしい。
色々出てきても結局MoE-TEST-2x7B-NSFWが一番まともな気がする。
0650名無しさん@ピンキー (ワッチョイ 0f8e-srET)2024/07/25(木) 18:12:04.46ID:???0
mistral-large、3bitくらいまで量子化しないと動かんけどとりあえず試してみたがエロも普通に通るし日本語も自然だな
6t/sくらいしか出ないからまだあんまり試せてないけどもうちょっといろいろ触ってみる
0661名無しさん@ピンキー (ワッチョイ fb5a-V2rD)2024/07/25(木) 23:57:00.64ID:???0
ほへー構成メインか……どのレベルなんやろ
自分は起承転結やら個々のエピソードまでは構成するけど
・険悪だった二人が◯◯というきっかけで仲良くなるシーンを1000文字で
みたいなフォーマットで書いてくれるなら
かなり創作の手助けになるんやが

エロでいうと
・フェラだけで1000文字で
といっても三行で終わらせて本番始めるモデルばかりで辛い
0663名無しさん@ピンキー (ワッチョイ fb32-G/Qc)2024/07/26(金) 03:31:04.84ID:???0
どもる文章がおかしくなることがよくあるな
「い、今やろうとしたところだ!」が正しい形なのに
「こ、今やろうとしたところだ!」となって漢字の読みを考慮しないことがある
Q5とか使ってるからなのか

>>862
裏でのやり取りごと消去って出来ないのかな?
0664名無しさん@ピンキー (ワッチョイ 9bab-G/Qc)2024/07/26(金) 05:14:52.62ID:???0
>>660
ファイル名書き換えたら読み込んでくれるで。
例えば、kagemusya-7b-v1.5-q8_0の部分をkagemusya-7b-v1Q8_0に書き換える。
わいは使わんやつの名前に書き換えて、色々試してるで。
0665名無しさん@ピンキー (ワッチョイ fb32-G/Qc)2024/07/26(金) 05:24:42.48ID:???0
Mistral-Nemo-Instruct-2407.Q5_K_M.ggufでエッチなことさせて遊んでるけど
単なるロールプレイ会話よりもハメ撮り動画の実況解説みたいなことをさせた方が本領発揮するな
0667名無しさん@ピンキー (ワッチョイ fb32-G/Qc)2024/07/26(金) 06:53:05.18ID:???0
>>666
アルファベットなら頭文字の連続だけでどもりを表現できるけど
読みがたくさんある漢字だと色んなパターンを丸暗記するしかないのか
間違えることなくどもらせるのはかなり難しそうだな
0678名無しさん@ピンキー (ワッチョイ 9b93-b7mV)2024/07/26(金) 18:07:53.12ID:???0
>>670
新参なもんでまだ全然分かってない。すまぬ。
このスレに出てきてないものだと、Antler-7B-evolve、
EZO(common/humanitiesの2つ)があるから試してみて。

Antler-7B-evolveはKagemsyaみたいな用途で使えると思う。
0679名無しさん@ピンキー (ワッチョイ 1bbe-G/Qc)2024/07/26(金) 21:29:01.00ID:???0
3.5sonnetがマジでかしこいな
ちゃんと設定すればそこそこ複雑な設定のゲームも進行させられる
この技術がPCゲームに応用されたら凄いことになるんだろうけどなぁ
0680名無しさん@ピンキー (ワッチョイ cb11-FnV+)2024/07/26(金) 21:33:05.12ID:zWi3niPt0
Mistral Large 2
脱獄なしで設定書くだけでもNSFW出力してくれて大変良い
ロリNGとかも特になさそう
若干繰り返し癖はある
https://i.imgur.com/09DNkK1.png
0682名無しさん@ピンキー (ワッチョイ 3311-Mtf7)2024/07/27(土) 00:14:33.14ID:s9nYYsMX0
>>681
量子化のレベルはIQ3_M(モデルサイズ55GB)で、64GBのunified memoryにロードしてる
意外と量子化による影響はあまり感じない(ちゃんと計測したらなんらかの劣化はあるだろうが)
0683名無しさん@ピンキー (ワッチョイ e720-7i3u)2024/07/27(土) 00:14:48.90ID:lT0n9RUP0
>>680
いいねー
こういうオープンソースが増えるのは明るい未来に繋がる
0687名無しさん@ピンキー (ワッチョイ 7bc1-/CG0)2024/07/27(土) 15:18:05.92ID:???0
>>683
オープンソースじゃないんだよなぁ
たぶんフラッグシップモデルの開示はする予定じゃなかったんだろうけど

オープンソースと言えるのはApache2.0ライセンスやMITライセンスのやつ
LlamaもGemmaも制限があるし、Mistral Large2は研究用だから研究にしか使えない
Gemmaライセンスは違法なことや公序良俗に反することに使うなってだけで制限が緩いけどね
0688名無しさん@ピンキー (ワッチョイ 3311-Mtf7)2024/07/27(土) 18:52:19.55ID:s9nYYsMX0
上にあるサイバーエージェントのやつも試してみた
Finetuningでバカになってる感じもあまりないし、いいかもしれない
https://i.imgur.com/DASmyky.png
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況