なんJLLM部避難所 ★3

1002コメント349KB

なんJLLM部避難所 ★3

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ 93c0-oLG6)

2024/06/09(日) 07:37:14.82ID:???0

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★2
https://mercury.bbspink.com/test/read.cgi/onatech/1714642045/

-
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0593名無しさん＠ピンキー (ﾜｯﾁｮｲ bb87-3SVq)

2024/07/23(火) 22:18:16.97ID:WTarfT0L0

Mistral-Nemo-InstructをQ4_K_Mに量子化してみたけどけっこう賢くて良い感じだわ
Q4だしさすがに精度は低いけど、3万字くらいの長文読ませても壊れないでちゃんと返答してくれるし
そこからキャラなりきりもできるのはほんと進歩を感じる

0594名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f1e-G/Qc)

2024/07/24(水) 00:45:09.02ID:v0jtOIDf0

赤ちゃん質問で申し訳ない
SillyTavernでclaude3 APIに接続する方法ってどこかに載っとる？
調べても英語ばっかりだし翻訳してもよくわからん

0595名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MMff-C9XH)

2024/07/24(水) 00:49:10.84ID:???M

llama-3.1エロプロンプト普通に通るね

0596名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f69-G/Qc)

2024/07/24(水) 02:31:24.98ID:89UGJXd20

APIキー既に取得済みって前提になるが
https://imgur.com/a/QsCkPSG
この一番上のAPIでChat Compilation選ぶとChat Compilation SourceからClaude選べんか？
あかんか？

0597名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fb3-x6+9)

2024/07/24(水) 04:13:13.30ID:???0

>>592
よくできた脱獄はLLMの本質突いてるから対策できないよ
というか対策したら性能落ちる
もう諦めて各社BANとか警戒度で対策するしかなくなってるのが現状

0598名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-G/Qc)

2024/07/24(水) 05:55:27.51ID:???0

>>597
poeとかはわざと緩くしてるだけだよ
サービス元によって同じモデルでも明らかに申し訳される度合いが違う
そもそも入力そのものをAIでチェック出来るから本気で検閲されたら全部アウトになる

0599名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fb3-x6+9)

2024/07/24(水) 06:14:04.09ID:???0

>>598
それはanthroに怒られたくないからやってるだけ
性能落ちるからやりたくないのが本音
anthroもAPIには規制かけてないのが何よりの証拠

0600名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f6f-tk+8)

2024/07/24(水) 06:30:40.27ID:???0

ここってローカル限定？

0601名無しさん＠ピンキー (ﾜｯﾁｮｲ fb32-G/Qc)

2024/07/24(水) 06:34:38.24ID:???0

ローカル限定ではないけどローカル中心ではある

0602名無しさん＠ピンキー (ﾜｯﾁｮｲ 9fa3-8WH3)

2024/07/24(水) 06:40:51.50ID:???0

非ローカルは別スレがあるからね
ここはローカル寄り

0603名無しさん＠ピンキー (ﾜｯﾁｮｲ 8bc7-3QTr)

2024/07/24(水) 06:59:12.86ID:???0

RAGも大葉のLoraも
なりきりでやって欲しいキャラのセリフと設定入れたら（セリフ集にユーザーとのやり取りも入れてる）
どのモデルも何故かユーザー役になりきるんだが
オススメの知識の入れ方ってある？

0604名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fdc-V2rD)

2024/07/24(水) 08:45:43.79ID:???0

llama3.1がgroqで触れるので70b版を触って来たけど最低限日本語っぽいものが返ってくるレベルやな　
脱獄プロンプト入れればエロプロンプトも通るけど誤字や簡体字混じりの文章でなにかのトリガーで同じフレーズを繰り返し始めるしなかなか厳しい
command r+くらいの性能はあると期待してたけど設定が悪いんかな

0605名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f5e-G/Qc)

2024/07/24(水) 10:04:08.93ID:VZ5aVPvs0

>>603
尻タブなら>>153周辺参考にしてもらえればなんやけど、大葉ってcustom stopping strings的な機能あったかわからん
あると思うが名称違うかもしれん

0606名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f5d-UVyF)

2024/07/24(水) 10:16:53.06ID:???0

ついにGPT4oを超えるオープンなLLMが出た
すごい事だが405bって何GBあれば動くんだ

0607名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-srET)

2024/07/24(水) 10:17:32.79ID:???0

なんか日本語弱いらしいよ

0608名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fb3-x6+9)

2024/07/24(水) 10:24:30.47ID:???0

perplexityで405B使えるけど、控えめに言ってゴミ
指示を理解してない上にそれを差し引いても表現ができてない
出力の質はGPT4oどころかGPT3.5にも劣る

0609名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f8e-srET)

2024/07/24(水) 10:38:57.85ID:???0

モデルカードの対応言語に日本語がないしまあ普通に対応外なだけなんじゃないか

0610名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fb3-x6+9)

2024/07/24(水) 10:55:04.74ID:???0

ドスケベメイドの自己紹介
3.5sonnet
i.imgur.com/UCpdPOL.png
GPT4o
i.imgur.com/s0VQ7ls.png
3opus
i.imgur.com/qQlveZY.png
LLAMA3.1 450B
i.imgur.com/BncztsU.png

0611名無しさん＠ピンキー (ﾜｯﾁｮｲ 8bc7-3QTr)

2024/07/24(水) 11:30:11.56ID:???0

>>605
ありがとう
尻使いなので一度やってみたんだか発狂しだしてな…
Lora使わずにプロンプトいじったり
単体のセリフ集をRAGしてみるよ

0612名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f74-cRQS)

2024/07/24(水) 11:31:59.62ID:???0

日本語はもうcohereに期待するしかないな
405bじゃ個人でのファインチューンも難しいだろうし

0613名無しさん＠ピンキー (ﾜｯﾁｮｲ 9be3-V2rD)

2024/07/24(水) 11:47:38.37ID:???0

別にしちゃダメってわけじゃないけど
何でローカル寄りなスレなのにパープレやpoeでの脱獄を推奨する人がここに居座ってるんや…？

0614名無しさん＠ピンキー (ﾜｯﾁｮｲ fb32-G/Qc)

2024/07/24(水) 12:00:17.76ID:???0

エッチなことをするとすぐ頭が真っ白になるのをやめさせたい
もっと他に表現方法ないのかよ！

0615名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f64-l0Lg)

2024/07/24(水) 12:03:45.08ID:???0

嫌なら出てけば？
誰も困らんぞ

0616名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-G/Qc)

2024/07/24(水) 12:19:35.50ID:???0

かしこさでは3.5sonnetが頭１つ抜けててCR+その他のローカル可能モデルは置いて行かれてる感じだな

0617名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f8e-srET)

2024/07/24(水) 12:21:43.30ID:???0

Llama3.1については70Bでも本来のベンチマークスコアは高いので
405Bは置いといて70Bベースの日本語モデルが出ることに期待してる

0618名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-srET)

2024/07/24(水) 12:21:43.72ID:???0

>>608
しかも3より規制きついな
日本語能力は対象外になってるのでまあ、御察し
ただ、推論力は高い
英語での質問に生徒会恋愛問題を完全とは言わないが正解に近づいけていた
日本語での質問はダメだったがｗ

0619名無しさん＠ピンキー (ﾜｯﾁｮｲ 8b6a-oASD)

2024/07/24(水) 12:46:30.17ID:???0

405bそんなダメかなあ

0620名無しさん＠ピンキー (ﾜｯﾁｮｲ dffb-3SVq)

2024/07/24(水) 12:51:22.01ID:???0

生徒会恋愛問題とは一体・・・・うごごっ

誰かマルチモーダル試している人居ないか？
画像を読み込ませて解析させるChatGPTとかでお馴染みの機能
大葉は拡張設定が面倒でkoboldcppで試したけど上手く行かん

画像生成のCILPに該当するllava mmprojのモデルに汎用性が無い？
ninjaやエロLLMで使おうとしたら壊れた文章しか出さなかった
llavaとセットのllmで動かしたら低性能だけど一応は動いた

0621名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ba0-srET)

2024/07/24(水) 14:29:49.07ID:???0

405Bいらんから70Bの日本語特化モデルを出してくれよ

0622名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f74-1Aj4)

2024/07/24(水) 14:40:38.30ID:???0

そもそも3.0からどれくらい性能アップしとるんやろな

3.0 70bはgemma2 27bよりも英語では性能低いから
3.1 70bが多少性能上がったところで日本語特化モデル作るならgemma2 27bと思うんやな

0623名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f8e-srET)

2024/07/24(水) 16:15:37.61ID:???0

>>619
ダメとかの問題じゃなくて動かせないし…

0624名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-srET)

2024/07/24(水) 18:11:04.83ID:???0

>>623
ワイはperplexityで試した

0625名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f74-1Aj4)

2024/07/24(水) 18:56:02.25ID:???0

公式に日本語対応してないからしゃーないやろ
まず英語の性能見たいけどchat arenaにまだ出てきてへん
まぁあとニ2、3日すれば出てくるやろ

0626名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fb3-x6+9)

2024/07/24(水) 20:08:33.07ID:???0

英語エロも試したけど、曖昧な表現ばかりでそもそもエロにならないな
オナニー実況
3.5sonnet
https://i.imgur.com/2Hn2wi0.png
llama3.1 405B
https://i.imgur.com/ViFZaCE.png

0627名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b09-PUYf)

2024/07/24(水) 20:40:38.12ID:???0

現状ローカル寄りというのは正しいけど、それはwebサービスで満足できない奴がより深い所に辿り着く結果ローカルの話になっているだけだと思う。
webサービスにより良いもの、新しいものが出現したら話題がそっちに流れる事はありうる。(405Bの話の様に)

0628名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-srET)

2024/07/24(水) 20:41:14.54ID:???0

>>626
規制がパワーアップしてるせいだな
pfnet/Llama3-Preferred-MedSwallow-70B
↑これみたいなfinetuneされれば、化けるかも

0629名無しさん＠ピンキー (ﾜｯﾁｮｲ df63-G/Qc)

2024/07/24(水) 23:47:18.89ID:mVMyWHlD0

Llama3.1で日本語使えるようにしたファインチューンモデルが出たみたいやで
https://huggingface.co/DataPilot/Llama3.1-ArrowSE-v0.4

0630名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f49-C9XH)

2024/07/25(木) 00:36:59.52ID:???0

mistralがなんか123Bの多言語モデル出した

0631名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f49-C9XH)

2024/07/25(木) 00:38:33.04ID:???0

https://huggingface.co/mistralai/Mistral-Large-Instruct-2407

0632名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fd5-upSA)

2024/07/25(木) 04:21:16.00ID:V89ZaqLA0

>>629
llama-3.1とELYZAの悪魔合体モデルか

0633名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fd5-upSA)

2024/07/25(木) 04:22:54.23ID:V89ZaqLA0

Ninjaにllama-3.1追加してください

0634名無しさん＠ピンキー (ﾜｯﾁｮｲ bbbb-TapC)

2024/07/25(木) 04:31:57.45ID:G9bWACJA0

>>629
はえーな
こんなでかいモデルのファインチューニングそんなすぐできるもんなのか

0635名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f6f-tk+8)

2024/07/25(木) 04:48:12.15ID:???0

ロールプレイ向いてるのってどれなんだろ

0636名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f5d-UVyF)

2024/07/25(木) 07:13:16.65ID:???0

Llama3.1 405bをRAM128GBのMac book Pro*2で外人が動かしてた
256GBあればローカルで動くんだな

0637名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-oq5P)

2024/07/25(木) 07:13:44.20ID:???0

>>634
8bのモデルやん

0638名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f9f-YxOV)

2024/07/25(木) 09:14:19.76ID:???0

https://huggingface.co/aixsatoshi/Meta-Llama-3.1-8B-Instruct-plus-Swallow
>Swallow-8Bは追加の日本語継続事前学習により日本語が大変流暢なLlama-3派生モデルです。
>このBranchとLlama3との差分ベクトルを、アップグレードされた新しいMeta Llama-3.1-8B-Instructに移植しました。
>Meta-Llama-3.1-8B-Instruct + 0.7*(tokyotech-llm/llama-3-Swallow-8b - meta-llama/Meta-Llama-3-8B)

0639名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f21-oASD)

2024/07/25(木) 09:31:55.28ID:???0

405bに日本語がそもそもサポート言語に入ってないね

0640名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f2e-x6+9)

2024/07/25(木) 09:33:45.09ID:???0

日本語も普通に出るけどね
文章力は英語でも何でもどのみち低品質だから対応云々はあまり関係ない気がする

0641名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-srET)

2024/07/25(木) 09:39:16.09ID:???0

何のための405Kだー！

0642名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-srET)

2024/07/25(木) 09:39:32.48ID:???0

bだった

0643名無しさん＠ピンキー (ｼｬﾁｰｸ 0Cdf-oq5P)

2024/07/25(木) 10:50:28.42ID:???C

mistralai/Mistral-Large-Instruct-2407
で、これどうなん？
gguf出てるが出先で試せん

0644名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f74-cRQS)

2024/07/25(木) 11:22:43.26ID:???0

chat arena見てたらいつの間にか言語別のランキング見れるようになってるな
結局日本語でもローカルで使えるモデルで一番高いのgemma2 27bだけど
日本語投票数少ないからもっと日本語でやらなあかんな

0645名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f74-cRQS)

2024/07/25(木) 11:40:28.19ID:???0

今chat arena投票するとめっちゃllama3.1出てくる
やってみてわかったのはllama3.0よりも日本語は間違いなく改善してる

0646名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f49-C9XH)

2024/07/25(木) 12:07:20.89ID:???0

チャットしてるとGemma 2よりCommand R+の方が日本語流暢だと感じるんだけど、あんまり一般的な感覚じゃないんかね

0647名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f30-XTc+)

2024/07/25(木) 12:27:14.89ID:kmDdavSa0

llama3.1に「山崎春のパン祭り」の説明させても不正解でがっかり
nemotronはシールと景品に言及できるあたり知識ベース自体はしっかりしてんのかな

0648名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f6f-tk+8)

2024/07/25(木) 12:44:25.44ID:???0

スレ間違えたスマソ

0649名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b09-PUYf)

2024/07/25(木) 13:09:05.83ID:???0

たまに話に出てるMedSwallow-70B使ってみたけど、それなりに賢いしなんかエロい。
ただ書かれてる通り挙動がおかしい。
色々出てきても結局MoE-TEST-2x7B-NSFWが一番まともな気がする。

0650名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f8e-srET)

2024/07/25(木) 18:12:04.46ID:???0

mistral-large、3bitくらいまで量子化しないと動かんけどとりあえず試してみたがエロも普通に通るし日本語も自然だな
6t/sくらいしか出ないからまだあんまり試せてないけどもうちょっといろいろ触ってみる

0651名無しさん＠ピンキー (ﾜｯﾁｮｲ fb32-G/Qc)

2024/07/25(木) 18:31:31.08ID:???0

koboldがMistral-Nemo-Instructに対応したな

0652名無しさん＠ピンキー (ﾜｯﾁｮｲ df7c-FHR6)

2024/07/25(木) 20:39:36.33ID:???0

非対応やったんか
道理で落ちると思ったわ

0653名無しさん＠ピンキー (ﾜｯﾁｮｲ df7c-FHR6)

2024/07/25(木) 20:58:11.21ID:???0

試したらMistral-Nemo-Instructが「こんちにちです。」って挨拶してきてズッコケたわ
temperatureが高すぎるだけやった

0654名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-G/Qc)

2024/07/25(木) 22:20:47.15ID:???0

APIは規制強化の波が来てるしやっぱローカルの進化にかけるしかないな

0655名無しさん＠ピンキー (JP 0Hdf-3SVq)

2024/07/25(木) 22:57:00.04ID:???H

円高になってグラボ安く買えるようになるといいねぇ

0656名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b8c-fado)

2024/07/25(木) 23:04:05.55ID:???0

そうはいっても300万円のカードが200万円になっても買えぬ
革ジャン潰して欲しい

0657名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f74-1Aj4)

2024/07/25(木) 23:11:44.84ID:???0

1bit LLMが主流になってほしい・・・

0658名無しさん＠ピンキー (ﾜｯﾁｮｲ 9bb9-fh/A)

2024/07/25(木) 23:20:12.41ID:hJ3Sr1Ob0

https://huggingface.co/akineAItech/kagemusya-7B-v1.5-Q8_0-GGUF
https://huggingface.co/akineAItech/kagemusya-7B-v1.5

ベータ版ですがkagemusya-V1.5をリリースしました。
小説の“構成”の学習を試みたモデルです。
ぜひお試しください。

0659名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM5f-C9XH)

2024/07/25(木) 23:49:34.68ID:???M

>>647
こういうのはRAGの領分なのでそもそもモデルの基礎知識に頼るべきじゃない

0660名無しさん＠ピンキー (ﾜｯﾁｮｲ 0bc8-srET)

2024/07/25(木) 23:52:16.41ID:???0

>>658
ありがとうございます
enaで対応していただいたら使用させていただきます

0661名無しさん＠ピンキー (ﾜｯﾁｮｲ fb5a-V2rD)

2024/07/25(木) 23:57:00.64ID:???0

ほへー構成メインか……どのレベルなんやろ
自分は起承転結やら個々のエピソードまでは構成するけど
・険悪だった二人が◯◯というきっかけで仲良くなるシーンを1000文字で
みたいなフォーマットで書いてくれるなら
かなり創作の手助けになるんやが

エロでいうと
・フェラだけで1000文字で
といっても三行で終わらせて本番始めるモデルばかりで辛い

0662名無しさん＠ピンキー (ﾜｯﾁｮｲ 8bc7-utX6)

2024/07/26(金) 01:06:11.60ID:???0

一人芝居ストップかけても尻の表面に出ないだけで裏ではやり取りがっつりあるのヘコむわ

0663名無しさん＠ピンキー (ﾜｯﾁｮｲ fb32-G/Qc)

2024/07/26(金) 03:31:04.84ID:???0

どもる文章がおかしくなることがよくあるな
「い、今やろうとしたところだ！」が正しい形なのに
「こ、今やろうとしたところだ！」となって漢字の読みを考慮しないことがある
Q5とか使ってるからなのか

>>862
裏でのやり取りごと消去って出来ないのかな？

0664名無しさん＠ピンキー (ﾜｯﾁｮｲ 9bab-G/Qc)

2024/07/26(金) 05:14:52.62ID:???0

>>660
ファイル名書き換えたら読み込んでくれるで。
例えば、kagemusya-7b-v1.5-q8_0の部分をkagemusya-7b-v1Q8_0に書き換える。
わいは使わんやつの名前に書き換えて、色々試してるで。

0665名無しさん＠ピンキー (ﾜｯﾁｮｲ fb32-G/Qc)

2024/07/26(金) 05:24:42.48ID:???0

Mistral-Nemo-Instruct-2407.Q5_K_M.ggufでエッチなことさせて遊んでるけど
単なるロールプレイ会話よりもハメ撮り動画の実況解説みたいなことをさせた方が本領発揮するな

0666名無しさん＠ピンキー (ﾜｯﾁｮｲ fb50-x6+9)

2024/07/26(金) 06:05:16.89ID:???0

>>663
opusとかでもそうなるよ
AIは文章を音として読んでるわけじゃないから、読みなんて再現できなくて当たり前
用例を全て丸暗記するしかない

0667名無しさん＠ピンキー (ﾜｯﾁｮｲ fb32-G/Qc)

2024/07/26(金) 06:53:05.18ID:???0

>>666
アルファベットなら頭文字の連続だけでどもりを表現できるけど
読みがたくさんある漢字だと色んなパターンを丸暗記するしかないのか
間違えることなくどもらせるのはかなり難しそうだな

0668名無しさん＠ピンキー (ﾜｯﾁｮｲ 8bc7-utX6)

2024/07/26(金) 08:45:13.81ID:???0

>>663
lmstadioに尻と同じプロンプト入れたらひとまず出なくなった

0669名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr5f-VXyX)

2024/07/26(金) 09:14:05.34ID:???r

>>665
Nemoは最初から無検閲らしいね

0670名無しさん＠ピンキー (ﾜｯﾁｮｲ 0bc8-srET)

2024/07/26(金) 11:40:31.90ID:???0

>>664
リネームでやってみます
助言ありがとうございます

用途に依るんだと思いますが
色々試したもので良かったモデルはありましたか

0671名無しさん＠ピンキー (ﾜｯﾁｮｲ 4fcc-oASD)

2024/07/26(金) 12:21:43.43ID:???0

規制かければかけるほど阿呆になるみたいだし
あんまり規制かけないでほしいな

0672名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM5f-C9XH)

2024/07/26(金) 12:56:05.83ID:???M

>>650
Mistral Large結構いい感じだよね
トークナイザが日本語に最適化されてなくて厳しいけど

0673名無しさん＠ピンキー (ﾜｯﾁｮｲ df77-1fg3)

2024/07/26(金) 15:32:19.59ID:???0

Vecteus好きだ
すぐ淫乱にならないところが

0674名無しさん＠ピンキー (ﾜｯﾁｮｲ fb32-G/Qc)

2024/07/26(金) 16:52:46.46ID:???0

応答の長さ（トークン数）を増やし過ぎても繰り返しが多くなるのか
何を弄ったらどう変わるのかいまいち把握しきれないな

0675名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-srET)

2024/07/26(金) 17:22:12.07ID:???0

cyberagent/Llama-3.1-70B-Japanese-Instruct-2407

ちょっと期待

0676名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b09-jkbP)

2024/07/26(金) 17:32:51.57ID:???0

設定といえばkoboldcppのGPUレイヤーだっけ？皆いくつにしてんの？
俺初期値の200のままなんだけど減らしたらええのか？

0677名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f97-C9XH)

2024/07/26(金) 17:46:23.51ID:???0

全レイヤー乗りさえすればいくつでもいいんじゃないの

0678名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b93-b7mV)

2024/07/26(金) 18:07:53.12ID:???0

>>670
新参なもんでまだ全然分かってない。すまぬ。
このスレに出てきてないものだと、Antler-7B-evolve、
EZO（common/humanitiesの2つ）があるから試してみて。

Antler-7B-evolveはKagemsyaみたいな用途で使えると思う。

0679名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-G/Qc)

2024/07/26(金) 21:29:01.00ID:???0

3.5sonnetがマジでかしこいな
ちゃんと設定すればそこそこ複雑な設定のゲームも進行させられる
この技術がPCゲームに応用されたら凄いことになるんだろうけどなぁ

0680名無しさん＠ピンキー (ﾜｯﾁｮｲ cb11-FnV+)

2024/07/26(金) 21:33:05.12ID:zWi3niPt0

Mistral Large 2
脱獄なしで設定書くだけでもNSFW出力してくれて大変良い
ロリNGとかも特になさそう
若干繰り返し癖はある
https://i.imgur.com/09DNkK1.png

0681名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fc7-Yk6i)

2024/07/26(金) 23:21:54.19ID:???0

>>680
w

VRAMどれくらいあれば動くの？

0682名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-Mtf7)

2024/07/27(土) 00:14:33.14ID:s9nYYsMX0

>>681
量子化のレベルはIQ3_M(モデルサイズ55GB)で、64GBのunified memoryにロードしてる
意外と量子化による影響はあまり感じない(ちゃんと計測したらなんらかの劣化はあるだろうが)

0683名無しさん＠ピンキー (ﾜｯﾁｮｲ e720-7i3u)

2024/07/27(土) 00:14:48.90ID:lT0n9RUP0

>>680
いいねー
こういうオープンソースが増えるのは明るい未来に繋がる

0684名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa0-05lm)

2024/07/27(土) 08:06:35.47ID:???0

サイバーエージェント期待してる。量子化してください

0685名無しさん＠ピンキー (ﾜｯﾁｮｲ 32c7-wyzZ)

2024/07/27(土) 08:58:22.02ID:???0

>>682
ほー、123Bが55GBで済むのか
この休日に試してみようかな

0686名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-Mtf7)

2024/07/27(土) 14:30:13.44ID:s9nYYsMX0

>>684
https://huggingface.co/mmnga/Llama-3.1-70B-Japanese-Instruct-2407-gguf/tree/main

0687名無しさん＠ピンキー (ﾜｯﾁｮｲ 7bc1-/CG0)

2024/07/27(土) 15:18:05.92ID:???0

>>683
オープンソースじゃないんだよなぁ
たぶんフラッグシップモデルの開示はする予定じゃなかったんだろうけど

オープンソースと言えるのはApache2.0ライセンスやMITライセンスのやつ
LlamaもGemmaも制限があるし、Mistral Large2は研究用だから研究にしか使えない
Gemmaライセンスは違法なことや公序良俗に反することに使うなってだけで制限が緩いけどね

0688名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-Mtf7)

2024/07/27(土) 18:52:19.55ID:s9nYYsMX0

上にあるサイバーエージェントのやつも試してみた
Finetuningでバカになってる感じもあまりないし、いいかもしれない
https://i.imgur.com/DASmyky.png

0689名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa0-05lm)

2024/07/27(土) 20:21:33.73ID:???0

>>686
流石だぜモモンガニキ、そこにシビれる!あこがれるゥ!

0690名無しさん＠ピンキー (ﾜｯﾁｮｲ 26de-FjlS)

2024/07/27(土) 22:43:39.29ID:???0

MacでLLM使うのってまだまだ難しい？

0691名無しさん＠ピンキー (ﾜｯﾁｮｲ 32c7-wyzZ)

2024/07/27(土) 22:55:45.70ID:???0

>>682
IQ3_M試してみたけど違和感ないね
ただ、Command R+より遅いなあ
いずれにしても選択肢が増えたのはいいことだわ

0692名無しさん＠ピンキー (ﾜｯﾁｮｲ 1784-ezuo)

2024/07/27(土) 23:33:22.47ID:???0

>>690
別に難しかったことなんて一度もないんじゃないの

■ このスレッドは過去ログ倉庫に格納されています