なんJLLM部避難所 ★3

1002コメント349KB

なんJLLM部避難所 ★3

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ 93c0-oLG6)

2024/06/09(日) 07:37:14.82ID:???0

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★2
https://mercury.bbspink.com/test/read.cgi/onatech/1714642045/

-
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0624名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-srET)

2024/07/24(水) 18:11:04.83ID:???0

>>623
ワイはperplexityで試した

0625名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f74-1Aj4)

2024/07/24(水) 18:56:02.25ID:???0

公式に日本語対応してないからしゃーないやろ
まず英語の性能見たいけどchat arenaにまだ出てきてへん
まぁあとニ2、3日すれば出てくるやろ

0626名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fb3-x6+9)

2024/07/24(水) 20:08:33.07ID:???0

英語エロも試したけど、曖昧な表現ばかりでそもそもエロにならないな
オナニー実況
3.5sonnet
https://i.imgur.com/2Hn2wi0.png
llama3.1 405B
https://i.imgur.com/ViFZaCE.png

0627名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b09-PUYf)

2024/07/24(水) 20:40:38.12ID:???0

現状ローカル寄りというのは正しいけど、それはwebサービスで満足できない奴がより深い所に辿り着く結果ローカルの話になっているだけだと思う。
webサービスにより良いもの、新しいものが出現したら話題がそっちに流れる事はありうる。(405Bの話の様に)

0628名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-srET)

2024/07/24(水) 20:41:14.54ID:???0

>>626
規制がパワーアップしてるせいだな
pfnet/Llama3-Preferred-MedSwallow-70B
↑これみたいなfinetuneされれば、化けるかも

0629名無しさん＠ピンキー (ﾜｯﾁｮｲ df63-G/Qc)

2024/07/24(水) 23:47:18.89ID:mVMyWHlD0

Llama3.1で日本語使えるようにしたファインチューンモデルが出たみたいやで
https://huggingface.co/DataPilot/Llama3.1-ArrowSE-v0.4

0630名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f49-C9XH)

2024/07/25(木) 00:36:59.52ID:???0

mistralがなんか123Bの多言語モデル出した

0631名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f49-C9XH)

2024/07/25(木) 00:38:33.04ID:???0

https://huggingface.co/mistralai/Mistral-Large-Instruct-2407

0632名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fd5-upSA)

2024/07/25(木) 04:21:16.00ID:V89ZaqLA0

>>629
llama-3.1とELYZAの悪魔合体モデルか

0633名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fd5-upSA)

2024/07/25(木) 04:22:54.23ID:V89ZaqLA0

Ninjaにllama-3.1追加してください

0634名無しさん＠ピンキー (ﾜｯﾁｮｲ bbbb-TapC)

2024/07/25(木) 04:31:57.45ID:G9bWACJA0

>>629
はえーな
こんなでかいモデルのファインチューニングそんなすぐできるもんなのか

0635名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f6f-tk+8)

2024/07/25(木) 04:48:12.15ID:???0

ロールプレイ向いてるのってどれなんだろ

0636名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f5d-UVyF)

2024/07/25(木) 07:13:16.65ID:???0

Llama3.1 405bをRAM128GBのMac book Pro*2で外人が動かしてた
256GBあればローカルで動くんだな

0637名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-oq5P)

2024/07/25(木) 07:13:44.20ID:???0

>>634
8bのモデルやん

0638名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f9f-YxOV)

2024/07/25(木) 09:14:19.76ID:???0

https://huggingface.co/aixsatoshi/Meta-Llama-3.1-8B-Instruct-plus-Swallow
>Swallow-8Bは追加の日本語継続事前学習により日本語が大変流暢なLlama-3派生モデルです。
>このBranchとLlama3との差分ベクトルを、アップグレードされた新しいMeta Llama-3.1-8B-Instructに移植しました。
>Meta-Llama-3.1-8B-Instruct + 0.7*(tokyotech-llm/llama-3-Swallow-8b - meta-llama/Meta-Llama-3-8B)

0639名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f21-oASD)

2024/07/25(木) 09:31:55.28ID:???0

405bに日本語がそもそもサポート言語に入ってないね

0640名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f2e-x6+9)

2024/07/25(木) 09:33:45.09ID:???0

日本語も普通に出るけどね
文章力は英語でも何でもどのみち低品質だから対応云々はあまり関係ない気がする

0641名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-srET)

2024/07/25(木) 09:39:16.09ID:???0

何のための405Kだー！

0642名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-srET)

2024/07/25(木) 09:39:32.48ID:???0

bだった

0643名無しさん＠ピンキー (ｼｬﾁｰｸ 0Cdf-oq5P)

2024/07/25(木) 10:50:28.42ID:???C

mistralai/Mistral-Large-Instruct-2407
で、これどうなん？
gguf出てるが出先で試せん

0644名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f74-cRQS)

2024/07/25(木) 11:22:43.26ID:???0

chat arena見てたらいつの間にか言語別のランキング見れるようになってるな
結局日本語でもローカルで使えるモデルで一番高いのgemma2 27bだけど
日本語投票数少ないからもっと日本語でやらなあかんな

0645名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f74-cRQS)

2024/07/25(木) 11:40:28.19ID:???0

今chat arena投票するとめっちゃllama3.1出てくる
やってみてわかったのはllama3.0よりも日本語は間違いなく改善してる

0646名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f49-C9XH)

2024/07/25(木) 12:07:20.89ID:???0

チャットしてるとGemma 2よりCommand R+の方が日本語流暢だと感じるんだけど、あんまり一般的な感覚じゃないんかね

0647名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f30-XTc+)

2024/07/25(木) 12:27:14.89ID:kmDdavSa0

llama3.1に「山崎春のパン祭り」の説明させても不正解でがっかり
nemotronはシールと景品に言及できるあたり知識ベース自体はしっかりしてんのかな

0648名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f6f-tk+8)

2024/07/25(木) 12:44:25.44ID:???0

スレ間違えたスマソ

0649名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b09-PUYf)

2024/07/25(木) 13:09:05.83ID:???0

たまに話に出てるMedSwallow-70B使ってみたけど、それなりに賢いしなんかエロい。
ただ書かれてる通り挙動がおかしい。
色々出てきても結局MoE-TEST-2x7B-NSFWが一番まともな気がする。

0650名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f8e-srET)

2024/07/25(木) 18:12:04.46ID:???0

mistral-large、3bitくらいまで量子化しないと動かんけどとりあえず試してみたがエロも普通に通るし日本語も自然だな
6t/sくらいしか出ないからまだあんまり試せてないけどもうちょっといろいろ触ってみる

0651名無しさん＠ピンキー (ﾜｯﾁｮｲ fb32-G/Qc)

2024/07/25(木) 18:31:31.08ID:???0

koboldがMistral-Nemo-Instructに対応したな

0652名無しさん＠ピンキー (ﾜｯﾁｮｲ df7c-FHR6)

2024/07/25(木) 20:39:36.33ID:???0

非対応やったんか
道理で落ちると思ったわ

0653名無しさん＠ピンキー (ﾜｯﾁｮｲ df7c-FHR6)

2024/07/25(木) 20:58:11.21ID:???0

試したらMistral-Nemo-Instructが「こんちにちです。」って挨拶してきてズッコケたわ
temperatureが高すぎるだけやった

0654名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-G/Qc)

2024/07/25(木) 22:20:47.15ID:???0

APIは規制強化の波が来てるしやっぱローカルの進化にかけるしかないな

0655名無しさん＠ピンキー (JP 0Hdf-3SVq)

2024/07/25(木) 22:57:00.04ID:???H

円高になってグラボ安く買えるようになるといいねぇ

0656名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b8c-fado)

2024/07/25(木) 23:04:05.55ID:???0

そうはいっても300万円のカードが200万円になっても買えぬ
革ジャン潰して欲しい

0657名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f74-1Aj4)

2024/07/25(木) 23:11:44.84ID:???0

1bit LLMが主流になってほしい・・・

0658名無しさん＠ピンキー (ﾜｯﾁｮｲ 9bb9-fh/A)

2024/07/25(木) 23:20:12.41ID:hJ3Sr1Ob0

https://huggingface.co/akineAItech/kagemusya-7B-v1.5-Q8_0-GGUF
https://huggingface.co/akineAItech/kagemusya-7B-v1.5

ベータ版ですがkagemusya-V1.5をリリースしました。
小説の“構成”の学習を試みたモデルです。
ぜひお試しください。

0659名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM5f-C9XH)

2024/07/25(木) 23:49:34.68ID:???M

>>647
こういうのはRAGの領分なのでそもそもモデルの基礎知識に頼るべきじゃない

0660名無しさん＠ピンキー (ﾜｯﾁｮｲ 0bc8-srET)

2024/07/25(木) 23:52:16.41ID:???0

>>658
ありがとうございます
enaで対応していただいたら使用させていただきます

0661名無しさん＠ピンキー (ﾜｯﾁｮｲ fb5a-V2rD)

2024/07/25(木) 23:57:00.64ID:???0

ほへー構成メインか……どのレベルなんやろ
自分は起承転結やら個々のエピソードまでは構成するけど
・険悪だった二人が◯◯というきっかけで仲良くなるシーンを1000文字で
みたいなフォーマットで書いてくれるなら
かなり創作の手助けになるんやが

エロでいうと
・フェラだけで1000文字で
といっても三行で終わらせて本番始めるモデルばかりで辛い

0662名無しさん＠ピンキー (ﾜｯﾁｮｲ 8bc7-utX6)

2024/07/26(金) 01:06:11.60ID:???0

一人芝居ストップかけても尻の表面に出ないだけで裏ではやり取りがっつりあるのヘコむわ

0663名無しさん＠ピンキー (ﾜｯﾁｮｲ fb32-G/Qc)

2024/07/26(金) 03:31:04.84ID:???0

どもる文章がおかしくなることがよくあるな
「い、今やろうとしたところだ！」が正しい形なのに
「こ、今やろうとしたところだ！」となって漢字の読みを考慮しないことがある
Q5とか使ってるからなのか

>>862
裏でのやり取りごと消去って出来ないのかな？

0664名無しさん＠ピンキー (ﾜｯﾁｮｲ 9bab-G/Qc)

2024/07/26(金) 05:14:52.62ID:???0

>>660
ファイル名書き換えたら読み込んでくれるで。
例えば、kagemusya-7b-v1.5-q8_0の部分をkagemusya-7b-v1Q8_0に書き換える。
わいは使わんやつの名前に書き換えて、色々試してるで。

0665名無しさん＠ピンキー (ﾜｯﾁｮｲ fb32-G/Qc)

2024/07/26(金) 05:24:42.48ID:???0

Mistral-Nemo-Instruct-2407.Q5_K_M.ggufでエッチなことさせて遊んでるけど
単なるロールプレイ会話よりもハメ撮り動画の実況解説みたいなことをさせた方が本領発揮するな

0666名無しさん＠ピンキー (ﾜｯﾁｮｲ fb50-x6+9)

2024/07/26(金) 06:05:16.89ID:???0

>>663
opusとかでもそうなるよ
AIは文章を音として読んでるわけじゃないから、読みなんて再現できなくて当たり前
用例を全て丸暗記するしかない

0667名無しさん＠ピンキー (ﾜｯﾁｮｲ fb32-G/Qc)

2024/07/26(金) 06:53:05.18ID:???0

>>666
アルファベットなら頭文字の連続だけでどもりを表現できるけど
読みがたくさんある漢字だと色んなパターンを丸暗記するしかないのか
間違えることなくどもらせるのはかなり難しそうだな

0668名無しさん＠ピンキー (ﾜｯﾁｮｲ 8bc7-utX6)

2024/07/26(金) 08:45:13.81ID:???0

>>663
lmstadioに尻と同じプロンプト入れたらひとまず出なくなった

0669名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr5f-VXyX)

2024/07/26(金) 09:14:05.34ID:???r

>>665
Nemoは最初から無検閲らしいね

0670名無しさん＠ピンキー (ﾜｯﾁｮｲ 0bc8-srET)

2024/07/26(金) 11:40:31.90ID:???0

>>664
リネームでやってみます
助言ありがとうございます

用途に依るんだと思いますが
色々試したもので良かったモデルはありましたか

0671名無しさん＠ピンキー (ﾜｯﾁｮｲ 4fcc-oASD)

2024/07/26(金) 12:21:43.43ID:???0

規制かければかけるほど阿呆になるみたいだし
あんまり規制かけないでほしいな

0672名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM5f-C9XH)

2024/07/26(金) 12:56:05.83ID:???M

>>650
Mistral Large結構いい感じだよね
トークナイザが日本語に最適化されてなくて厳しいけど

0673名無しさん＠ピンキー (ﾜｯﾁｮｲ df77-1fg3)

2024/07/26(金) 15:32:19.59ID:???0

Vecteus好きだ
すぐ淫乱にならないところが

0674名無しさん＠ピンキー (ﾜｯﾁｮｲ fb32-G/Qc)

2024/07/26(金) 16:52:46.46ID:???0

応答の長さ（トークン数）を増やし過ぎても繰り返しが多くなるのか
何を弄ったらどう変わるのかいまいち把握しきれないな

0675名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-srET)

2024/07/26(金) 17:22:12.07ID:???0

cyberagent/Llama-3.1-70B-Japanese-Instruct-2407

ちょっと期待

0676名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b09-jkbP)

2024/07/26(金) 17:32:51.57ID:???0

設定といえばkoboldcppのGPUレイヤーだっけ？皆いくつにしてんの？
俺初期値の200のままなんだけど減らしたらええのか？

0677名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f97-C9XH)

2024/07/26(金) 17:46:23.51ID:???0

全レイヤー乗りさえすればいくつでもいいんじゃないの

0678名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b93-b7mV)

2024/07/26(金) 18:07:53.12ID:???0

>>670
新参なもんでまだ全然分かってない。すまぬ。
このスレに出てきてないものだと、Antler-7B-evolve、
EZO（common/humanitiesの2つ）があるから試してみて。

Antler-7B-evolveはKagemsyaみたいな用途で使えると思う。

0679名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-G/Qc)

2024/07/26(金) 21:29:01.00ID:???0

3.5sonnetがマジでかしこいな
ちゃんと設定すればそこそこ複雑な設定のゲームも進行させられる
この技術がPCゲームに応用されたら凄いことになるんだろうけどなぁ

0680名無しさん＠ピンキー (ﾜｯﾁｮｲ cb11-FnV+)

2024/07/26(金) 21:33:05.12ID:zWi3niPt0

Mistral Large 2
脱獄なしで設定書くだけでもNSFW出力してくれて大変良い
ロリNGとかも特になさそう
若干繰り返し癖はある
https://i.imgur.com/09DNkK1.png

0681名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fc7-Yk6i)

2024/07/26(金) 23:21:54.19ID:???0

>>680
w

VRAMどれくらいあれば動くの？

0682名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-Mtf7)

2024/07/27(土) 00:14:33.14ID:s9nYYsMX0

>>681
量子化のレベルはIQ3_M(モデルサイズ55GB)で、64GBのunified memoryにロードしてる
意外と量子化による影響はあまり感じない(ちゃんと計測したらなんらかの劣化はあるだろうが)

0683名無しさん＠ピンキー (ﾜｯﾁｮｲ e720-7i3u)

2024/07/27(土) 00:14:48.90ID:lT0n9RUP0

>>680
いいねー
こういうオープンソースが増えるのは明るい未来に繋がる

0684名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa0-05lm)

2024/07/27(土) 08:06:35.47ID:???0

サイバーエージェント期待してる。量子化してください

0685名無しさん＠ピンキー (ﾜｯﾁｮｲ 32c7-wyzZ)

2024/07/27(土) 08:58:22.02ID:???0

>>682
ほー、123Bが55GBで済むのか
この休日に試してみようかな

0686名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-Mtf7)

2024/07/27(土) 14:30:13.44ID:s9nYYsMX0

>>684
https://huggingface.co/mmnga/Llama-3.1-70B-Japanese-Instruct-2407-gguf/tree/main

0687名無しさん＠ピンキー (ﾜｯﾁｮｲ 7bc1-/CG0)

2024/07/27(土) 15:18:05.92ID:???0

>>683
オープンソースじゃないんだよなぁ
たぶんフラッグシップモデルの開示はする予定じゃなかったんだろうけど

オープンソースと言えるのはApache2.0ライセンスやMITライセンスのやつ
LlamaもGemmaも制限があるし、Mistral Large2は研究用だから研究にしか使えない
Gemmaライセンスは違法なことや公序良俗に反することに使うなってだけで制限が緩いけどね

0688名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-Mtf7)

2024/07/27(土) 18:52:19.55ID:s9nYYsMX0

上にあるサイバーエージェントのやつも試してみた
Finetuningでバカになってる感じもあまりないし、いいかもしれない
https://i.imgur.com/DASmyky.png

0689名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa0-05lm)

2024/07/27(土) 20:21:33.73ID:???0

>>686
流石だぜモモンガニキ、そこにシビれる!あこがれるゥ!

0690名無しさん＠ピンキー (ﾜｯﾁｮｲ 26de-FjlS)

2024/07/27(土) 22:43:39.29ID:???0

MacでLLM使うのってまだまだ難しい？

0691名無しさん＠ピンキー (ﾜｯﾁｮｲ 32c7-wyzZ)

2024/07/27(土) 22:55:45.70ID:???0

>>682
IQ3_M試してみたけど違和感ないね
ただ、Command R+より遅いなあ
いずれにしても選択肢が増えたのはいいことだわ

0692名無しさん＠ピンキー (ﾜｯﾁｮｲ 1784-ezuo)

2024/07/27(土) 23:33:22.47ID:???0

>>690
別に難しかったことなんて一度もないんじゃないの

0693名無しさん＠ピンキー (ﾜｯﾁｮｲ be87-x+oO)

2024/07/28(日) 00:24:38.08ID:???0

Mistral-Large-Instruct-2407-Q6_K がM3Max 128GBで動いた
ちょっと試した感じだとCommand R+より賢そうだけどめちゃくちゃ遅い
Command R+で行けたNSFWプロンプトは申し訳されてしまったので
ある程度の規制はされてるっぽい

0694名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-Mtf7)

2024/07/28(日) 00:32:07.72ID:9iQh5kAD0

Mistral Large 2が遅いのはパラメータ数がでかいからというより、日本語が1トークン/文字になってることの方が影響大きい気がする
R+はtpsは決して早くはないけど、トークナイザが最強だからモデルサイズに比して体感かなりストレス少ない

0695名無しさん＠ピンキー (ﾜｯﾁｮｲ 329f-q1yw)

2024/07/28(日) 00:36:37.11ID:???0

>>693
お大尽やの、うらやましい……
M2 24GBなワイは快適に使うには9B位(LLMやなくてSLMやな)が限界でGemma2とかNinja3で妥協しとる

0696名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-Mtf7)

2024/07/28(日) 00:44:26.47ID:9iQh5kAD0

>>695
システムが占有するunified memory 10GBくらいを差し引いても、量子化したモデルならもうちょい大きめのでも動きそうじゃね？
Mistral NeMoとかいけると思うんだけど

0697名無しさん＠ピンキー (ﾜｯﾁｮｲ be87-x+oO)

2024/07/28(日) 00:57:55.22ID:???0

>>694
なるほど勉強になる
R+は日本語対応頑張ってくれてるんだなぁ

0698名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f32-05lm)

2024/07/28(日) 01:00:52.48ID:???0

>>689
mmnga/rinna-llama-3-youko-70b-instruct-gguf

こっちもやってくれたぞ
rinna系では一番の出来じゃないかと思う
しかもエロいｗ

0699名無しさん＠ピンキー (ﾜｯﾁｮｲ df8a-RfJN)

2024/07/28(日) 08:16:54.08ID:???0

mini-magnum-12b　文章が短いのが嫌な人はおすすめ設定はMistralと同じだから調べれば出てくるエロもいける

0700名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa0-05lm)

2024/07/28(日) 12:00:32.62ID:???0

大葉で
mmnga/rinna-llama-3-youko-70b-instruct-ggufはllamacppでロードできるけど
mmnga/Llama-3.1-70B-Japanese-Instruct-2407-ggufはエラーになっちゃうなんでだろう

0701名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-Mtf7)

2024/07/28(日) 12:44:00.71ID:9iQh5kAD0

>>700
どのファイル使ったかわからんけど、catコマンドで結合した？

0702名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa0-05lm)

2024/07/28(日) 12:58:00.46ID:???0

ん～IQ1-5を合体させる？

0703名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-Mtf7)

2024/07/28(日) 13:14:51.07ID:9iQh5kAD0

>>702
いや、そうじゃなくて
モデルサイズが大きいとmmnga氏の場合、*.gguf.aと*.gguf.bっていう二つに分割されてることがある
その時は、シェルコマンドのcatを使って結合しないとllama.cppで読めないと思う

0704名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fbe-RfJN)

2024/07/28(日) 13:30:13.26ID:???0

3.5sonnetだと独り芝居の問題は全く起きなくて快適にロールプレイ出来る
ローカルでこのレベルまで来てくれたら世界が変わるんだけどな

0705名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa0-05lm)

2024/07/28(日) 13:32:43.34ID:???0

Llama-3.1-70B-Japanese-Instruct-2407-IQ1_M.ggufって一つのファイルでもllamacppでエラーになってしまいます。なんでだろう

0706名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-Mtf7)

2024/07/28(日) 13:37:10.24ID:9iQh5kAD0

>>705
調べてみたら、llama-3.1とllama.cppのバージョンに関するissueがoobaboogaに上がってた
https://github.com/oobabooga/text-generation-webui/issues/6270
ただ、うちの環境だと今のバージョンのllama-cpp-pythonでもllama-3.1読めてるからちょっと謎

0707名無しさん＠ピンキー (ﾜｯﾁｮｲ 329f-iBG8)

2024/07/28(日) 19:04:16.43ID:???0

3060 12gbだとninja v1が良さげかなあ
速度も速いしそこそこちゃんと対話してる
それともq4とq3で結構かわってくるかな

0708名無しさん＠ピンキー (ﾜｯﾁｮｲ e3c8-05lm)

2024/07/29(月) 00:12:26.20ID:???0

>>678
何度も質問してすいません

Antler-7B-evolveなどのモデルにおいて
以下のように分かれている場合は
どのようにすればEasyNAで使用できるんでしょうか

（model-00001-of-00002.safetensorsと
model-00002-of-00002.safetensorsの2つ）

例えば結合したりバッチファイルの書き替え方などがあるんでしょうか

0709名無しさん＠ピンキー (ﾜｯﾁｮｲ 9373-Xto+)

2024/07/29(月) 19:19:02.85ID:???0

間違ってるかもしれんけど、それ量子化されてない気がするからどのみちやめた方がいいと思う
duyntnet/Antler-7B-evolve-imatrix-GGUF あたりにしたら？
huggingfaceの検索欄にAntler-7B-evolveって打ち込んだら出るはず

0710名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fbe-RfJN)

2024/07/29(月) 21:21:46.80ID:???0

WEBのAPIはマジで規制厳し過ぎなんだよな
エロはまだしも少しでも政治的要素が入ると駄目だから核戦争後の世界を扱うお約束のサバイバル小説ですら検閲されまくる
NATOやアメリカ、中国、ロシアの単語を直接出すのは勿論、欧州の某国みたいにぼかしてもNG
Jアラートとかの単語も少しでも与党側へネガティブとみなされると全削除なんて核戦争の詳細は全部ぼかさないと駄目だった
とにかく政治に対する検閲が異常

0711名無しさん＠ピンキー (ﾜｯﾁｮｲ e3c8-05lm)

2024/07/29(月) 21:38:01.41ID:???0

>>709
助言ありがとうございます

SDと勘違いして.safetensors自体で
そのまま使用できると考えておりました

.ggufとの違いを理解していませんでした
申し訳ありませんでした

0712名無しさん＠ピンキー (ﾜｯﾁｮｲ b22c-b6qp)

2024/07/30(火) 05:14:19.45ID:???0

>>710
webのAPIってのはよくわからんけど普通にwebuiで出るじゃん
https://i.imgur.com/I8sEMp0.png

0713名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa0-05lm)

2024/07/30(火) 09:45:52.37ID:???0

Meta、「Llama 3.1」ベースの「AI Studio」を米国で開始
https://news.yahoo.co.jp/articles/de38856f54445f11f60beb7e154995f7d2498dfc

BOTの作り方も公開してくれるのだろうか

0714名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f32-05lm)

2024/07/30(火) 13:15:14.54ID:???0

HODACHI/Llama-3.1-70B-EZO-1.1-it

leafspark/Mistral-Large-218B-Instruct

どんどんでてくるな

0715名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa0-05lm)

2024/07/30(火) 13:32:13.03ID:???0

llama.cppでロードできました。n-gpu-layersとn_ctxの値が重要なようです。
mmnga/Llama-3.1-70B-Japanese-Instruct-2407-gguf

0716名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa0-05lm)

2024/07/30(火) 15:01:38.94ID:???0

mmnga/Llama-3.1-70B-Japanese-Instruct-2407-ggufいいね、うちの環境で何がベストか実験中

0717名無しさん＠ピンキー (ﾄﾝﾓｰ MMc3-1Juy)

2024/07/30(火) 15:09:01.26ID:???M

mmnga/Llama-3.1-70B-Japanese-Instruct-2407-gguf
かなり繰り返し癖ない？俺が悪いのかな

0718名無しさん＠ピンキー (ﾜｯﾁｮｲ f68e-05lm)

2024/07/30(火) 17:17:57.88ID:???0

Llama-3.1-70B-EZO-1.1-itめちゃくちゃ良い感触だ
自宅チャットボットで試してる限りでは返答内容にGPT-4並みの知性を感じる

0719名無しさん＠ピンキー (ﾜｯﾁｮｲ 137a-M0/w)

2024/07/30(火) 17:31:40.16ID:???0

70Bを動かせるほどのスペックじゃないからみんながうらやましいよ

0720名無しさん＠ピンキー (ﾜｯﾁｮｲ 9beb-lymj)

2024/07/30(火) 17:56:10.47ID:???0

Mistral Large 2をNSFWチューンしたやつ今試してるけど、これ結構凄いかも
遅さに目を瞑れば最適解な気がしている

0721名無しさん＠ピンキー (ﾜｯﾁｮｲ 928b-RfJN)

2024/07/30(火) 18:17:10.61ID:sqT3r6O70

>>720
なんてモデル？

0722名無しさん＠ピンキー (ﾜｯﾁｮｲ 9beb-lymj)

2024/07/30(火) 18:19:18.58ID:???0

>>721
Lumimaid-v0.2ってやつ

0723名無しさん＠ピンキー (ﾜｯﾁｮｲ 928b-RfJN)

2024/07/30(火) 18:59:13.28ID:sqT3r6O70

>>722
ty

■ このスレッドは過去ログ倉庫に格納されています