なんJLLM部避難所 ★3

1002コメント349KB

なんJLLM部避難所 ★3

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ 93c0-oLG6)

2024/06/09(日) 07:37:14.82ID:???0

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★2
https://mercury.bbspink.com/test/read.cgi/onatech/1714642045/

-
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0661名無しさん＠ピンキー (ﾜｯﾁｮｲ fb5a-V2rD)

2024/07/25(木) 23:57:00.64ID:???0

ほへー構成メインか……どのレベルなんやろ
自分は起承転結やら個々のエピソードまでは構成するけど
・険悪だった二人が◯◯というきっかけで仲良くなるシーンを1000文字で
みたいなフォーマットで書いてくれるなら
かなり創作の手助けになるんやが

エロでいうと
・フェラだけで1000文字で
といっても三行で終わらせて本番始めるモデルばかりで辛い

0662名無しさん＠ピンキー (ﾜｯﾁｮｲ 8bc7-utX6)

2024/07/26(金) 01:06:11.60ID:???0

一人芝居ストップかけても尻の表面に出ないだけで裏ではやり取りがっつりあるのヘコむわ

0663名無しさん＠ピンキー (ﾜｯﾁｮｲ fb32-G/Qc)

2024/07/26(金) 03:31:04.84ID:???0

どもる文章がおかしくなることがよくあるな
「い、今やろうとしたところだ！」が正しい形なのに
「こ、今やろうとしたところだ！」となって漢字の読みを考慮しないことがある
Q5とか使ってるからなのか

>>862
裏でのやり取りごと消去って出来ないのかな？

0664名無しさん＠ピンキー (ﾜｯﾁｮｲ 9bab-G/Qc)

2024/07/26(金) 05:14:52.62ID:???0

>>660
ファイル名書き換えたら読み込んでくれるで。
例えば、kagemusya-7b-v1.5-q8_0の部分をkagemusya-7b-v1Q8_0に書き換える。
わいは使わんやつの名前に書き換えて、色々試してるで。

0665名無しさん＠ピンキー (ﾜｯﾁｮｲ fb32-G/Qc)

2024/07/26(金) 05:24:42.48ID:???0

Mistral-Nemo-Instruct-2407.Q5_K_M.ggufでエッチなことさせて遊んでるけど
単なるロールプレイ会話よりもハメ撮り動画の実況解説みたいなことをさせた方が本領発揮するな

0666名無しさん＠ピンキー (ﾜｯﾁｮｲ fb50-x6+9)

2024/07/26(金) 06:05:16.89ID:???0

>>663
opusとかでもそうなるよ
AIは文章を音として読んでるわけじゃないから、読みなんて再現できなくて当たり前
用例を全て丸暗記するしかない

0667名無しさん＠ピンキー (ﾜｯﾁｮｲ fb32-G/Qc)

2024/07/26(金) 06:53:05.18ID:???0

>>666
アルファベットなら頭文字の連続だけでどもりを表現できるけど
読みがたくさんある漢字だと色んなパターンを丸暗記するしかないのか
間違えることなくどもらせるのはかなり難しそうだな

0668名無しさん＠ピンキー (ﾜｯﾁｮｲ 8bc7-utX6)

2024/07/26(金) 08:45:13.81ID:???0

>>663
lmstadioに尻と同じプロンプト入れたらひとまず出なくなった

0669名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr5f-VXyX)

2024/07/26(金) 09:14:05.34ID:???r

>>665
Nemoは最初から無検閲らしいね

0670名無しさん＠ピンキー (ﾜｯﾁｮｲ 0bc8-srET)

2024/07/26(金) 11:40:31.90ID:???0

>>664
リネームでやってみます
助言ありがとうございます

用途に依るんだと思いますが
色々試したもので良かったモデルはありましたか

0671名無しさん＠ピンキー (ﾜｯﾁｮｲ 4fcc-oASD)

2024/07/26(金) 12:21:43.43ID:???0

規制かければかけるほど阿呆になるみたいだし
あんまり規制かけないでほしいな

0672名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM5f-C9XH)

2024/07/26(金) 12:56:05.83ID:???M

>>650
Mistral Large結構いい感じだよね
トークナイザが日本語に最適化されてなくて厳しいけど

0673名無しさん＠ピンキー (ﾜｯﾁｮｲ df77-1fg3)

2024/07/26(金) 15:32:19.59ID:???0

Vecteus好きだ
すぐ淫乱にならないところが

0674名無しさん＠ピンキー (ﾜｯﾁｮｲ fb32-G/Qc)

2024/07/26(金) 16:52:46.46ID:???0

応答の長さ（トークン数）を増やし過ぎても繰り返しが多くなるのか
何を弄ったらどう変わるのかいまいち把握しきれないな

0675名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-srET)

2024/07/26(金) 17:22:12.07ID:???0

cyberagent/Llama-3.1-70B-Japanese-Instruct-2407

ちょっと期待

0676名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b09-jkbP)

2024/07/26(金) 17:32:51.57ID:???0

設定といえばkoboldcppのGPUレイヤーだっけ？皆いくつにしてんの？
俺初期値の200のままなんだけど減らしたらええのか？

0677名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f97-C9XH)

2024/07/26(金) 17:46:23.51ID:???0

全レイヤー乗りさえすればいくつでもいいんじゃないの

0678名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b93-b7mV)

2024/07/26(金) 18:07:53.12ID:???0

>>670
新参なもんでまだ全然分かってない。すまぬ。
このスレに出てきてないものだと、Antler-7B-evolve、
EZO（common/humanitiesの2つ）があるから試してみて。

Antler-7B-evolveはKagemsyaみたいな用途で使えると思う。

0679名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-G/Qc)

2024/07/26(金) 21:29:01.00ID:???0

3.5sonnetがマジでかしこいな
ちゃんと設定すればそこそこ複雑な設定のゲームも進行させられる
この技術がPCゲームに応用されたら凄いことになるんだろうけどなぁ

0680名無しさん＠ピンキー (ﾜｯﾁｮｲ cb11-FnV+)

2024/07/26(金) 21:33:05.12ID:zWi3niPt0

Mistral Large 2
脱獄なしで設定書くだけでもNSFW出力してくれて大変良い
ロリNGとかも特になさそう
若干繰り返し癖はある
https://i.imgur.com/09DNkK1.png

0681名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fc7-Yk6i)

2024/07/26(金) 23:21:54.19ID:???0

>>680
w

VRAMどれくらいあれば動くの？

0682名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-Mtf7)

2024/07/27(土) 00:14:33.14ID:s9nYYsMX0

>>681
量子化のレベルはIQ3_M(モデルサイズ55GB)で、64GBのunified memoryにロードしてる
意外と量子化による影響はあまり感じない(ちゃんと計測したらなんらかの劣化はあるだろうが)

0683名無しさん＠ピンキー (ﾜｯﾁｮｲ e720-7i3u)

2024/07/27(土) 00:14:48.90ID:lT0n9RUP0

>>680
いいねー
こういうオープンソースが増えるのは明るい未来に繋がる

0684名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa0-05lm)

2024/07/27(土) 08:06:35.47ID:???0

サイバーエージェント期待してる。量子化してください

0685名無しさん＠ピンキー (ﾜｯﾁｮｲ 32c7-wyzZ)

2024/07/27(土) 08:58:22.02ID:???0

>>682
ほー、123Bが55GBで済むのか
この休日に試してみようかな

0686名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-Mtf7)

2024/07/27(土) 14:30:13.44ID:s9nYYsMX0

>>684
https://huggingface.co/mmnga/Llama-3.1-70B-Japanese-Instruct-2407-gguf/tree/main

0687名無しさん＠ピンキー (ﾜｯﾁｮｲ 7bc1-/CG0)

2024/07/27(土) 15:18:05.92ID:???0

>>683
オープンソースじゃないんだよなぁ
たぶんフラッグシップモデルの開示はする予定じゃなかったんだろうけど

オープンソースと言えるのはApache2.0ライセンスやMITライセンスのやつ
LlamaもGemmaも制限があるし、Mistral Large2は研究用だから研究にしか使えない
Gemmaライセンスは違法なことや公序良俗に反することに使うなってだけで制限が緩いけどね

0688名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-Mtf7)

2024/07/27(土) 18:52:19.55ID:s9nYYsMX0

上にあるサイバーエージェントのやつも試してみた
Finetuningでバカになってる感じもあまりないし、いいかもしれない
https://i.imgur.com/DASmyky.png

0689名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa0-05lm)

2024/07/27(土) 20:21:33.73ID:???0

>>686
流石だぜモモンガニキ、そこにシビれる!あこがれるゥ!

0690名無しさん＠ピンキー (ﾜｯﾁｮｲ 26de-FjlS)

2024/07/27(土) 22:43:39.29ID:???0

MacでLLM使うのってまだまだ難しい？

0691名無しさん＠ピンキー (ﾜｯﾁｮｲ 32c7-wyzZ)

2024/07/27(土) 22:55:45.70ID:???0

>>682
IQ3_M試してみたけど違和感ないね
ただ、Command R+より遅いなあ
いずれにしても選択肢が増えたのはいいことだわ

0692名無しさん＠ピンキー (ﾜｯﾁｮｲ 1784-ezuo)

2024/07/27(土) 23:33:22.47ID:???0

>>690
別に難しかったことなんて一度もないんじゃないの

0693名無しさん＠ピンキー (ﾜｯﾁｮｲ be87-x+oO)

2024/07/28(日) 00:24:38.08ID:???0

Mistral-Large-Instruct-2407-Q6_K がM3Max 128GBで動いた
ちょっと試した感じだとCommand R+より賢そうだけどめちゃくちゃ遅い
Command R+で行けたNSFWプロンプトは申し訳されてしまったので
ある程度の規制はされてるっぽい

0694名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-Mtf7)

2024/07/28(日) 00:32:07.72ID:9iQh5kAD0

Mistral Large 2が遅いのはパラメータ数がでかいからというより、日本語が1トークン/文字になってることの方が影響大きい気がする
R+はtpsは決して早くはないけど、トークナイザが最強だからモデルサイズに比して体感かなりストレス少ない

0695名無しさん＠ピンキー (ﾜｯﾁｮｲ 329f-q1yw)

2024/07/28(日) 00:36:37.11ID:???0

>>693
お大尽やの、うらやましい……
M2 24GBなワイは快適に使うには9B位(LLMやなくてSLMやな)が限界でGemma2とかNinja3で妥協しとる

0696名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-Mtf7)

2024/07/28(日) 00:44:26.47ID:9iQh5kAD0

>>695
システムが占有するunified memory 10GBくらいを差し引いても、量子化したモデルならもうちょい大きめのでも動きそうじゃね？
Mistral NeMoとかいけると思うんだけど

0697名無しさん＠ピンキー (ﾜｯﾁｮｲ be87-x+oO)

2024/07/28(日) 00:57:55.22ID:???0

>>694
なるほど勉強になる
R+は日本語対応頑張ってくれてるんだなぁ

0698名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f32-05lm)

2024/07/28(日) 01:00:52.48ID:???0

>>689
mmnga/rinna-llama-3-youko-70b-instruct-gguf

こっちもやってくれたぞ
rinna系では一番の出来じゃないかと思う
しかもエロいｗ

0699名無しさん＠ピンキー (ﾜｯﾁｮｲ df8a-RfJN)

2024/07/28(日) 08:16:54.08ID:???0

mini-magnum-12b　文章が短いのが嫌な人はおすすめ設定はMistralと同じだから調べれば出てくるエロもいける

0700名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa0-05lm)

2024/07/28(日) 12:00:32.62ID:???0

大葉で
mmnga/rinna-llama-3-youko-70b-instruct-ggufはllamacppでロードできるけど
mmnga/Llama-3.1-70B-Japanese-Instruct-2407-ggufはエラーになっちゃうなんでだろう

0701名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-Mtf7)

2024/07/28(日) 12:44:00.71ID:9iQh5kAD0

>>700
どのファイル使ったかわからんけど、catコマンドで結合した？

0702名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa0-05lm)

2024/07/28(日) 12:58:00.46ID:???0

ん～IQ1-5を合体させる？

0703名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-Mtf7)

2024/07/28(日) 13:14:51.07ID:9iQh5kAD0

>>702
いや、そうじゃなくて
モデルサイズが大きいとmmnga氏の場合、*.gguf.aと*.gguf.bっていう二つに分割されてることがある
その時は、シェルコマンドのcatを使って結合しないとllama.cppで読めないと思う

0704名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fbe-RfJN)

2024/07/28(日) 13:30:13.26ID:???0

3.5sonnetだと独り芝居の問題は全く起きなくて快適にロールプレイ出来る
ローカルでこのレベルまで来てくれたら世界が変わるんだけどな

0705名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa0-05lm)

2024/07/28(日) 13:32:43.34ID:???0

Llama-3.1-70B-Japanese-Instruct-2407-IQ1_M.ggufって一つのファイルでもllamacppでエラーになってしまいます。なんでだろう

0706名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-Mtf7)

2024/07/28(日) 13:37:10.24ID:9iQh5kAD0

>>705
調べてみたら、llama-3.1とllama.cppのバージョンに関するissueがoobaboogaに上がってた
https://github.com/oobabooga/text-generation-webui/issues/6270
ただ、うちの環境だと今のバージョンのllama-cpp-pythonでもllama-3.1読めてるからちょっと謎

0707名無しさん＠ピンキー (ﾜｯﾁｮｲ 329f-iBG8)

2024/07/28(日) 19:04:16.43ID:???0

3060 12gbだとninja v1が良さげかなあ
速度も速いしそこそこちゃんと対話してる
それともq4とq3で結構かわってくるかな

0708名無しさん＠ピンキー (ﾜｯﾁｮｲ e3c8-05lm)

2024/07/29(月) 00:12:26.20ID:???0

>>678
何度も質問してすいません

Antler-7B-evolveなどのモデルにおいて
以下のように分かれている場合は
どのようにすればEasyNAで使用できるんでしょうか

（model-00001-of-00002.safetensorsと
model-00002-of-00002.safetensorsの2つ）

例えば結合したりバッチファイルの書き替え方などがあるんでしょうか

0709名無しさん＠ピンキー (ﾜｯﾁｮｲ 9373-Xto+)

2024/07/29(月) 19:19:02.85ID:???0

間違ってるかもしれんけど、それ量子化されてない気がするからどのみちやめた方がいいと思う
duyntnet/Antler-7B-evolve-imatrix-GGUF あたりにしたら？
huggingfaceの検索欄にAntler-7B-evolveって打ち込んだら出るはず

0710名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fbe-RfJN)

2024/07/29(月) 21:21:46.80ID:???0

WEBのAPIはマジで規制厳し過ぎなんだよな
エロはまだしも少しでも政治的要素が入ると駄目だから核戦争後の世界を扱うお約束のサバイバル小説ですら検閲されまくる
NATOやアメリカ、中国、ロシアの単語を直接出すのは勿論、欧州の某国みたいにぼかしてもNG
Jアラートとかの単語も少しでも与党側へネガティブとみなされると全削除なんて核戦争の詳細は全部ぼかさないと駄目だった
とにかく政治に対する検閲が異常

0711名無しさん＠ピンキー (ﾜｯﾁｮｲ e3c8-05lm)

2024/07/29(月) 21:38:01.41ID:???0

>>709
助言ありがとうございます

SDと勘違いして.safetensors自体で
そのまま使用できると考えておりました

.ggufとの違いを理解していませんでした
申し訳ありませんでした

0712名無しさん＠ピンキー (ﾜｯﾁｮｲ b22c-b6qp)

2024/07/30(火) 05:14:19.45ID:???0

>>710
webのAPIってのはよくわからんけど普通にwebuiで出るじゃん
https://i.imgur.com/I8sEMp0.png

0713名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa0-05lm)

2024/07/30(火) 09:45:52.37ID:???0

Meta、「Llama 3.1」ベースの「AI Studio」を米国で開始
https://news.yahoo.co.jp/articles/de38856f54445f11f60beb7e154995f7d2498dfc

BOTの作り方も公開してくれるのだろうか

0714名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f32-05lm)

2024/07/30(火) 13:15:14.54ID:???0

HODACHI/Llama-3.1-70B-EZO-1.1-it

leafspark/Mistral-Large-218B-Instruct

どんどんでてくるな

0715名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa0-05lm)

2024/07/30(火) 13:32:13.03ID:???0

llama.cppでロードできました。n-gpu-layersとn_ctxの値が重要なようです。
mmnga/Llama-3.1-70B-Japanese-Instruct-2407-gguf

0716名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa0-05lm)

2024/07/30(火) 15:01:38.94ID:???0

mmnga/Llama-3.1-70B-Japanese-Instruct-2407-ggufいいね、うちの環境で何がベストか実験中

0717名無しさん＠ピンキー (ﾄﾝﾓｰ MMc3-1Juy)

2024/07/30(火) 15:09:01.26ID:???M

mmnga/Llama-3.1-70B-Japanese-Instruct-2407-gguf
かなり繰り返し癖ない？俺が悪いのかな

0718名無しさん＠ピンキー (ﾜｯﾁｮｲ f68e-05lm)

2024/07/30(火) 17:17:57.88ID:???0

Llama-3.1-70B-EZO-1.1-itめちゃくちゃ良い感触だ
自宅チャットボットで試してる限りでは返答内容にGPT-4並みの知性を感じる

0719名無しさん＠ピンキー (ﾜｯﾁｮｲ 137a-M0/w)

2024/07/30(火) 17:31:40.16ID:???0

70Bを動かせるほどのスペックじゃないからみんながうらやましいよ

0720名無しさん＠ピンキー (ﾜｯﾁｮｲ 9beb-lymj)

2024/07/30(火) 17:56:10.47ID:???0

Mistral Large 2をNSFWチューンしたやつ今試してるけど、これ結構凄いかも
遅さに目を瞑れば最適解な気がしている

0721名無しさん＠ピンキー (ﾜｯﾁｮｲ 928b-RfJN)

2024/07/30(火) 18:17:10.61ID:sqT3r6O70

>>720
なんてモデル？

0722名無しさん＠ピンキー (ﾜｯﾁｮｲ 9beb-lymj)

2024/07/30(火) 18:19:18.58ID:???0

>>721
Lumimaid-v0.2ってやつ

0723名無しさん＠ピンキー (ﾜｯﾁｮｲ 928b-RfJN)

2024/07/30(火) 18:59:13.28ID:sqT3r6O70

>>722
ty

0724名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f51-b6qp)

2024/07/30(火) 19:10:28.82ID:???0

>>722
12Bがあるね。試したのはどれ？

0725名無しさん＠ピンキー (ﾜｯﾁｮｲ 9beb-lymj)

2024/07/30(火) 19:56:24.86ID:???0

>>724
123BのIQ-3M試した

0726!donguri (ﾜｯﾁｮｲ 7b12-em/f)

2024/07/30(火) 19:57:44.16ID:???0

いがいだったけどllama-3-elyza-jp-8bで申し訳されなかったかな。
最近、エロOKな流れになってるのかな。日本語が自然で好きなんですよね

0727名無しさん＠ピンキー (ﾜｯﾁｮｲ e787-em/f)

2024/07/30(火) 20:21:12.08ID:vqVdxEpO0

検閲に起因する性能低下が割と洒落になってない感じの事がわかってきたし
このまま無検閲のベースモデル+検閲用の別のモデル、みたいな形で分離して発展して欲しいねぇ

0728名無しさん＠ピンキー (ﾜｯﾁｮｲ f68e-05lm)

2024/07/30(火) 20:39:52.20ID:???0

Elyzaは初期の頃からやりたい放題できてた記憶がある

0729名無しさん＠ピンキー (ﾜｯﾁｮｲ 36ef-jK5+)

2024/07/30(火) 20:50:46.51ID:6Hc3QgOV0

ELYZAは東大で作ってるやつでしょお堅いんじゃないの

0730名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f32-05lm)

2024/07/30(火) 21:18:01.99ID:???0

>>720
英語？

0731名無しさん＠ピンキー (ﾜｯﾁｮｲ 7b12-em/f)

2024/07/30(火) 21:34:42.72ID:???0

elyzaって優等生って感じだからあんまり好みではない人もいるかも
優等生といちゃいちゃなチャットの後、そういう流れに・・・っていうのが好きなもので

0732名無しさん＠ピンキー (ﾜｯﾁｮｲ 9beb-lymj)

2024/07/30(火) 21:38:17.12ID:???0

>>730
追加学習は英語だと思うけど、日本語のERPもかなり流暢だよ
そもそも元のMistral Large 2がマルチリンガルなので、そこはちゃんと失わずに保ってる

0733名無しさん＠ピンキー (ﾜｯﾁｮｲ b230-p9Qa)

2024/07/30(火) 21:45:38.53ID:???0

12Bは駄目だったや
ルー大柴化に加えてエロ関係なく意味不明な文がかなり多い感じ
これなら7BのVecteusやBerghofの方がよほど賢いと感じた

0734名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-Mtf7)

2024/07/30(火) 23:07:20.37ID:xTt96Yir0

Lumimaid v0.2 123BのERPはこんな感じ
https://i.imgur.com/NbSDsAk.png

0735名無しさん＠ピンキー (ﾜｯﾁｮｲ b274-tpLL)

2024/07/31(水) 09:35:31.00ID:???0

チャットアリーナのリーダーボード更新きたんだけど、英語に絞ると
llama3.1 405bと70bがclaude3.5sonnetの上にきてるな
405bはわかるんだけど70bもここまで来るか

日本語に絞るとまだデータ数が少ないのか項目自体出てこない

0736名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b4f-+LaP)

2024/07/31(水) 10:15:57.61ID:???0

Llama 3.1 EZO、ベンチスコア高すぎて怪しいなこれ
gpt-4の出力学習に使うかベンチマークリークさせてるだろ

0737名無しさん＠ピンキー (ｼｬﾁｰｸ 0C73-w6uy)

2024/07/31(水) 10:39:54.61ID:???C

>>736
実際使った感じは？
上の方では良感触だったとの書き込みあるけど

0738名無しさん＠ピンキー (ﾜｯﾁｮｲ 9732-RfJN)

2024/07/31(水) 12:29:09.64ID:???0

Llama-3-ELYZA-JP-8B-q4_k_mは脱字が酷いな
「ハンバーグとステーキどっちが好き？」って聞いたら

「は美味しい食べ物が大好きなのですが、その中でも特にハンバーとステーは大好物ですね。
どちらかというと私はハンバー派です。理由としては、肉汁が溢れ出るジューーな部分がたまらないからです。」

みたいな脱字だらけの文章が返ってくる。Q8でも脱字だらけだ

0739名無しさん＠ピンキー (ﾍﾞｰｲﾓ MM4e-kmAZ)

2024/07/31(水) 12:39:22.69ID:mLdonqTXM

ELYZAは俺俺ベンチの本家本元だからしゃーないし期待してない

0740名無しさん＠ピンキー (ﾜｯﾁｮｲ 127c-1ExY)

2024/07/31(水) 13:22:00.25ID:???0

>>738
さすがにそこまで出力おかしいのは何かが間違っとるやろ
LM Studioで落としたけど普通に会話できとるで

0741名無しさん＠ピンキー (ﾜｯﾁｮｲ 9732-RfJN)

2024/07/31(水) 14:00:44.65ID:???0

>>740
設定間違ってるのかな？

色々試してみた感じ一定の法則で文字が欠けることが多いんだよね
長音の後が欠けやすいから
「ケーキ」「ラーメン」「アーメン」「ザーメン」「ステーション」が
「ケー」「ラーン」「アーン」「ザーン」「ステーョン」になるわ
あとは文頭の文字が欠けやすいのと「楽しみ」「慈しみ」も「楽し」「慈し」になる

koboldでデフォ設定にしたり色々設定変えたりしてるけどあんまり変わらん

0742名無しさん＠ピンキー (ｼｬﾁｰｸ 0C73-w6uy)

2024/07/31(水) 14:07:13.47ID:???C

>>741
しずかちゃん　って言わせられるか？
llama3系は何故か
しかちゃん　になる傾向がある

0743名無しさん＠ピンキー (ﾜｯﾁｮｲ 9732-RfJN)

2024/07/31(水) 14:14:43.72ID:???0

>>742
しかちゃんになる

「しずかに」→「しかに」
「わずかに」→「わすかに」
「おおきいかに」→「おおきいに」

脱字が多いけど「わすかに」みたいに濁点が消える場合もあるみたいだ

0744名無しさん＠ピンキー (ﾜｯﾁｮｲ 1798-wWBb)

2024/07/31(水) 14:28:12.94ID:???0

AIの出力終了後、
ブラウザ側だと「# 記」だけど
kobold（v1.69.1）のコンソール側だと「# 追記」になってた。
koboldのexeとブラウザ間のhttp通信ペイロードの取込上の問題があるかも？

0745名無しさん＠ピンキー (ﾜｯﾁｮｲ 9732-RfJN)

2024/07/31(水) 14:42:03.31ID:???0

>>744
本当だ
ブラウザ側だと「しかちゃん」になってるけど
コンソール側には「しずかちゃん」って書かれてるわ

これってユーザー側で何か対策方法あるの？

0746名無しさん＠ピンキー (ﾜｯﾁｮｲ 1798-wWBb)

2024/07/31(水) 15:28:57.40ID:???0

暫定対策としては
設定で「Token Streaming」を「SSE」から「Poll」にすると大丈夫そう

0747名無しさん＠ピンキー (ﾜｯﾁｮｲ 9732-RfJN)

2024/07/31(水) 15:39:23.44ID:???0

>>746
おお！サンクス！脱字無くなったわ！

0748名無しさん＠ピンキー (ﾜｯﾁｮｲ 1798-wWBb)

2024/07/31(水) 16:45:34.31ID:???0

別モデルの中国語でも同様の問題があるみたい。今のところ「Poll」にするしかなさそう。

https://github.com/LostRuins/koboldcpp/issues/772

0749名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa0-05lm)

2024/07/31(水) 17:29:04.29ID:???0

とにかくLlama-3.1で次の段階に入ったんだろうな

0750名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fbe-RfJN)

2024/07/31(水) 20:57:05.31ID:???0

3.5sonnetより上とはにわかに信じがたいな
ベンチマーク最適化してるとしか思えん

0751名無しさん＠ピンキー (ﾜｯﾁｮｲ e76b-GRnx)

2024/07/31(水) 21:54:12.27ID:???0

ベンチマークありき学習するのは結局奇形産まれるだけや

0752名無しさん＠ピンキー (ﾜｯﾁｮｲ 436a-6ASf)

2024/07/31(水) 22:26:11.90ID:???0

中国人の性質を鑑みれはチートはしてるだろ

0753名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b4f-+LaP)

2024/07/31(水) 22:44:28.16ID:???0

ベンチマーク特化になってるかはベンチマークの領域外のテストすれば分かりやすい
それこそエロとかもその1つ
断られるのは別として、ベンチマーク性能は良いのにエロの表現とかが微妙なのは根本的にベンチ特化になっている

0754名無しさん＠ピンキー (ﾜｯﾁｮｲ b2ed-b6qp)

2024/08/01(木) 01:22:07.19ID:???0

エロ性能で言えばllama3.1はゴミでしかないな
まあそもそも学習してないんだと思うが

0755名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f32-05lm)

2024/08/01(木) 01:27:05.00ID:???0

Llama 3.1 EZO 70BをQ5K_Mで試した

マジいいぞこれ。
いままでのllama3.1日本語では一番じゃないか？
ただ、規制は残ってるな

0756名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f32-05lm)

2024/08/01(木) 01:41:57.36ID:???0

続
規制の件だけど、自分から今のは少し不適切だったので、以下のように書き直しますね
って、言って書き直してきたのはワロタ
まあ、オリジナルよりは緩いわ

0757名無しさん＠ピンキー (ﾜｯﾁｮｲ 3eec-b6qp)

2024/08/01(木) 11:12:41.16ID:???0

>>755
8Bと70Bしかないのか

0758名無しさん＠ピンキー (ﾜｯﾁｮｲ b274-nOcR)

2024/08/01(木) 12:51:36.25ID:???0

405Bのggufあったとして1bitでも動かせない・・・

0759名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa0-05lm)

2024/08/01(木) 13:52:38.76ID:???0

繰り返しを無くす方法

■temperature高くする。
temperatureが低すぎると、モデルが非常に確率の高い次の単語を選択し続けるため、繰り返しが生じやすくなります。

■top_p（トップPサンプリング）高くする。
確率の合計がP以上になるまで単語を選択
Pの値が低いと、選択肢が制限されるため、繰り返しが発生しやすくなります。逆にPの値が高すぎると、ランダム性が増し、
文脈にそぐわない単語が選ばれやすくなるため、適切なバランスを見つけることが大切です。
一般的にはP値を0.9前後から調整を始め、状況に応じて微調整します。

■top_k（トップKサンプリング）高くする。
K個の最も確率の高い単語から選択
トップKの値を上げることで、選択肢が増えるため、より多様な単語やフレーズが選ばれる可能性が高くなります。これにより、
同じフレーズの繰り返しが減少する可能性があります。
トップKの値が小さいと、モデルは最も確率の高い単語に集中しがちですが、Kを大きくすると、より多様な単語が選ばれる可能性が増えます。
これにより、生成されるテキストの多様性が向上し、繰り返しが減少することがあります。

0760名無しさん＠ピンキー (ﾜｯﾁｮｲ 9321-Xto+)

2024/08/01(木) 14:28:37.35ID:???0

sillyはデフォだと繰り返しﾍﾟﾅﾙﾃｨの値死んでるから、その辺り弄るとかなりマシになった。
EZO 70B量子化ありがたい、あとで試そう

■ このスレッドは過去ログ倉庫に格納されています