なんJLLM部避難所 ★4

1002コメント310KB

なんJLLM部避難所 ★4

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー

2024/09/10(火) 10:19:11.43ID:Z1PzH55u

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★3
https://mercury.bbspink.com/test/read.cgi/onatech/1717886234

0329名無しさん＠ピンキー

2024/10/15(火) 12:31:11.83ID:???

カンニング可能な以上ベンチマークを有効に機能させるのってそもそも困難だと思う
Chatbot Arenaみたいなユーザーの使用感ベースによる比較を纏めたものが一番本質に近いんじゃなかろうか
もちろん専門性を測るのはカバーしてないけど対話相手や創作用途って意味なら十分だろうし

0330名無しさん＠ピンキー

2024/10/15(火) 13:15:58.15ID:yfAQYZIp

エッチ用途だとベンチより体感でわかるよね出来の良し悪し

0331名無しさん＠ピンキー

2024/10/15(火) 13:47:25.35ID:???

8bですぐ正解しなくなってんだから駄目だろ

0332名無しさん＠ピンキー

2024/10/15(火) 20:16:46.43ID:???

自分で問題作って自分のモデルに学習させて他の有名モデルに勝ったと言い張るElyzaの話する？

0333名無しさん＠ピンキー

2024/10/15(火) 20:23:11.68ID:???

しない
gpt−4レベルです言われても😅

0334名無しさん＠ピンキー

2024/10/16(水) 08:02:40.82ID:???

Elyzaは予算獲得のためになりふり構わずという感じだったなぁ

0335名無しさん＠ピンキー

2024/10/16(水) 10:52:58.29ID:???

>>330
どんなベンチ結果よりも信頼できるわｗ

0336名無しさん＠ピンキー

2024/10/16(水) 11:24:08.47ID:???

やっぱエロなのか

0337名無しさん＠ピンキー

2024/10/16(水) 17:58:06.00ID:???

エロはモデルの厚みというか雑多な総合性能みたいなの図るのには向いてる

0338名無しさん＠ピンキー

2024/10/16(水) 21:11:05.16ID:???

週末のセールで何か買っておくべきだった
やるゲームがない

0339名無しさん＠ピンキー

2024/10/16(水) 21:11:20.68ID:???

誤爆

0340名無しさん＠ピンキー

2024/10/17(木) 00:26:34.40ID:CcuUment

検閲0でおなじみmistralから8bモデルが出たね
いい機会だしmagnumみたいなファインチューニングモデル作ってみようかな
https://huggingface.co/mistralai/Ministral-8B-Instruct-2410

0341名無しさん＠ピンキー

2024/10/17(木) 05:12:53.13ID:???

Nemotron-70BでもEntropixは上手くいくって言ってるけど
これ個人で試すにはどうすれば良いんだ？

俺はバナナの本数の計算が出来るかどうかよりも
エッチな文章が軽いモデルでもより正確かつエロティックになるかどうかを知りたいんだ

0342名無しさん＠ピンキー

2024/10/17(木) 12:17:52.03ID:???

koboldを1.72から1.76に更新したら色んなモデルで「おっぱい」って言えなくなったんだけどどういうことなんだ？
「おっパイ」や「オッパイ」とは言ってくれるけど
「おっぱい」になると「おっ……おっ……おっ……」と延々と続けたり「おっ……パイ！」みたいな変な言い方しかしなくなった

1.72に戻したらちゃんと「おっぱい」って言ってくれるようになった

0343名無しさん＠ピンキー

2024/10/17(木) 12:23:47.80ID:???

なんかワロタ

0344名無しさん＠ピンキー

2024/10/17(木) 12:37:31.25ID:???

おっ……パイ！とかそんなん笑ってちんぽ萎むわ

0345名無しさん＠ピンキー

2024/10/17(木) 12:38:47.17ID:???

>>342
規制にあらがってる感

0346名無しさん＠ピンキー

2024/10/17(木) 12:44:42.58ID:???

>>345
kobold側の設定でなんか規制でも入るようになったのかと考えて
思いつく限りの淫語や禁止ワードに引っ掛かりそうなことを言わせてみたんだけど
「おっぱい」と「ずぽずぽ」以外はどんなに際どいことでもちゃんと言ってくれるんだよな
ちなみに「ずぽズポ」や「ズポズポ」ならやっぱり言ってくれる

0347名無しさん＠ピンキー

2024/10/17(木) 12:54:50.14ID:???

1.76でもkobold自体なら「おっぱい」とは言ってくれるけど
尻タブだと言ってくれなくなるみたいだ

はぁーん？訳が分からん

0348名無しさん＠ピンキー

2024/10/17(木) 13:01:44.93ID:???

それ俺も別の単語で起こったな
俺の場合はありがとうございますがどうしても言えなくなってありがとうござます
ありがとうござ、います
ありがとうござ#います
などなど、何かに邪魔されている感じだった
結局何をどうやっても改善されなくて、sillyを入れ直してデータ引っ越したら直ってたよ

0349名無しさん＠ピンキー

2024/10/17(木) 13:28:59.81ID:???

ひらがなの

「ぬ」
「ゆ」
「ぎ」「ぐ」
「ざ」「ぜ」「ぞ」
「ぢ」
「ぶ」「ぼ」
「ぱ」「ぴ」「ぷ」「ぺ」「ぽ」

が言えなくなるみたいだ。淫語かどうかは関係ない
「ぴかぴか」とか「まつぼっくり」とかも言えなくなる
もちろん五十音をひらがなで全部言うのは無理

0350名無しさん＠ピンキー

2024/10/17(木) 13:30:53.32ID:???

>>348
dataフォルダだけ引っ越せばおｋ？

0351名無しさん＠ピンキー

2024/10/17(木) 13:34:21.20ID:???

>>350
ログとかは別保存だったかもしんない
大事なやつだけあらかじめエクスポートして新sillyでインポートしたよ

0352名無しさん＠ピンキー

2024/10/17(木) 13:45:59.57ID:???

>>351
サンクス
引っ越したけどやっぱり特定のひらがなが言えないみたいだ
誰かkobold 1.76で尻タブを試してみてくれないか
おま環かどうか知りたい

0353名無しさん＠ピンキー

2024/10/17(木) 13:47:47.68ID:???

トークナイザーの問題？🤔

0354名無しさん＠ピンキー

2024/10/17(木) 14:00:31.38ID:???

>>353
トークナイザーの問題っぽい
今まではBest match(recommended)のまま使ってたけど、これもAPI Koboldcppもダメで
llama3にしたらちゃんと言ってくれるようになった

でもllama3だとグラボがギャリギャリ言うから怖い……

0355名無しさん＠ピンキー

2024/10/17(木) 14:22:27.05ID:???

しずかちゃん　が　しかちゃん　になるのとは別の現象か
あれはsseを変えたら治ったが

0356名無しさん＠ピンキー

2024/10/17(木) 14:37:17.73ID:???

>>355
コンソールと実際の表示が異なって文字が欠けるのとは別の現象だね
あれはkobold最新版でもまだバグが残っていて
koboldが原因となって尻タブで文字が欠けるみたいだからgithubのissuesに提出されてるところ

0357名無しさん＠ピンキー

2024/10/17(木) 14:59:03.49ID:???

>>352
俺はまさに今その環境だよ
ちなみに俺がなった時はkobold1.72くらいの時
多分koboldは関係ない
sillyが何かの拍子で壊れるんだと思う

0358名無しさん＠ピンキー

2024/10/17(木) 15:05:28.67ID:???

ちなみに俺はデータフォルダ丸ごとは引っ越してない
新しくsillyを別の場所に入れて、古い方からキャラカードやログをインポートする形で移行したよ

0359名無しさん＠ピンキー

2024/10/17(木) 15:30:24.41ID:???

>>358
確かにキャラカードとかだけ移し替えたらちゃんと喋ってくれるようになったわ
dataフォルダ内のどれかがぶっ壊れるっぽな

0360名無しさん＠ピンキー

2024/10/17(木) 18:33:55.37ID:???

Silly通してるならAマークからTokenizerの設定あるよね
何が正しいのかは知らんけど

0361名無しさん＠ピンキー

2024/10/17(木) 18:42:50.02ID:???

>>360
尻タブ入れ直したらトークナイザー弄らなくても直ったから尻タブがぶっ壊れてたっぽい

0362名無しさん＠ピンキー

2024/10/17(木) 18:58:46.06ID:???

utf−8の1文字を1トークンにしたら解決する話じゃないんだろうねきっと

0363名無しさん＠ピンキー

2024/10/18(金) 01:11:35.39ID:???

Llama-3.1-Nemotron-70B-Instruc
Q8で試してるけど日本語も流暢でエロもいけて結構良い感じ
個人的にCommand-R-Plus超えかもしれん

0364名無しさん＠ピンキー

2024/10/18(金) 11:42:02.90ID:???

>>363
q8動くのええなー
ちなどこのgguf?
なんかいっぱいあるな
swallowとのマージモデルもある

0365名無しさん＠ピンキー

2024/10/18(金) 12:10:45.12ID:QlmWzaqT

70Bをq8だとざっくり40GBぐらい食うからなかなか手が出しにくい5090来てもそのへんは変わらんだろな

0366名無しさん＠ピンキー

2024/10/18(金) 13:53:40.71ID:???

q8なら80GB～じゃね？
うちの3090+4060Tix2の56GBだと実用的なコンテクスト長で使うならq4が精一杯だ

0367名無しさん＠ピンキー

2024/10/18(金) 14:44:47.14ID:???

>>364
lmstudio-community/Llama-3.1-Nemotron-70B-Instruct-HF-GGUF
ってやつ。
ベンチマークでSonnetと4o超え謳ってるだけあって日本語対応70Bの中だと賢い気がする。

メモリ128GB積んだMacでRAM使用量70GB、3t/sくらい

0368名無しさん＠ピンキー

2024/10/18(金) 20:26:47.37ID:marnTRSw

>>366
ほんまや普段の自分のスケールで書いてしまった

0369名無しさん＠ピンキー

2024/10/18(金) 21:03:00.81ID:???

>>363
どういうところがCR+超えに感じたってのはある？

0370名無しさん＠ピンキー

2024/10/18(金) 21:13:09.78ID:???

1.58bitきたやで
https://github.com/microsoft/BitNet

0371名無しさん＠ピンキー

2024/10/18(金) 23:29:49.98ID:???

>>370
Microsoftなのにデモ動画はApple M2なのか

0372名無しさん＠ピンキー

2024/10/19(土) 00:29:32.39ID:???

既存のウェイトを1.58bitに変換したllama3 8bも公開されとるのか
変換方法と微調整方法(これが肝らしい)が公開されとるから
一気に1.58bitのモデル出てくるかもわからんな

0373名無しさん＠ピンキー

2024/10/19(土) 07:33:36.87ID:???

どれくらい高速化するかな

0374名無しさん＠ピンキー

2024/10/19(土) 09:41:57.22ID:???

>>235
LM Studioにheadless mode (他アプリから呼び出すサーバ用のGUIなしモード) が来るみたいね
https://x.com/yagilb/status/1847323458071298051

0375名無しさん＠ピンキー

2024/10/19(土) 11:42:03.95ID:???

text-generation-webui使ってるけど、モデルの選択は当然重要だけどパラメータもそれ以上に重要なのね
プリセットでお勧め設定ある？

0376名無しさん＠ピンキー

2024/10/19(土) 11:53:28.52ID:IJphwg4/

大葉も尻タブもモデルと遊び方によってベストなプリセットやプロンプト変わるから一概に言えんやろ
せめて自分が使ってるモデルと遊び方開示せんことには誰もなんも言えんと思うで
パラメータはより好みで別れる部分や

ただ、ワイは尻タブやが諸氏のモデルとプリセット、システムプロンプトのお勧めは大いに興味ある
とはいえ最近は課金Opusなのでワイが公開できるもんは無いんやが...

0377名無しさん＠ピンキー

2024/10/19(土) 12:14:11.31ID:???

sillyのプリセットにあるkobold godlikeってのは使うこと多いな
別に他と比べまくってるわけじゃないけど
あと動的温度ってのはよくわからないまま有効にしてみてる

0378名無しさん＠ピンキー

2024/10/19(土) 13:58:35.24ID:???

lambda chatっていうところで無料で試せるhermes-3-llama-3.1-405b-fp8なかなかいいと思う

0379名無しさん＠ピンキー

2024/10/20(日) 00:00:56.25ID:hgtEe7TK

テストでmagnumみたいなエロに強いファインチューニングモデル作ってみたで
使ったデータセットの半分ぐらいが日本語だから普通のmagnumよりも日本語には強いはず？
https://huggingface.co/ascktgcc/Mistral-nemo-ja-rp-v0.1

0380名無しさん＠ピンキー

2024/10/20(日) 07:51:39.68ID:???

すげーな
帰ったら試すわ
できれば作成手順もアップして欲しい

0381名無しさん＠ピンキー

2024/10/20(日) 08:56:52.87ID:???

>>379
Mistral-nemo-ja-rp-v0.1-Q4_K_S.gguf
を使ってみたけどチャットで少し性的な内容だと「そういう問い合わせには回答できない（要約）」、文章生成で使うとルー語（youがrunした、みたいな）になるね（Lumimaid-Magnumだと実用レベルの文章が生成できている設定で比較）
もしかするとQ4まで量子化してる影響かもしれないからQ6かQ8で12GBに収まるギリギリなのがあれば試したい

0382名無しさん＠ピンキー

2024/10/20(日) 09:30:46.81ID:???

>>379
すげー個人でできるもんなんか
青空文庫ぜんぶ喰わせたとか？
DLさせてもらうで

ガチハード勢が多いここのニキら用に
VRAM24Gのも用意しとくのもええんやないかしら

0383名無しさん＠ピンキー

2024/10/20(日) 10:35:04.87ID:???

>>381
そういやfinetuneする時無修正化してるのはどうやってるんかな？

0384名無しさん＠ピンキー

2024/10/20(日) 10:39:25.18ID:???

>>381
俺の設定だと性的内容でも問題なく出力してくれたよ
キャラの設定とか会話例とか次第なのかもしれない

0385名無しさん＠ピンキー

2024/10/20(日) 10:42:07.59ID:???

ただ文章が固いし日本語が不自然かつ英語が混ざるのは確か
俺の設定が悪いだけかもしれんが

0386名無しさん＠ピンキー

2024/10/20(日) 10:48:14.03ID:???

海外製モデルは根本的に日本語不自由だからSFTだけじゃ不自然なのは治らないよ
継続事前学習しないと

0387名無しさん＠ピンキー

2024/10/20(日) 11:05:30.97ID:hgtEe7TK

>>381,385
英語交じりになる問題はmistral-nemoベースなんでTemperatureを0.3前後に下げれば解決すると思う。
回答拒否は再現できなかった
q6とq8は今アップロード中だからそのうち追加されると思う
>>380,379
unslothの公式ノートブックを使ってモデルページに書いてあるデータセットでファインチューニングしただけだから簡単やで
>>383
Mistral-nemoは素の状態で無修正だからファインチューンでエロさを足してる感じだね

0388名無しさん＠ピンキー

2024/10/20(日) 11:25:17.06ID:Hr2coa44

自作アプリにどの程度のモデル組み込めるか実験中なんやけど、1.5Bとかの極小モデルで日本語モデルなんかお勧めないか？
これまで小さくても7Bぐらいまでしか触ってこなかったから、小さいの全然分からんのや
実機でどの程度の速度出るか、とかどの程度の日本語力なのかとか私的なベンチマークが目的や

0389名無しさん＠ピンキー

2024/10/20(日) 12:47:40.71ID:???

>>387
q8触ってみた、Temperature下げたら英語が出る問題も回答拒否についても解決したよ
(普段小説生成で使用しててTemperatureは1.0)

0390名無しさん＠ピンキー

2024/10/20(日) 14:25:14.70ID:???

>>388
極小モデルでまともな日本語を話すのはGemma2 2BベースのBakuかな

0391名無しさん＠ピンキー

2024/10/20(日) 14:59:41.21ID:Hr2coa44

>>390
試してみるわ、サンガツ！

0392名無しさん＠ピンキー

2024/10/20(日) 17:46:05.75ID:???

0.3でも英語出るけどなあ
他が関係してんのかな

0393名無しさん＠ピンキー

2024/10/20(日) 17:51:13.71ID:???

stで試したがワイもルー語出るなぁ。英語以外のよくわからん単語も時々出る。
指示が悪いのかもだけど、セリフだけでいいのに状況描写まで出力されがちやった。
でもワイにはとても学習までやれんから期待しとるで！

0394名無しさん＠ピンキー

2024/10/20(日) 20:07:18.00ID:???

ｑ８をkoboldデフォ設定で試したが、かなり日本語の語彙が豊富になってる感じがするな
同じ方法で70Ｂをfinetuneするには、メモリどれくらい必要なんだろ？

0395名無しさん＠ピンキー

2024/10/20(日) 23:59:00.49ID:???

新しいmagnumはかなり良さげ
vram48GB勢(72B qwen2.5ベース), 24GB勢(27B gemma2ベース)には最適かもしれん

0396名無しさん＠ピンキー

2024/10/21(月) 01:54:30.42ID:???

qwenベースは規制高そうだから、123Bいくわ

0397名無しさん＠ピンキー

2024/10/21(月) 03:24:41.25ID:???

7B~12B帯の日本語エロは未だBerghofが１強じゃないか？
指示が複雑なのはumiyuki-Umievo-itr012-Gleipnir-7B
画像生成とか海外モデルに比べて日本語モデルはあまり進化してない感じする

0398名無しさん＠ピンキー

2024/10/21(月) 05:18:44.28ID:???

Berghofは即落ち♡連発ですぐエロエロになっちゃうからGleipnir使ってる
キャラ崩壊せず平然とした状態でエロを受け入れるように出来るならBerghofも使いたいんだけど出来るもんなの？

0399名無しさん＠ピンキー

2024/10/21(月) 06:55:14.97ID:???

>>397
なんかわかる
エロ関係ない普通の受け答えも7Bモデルの方が賢い気がする
現状の12Bってサイズでかいだけで良いとこが無い

0400名無しさん＠ピンキー

2024/10/21(月) 07:05:51.92ID:???

berghofは肩を真面目にマッサージしてるだけで喘ぎ散らかしてイクからなw

0401名無しさん＠ピンキー

2024/10/21(月) 07:43:39.62ID:???

ミニopusかw

0402名無しさん＠ピンキー

2024/10/21(月) 11:47:35.55ID:???

style bert VITS2でキャッキャしてたらいつの間にかもっと凄いのが次々出てきてるのね
GPT-soVITS v2
XTTS v2
F5-TTS
この辺が超気になる

0403名無しさん＠ピンキー

2024/10/21(月) 12:22:40.50ID:???

日本語用のモデル探してるんだけど良さそうなのなにか無いかな？

0404名無しさん＠ピンキー

2024/10/21(月) 12:40:28.25ID:???

音声AIのTTSは何が主流なんだろうな

0405名無しさん＠ピンキー

2024/10/21(月) 13:13:08.79ID:???

実績から考えたら棒読みちゃんだろうな

0406名無しさん＠ピンキー

2024/10/21(月) 13:28:04.99ID:???

「こんにちはゆっくり霊夢よ」
「ゆっくり魔理沙だぜ」
「今日はオナテク板のLLM部を紹介するわね」

0407名無しさん＠ピンキー

2024/10/21(月) 14:08:42.11ID:???

magnum v4 123b エロいわｗ
これがサクサク動くmacニキうらやましす

0408名無しさん＠ピンキー

2024/10/21(月) 15:06:46.42ID:???

>>403
SFWな用途にはこのページが網羅的にまとめてくれてるかな　NSFWなのは載ってなさそ
llm-jp/awesome-japanese-llm: 日本語LLMまとめ - Overview of Japanese LLMs
https://github.com/llm-jp/awesome-japanese-llm

0409名無しさん＠ピンキー

2024/10/21(月) 18:28:19.99ID:9qUbpEYj

>>387
VRAM12GBなんでq6使わせてもらったけどええですね
飲んでもらうときにんごっんごっ言い出したけど手直しすると以降は従ってくれた

0410名無しさん＠ピンキー

2024/10/21(月) 19:47:52.79ID:PlLaQBFA

spiritlm試せた奴おる？

0411名無しさん＠ピンキー

2024/10/21(月) 19:47:57.82ID:???

- bartowski/Lumimaid-Magnum-12B-GGUF
- anthracite-org/magnum-v4-12b-gguf
今のところ12Bだとこの二つが好みかなぁ
日本語が不安定な時もあるけど、シチュエーションに対する理解度の高さが良い
Berghofも悪くないけど上にもあるようにすぐに喘いじゃうのと文章の整合性がすぐに破綻しちゃうのがね……

0412名無しさん＠ピンキー

2024/10/21(月) 23:48:24.21ID:QRvnY3l6

>>408
はぇ～、これは助かる
サンガツや！

0413403

2024/10/22(火) 02:19:20.82ID:xozHFOrG

>>408
サンガツ
NSFWで現状良さそうなモデルってある？

0414名無しさん＠ピンキー

2024/10/22(火) 05:35:04.87ID:???

すぐ上にも書いてあるんだからまず名前上がってるのを試してみなよ

0415名無しさん＠ピンキー

2024/10/22(火) 08:06:25.51ID:???

すまん詳しい奴助けてくれ
LMでSTに繋いでRP利用してる
/nを使ったからかSTの出力には出ないんだがLMサーバーとcmdで
ひとり芝居してる
隠れて浮気されてる気分になるので
ひとり芝居を消したいのだが
どこをどうすれば消えるのか分からず困っている
LMのシステムプロンプトに日本語で「下記のキャラの発言のみして下さい」としても効果なし

0416名無しさん＠ピンキー

2024/10/22(火) 08:24:18.56ID:???

>>370
M2 Ultraすんごいな。
Intelのほうだって13700だから遅いCPUじゃない筈なんだけど
4倍近い速度差があるんか

0417名無しさん＠ピンキー

2024/10/22(火) 09:50:30.01ID:lsOejY8B

メモリ帯域とかの話じゃなくて？

0418名無しさん＠ピンキー

2024/10/22(火) 12:41:53.61ID:???

7Bモデルでのチャットは結局VecteusのV1に戻ってきてしまう。(V2は小説寄りっぽい)

0419名無しさん＠ピンキー

2024/10/22(火) 13:11:17.92ID:???

特定のキャラ付けでチャットして遊んでるやつは自分で専用の小規模モデル作った方が良いと思うわ
ClaudeとかGPTとかの高性能モデルのチャットログあればそれをデータにして学習すれば小規模でも結構上手く喋れるようになる

0420名無しさん＠ピンキー

2024/10/22(火) 15:36:31.14ID:???

>>411
bartowski/Lumimaid-Magnum-12B-GGUF
これプロンプトの応答性がよくてええな

0421名無しさん＠ピンキー

2024/10/22(火) 19:01:27.80ID:???

>>397
>>398
Gleipnirをsillyで使ってみたんだけど何度再生成しても意味不明な文ばかり出るや
例えばこんなの↓

また、私達って、お誕生日のゲストランチと言うことがないと言うことが好きなどう、ことが得意じゃないちょうと、その代わり出します。

どんな設定でやってるの？

0422名無しさん＠ピンキー

2024/10/22(火) 20:33:51.24ID:???

日本語がバグってる風な時はtemperatureを下げると良いかも（sillyに無かったらごめん）

あとモデル名は省略せず書いたほうが良いで
umiyuki_Umievo-itr012-Gleipnir-7Bはそこまでアホじゃない（割とおすすめ）
ただ他人が量子化したUmievo-itr012-Gleipnir-7B.Q4_1はちょうどそんな風やったな。Q8はそこそこ

0423名無しさん＠ピンキー

2024/10/22(火) 21:28:00.46ID:???

>>422
umiyuki_Umievo-itr012-Gleipnir-7B-Q8_0.ggufでこんな感じになるんよ
温度いくつでやってるの？

0424名無しさん＠ピンキー

2024/10/22(火) 21:41:30.01ID:???

あ、koboldcppで適当に指示して会話したら普通に流暢に話すみたい
sillyでやると温度0.3にしても全くアホの子だなあ
誰かsillyでgleipnirを普通に使えてる人いないのかな

0425名無しさん＠ピンキー

2024/10/22(火) 22:28:55.30ID:???

>>424
尻の設定を、koboldと同じにしてもだめかな？
デフォの設定がかなり違うから

0426名無しさん＠ピンキー

2024/10/22(火) 22:33:14.80ID:???

Gleipnir−７B.Q6_Kでもsillyで普通に使えとるがなぁ
温度１でも0.5でもそんなに変なことにはならない。

0427名無しさん＠ピンキー

2024/10/22(火) 22:41:04.83ID:???

>>426
おお
ということは温度以外の何かが原因か
コンテキストテンプレートはMistral？

0428名無しさん＠ピンキー

2024/10/22(火) 23:01:05.46ID:???

何か原因が分かってきた
もしかしたらgleipnirの最大コンテキスト長って8192より小さい？
他のモデルでやってた長ーい会話の続きをgleipnirでやろうとすると文章がバグる
ほどほどに短めの会話の続きなら自然にやってくれる
この挙動って最大コンテキスト長の違いから来てそうなんだよなあ

■ このスレッドは過去ログ倉庫に格納されています