なんJLLM部避難所 ★4

1002コメント310KB

なんJLLM部避難所 ★4

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー

2024/09/10(火) 10:19:11.43ID:Z1PzH55u

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★3
https://mercury.bbspink.com/test/read.cgi/onatech/1717886234

0351名無しさん＠ピンキー

2024/10/17(木) 13:34:21.20ID:???

>>350
ログとかは別保存だったかもしんない
大事なやつだけあらかじめエクスポートして新sillyでインポートしたよ

0352名無しさん＠ピンキー

2024/10/17(木) 13:45:59.57ID:???

>>351
サンクス
引っ越したけどやっぱり特定のひらがなが言えないみたいだ
誰かkobold 1.76で尻タブを試してみてくれないか
おま環かどうか知りたい

0353名無しさん＠ピンキー

2024/10/17(木) 13:47:47.68ID:???

トークナイザーの問題？🤔

0354名無しさん＠ピンキー

2024/10/17(木) 14:00:31.38ID:???

>>353
トークナイザーの問題っぽい
今まではBest match(recommended)のまま使ってたけど、これもAPI Koboldcppもダメで
llama3にしたらちゃんと言ってくれるようになった

でもllama3だとグラボがギャリギャリ言うから怖い……

0355名無しさん＠ピンキー

2024/10/17(木) 14:22:27.05ID:???

しずかちゃん　が　しかちゃん　になるのとは別の現象か
あれはsseを変えたら治ったが

0356名無しさん＠ピンキー

2024/10/17(木) 14:37:17.73ID:???

>>355
コンソールと実際の表示が異なって文字が欠けるのとは別の現象だね
あれはkobold最新版でもまだバグが残っていて
koboldが原因となって尻タブで文字が欠けるみたいだからgithubのissuesに提出されてるところ

0357名無しさん＠ピンキー

2024/10/17(木) 14:59:03.49ID:???

>>352
俺はまさに今その環境だよ
ちなみに俺がなった時はkobold1.72くらいの時
多分koboldは関係ない
sillyが何かの拍子で壊れるんだと思う

0358名無しさん＠ピンキー

2024/10/17(木) 15:05:28.67ID:???

ちなみに俺はデータフォルダ丸ごとは引っ越してない
新しくsillyを別の場所に入れて、古い方からキャラカードやログをインポートする形で移行したよ

0359名無しさん＠ピンキー

2024/10/17(木) 15:30:24.41ID:???

>>358
確かにキャラカードとかだけ移し替えたらちゃんと喋ってくれるようになったわ
dataフォルダ内のどれかがぶっ壊れるっぽな

0360名無しさん＠ピンキー

2024/10/17(木) 18:33:55.37ID:???

Silly通してるならAマークからTokenizerの設定あるよね
何が正しいのかは知らんけど

0361名無しさん＠ピンキー

2024/10/17(木) 18:42:50.02ID:???

>>360
尻タブ入れ直したらトークナイザー弄らなくても直ったから尻タブがぶっ壊れてたっぽい

0362名無しさん＠ピンキー

2024/10/17(木) 18:58:46.06ID:???

utf−8の1文字を1トークンにしたら解決する話じゃないんだろうねきっと

0363名無しさん＠ピンキー

2024/10/18(金) 01:11:35.39ID:???

Llama-3.1-Nemotron-70B-Instruc
Q8で試してるけど日本語も流暢でエロもいけて結構良い感じ
個人的にCommand-R-Plus超えかもしれん

0364名無しさん＠ピンキー

2024/10/18(金) 11:42:02.90ID:???

>>363
q8動くのええなー
ちなどこのgguf?
なんかいっぱいあるな
swallowとのマージモデルもある

0365名無しさん＠ピンキー

2024/10/18(金) 12:10:45.12ID:QlmWzaqT

70Bをq8だとざっくり40GBぐらい食うからなかなか手が出しにくい5090来てもそのへんは変わらんだろな

0366名無しさん＠ピンキー

2024/10/18(金) 13:53:40.71ID:???

q8なら80GB～じゃね？
うちの3090+4060Tix2の56GBだと実用的なコンテクスト長で使うならq4が精一杯だ

0367名無しさん＠ピンキー

2024/10/18(金) 14:44:47.14ID:???

>>364
lmstudio-community/Llama-3.1-Nemotron-70B-Instruct-HF-GGUF
ってやつ。
ベンチマークでSonnetと4o超え謳ってるだけあって日本語対応70Bの中だと賢い気がする。

メモリ128GB積んだMacでRAM使用量70GB、3t/sくらい

0368名無しさん＠ピンキー

2024/10/18(金) 20:26:47.37ID:marnTRSw

>>366
ほんまや普段の自分のスケールで書いてしまった

0369名無しさん＠ピンキー

2024/10/18(金) 21:03:00.81ID:???

>>363
どういうところがCR+超えに感じたってのはある？

0370名無しさん＠ピンキー

2024/10/18(金) 21:13:09.78ID:???

1.58bitきたやで
https://github.com/microsoft/BitNet

0371名無しさん＠ピンキー

2024/10/18(金) 23:29:49.98ID:???

>>370
Microsoftなのにデモ動画はApple M2なのか

0372名無しさん＠ピンキー

2024/10/19(土) 00:29:32.39ID:???

既存のウェイトを1.58bitに変換したllama3 8bも公開されとるのか
変換方法と微調整方法(これが肝らしい)が公開されとるから
一気に1.58bitのモデル出てくるかもわからんな

0373名無しさん＠ピンキー

2024/10/19(土) 07:33:36.87ID:???

どれくらい高速化するかな

0374名無しさん＠ピンキー

2024/10/19(土) 09:41:57.22ID:???

>>235
LM Studioにheadless mode (他アプリから呼び出すサーバ用のGUIなしモード) が来るみたいね
https://x.com/yagilb/status/1847323458071298051

0375名無しさん＠ピンキー

2024/10/19(土) 11:42:03.95ID:???

text-generation-webui使ってるけど、モデルの選択は当然重要だけどパラメータもそれ以上に重要なのね
プリセットでお勧め設定ある？

0376名無しさん＠ピンキー

2024/10/19(土) 11:53:28.52ID:IJphwg4/

大葉も尻タブもモデルと遊び方によってベストなプリセットやプロンプト変わるから一概に言えんやろ
せめて自分が使ってるモデルと遊び方開示せんことには誰もなんも言えんと思うで
パラメータはより好みで別れる部分や

ただ、ワイは尻タブやが諸氏のモデルとプリセット、システムプロンプトのお勧めは大いに興味ある
とはいえ最近は課金Opusなのでワイが公開できるもんは無いんやが...

0377名無しさん＠ピンキー

2024/10/19(土) 12:14:11.31ID:???

sillyのプリセットにあるkobold godlikeってのは使うこと多いな
別に他と比べまくってるわけじゃないけど
あと動的温度ってのはよくわからないまま有効にしてみてる

0378名無しさん＠ピンキー

2024/10/19(土) 13:58:35.24ID:???

lambda chatっていうところで無料で試せるhermes-3-llama-3.1-405b-fp8なかなかいいと思う

0379名無しさん＠ピンキー

2024/10/20(日) 00:00:56.25ID:hgtEe7TK

テストでmagnumみたいなエロに強いファインチューニングモデル作ってみたで
使ったデータセットの半分ぐらいが日本語だから普通のmagnumよりも日本語には強いはず？
https://huggingface.co/ascktgcc/Mistral-nemo-ja-rp-v0.1

0380名無しさん＠ピンキー

2024/10/20(日) 07:51:39.68ID:???

すげーな
帰ったら試すわ
できれば作成手順もアップして欲しい

0381名無しさん＠ピンキー

2024/10/20(日) 08:56:52.87ID:???

>>379
Mistral-nemo-ja-rp-v0.1-Q4_K_S.gguf
を使ってみたけどチャットで少し性的な内容だと「そういう問い合わせには回答できない（要約）」、文章生成で使うとルー語（youがrunした、みたいな）になるね（Lumimaid-Magnumだと実用レベルの文章が生成できている設定で比較）
もしかするとQ4まで量子化してる影響かもしれないからQ6かQ8で12GBに収まるギリギリなのがあれば試したい

0382名無しさん＠ピンキー

2024/10/20(日) 09:30:46.81ID:???

>>379
すげー個人でできるもんなんか
青空文庫ぜんぶ喰わせたとか？
DLさせてもらうで

ガチハード勢が多いここのニキら用に
VRAM24Gのも用意しとくのもええんやないかしら

0383名無しさん＠ピンキー

2024/10/20(日) 10:35:04.87ID:???

>>381
そういやfinetuneする時無修正化してるのはどうやってるんかな？

0384名無しさん＠ピンキー

2024/10/20(日) 10:39:25.18ID:???

>>381
俺の設定だと性的内容でも問題なく出力してくれたよ
キャラの設定とか会話例とか次第なのかもしれない

0385名無しさん＠ピンキー

2024/10/20(日) 10:42:07.59ID:???

ただ文章が固いし日本語が不自然かつ英語が混ざるのは確か
俺の設定が悪いだけかもしれんが

0386名無しさん＠ピンキー

2024/10/20(日) 10:48:14.03ID:???

海外製モデルは根本的に日本語不自由だからSFTだけじゃ不自然なのは治らないよ
継続事前学習しないと

0387名無しさん＠ピンキー

2024/10/20(日) 11:05:30.97ID:hgtEe7TK

>>381,385
英語交じりになる問題はmistral-nemoベースなんでTemperatureを0.3前後に下げれば解決すると思う。
回答拒否は再現できなかった
q6とq8は今アップロード中だからそのうち追加されると思う
>>380,379
unslothの公式ノートブックを使ってモデルページに書いてあるデータセットでファインチューニングしただけだから簡単やで
>>383
Mistral-nemoは素の状態で無修正だからファインチューンでエロさを足してる感じだね

0388名無しさん＠ピンキー

2024/10/20(日) 11:25:17.06ID:Hr2coa44

自作アプリにどの程度のモデル組み込めるか実験中なんやけど、1.5Bとかの極小モデルで日本語モデルなんかお勧めないか？
これまで小さくても7Bぐらいまでしか触ってこなかったから、小さいの全然分からんのや
実機でどの程度の速度出るか、とかどの程度の日本語力なのかとか私的なベンチマークが目的や

0389名無しさん＠ピンキー

2024/10/20(日) 12:47:40.71ID:???

>>387
q8触ってみた、Temperature下げたら英語が出る問題も回答拒否についても解決したよ
(普段小説生成で使用しててTemperatureは1.0)

0390名無しさん＠ピンキー

2024/10/20(日) 14:25:14.70ID:???

>>388
極小モデルでまともな日本語を話すのはGemma2 2BベースのBakuかな

0391名無しさん＠ピンキー

2024/10/20(日) 14:59:41.21ID:Hr2coa44

>>390
試してみるわ、サンガツ！

0392名無しさん＠ピンキー

2024/10/20(日) 17:46:05.75ID:???

0.3でも英語出るけどなあ
他が関係してんのかな

0393名無しさん＠ピンキー

2024/10/20(日) 17:51:13.71ID:???

stで試したがワイもルー語出るなぁ。英語以外のよくわからん単語も時々出る。
指示が悪いのかもだけど、セリフだけでいいのに状況描写まで出力されがちやった。
でもワイにはとても学習までやれんから期待しとるで！

0394名無しさん＠ピンキー

2024/10/20(日) 20:07:18.00ID:???

ｑ８をkoboldデフォ設定で試したが、かなり日本語の語彙が豊富になってる感じがするな
同じ方法で70Ｂをfinetuneするには、メモリどれくらい必要なんだろ？

0395名無しさん＠ピンキー

2024/10/20(日) 23:59:00.49ID:???

新しいmagnumはかなり良さげ
vram48GB勢(72B qwen2.5ベース), 24GB勢(27B gemma2ベース)には最適かもしれん

0396名無しさん＠ピンキー

2024/10/21(月) 01:54:30.42ID:???

qwenベースは規制高そうだから、123Bいくわ

0397名無しさん＠ピンキー

2024/10/21(月) 03:24:41.25ID:???

7B~12B帯の日本語エロは未だBerghofが１強じゃないか？
指示が複雑なのはumiyuki-Umievo-itr012-Gleipnir-7B
画像生成とか海外モデルに比べて日本語モデルはあまり進化してない感じする

0398名無しさん＠ピンキー

2024/10/21(月) 05:18:44.28ID:???

Berghofは即落ち♡連発ですぐエロエロになっちゃうからGleipnir使ってる
キャラ崩壊せず平然とした状態でエロを受け入れるように出来るならBerghofも使いたいんだけど出来るもんなの？

0399名無しさん＠ピンキー

2024/10/21(月) 06:55:14.97ID:???

>>397
なんかわかる
エロ関係ない普通の受け答えも7Bモデルの方が賢い気がする
現状の12Bってサイズでかいだけで良いとこが無い

0400名無しさん＠ピンキー

2024/10/21(月) 07:05:51.92ID:???

berghofは肩を真面目にマッサージしてるだけで喘ぎ散らかしてイクからなw

0401名無しさん＠ピンキー

2024/10/21(月) 07:43:39.62ID:???

ミニopusかw

0402名無しさん＠ピンキー

2024/10/21(月) 11:47:35.55ID:???

style bert VITS2でキャッキャしてたらいつの間にかもっと凄いのが次々出てきてるのね
GPT-soVITS v2
XTTS v2
F5-TTS
この辺が超気になる

0403名無しさん＠ピンキー

2024/10/21(月) 12:22:40.50ID:???

日本語用のモデル探してるんだけど良さそうなのなにか無いかな？

0404名無しさん＠ピンキー

2024/10/21(月) 12:40:28.25ID:???

音声AIのTTSは何が主流なんだろうな

0405名無しさん＠ピンキー

2024/10/21(月) 13:13:08.79ID:???

実績から考えたら棒読みちゃんだろうな

0406名無しさん＠ピンキー

2024/10/21(月) 13:28:04.99ID:???

「こんにちはゆっくり霊夢よ」
「ゆっくり魔理沙だぜ」
「今日はオナテク板のLLM部を紹介するわね」

0407名無しさん＠ピンキー

2024/10/21(月) 14:08:42.11ID:???

magnum v4 123b エロいわｗ
これがサクサク動くmacニキうらやましす

0408名無しさん＠ピンキー

2024/10/21(月) 15:06:46.42ID:???

>>403
SFWな用途にはこのページが網羅的にまとめてくれてるかな　NSFWなのは載ってなさそ
llm-jp/awesome-japanese-llm: 日本語LLMまとめ - Overview of Japanese LLMs
https://github.com/llm-jp/awesome-japanese-llm

0409名無しさん＠ピンキー

2024/10/21(月) 18:28:19.99ID:9qUbpEYj

>>387
VRAM12GBなんでq6使わせてもらったけどええですね
飲んでもらうときにんごっんごっ言い出したけど手直しすると以降は従ってくれた

0410名無しさん＠ピンキー

2024/10/21(月) 19:47:52.79ID:PlLaQBFA

spiritlm試せた奴おる？

0411名無しさん＠ピンキー

2024/10/21(月) 19:47:57.82ID:???

- bartowski/Lumimaid-Magnum-12B-GGUF
- anthracite-org/magnum-v4-12b-gguf
今のところ12Bだとこの二つが好みかなぁ
日本語が不安定な時もあるけど、シチュエーションに対する理解度の高さが良い
Berghofも悪くないけど上にもあるようにすぐに喘いじゃうのと文章の整合性がすぐに破綻しちゃうのがね……

0412名無しさん＠ピンキー

2024/10/21(月) 23:48:24.21ID:QRvnY3l6

>>408
はぇ～、これは助かる
サンガツや！

0413403

2024/10/22(火) 02:19:20.82ID:xozHFOrG

>>408
サンガツ
NSFWで現状良さそうなモデルってある？

0414名無しさん＠ピンキー

2024/10/22(火) 05:35:04.87ID:???

すぐ上にも書いてあるんだからまず名前上がってるのを試してみなよ

0415名無しさん＠ピンキー

2024/10/22(火) 08:06:25.51ID:???

すまん詳しい奴助けてくれ
LMでSTに繋いでRP利用してる
/nを使ったからかSTの出力には出ないんだがLMサーバーとcmdで
ひとり芝居してる
隠れて浮気されてる気分になるので
ひとり芝居を消したいのだが
どこをどうすれば消えるのか分からず困っている
LMのシステムプロンプトに日本語で「下記のキャラの発言のみして下さい」としても効果なし

0416名無しさん＠ピンキー

2024/10/22(火) 08:24:18.56ID:???

>>370
M2 Ultraすんごいな。
Intelのほうだって13700だから遅いCPUじゃない筈なんだけど
4倍近い速度差があるんか

0417名無しさん＠ピンキー

2024/10/22(火) 09:50:30.01ID:lsOejY8B

メモリ帯域とかの話じゃなくて？

0418名無しさん＠ピンキー

2024/10/22(火) 12:41:53.61ID:???

7Bモデルでのチャットは結局VecteusのV1に戻ってきてしまう。(V2は小説寄りっぽい)

0419名無しさん＠ピンキー

2024/10/22(火) 13:11:17.92ID:???

特定のキャラ付けでチャットして遊んでるやつは自分で専用の小規模モデル作った方が良いと思うわ
ClaudeとかGPTとかの高性能モデルのチャットログあればそれをデータにして学習すれば小規模でも結構上手く喋れるようになる

0420名無しさん＠ピンキー

2024/10/22(火) 15:36:31.14ID:???

>>411
bartowski/Lumimaid-Magnum-12B-GGUF
これプロンプトの応答性がよくてええな

0421名無しさん＠ピンキー

2024/10/22(火) 19:01:27.80ID:???

>>397
>>398
Gleipnirをsillyで使ってみたんだけど何度再生成しても意味不明な文ばかり出るや
例えばこんなの↓

また、私達って、お誕生日のゲストランチと言うことがないと言うことが好きなどう、ことが得意じゃないちょうと、その代わり出します。

どんな設定でやってるの？

0422名無しさん＠ピンキー

2024/10/22(火) 20:33:51.24ID:???

日本語がバグってる風な時はtemperatureを下げると良いかも（sillyに無かったらごめん）

あとモデル名は省略せず書いたほうが良いで
umiyuki_Umievo-itr012-Gleipnir-7Bはそこまでアホじゃない（割とおすすめ）
ただ他人が量子化したUmievo-itr012-Gleipnir-7B.Q4_1はちょうどそんな風やったな。Q8はそこそこ

0423名無しさん＠ピンキー

2024/10/22(火) 21:28:00.46ID:???

>>422
umiyuki_Umievo-itr012-Gleipnir-7B-Q8_0.ggufでこんな感じになるんよ
温度いくつでやってるの？

0424名無しさん＠ピンキー

2024/10/22(火) 21:41:30.01ID:???

あ、koboldcppで適当に指示して会話したら普通に流暢に話すみたい
sillyでやると温度0.3にしても全くアホの子だなあ
誰かsillyでgleipnirを普通に使えてる人いないのかな

0425名無しさん＠ピンキー

2024/10/22(火) 22:28:55.30ID:???

>>424
尻の設定を、koboldと同じにしてもだめかな？
デフォの設定がかなり違うから

0426名無しさん＠ピンキー

2024/10/22(火) 22:33:14.80ID:???

Gleipnir−７B.Q6_Kでもsillyで普通に使えとるがなぁ
温度１でも0.5でもそんなに変なことにはならない。

0427名無しさん＠ピンキー

2024/10/22(火) 22:41:04.83ID:???

>>426
おお
ということは温度以外の何かが原因か
コンテキストテンプレートはMistral？

0428名無しさん＠ピンキー

2024/10/22(火) 23:01:05.46ID:???

何か原因が分かってきた
もしかしたらgleipnirの最大コンテキスト長って8192より小さい？
他のモデルでやってた長ーい会話の続きをgleipnirでやろうとすると文章がバグる
ほどほどに短めの会話の続きなら自然にやってくれる
この挙動って最大コンテキスト長の違いから来てそうなんだよなあ

0429名無しさん＠ピンキー

2024/10/22(火) 23:24:33.70ID:Fw/LhCMO

SillyのText CompletionかChat Completionかで挙動が違ってるとか？

0430名無しさん＠ピンキー

2024/10/23(水) 00:49:03.08ID:???

やっぱりコンテキスト長が原因だったよ
gleipnirの最大コンテキスト長は4096！
最近8192以上のモデルばっかりだったから失念してた

0431名無しさん＠ピンキー

2024/10/23(水) 05:33:57.45ID:???

なるほどー
モデルごとにコンテキスト長もメモしとかんといかんな

0432名無しさん＠ピンキー

2024/10/23(水) 11:18:46.91ID:???

magnum v4 72b
qwenベースだけど規制緩くなってたわ
普通にエロい

0433名無しさん＠ピンキー

2024/10/23(水) 14:02:53.79ID:???

Tavernって翻訳無しに日本語で出力させるのは無理だったかな？

0434名無しさん＠ピンキー

2024/10/23(水) 14:07:30.81ID:???

>>433
モデルを日本語のにして設定日本語にすればいいんでない

0435名無しさん＠ピンキー

2024/10/23(水) 14:07:45.71ID:???

日本語使えるモデルなら日本語でおｋ

0436名無しさん＠ピンキー

2024/10/23(水) 14:09:27.10ID:???

英語で書かれたキャラカード落として入れると英語で話すからdeepL翻訳とかで日本語に書き直して使うとヨシ！

0437名無しさん＠ピンキー

2024/10/23(水) 14:09:43.50ID:???

>>434
>>435
サンガツ、始めたばっかりなんでもう一度モデルと設定確認するわ

0438名無しさん＠ピンキー

2024/10/23(水) 18:33:17.57ID:UrwrrQ+R

>>436
サンガツ、それも確認してみる

0439名無しさん＠ピンキー

2024/10/23(水) 18:33:17.97ID:UrwrrQ+R

>>436
サンガツ、それも確認してみる

0440名無しさん＠ピンキー

2024/10/24(木) 23:36:20.79ID:PTQ3TvZN

cohereから8bと32bの新モデルが出たね
https://huggingface.co/CohereForAI/aya-expanse-8b
https://huggingface.co/CohereForAI/aya-expanse-32b

0441名無しさん＠ピンキー

2024/10/25(金) 07:17:07.82ID:???

セリフの後の（）内に状況を描写
って形にすると受け身表現が出来なくなる

userがcharの乳を揉んでいる状況の説明なんだけど

user：userがcharの乳を揉んでいるセリフ
char：charのセリフ（charは乳を揉んでいる）

みたいにあたかもchar自身が揉んでいるかのような描写になる
（charは乳を揉まれている）
のような受け身表現ならないんだよな

Gleipnirでもcohere8bでもダメだし他のモデルでも受け身表現にならないことが多い
何か設定を間違えているんだろうか

0442名無しさん＠ピンキー

2024/10/25(金) 09:05:33.68ID:4ByvMro+

8Bだとそんなもんやないか？

0443名無しさん＠ピンキー

2024/10/25(金) 09:56:23.90ID:???

そんなもんなのか
これが原因でcharが自分の乳を揉んでいるって流れになりがちだからなんとかしたいところだけど
軽いモデル使ってる代償みたいなもんか

0444名無しさん＠ピンキー

2024/10/25(金) 09:58:22.42ID:???

尻？
koboldでも会話とか指示内に入れたら7bでも結構上手くいくで

0445名無しさん＠ピンキー

2024/10/25(金) 09:58:53.29ID:???

ミス
会話例ね

0446名無しさん＠ピンキー

2024/10/25(金) 10:43:25.05ID:???

>>441
silly+koboldになるけど口上をキャラクターとして状況描写させてる

0447名無しさん＠ピンキー

2024/10/25(金) 11:01:28.43ID:???

>>444
できるんか
会話例もうちょっと工夫してみるわ

0448名無しさん＠ピンキー

2024/10/25(金) 14:13:15.87ID:???

>>447
適当な７Bでテストしてみたけど、（～は揉まれている）みたいな表現は出てこんな。すまん。
（）内は心情表現に指定してるせいかな？

https://imgur.com/a/0GHrmYH

0449名無しさん＠ピンキー

2024/10/25(金) 15:54:37.75ID:aL3tLNyw

日曜にアップしたファインチューニングモデルのアップデート版を公開したで
変更点は、データセットにここで好評だったmagnum v4の物の取り込み、system promptにデータセットの言語で出力するよう指示を追加、文字化け修正、9倍学習や
英語問題もstでsystem promptに「出力は日本語にしてください。」の文字を入れて100回テストしたけど１回も出なかったから解決されてると思う(v0.1は9回出た)
https://huggingface.co/ascktgcc/Mistral-nemo-ja-rp-v0.2

0450名無しさん＠ピンキー

2024/10/25(金) 15:58:09.95ID:???

>>449
すごーい！
ちなみにこれは最大コンテキスト長いくつなの？

■ このスレッドは過去ログ倉庫に格納されています