なんJLLM部 避難所 ★4
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@ピンキー2024/09/10(火) 10:19:11.43ID:Z1PzH55u
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC(できれば+3060 12GB以上)でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部 避難所 ★3
https://mercury.bbspink.com/test/read.cgi/onatech/1717886234
0329名無しさん@ピンキー2024/10/15(火) 12:31:11.83ID:???
カンニング可能な以上ベンチマークを有効に機能させるのってそもそも困難だと思う
Chatbot Arenaみたいなユーザーの使用感ベースによる比較を纏めたものが一番本質に近いんじゃなかろうか
もちろん専門性を測るのはカバーしてないけど対話相手や創作用途って意味なら十分だろうし
0330名無しさん@ピンキー2024/10/15(火) 13:15:58.15ID:yfAQYZIp
エッチ用途だとベンチより体感でわかるよね出来の良し悪し
0332名無しさん@ピンキー2024/10/15(火) 20:16:46.43ID:???
自分で問題作って自分のモデルに学習させて他の有名モデルに勝ったと言い張るElyzaの話する?
0334名無しさん@ピンキー2024/10/16(水) 08:02:40.82ID:???
Elyzaは予算獲得のためになりふり構わずという感じだったなぁ
0337名無しさん@ピンキー2024/10/16(水) 17:58:06.00ID:???
エロはモデルの厚みというか雑多な総合性能みたいなの図るのには向いてる
0338名無しさん@ピンキー2024/10/16(水) 21:11:05.16ID:???
週末のセールで何か買っておくべきだった
やるゲームがない
0341名無しさん@ピンキー2024/10/17(木) 05:12:53.13ID:???
Nemotron-70BでもEntropixは上手くいくって言ってるけど
これ個人で試すにはどうすれば良いんだ?

俺はバナナの本数の計算が出来るかどうかよりも
エッチな文章が軽いモデルでもより正確かつエロティックになるかどうかを知りたいんだ
0342名無しさん@ピンキー2024/10/17(木) 12:17:52.03ID:???
koboldを1.72から1.76に更新したら色んなモデルで「おっぱい」って言えなくなったんだけどどういうことなんだ?
「おっパイ」や「オッパイ」とは言ってくれるけど
「おっぱい」になると「おっ……おっ……おっ……」と延々と続けたり「おっ……パイ!」みたいな変な言い方しかしなくなった

1.72に戻したらちゃんと「おっぱい」って言ってくれるようになった
0346名無しさん@ピンキー2024/10/17(木) 12:44:42.58ID:???
>>345
kobold側の設定でなんか規制でも入るようになったのかと考えて
思いつく限りの淫語や禁止ワードに引っ掛かりそうなことを言わせてみたんだけど
「おっぱい」と「ずぽずぽ」以外はどんなに際どいことでもちゃんと言ってくれるんだよな
ちなみに「ずぽズポ」や「ズポズポ」ならやっぱり言ってくれる
0347名無しさん@ピンキー2024/10/17(木) 12:54:50.14ID:???
1.76でもkobold自体なら「おっぱい」とは言ってくれるけど
尻タブだと言ってくれなくなるみたいだ

はぁーん?訳が分からん
0348名無しさん@ピンキー2024/10/17(木) 13:01:44.93ID:???
それ俺も別の単語で起こったな
俺の場合はありがとうございますがどうしても言えなくなってありがとうござます
ありがとうござ、います
ありがとうござ#います
などなど、何かに邪魔されている感じだった
結局何をどうやっても改善されなくて、sillyを入れ直してデータ引っ越したら直ってたよ
0349名無しさん@ピンキー2024/10/17(木) 13:28:59.81ID:???
ひらがなの

「ぬ」
「ゆ」
「ぎ」「ぐ」
「ざ」「ぜ」「ぞ」
「ぢ」
「ぶ」「ぼ」
「ぱ」「ぴ」「ぷ」「ぺ」「ぽ」

が言えなくなるみたいだ。淫語かどうかは関係ない
「ぴかぴか」とか「まつぼっくり」とかも言えなくなる
もちろん五十音をひらがなで全部言うのは無理
0351名無しさん@ピンキー2024/10/17(木) 13:34:21.20ID:???
>>350
ログとかは別保存だったかもしんない
大事なやつだけあらかじめエクスポートして新sillyでインポートしたよ
0352名無しさん@ピンキー2024/10/17(木) 13:45:59.57ID:???
>>351
サンクス
引っ越したけどやっぱり特定のひらがなが言えないみたいだ
誰かkobold 1.76で尻タブを試してみてくれないか
おま環かどうか知りたい
0354名無しさん@ピンキー2024/10/17(木) 14:00:31.38ID:???
>>353
トークナイザーの問題っぽい
今まではBest match(recommended)のまま使ってたけど、これもAPI Koboldcppもダメで
llama3にしたらちゃんと言ってくれるようになった

でもllama3だとグラボがギャリギャリ言うから怖い……
0355名無しさん@ピンキー2024/10/17(木) 14:22:27.05ID:???
しずかちゃん が しかちゃん になるのとは別の現象か
あれはsseを変えたら治ったが
0356名無しさん@ピンキー2024/10/17(木) 14:37:17.73ID:???
>>355
コンソールと実際の表示が異なって文字が欠けるのとは別の現象だね
あれはkobold最新版でもまだバグが残っていて
koboldが原因となって尻タブで文字が欠けるみたいだからgithubのissuesに提出されてるところ
0357名無しさん@ピンキー2024/10/17(木) 14:59:03.49ID:???
>>352
俺はまさに今その環境だよ
ちなみに俺がなった時はkobold1.72くらいの時
多分koboldは関係ない
sillyが何かの拍子で壊れるんだと思う
0358名無しさん@ピンキー2024/10/17(木) 15:05:28.67ID:???
ちなみに俺はデータフォルダ丸ごとは引っ越してない
新しくsillyを別の場所に入れて、古い方からキャラカードやログをインポートする形で移行したよ
0359名無しさん@ピンキー2024/10/17(木) 15:30:24.41ID:???
>>358
確かにキャラカードとかだけ移し替えたらちゃんと喋ってくれるようになったわ
dataフォルダ内のどれかがぶっ壊れるっぽな
0360名無しさん@ピンキー2024/10/17(木) 18:33:55.37ID:???
Silly通してるならAマークからTokenizerの設定あるよね
何が正しいのかは知らんけど
0361名無しさん@ピンキー2024/10/17(木) 18:42:50.02ID:???
>>360
尻タブ入れ直したらトークナイザー弄らなくても直ったから尻タブがぶっ壊れてたっぽい
0362名無しさん@ピンキー2024/10/17(木) 18:58:46.06ID:???
utf−8の1文字を1トークンにしたら解決する話じゃないんだろうねきっと
0363名無しさん@ピンキー2024/10/18(金) 01:11:35.39ID:???
Llama-3.1-Nemotron-70B-Instruc
Q8で試してるけど日本語も流暢でエロもいけて結構良い感じ
個人的にCommand-R-Plus超えかもしれん
0364名無しさん@ピンキー2024/10/18(金) 11:42:02.90ID:???
>>363
q8動くのええなー
ちなどこのgguf?
なんかいっぱいあるな
swallowとのマージモデルもある
0365名無しさん@ピンキー2024/10/18(金) 12:10:45.12ID:QlmWzaqT
70Bをq8だとざっくり40GBぐらい食うからなかなか手が出しにくい5090来てもそのへんは変わらんだろな
0366名無しさん@ピンキー2024/10/18(金) 13:53:40.71ID:???
q8なら80GB〜じゃね?
うちの3090+4060Tix2の56GBだと実用的なコンテクスト長で使うならq4が精一杯だ
0367名無しさん@ピンキー2024/10/18(金) 14:44:47.14ID:???
>>364
lmstudio-community/Llama-3.1-Nemotron-70B-Instruct-HF-GGUF
ってやつ。
ベンチマークでSonnetと4o超え謳ってるだけあって日本語対応70Bの中だと賢い気がする。

メモリ128GB積んだMacでRAM使用量70GB、3t/sくらい
0368名無しさん@ピンキー2024/10/18(金) 20:26:47.37ID:marnTRSw
>>366
ほんまや普段の自分のスケールで書いてしまった
0372名無しさん@ピンキー2024/10/19(土) 00:29:32.39ID:???
既存のウェイトを1.58bitに変換したllama3 8bも公開されとるのか
変換方法と微調整方法(これが肝らしい)が公開されとるから
一気に1.58bitのモデル出てくるかもわからんな
0375名無しさん@ピンキー2024/10/19(土) 11:42:03.95ID:???
text-generation-webui使ってるけど、モデルの選択は当然重要だけどパラメータもそれ以上に重要なのね
プリセットでお勧め設定ある?
0376名無しさん@ピンキー2024/10/19(土) 11:53:28.52ID:IJphwg4/
大葉も尻タブもモデルと遊び方によってベストなプリセットやプロンプト変わるから一概に言えんやろ
せめて自分が使ってるモデルと遊び方開示せんことには誰もなんも言えんと思うで
パラメータはより好みで別れる部分や

ただ、ワイは尻タブやが諸氏のモデルとプリセット、システムプロンプトのお勧めは大いに興味ある
とはいえ最近は課金Opusなのでワイが公開できるもんは無いんやが...
0377名無しさん@ピンキー2024/10/19(土) 12:14:11.31ID:???
sillyのプリセットにあるkobold godlikeってのは使うこと多いな
別に他と比べまくってるわけじゃないけど
あと動的温度ってのはよくわからないまま有効にしてみてる
0378名無しさん@ピンキー2024/10/19(土) 13:58:35.24ID:???
lambda chatっていうところで無料で試せるhermes-3-llama-3.1-405b-fp8なかなかいいと思う
0379名無しさん@ピンキー2024/10/20(日) 00:00:56.25ID:hgtEe7TK
テストでmagnumみたいなエロに強いファインチューニングモデル作ってみたで
使ったデータセットの半分ぐらいが日本語だから普通のmagnumよりも日本語には強いはず?
https://huggingface.co/ascktgcc/Mistral-nemo-ja-rp-v0.1
0380名無しさん@ピンキー2024/10/20(日) 07:51:39.68ID:???
すげーな
帰ったら試すわ
できれば作成手順もアップして欲しい
0381名無しさん@ピンキー2024/10/20(日) 08:56:52.87ID:???
>>379
Mistral-nemo-ja-rp-v0.1-Q4_K_S.gguf
を使ってみたけどチャットで少し性的な内容だと「そういう問い合わせには回答できない(要約)」、文章生成で使うとルー語(youがrunした、みたいな)になるね(Lumimaid-Magnumだと実用レベルの文章が生成できている設定で比較)
もしかするとQ4まで量子化してる影響かもしれないからQ6かQ8で12GBに収まるギリギリなのがあれば試したい
0382名無しさん@ピンキー2024/10/20(日) 09:30:46.81ID:???
>>379
すげー個人でできるもんなんか
青空文庫ぜんぶ喰わせたとか?
DLさせてもらうで

ガチハード勢が多いここのニキら用に
VRAM24Gのも用意しとくのもええんやないかしら
0384名無しさん@ピンキー2024/10/20(日) 10:39:25.18ID:???
>>381
俺の設定だと性的内容でも問題なく出力してくれたよ
キャラの設定とか会話例とか次第なのかもしれない
0385名無しさん@ピンキー2024/10/20(日) 10:42:07.59ID:???
ただ文章が固いし日本語が不自然かつ英語が混ざるのは確か
俺の設定が悪いだけかもしれんが
0386名無しさん@ピンキー2024/10/20(日) 10:48:14.03ID:???
海外製モデルは根本的に日本語不自由だからSFTだけじゃ不自然なのは治らないよ
継続事前学習しないと
0387名無しさん@ピンキー2024/10/20(日) 11:05:30.97ID:hgtEe7TK
>>381,385
英語交じりになる問題はmistral-nemoベースなんでTemperatureを0.3前後に下げれば解決すると思う。
回答拒否は再現できなかった
q6とq8は今アップロード中だからそのうち追加されると思う
>>380,379
unslothの公式ノートブックを使ってモデルページに書いてあるデータセットでファインチューニングしただけだから簡単やで
>>383
Mistral-nemoは素の状態で無修正だからファインチューンでエロさを足してる感じだね
0388名無しさん@ピンキー2024/10/20(日) 11:25:17.06ID:Hr2coa44
自作アプリにどの程度のモデル組み込めるか実験中なんやけど、1.5Bとかの極小モデルで日本語モデルなんかお勧めないか?
これまで小さくても7Bぐらいまでしか触ってこなかったから、小さいの全然分からんのや
実機でどの程度の速度出るか、とかどの程度の日本語力なのかとか私的なベンチマークが目的や
0389名無しさん@ピンキー2024/10/20(日) 12:47:40.71ID:???
>>387
q8触ってみた、Temperature下げたら英語が出る問題も回答拒否についても解決したよ
(普段小説生成で使用しててTemperatureは1.0)
0391名無しさん@ピンキー2024/10/20(日) 14:59:41.21ID:Hr2coa44
>>390
試してみるわ、サンガツ!
0393名無しさん@ピンキー2024/10/20(日) 17:51:13.71ID:???
stで試したがワイもルー語出るなぁ。英語以外のよくわからん単語も時々出る。
指示が悪いのかもだけど、セリフだけでいいのに状況描写まで出力されがちやった。
でもワイにはとても学習までやれんから期待しとるで!
0394名無しさん@ピンキー2024/10/20(日) 20:07:18.00ID:???
q8をkoboldデフォ設定で試したが、かなり日本語の語彙が豊富になってる感じがするな
同じ方法で70Bをfinetuneするには、メモリどれくらい必要なんだろ?
0395名無しさん@ピンキー2024/10/20(日) 23:59:00.49ID:???
新しいmagnumはかなり良さげ
vram48GB勢(72B qwen2.5ベース), 24GB勢(27B gemma2ベース)には最適かもしれん
0397名無しさん@ピンキー2024/10/21(月) 03:24:41.25ID:???
7B~12B帯の日本語エロは未だBerghofが1強じゃないか?
指示が複雑なのはumiyuki-Umievo-itr012-Gleipnir-7B
画像生成とか海外モデルに比べて日本語モデルはあまり進化してない感じする
0398名無しさん@ピンキー2024/10/21(月) 05:18:44.28ID:???
Berghofは即落ち♡連発ですぐエロエロになっちゃうからGleipnir使ってる
キャラ崩壊せず平然とした状態でエロを受け入れるように出来るならBerghofも使いたいんだけど出来るもんなの?
0399名無しさん@ピンキー2024/10/21(月) 06:55:14.97ID:???
>>397
なんかわかる
エロ関係ない普通の受け答えも7Bモデルの方が賢い気がする
現状の12Bってサイズでかいだけで良いとこが無い
0400名無しさん@ピンキー2024/10/21(月) 07:05:51.92ID:???
berghofは肩を真面目にマッサージしてるだけで喘ぎ散らかしてイクからなw
0402名無しさん@ピンキー2024/10/21(月) 11:47:35.55ID:???
style bert VITS2でキャッキャしてたらいつの間にかもっと凄いのが次々出てきてるのね
GPT-soVITS v2
XTTS v2
F5-TTS
この辺が超気になる
0403名無しさん@ピンキー2024/10/21(月) 12:22:40.50ID:???
日本語用のモデル探してるんだけど良さそうなのなにか無いかな?
0406名無しさん@ピンキー2024/10/21(月) 13:28:04.99ID:???
「こんにちは ゆっくり霊夢よ」
「ゆっくり魔理沙だぜ」
「今日はオナテク板のLLM部を紹介するわね」
0407名無しさん@ピンキー2024/10/21(月) 14:08:42.11ID:???
magnum v4 123b エロいわw
これがサクサク動くmacニキうらやましす
0409名無しさん@ピンキー2024/10/21(月) 18:28:19.99ID:9qUbpEYj
>>387
VRAM12GBなんでq6使わせてもらったけどええですね
飲んでもらうときにんごっんごっ言い出したけど手直しすると以降は従ってくれた
0410名無しさん@ピンキー2024/10/21(月) 19:47:52.79ID:PlLaQBFA
spiritlm試せた奴おる?
0411名無しさん@ピンキー2024/10/21(月) 19:47:57.82ID:???
- bartowski/Lumimaid-Magnum-12B-GGUF
- anthracite-org/magnum-v4-12b-gguf
今のところ12Bだとこの二つが好みかなぁ
日本語が不安定な時もあるけど、シチュエーションに対する理解度の高さが良い
Berghofも悪くないけど上にもあるようにすぐに喘いじゃうのと文章の整合性がすぐに破綻しちゃうのがね……
0412名無しさん@ピンキー2024/10/21(月) 23:48:24.21ID:QRvnY3l6
>>408
はぇ〜、これは助かる
サンガツや!
04134032024/10/22(火) 02:19:20.82ID:xozHFOrG
>>408
サンガツ
NSFWで現状良さそうなモデルってある?
0414名無しさん@ピンキー2024/10/22(火) 05:35:04.87ID:???
すぐ上にも書いてあるんだからまず名前上がってるのを試してみなよ
0415名無しさん@ピンキー2024/10/22(火) 08:06:25.51ID:???
すまん詳しい奴助けてくれ
LMでSTに繋いでRP利用してる
/nを使ったからかSTの出力には出ないんだがLMサーバーとcmdで
ひとり芝居してる
隠れて浮気されてる気分になるので
ひとり芝居を消したいのだが
どこをどうすれば消えるのか分からず困っている
LMのシステムプロンプトに日本語で「下記のキャラの発言のみして下さい」としても効果なし
0416名無しさん@ピンキー2024/10/22(火) 08:24:18.56ID:???
>>370
M2 Ultraすんごいな。
Intelのほうだって13700だから遅いCPUじゃない筈なんだけど
4倍近い速度差があるんか
0417名無しさん@ピンキー2024/10/22(火) 09:50:30.01ID:lsOejY8B
メモリ帯域とかの話じゃなくて?
0418名無しさん@ピンキー2024/10/22(火) 12:41:53.61ID:???
7Bモデルでのチャットは結局VecteusのV1に戻ってきてしまう。(V2は小説寄りっぽい)
0419名無しさん@ピンキー2024/10/22(火) 13:11:17.92ID:???
特定のキャラ付けでチャットして遊んでるやつは自分で専用の小規模モデル作った方が良いと思うわ
ClaudeとかGPTとかの高性能モデルのチャットログあればそれをデータにして学習すれば小規模でも結構上手く喋れるようになる
0421名無しさん@ピンキー2024/10/22(火) 19:01:27.80ID:???
>>397
>>398
Gleipnirをsillyで使ってみたんだけど何度再生成しても意味不明な文ばかり出るや
例えばこんなの↓

また、私達って、お誕生日のゲストランチと言うことがないと言うことが好きなどう、ことが得意じゃないちょうと、その代わり出します。

どんな設定でやってるの?
0422名無しさん@ピンキー2024/10/22(火) 20:33:51.24ID:???
日本語がバグってる風な時はtemperatureを下げると良いかも(sillyに無かったらごめん)

あとモデル名は省略せず書いたほうが良いで
umiyuki_Umievo-itr012-Gleipnir-7Bはそこまでアホじゃない(割とおすすめ)
ただ他人が量子化したUmievo-itr012-Gleipnir-7B.Q4_1はちょうどそんな風やったな。Q8はそこそこ
0423名無しさん@ピンキー2024/10/22(火) 21:28:00.46ID:???
>>422
umiyuki_Umievo-itr012-Gleipnir-7B-Q8_0.ggufでこんな感じになるんよ
温度いくつでやってるの?
0424名無しさん@ピンキー2024/10/22(火) 21:41:30.01ID:???
あ、koboldcppで適当に指示して会話したら普通に流暢に話すみたい
sillyでやると温度0.3にしても全くアホの子だなあ
誰かsillyでgleipnirを普通に使えてる人いないのかな
0425名無しさん@ピンキー2024/10/22(火) 22:28:55.30ID:???
>>424
尻の設定を、koboldと同じにしてもだめかな?
デフォの設定がかなり違うから
0426名無しさん@ピンキー2024/10/22(火) 22:33:14.80ID:???
Gleipnir−7B.Q6_Kでもsillyで普通に使えとるがなぁ
温度1でも0.5でもそんなに変なことにはならない。
0427名無しさん@ピンキー2024/10/22(火) 22:41:04.83ID:???
>>426
おお
ということは温度以外の何かが原因か
コンテキストテンプレートはMistral?
0428名無しさん@ピンキー2024/10/22(火) 23:01:05.46ID:???
何か原因が分かってきた
もしかしたらgleipnirの最大コンテキスト長って8192より小さい?
他のモデルでやってた長ーい会話の続きをgleipnirでやろうとすると文章がバグる
ほどほどに短めの会話の続きなら自然にやってくれる
この挙動って最大コンテキスト長の違いから来てそうなんだよなあ
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況