なんJLLM部避難所 ★4

1002コメント310KB

なんJLLM部避難所 ★4

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー

2024/09/10(火) 10:19:11.43ID:Z1PzH55u

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★3
https://mercury.bbspink.com/test/read.cgi/onatech/1717886234

0311名無しさん＠ピンキー

2024/10/14(月) 14:33:25.71ID:???

>>304
それがそのまま答えなんやろな

0312名無しさん＠ピンキー

2024/10/14(月) 14:37:39.79ID:???

>>299
最新記事でたけど8bにしたら微妙になったっぽいな

0313名無しさん＠ピンキー

2024/10/14(月) 14:45:16.25ID:???

>>312
何だろうね
小型モデルほど恩恵を受ける技術って感じなのか？

0314名無しさん＠ピンキー

2024/10/14(月) 14:46:07.86ID:???

探索が少なくて済むぶんむしろ小さいモデルのほうが正確な答えを返してくるとか
やたらとモデル大きくするのはマジで無駄だったのか

0315名無しさん＠ピンキー

2024/10/14(月) 14:46:21.80ID:???

Entropixの解説っぽいのを見つけた

https://southbridge-research.notion.site/Entropixplained-11e5fec70db18022b083d7d7b0e93505

0316名無しさん＠ピンキー

2024/10/14(月) 15:06:21.32ID:???

よくわからんけど期待していいんか？
https://files.catbox.moe/h70mc7.jpg

0317名無しさん＠ピンキー

2024/10/14(月) 17:35:53.54ID:???

ダメそう

0318名無しさん＠ピンキー

2024/10/14(月) 20:11:19.81ID:???

それじゃ数百兆円かけてグラボ買って数兆パラメータのLLM作ってた人たちが馬鹿みたいじゃないですか

0319名無しさん＠ピンキー

2024/10/14(月) 20:27:47.16ID:???

黎明期に頑張った人たちは大抵踏み台にされるのだ

0320名無しさん＠ピンキー

2024/10/14(月) 22:14:25.09ID:???

bitnetですら採用されずに消えた
今のモデル規模は正直過剰だと思うがこの手の話題は一歩引いて見てしまう

0321名無しさん＠ピンキー

2024/10/14(月) 23:02:00.46ID:MCmEldhQ

まあ0.36Bで既存のLLMには難しい問題を解けた、っていうのは確かなんだし
アプローチが一つ増えたってのは良いことなんじゃないかな
これが本当に革命的な機構なら最高な話な訳だし

0322名無しさん＠ピンキー

2024/10/15(火) 00:06:47.64ID:???

学習データの質を向上させるってアプローチと組み合わせやすい点がいいところだと思う
判断プロセスの方を変えるってやり方は多くのモデルで応用効かせられそうだし

0323名無しさん＠ピンキー

2024/10/15(火) 05:46:40.57ID:???

Rocinante-12B-v2g-Q5_K_Mって日本語返すし12Bじゃ他のと比べても返答が違和感がない気がする

0324名無しさん＠ピンキー

2024/10/15(火) 06:14:24.82ID:???

ベンチマーク詐欺や驚き屋にはウンザリしてるんよ
肩透かししすぎて骨折れてるんだわ

0325名無しさん＠ピンキー

2024/10/15(火) 08:07:47.12ID:???

詐欺にならない新ベンチマーク制定よろしくです

0326名無しさん＠ピンキー

2024/10/15(火) 08:34:16.57ID:???

>>323
ちょろっと触った感じだと直訳っぽい表現は多いものの文脈は破綻してない感じやね
日本語が強化されたら12Bの中では賢い方かも

0327名無しさん＠ピンキー

2024/10/15(火) 09:58:03.24ID:???

Entropixよくわからんけどtwitterで流れてきたそれっぽい解説

https://x.com/kenn/status/1845988365021466766

0328名無しさん＠ピンキー

2024/10/15(火) 11:43:35.62ID:???

ベンチマークに問題があるのではなくて、ベンチマーク詐欺をするやつやベンチマークだけ見て驚く驚き屋に問題があるんやろ

0329名無しさん＠ピンキー

2024/10/15(火) 12:31:11.83ID:???

カンニング可能な以上ベンチマークを有効に機能させるのってそもそも困難だと思う
Chatbot Arenaみたいなユーザーの使用感ベースによる比較を纏めたものが一番本質に近いんじゃなかろうか
もちろん専門性を測るのはカバーしてないけど対話相手や創作用途って意味なら十分だろうし

0330名無しさん＠ピンキー

2024/10/15(火) 13:15:58.15ID:yfAQYZIp

エッチ用途だとベンチより体感でわかるよね出来の良し悪し

0331名無しさん＠ピンキー

2024/10/15(火) 13:47:25.35ID:???

8bですぐ正解しなくなってんだから駄目だろ

0332名無しさん＠ピンキー

2024/10/15(火) 20:16:46.43ID:???

自分で問題作って自分のモデルに学習させて他の有名モデルに勝ったと言い張るElyzaの話する？

0333名無しさん＠ピンキー

2024/10/15(火) 20:23:11.68ID:???

しない
gpt−4レベルです言われても😅

0334名無しさん＠ピンキー

2024/10/16(水) 08:02:40.82ID:???

Elyzaは予算獲得のためになりふり構わずという感じだったなぁ

0335名無しさん＠ピンキー

2024/10/16(水) 10:52:58.29ID:???

>>330
どんなベンチ結果よりも信頼できるわｗ

0336名無しさん＠ピンキー

2024/10/16(水) 11:24:08.47ID:???

やっぱエロなのか

0337名無しさん＠ピンキー

2024/10/16(水) 17:58:06.00ID:???

エロはモデルの厚みというか雑多な総合性能みたいなの図るのには向いてる

0338名無しさん＠ピンキー

2024/10/16(水) 21:11:05.16ID:???

週末のセールで何か買っておくべきだった
やるゲームがない

0339名無しさん＠ピンキー

2024/10/16(水) 21:11:20.68ID:???

誤爆

0340名無しさん＠ピンキー

2024/10/17(木) 00:26:34.40ID:CcuUment

検閲0でおなじみmistralから8bモデルが出たね
いい機会だしmagnumみたいなファインチューニングモデル作ってみようかな
https://huggingface.co/mistralai/Ministral-8B-Instruct-2410

0341名無しさん＠ピンキー

2024/10/17(木) 05:12:53.13ID:???

Nemotron-70BでもEntropixは上手くいくって言ってるけど
これ個人で試すにはどうすれば良いんだ？

俺はバナナの本数の計算が出来るかどうかよりも
エッチな文章が軽いモデルでもより正確かつエロティックになるかどうかを知りたいんだ

0342名無しさん＠ピンキー

2024/10/17(木) 12:17:52.03ID:???

koboldを1.72から1.76に更新したら色んなモデルで「おっぱい」って言えなくなったんだけどどういうことなんだ？
「おっパイ」や「オッパイ」とは言ってくれるけど
「おっぱい」になると「おっ……おっ……おっ……」と延々と続けたり「おっ……パイ！」みたいな変な言い方しかしなくなった

1.72に戻したらちゃんと「おっぱい」って言ってくれるようになった

0343名無しさん＠ピンキー

2024/10/17(木) 12:23:47.80ID:???

なんかワロタ

0344名無しさん＠ピンキー

2024/10/17(木) 12:37:31.25ID:???

おっ……パイ！とかそんなん笑ってちんぽ萎むわ

0345名無しさん＠ピンキー

2024/10/17(木) 12:38:47.17ID:???

>>342
規制にあらがってる感

0346名無しさん＠ピンキー

2024/10/17(木) 12:44:42.58ID:???

>>345
kobold側の設定でなんか規制でも入るようになったのかと考えて
思いつく限りの淫語や禁止ワードに引っ掛かりそうなことを言わせてみたんだけど
「おっぱい」と「ずぽずぽ」以外はどんなに際どいことでもちゃんと言ってくれるんだよな
ちなみに「ずぽズポ」や「ズポズポ」ならやっぱり言ってくれる

0347名無しさん＠ピンキー

2024/10/17(木) 12:54:50.14ID:???

1.76でもkobold自体なら「おっぱい」とは言ってくれるけど
尻タブだと言ってくれなくなるみたいだ

はぁーん？訳が分からん

0348名無しさん＠ピンキー

2024/10/17(木) 13:01:44.93ID:???

それ俺も別の単語で起こったな
俺の場合はありがとうございますがどうしても言えなくなってありがとうござます
ありがとうござ、います
ありがとうござ#います
などなど、何かに邪魔されている感じだった
結局何をどうやっても改善されなくて、sillyを入れ直してデータ引っ越したら直ってたよ

0349名無しさん＠ピンキー

2024/10/17(木) 13:28:59.81ID:???

ひらがなの

「ぬ」
「ゆ」
「ぎ」「ぐ」
「ざ」「ぜ」「ぞ」
「ぢ」
「ぶ」「ぼ」
「ぱ」「ぴ」「ぷ」「ぺ」「ぽ」

が言えなくなるみたいだ。淫語かどうかは関係ない
「ぴかぴか」とか「まつぼっくり」とかも言えなくなる
もちろん五十音をひらがなで全部言うのは無理

0350名無しさん＠ピンキー

2024/10/17(木) 13:30:53.32ID:???

>>348
dataフォルダだけ引っ越せばおｋ？

0351名無しさん＠ピンキー

2024/10/17(木) 13:34:21.20ID:???

>>350
ログとかは別保存だったかもしんない
大事なやつだけあらかじめエクスポートして新sillyでインポートしたよ

0352名無しさん＠ピンキー

2024/10/17(木) 13:45:59.57ID:???

>>351
サンクス
引っ越したけどやっぱり特定のひらがなが言えないみたいだ
誰かkobold 1.76で尻タブを試してみてくれないか
おま環かどうか知りたい

0353名無しさん＠ピンキー

2024/10/17(木) 13:47:47.68ID:???

トークナイザーの問題？🤔

0354名無しさん＠ピンキー

2024/10/17(木) 14:00:31.38ID:???

>>353
トークナイザーの問題っぽい
今まではBest match(recommended)のまま使ってたけど、これもAPI Koboldcppもダメで
llama3にしたらちゃんと言ってくれるようになった

でもllama3だとグラボがギャリギャリ言うから怖い……

0355名無しさん＠ピンキー

2024/10/17(木) 14:22:27.05ID:???

しずかちゃん　が　しかちゃん　になるのとは別の現象か
あれはsseを変えたら治ったが

0356名無しさん＠ピンキー

2024/10/17(木) 14:37:17.73ID:???

>>355
コンソールと実際の表示が異なって文字が欠けるのとは別の現象だね
あれはkobold最新版でもまだバグが残っていて
koboldが原因となって尻タブで文字が欠けるみたいだからgithubのissuesに提出されてるところ

0357名無しさん＠ピンキー

2024/10/17(木) 14:59:03.49ID:???

>>352
俺はまさに今その環境だよ
ちなみに俺がなった時はkobold1.72くらいの時
多分koboldは関係ない
sillyが何かの拍子で壊れるんだと思う

0358名無しさん＠ピンキー

2024/10/17(木) 15:05:28.67ID:???

ちなみに俺はデータフォルダ丸ごとは引っ越してない
新しくsillyを別の場所に入れて、古い方からキャラカードやログをインポートする形で移行したよ

0359名無しさん＠ピンキー

2024/10/17(木) 15:30:24.41ID:???

>>358
確かにキャラカードとかだけ移し替えたらちゃんと喋ってくれるようになったわ
dataフォルダ内のどれかがぶっ壊れるっぽな

0360名無しさん＠ピンキー

2024/10/17(木) 18:33:55.37ID:???

Silly通してるならAマークからTokenizerの設定あるよね
何が正しいのかは知らんけど

0361名無しさん＠ピンキー

2024/10/17(木) 18:42:50.02ID:???

>>360
尻タブ入れ直したらトークナイザー弄らなくても直ったから尻タブがぶっ壊れてたっぽい

0362名無しさん＠ピンキー

2024/10/17(木) 18:58:46.06ID:???

utf−8の1文字を1トークンにしたら解決する話じゃないんだろうねきっと

0363名無しさん＠ピンキー

2024/10/18(金) 01:11:35.39ID:???

Llama-3.1-Nemotron-70B-Instruc
Q8で試してるけど日本語も流暢でエロもいけて結構良い感じ
個人的にCommand-R-Plus超えかもしれん

0364名無しさん＠ピンキー

2024/10/18(金) 11:42:02.90ID:???

>>363
q8動くのええなー
ちなどこのgguf?
なんかいっぱいあるな
swallowとのマージモデルもある

0365名無しさん＠ピンキー

2024/10/18(金) 12:10:45.12ID:QlmWzaqT

70Bをq8だとざっくり40GBぐらい食うからなかなか手が出しにくい5090来てもそのへんは変わらんだろな

0366名無しさん＠ピンキー

2024/10/18(金) 13:53:40.71ID:???

q8なら80GB～じゃね？
うちの3090+4060Tix2の56GBだと実用的なコンテクスト長で使うならq4が精一杯だ

0367名無しさん＠ピンキー

2024/10/18(金) 14:44:47.14ID:???

>>364
lmstudio-community/Llama-3.1-Nemotron-70B-Instruct-HF-GGUF
ってやつ。
ベンチマークでSonnetと4o超え謳ってるだけあって日本語対応70Bの中だと賢い気がする。

メモリ128GB積んだMacでRAM使用量70GB、3t/sくらい

0368名無しさん＠ピンキー

2024/10/18(金) 20:26:47.37ID:marnTRSw

>>366
ほんまや普段の自分のスケールで書いてしまった

0369名無しさん＠ピンキー

2024/10/18(金) 21:03:00.81ID:???

>>363
どういうところがCR+超えに感じたってのはある？

0370名無しさん＠ピンキー

2024/10/18(金) 21:13:09.78ID:???

1.58bitきたやで
https://github.com/microsoft/BitNet

0371名無しさん＠ピンキー

2024/10/18(金) 23:29:49.98ID:???

>>370
Microsoftなのにデモ動画はApple M2なのか

0372名無しさん＠ピンキー

2024/10/19(土) 00:29:32.39ID:???

既存のウェイトを1.58bitに変換したllama3 8bも公開されとるのか
変換方法と微調整方法(これが肝らしい)が公開されとるから
一気に1.58bitのモデル出てくるかもわからんな

0373名無しさん＠ピンキー

2024/10/19(土) 07:33:36.87ID:???

どれくらい高速化するかな

0374名無しさん＠ピンキー

2024/10/19(土) 09:41:57.22ID:???

>>235
LM Studioにheadless mode (他アプリから呼び出すサーバ用のGUIなしモード) が来るみたいね
https://x.com/yagilb/status/1847323458071298051

0375名無しさん＠ピンキー

2024/10/19(土) 11:42:03.95ID:???

text-generation-webui使ってるけど、モデルの選択は当然重要だけどパラメータもそれ以上に重要なのね
プリセットでお勧め設定ある？

0376名無しさん＠ピンキー

2024/10/19(土) 11:53:28.52ID:IJphwg4/

大葉も尻タブもモデルと遊び方によってベストなプリセットやプロンプト変わるから一概に言えんやろ
せめて自分が使ってるモデルと遊び方開示せんことには誰もなんも言えんと思うで
パラメータはより好みで別れる部分や

ただ、ワイは尻タブやが諸氏のモデルとプリセット、システムプロンプトのお勧めは大いに興味ある
とはいえ最近は課金Opusなのでワイが公開できるもんは無いんやが...

0377名無しさん＠ピンキー

2024/10/19(土) 12:14:11.31ID:???

sillyのプリセットにあるkobold godlikeってのは使うこと多いな
別に他と比べまくってるわけじゃないけど
あと動的温度ってのはよくわからないまま有効にしてみてる

0378名無しさん＠ピンキー

2024/10/19(土) 13:58:35.24ID:???

lambda chatっていうところで無料で試せるhermes-3-llama-3.1-405b-fp8なかなかいいと思う

0379名無しさん＠ピンキー

2024/10/20(日) 00:00:56.25ID:hgtEe7TK

テストでmagnumみたいなエロに強いファインチューニングモデル作ってみたで
使ったデータセットの半分ぐらいが日本語だから普通のmagnumよりも日本語には強いはず？
https://huggingface.co/ascktgcc/Mistral-nemo-ja-rp-v0.1

0380名無しさん＠ピンキー

2024/10/20(日) 07:51:39.68ID:???

すげーな
帰ったら試すわ
できれば作成手順もアップして欲しい

0381名無しさん＠ピンキー

2024/10/20(日) 08:56:52.87ID:???

>>379
Mistral-nemo-ja-rp-v0.1-Q4_K_S.gguf
を使ってみたけどチャットで少し性的な内容だと「そういう問い合わせには回答できない（要約）」、文章生成で使うとルー語（youがrunした、みたいな）になるね（Lumimaid-Magnumだと実用レベルの文章が生成できている設定で比較）
もしかするとQ4まで量子化してる影響かもしれないからQ6かQ8で12GBに収まるギリギリなのがあれば試したい

0382名無しさん＠ピンキー

2024/10/20(日) 09:30:46.81ID:???

>>379
すげー個人でできるもんなんか
青空文庫ぜんぶ喰わせたとか？
DLさせてもらうで

ガチハード勢が多いここのニキら用に
VRAM24Gのも用意しとくのもええんやないかしら

0383名無しさん＠ピンキー

2024/10/20(日) 10:35:04.87ID:???

>>381
そういやfinetuneする時無修正化してるのはどうやってるんかな？

0384名無しさん＠ピンキー

2024/10/20(日) 10:39:25.18ID:???

>>381
俺の設定だと性的内容でも問題なく出力してくれたよ
キャラの設定とか会話例とか次第なのかもしれない

0385名無しさん＠ピンキー

2024/10/20(日) 10:42:07.59ID:???

ただ文章が固いし日本語が不自然かつ英語が混ざるのは確か
俺の設定が悪いだけかもしれんが

0386名無しさん＠ピンキー

2024/10/20(日) 10:48:14.03ID:???

海外製モデルは根本的に日本語不自由だからSFTだけじゃ不自然なのは治らないよ
継続事前学習しないと

0387名無しさん＠ピンキー

2024/10/20(日) 11:05:30.97ID:hgtEe7TK

>>381,385
英語交じりになる問題はmistral-nemoベースなんでTemperatureを0.3前後に下げれば解決すると思う。
回答拒否は再現できなかった
q6とq8は今アップロード中だからそのうち追加されると思う
>>380,379
unslothの公式ノートブックを使ってモデルページに書いてあるデータセットでファインチューニングしただけだから簡単やで
>>383
Mistral-nemoは素の状態で無修正だからファインチューンでエロさを足してる感じだね

0388名無しさん＠ピンキー

2024/10/20(日) 11:25:17.06ID:Hr2coa44

自作アプリにどの程度のモデル組み込めるか実験中なんやけど、1.5Bとかの極小モデルで日本語モデルなんかお勧めないか？
これまで小さくても7Bぐらいまでしか触ってこなかったから、小さいの全然分からんのや
実機でどの程度の速度出るか、とかどの程度の日本語力なのかとか私的なベンチマークが目的や

0389名無しさん＠ピンキー

2024/10/20(日) 12:47:40.71ID:???

>>387
q8触ってみた、Temperature下げたら英語が出る問題も回答拒否についても解決したよ
(普段小説生成で使用しててTemperatureは1.0)

0390名無しさん＠ピンキー

2024/10/20(日) 14:25:14.70ID:???

>>388
極小モデルでまともな日本語を話すのはGemma2 2BベースのBakuかな

0391名無しさん＠ピンキー

2024/10/20(日) 14:59:41.21ID:Hr2coa44

>>390
試してみるわ、サンガツ！

0392名無しさん＠ピンキー

2024/10/20(日) 17:46:05.75ID:???

0.3でも英語出るけどなあ
他が関係してんのかな

0393名無しさん＠ピンキー

2024/10/20(日) 17:51:13.71ID:???

stで試したがワイもルー語出るなぁ。英語以外のよくわからん単語も時々出る。
指示が悪いのかもだけど、セリフだけでいいのに状況描写まで出力されがちやった。
でもワイにはとても学習までやれんから期待しとるで！

0394名無しさん＠ピンキー

2024/10/20(日) 20:07:18.00ID:???

ｑ８をkoboldデフォ設定で試したが、かなり日本語の語彙が豊富になってる感じがするな
同じ方法で70Ｂをfinetuneするには、メモリどれくらい必要なんだろ？

0395名無しさん＠ピンキー

2024/10/20(日) 23:59:00.49ID:???

新しいmagnumはかなり良さげ
vram48GB勢(72B qwen2.5ベース), 24GB勢(27B gemma2ベース)には最適かもしれん

0396名無しさん＠ピンキー

2024/10/21(月) 01:54:30.42ID:???

qwenベースは規制高そうだから、123Bいくわ

0397名無しさん＠ピンキー

2024/10/21(月) 03:24:41.25ID:???

7B~12B帯の日本語エロは未だBerghofが１強じゃないか？
指示が複雑なのはumiyuki-Umievo-itr012-Gleipnir-7B
画像生成とか海外モデルに比べて日本語モデルはあまり進化してない感じする

0398名無しさん＠ピンキー

2024/10/21(月) 05:18:44.28ID:???

Berghofは即落ち♡連発ですぐエロエロになっちゃうからGleipnir使ってる
キャラ崩壊せず平然とした状態でエロを受け入れるように出来るならBerghofも使いたいんだけど出来るもんなの？

0399名無しさん＠ピンキー

2024/10/21(月) 06:55:14.97ID:???

>>397
なんかわかる
エロ関係ない普通の受け答えも7Bモデルの方が賢い気がする
現状の12Bってサイズでかいだけで良いとこが無い

0400名無しさん＠ピンキー

2024/10/21(月) 07:05:51.92ID:???

berghofは肩を真面目にマッサージしてるだけで喘ぎ散らかしてイクからなw

0401名無しさん＠ピンキー

2024/10/21(月) 07:43:39.62ID:???

ミニopusかw

0402名無しさん＠ピンキー

2024/10/21(月) 11:47:35.55ID:???

style bert VITS2でキャッキャしてたらいつの間にかもっと凄いのが次々出てきてるのね
GPT-soVITS v2
XTTS v2
F5-TTS
この辺が超気になる

0403名無しさん＠ピンキー

2024/10/21(月) 12:22:40.50ID:???

日本語用のモデル探してるんだけど良さそうなのなにか無いかな？

0404名無しさん＠ピンキー

2024/10/21(月) 12:40:28.25ID:???

音声AIのTTSは何が主流なんだろうな

0405名無しさん＠ピンキー

2024/10/21(月) 13:13:08.79ID:???

実績から考えたら棒読みちゃんだろうな

0406名無しさん＠ピンキー

2024/10/21(月) 13:28:04.99ID:???

「こんにちはゆっくり霊夢よ」
「ゆっくり魔理沙だぜ」
「今日はオナテク板のLLM部を紹介するわね」

0407名無しさん＠ピンキー

2024/10/21(月) 14:08:42.11ID:???

magnum v4 123b エロいわｗ
これがサクサク動くmacニキうらやましす

0408名無しさん＠ピンキー

2024/10/21(月) 15:06:46.42ID:???

>>403
SFWな用途にはこのページが網羅的にまとめてくれてるかな　NSFWなのは載ってなさそ
llm-jp/awesome-japanese-llm: 日本語LLMまとめ - Overview of Japanese LLMs
https://github.com/llm-jp/awesome-japanese-llm

0409名無しさん＠ピンキー

2024/10/21(月) 18:28:19.99ID:9qUbpEYj

>>387
VRAM12GBなんでq6使わせてもらったけどええですね
飲んでもらうときにんごっんごっ言い出したけど手直しすると以降は従ってくれた

0410名無しさん＠ピンキー

2024/10/21(月) 19:47:52.79ID:PlLaQBFA

spiritlm試せた奴おる？

0411名無しさん＠ピンキー

2024/10/21(月) 19:47:57.82ID:???

- bartowski/Lumimaid-Magnum-12B-GGUF
- anthracite-org/magnum-v4-12b-gguf
今のところ12Bだとこの二つが好みかなぁ
日本語が不安定な時もあるけど、シチュエーションに対する理解度の高さが良い
Berghofも悪くないけど上にもあるようにすぐに喘いじゃうのと文章の整合性がすぐに破綻しちゃうのがね……

■ このスレッドは過去ログ倉庫に格納されています