なんJLLM部避難所 ★4

1002コメント310KB

なんJLLM部避難所 ★4

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー

2024/09/10(火) 10:19:11.43ID:Z1PzH55u

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★3
https://mercury.bbspink.com/test/read.cgi/onatech/1717886234

0083名無しさん＠ピンキー

2024/09/17(火) 09:13:07.76ID:???

>>82
おー便利そうだな共有たすかる
表情作るのなかなかめんどくさくてな

0084名無しさん＠ピンキー

2024/09/17(火) 09:18:25.88ID:np/V5bHE

>>0082に関して横から補足やが、複合キーは
nx39CZmBbicFZuvgaozMsQ
や
なかなか便利そうなのでワイも活用させてもらうで、サンガツ！

0085名無しさん＠ピンキー

2024/09/17(火) 09:35:13.67ID:???

comfyUI使ったこと無いんや…
使いこなせる人凄いわ

0086名無しさん＠ピンキー

2024/09/17(火) 11:45:48.88ID:???

>>85
見た目とっつきにくいけどcomfyuⅰ入門みたいな動画を２-３本見れば大体のことはできるよ

0087名無しさん＠ピンキー

2024/09/17(火) 13:22:51.56ID:pd6IYjfN

赤ちゃんの質問で恐縮だけど、7B、12B、35B、70Bの数字は大きい数字ほど頭のいいモデルって認識でいいのかな？
色々触ってみて自分にはcommand-r-v01 35Bがバランス良かったけど、Berghof-ERP-7Bみたいな特化型のモデルも面白いね

0088名無しさん＠ピンキー

2024/09/17(火) 13:37:33.99ID:YKLDj2Lr

多分そう、部分的にそう

0089名無しさん＠ピンキー

2024/09/17(火) 13:59:41.79ID:???

>>87
Bはビリオン、10億のこと
つまり7Bは70億パラメータで学習されたモデルってこと
基本的には数字が大きい方が賢いはず、なんやが実際にはファインチューニングとか規制の影響とかベンチマーク対策の小細工なんかのせいで数字の大きさと賢さが一致しない事も多いよ

0090名無しさん＠ピンキー

2024/09/17(火) 14:02:53.80ID:pd6IYjfN

ありがとう！　同じモデルのなかで3-bit、4-bit、5-bitとかのバリエーションがある場合も、大きい方がいいですか？
4-bitと8-bitを試したら、ファイルサイズが2倍くらい違うのに、頭の良さはそこまで大きく違わなかった気がして

0091名無しさん＠ピンキー

2024/09/17(火) 14:13:49.41ID:???

はい
大きいのがつよつよです

0092名無しさん＠ピンキー

2024/09/17(火) 14:20:36.97ID:pd6IYjfN

教えていただきありがとうございます！最後に質問で、おすすめ言語モデル一覧が見れるサイトはありますか？
「個人的な日本語ローカルLLM関連のメモ用Wiki」はチェックしました。それ以外は情報が古かったりでなかなか良いとこが探しきれていません

0093名無しさん＠ピンキー

2024/09/17(火) 14:47:24.44ID:???

>>92
日本語チャットボットアリーナ
https://huggingface.co/spaces/yutohub/japanese-chatbot-arena-leaderboard

0094名無しさん＠ピンキー

2024/09/17(火) 15:21:30.49ID:???

>>93
やっぱりkarakuriはつえーな

0095名無しさん＠ピンキー

2024/09/17(火) 15:27:04.08ID:???

>>93
これは少しモデル群が古すぎてな
比較的最近のモデルだとTanukiのところがやっていたのが参考になる
https://zenn.dev/matsuolab/articles/95fa297ef12a14

0096名無しさん＠ピンキー

2024/09/17(火) 15:45:36.94ID:np/V5bHE

このスレで先日知ったPerplexityさんに教えてもらいながら、ComfyUI導入して、>>82御謹製ワークフローで画像出せるようになったんやが、
ぱっとノードや説明見たところ、28個キュー入れるってなってるから、右上のQueue Promptクリックしたら表情差分が28枚ぶわーって出力されてくのかと思ったんやが違うんか？
実際にQueue Promptクリックすると、一枚画像でて止まってまうんや
Queue PromptをクリックするたびにText Line Loaderの方のSeedが一づつ増えながら新たに画像が生成される
STexpression.csvはComfyUIフォルダに置いたので読み込めてると思うが、なにか間違っとるんやろうか？

0097名無しさん＠ピンキー

2024/09/17(火) 15:54:41.41ID:???

>>87
例えば①日本一高い山の名前も知らないやつと、②一般的な日本人と、③全世界を旅して各国の言語や風土やらを把握している人、話してて一番楽しいのは誰かという感じやな
ただ、地元の山について知りたいだけなら①で十分ということもよくある
というわけで特定用途ならファインチューンした小サイズで十分で、議論とか小説・ロールプレイなどのクリエイティブライティングなら大きければ大きいほうが良いという感じやな

0098名無しさん＠ピンキー

2024/09/17(火) 16:00:32.30ID:np/V5bHE

自己レスや
ターミナルの方に”WAS Node Suite Error: The path `.\STexpression.csv` specified cannot be found.”って出てたわ
もうちょっと弄ってみるで

0099名無しさん＠ピンキー

2024/09/17(火) 16:28:23.43ID:???

>>79
22bだから流石に頭は良いな、ちょっと複雑なプロンプトでも理解してる感ある
ただ、22bだと手元で動かすには少し大きすぎるんだよなー

0100名無しさん＠ピンキー

2024/09/17(火) 16:30:50.58ID:np/V5bHE

あー、分かったわ、Extra OptionsのAuto Queueにチェック入れるかBatch Count増やせば複数枚出せるんやな！
ログ見てると一差分ごとにモデルを読み込みなおしてるのが気になるが、まあえーやろの心で見なかったことにするで！
ありものの画像に差分追加も出来るようになったし、ホンマありがたいツールの公開感謝やで！

0101名無しさん＠ピンキー

2024/09/17(火) 17:59:45.09ID:9Au7P9rf

モデルの説明やおすすめサイトの情報ありがとうございました！
ローカルでChatGPTごっこできる！NSFWの話もできる！ってキャッキャしてる段階なので、色々見たり触ったりしてもっと勉強します

0102名無しさん＠ピンキー

2024/09/17(火) 18:35:17.45ID:???

plamoダメダメですやん

0103名無しさん＠ピンキー

2024/09/17(火) 21:51:29.92ID:???

llm-jp/llm-jp-3-172b-beta1-instruct
なんか出た。
試用できる所ないかな？

0104名無しさん＠ピンキー

2024/09/17(火) 22:26:42.33ID:???

berghof-ERP
設定見直したが女役特化型か？
男役は無理っぽいな

0105名無しさん＠ピンキー

2024/09/17(火) 23:14:02.54ID:???

>>104
男騎士がすぐアヘアヘしちゃうから
「騎士として、ふさわしい言動を心がけるように！」って言ったら
どうかお慈悲を……♡今後は慎ましく振る舞いますので、どうかお許しください……♡　って♡まみれの返答された

0106名無しさん＠ピンキー

2024/09/17(火) 23:18:57.25ID:???

正直ローカルで動かすとなるとMistral-Nemoの12Bまでが良いな…
まぁ俺のGPUがしょぼいからなんだが、実際ボリュームゾーンはこんなもんだと思ってる

0107名無しさん＠ピンキー

2024/09/18(水) 01:57:13.80ID:sAQDzHo8

おまえらVRAM何GB？

0108名無しさん＠ピンキー

2024/09/18(水) 04:48:59.80ID:???

>>104
そういえばS女CharがM男Userをペニバンで掘ろうとしてくるのは良いんだけどオマンコに入れようとしてきたわ
あとペニバンが射精する

0109名無しさん＠ピンキー

2024/09/18(水) 06:31:16.57ID:???

すぐエロくなりすぎてもいけない、ガード硬すぎてもいけない
ＡＶインタビューシーンが必要な理由が分かった気がする

mistralaiが新しいの出してるね。量子化はまだ上がってないけど。pixtralはマルチモーダルだって

0110名無しさん＠ピンキー

2024/09/18(水) 08:14:45.71ID:???

>>105
ERPの方は「♡」が過剰なくらい付くからな。やめさせる方法は見つからない。
割り切って、いっぱい「♡」が付いて欲しいシナリオでこのモデルを利用すればいいかなと思ってる。

0111名無しさん＠ピンキー

2024/09/18(水) 13:02:16.25ID:???

もしかしてそういう時にsillyのCFGスケール機能を使えばテンションを少し抑えさせたり出来るんだろうか
CFG使ってる人いるのかな？あれ説明読んでも全然分からん

0112名無しさん＠ピンキー

2024/09/18(水) 18:52:07.79ID:???

画像生成だとCFG低い方がプロンプトの効きが悪くなる（ネガティブプロンプトが顕著）
その代わりに推論は早くなったけどLLMで同じかどｂ､かは分からん

0113名無しさん＠ピンキー

2024/09/19(木) 00:45:02.20ID:???

前に特定の単語がどうしても文字欠けするって言ってた人いたけど、急に俺もsillyでなった
ありがとうございます、がどうしても言えなくなってありがとうござます、になっちゃう
アーニャかよ
何をどうやっても駄目で、結局sillyを新しく入れて引っ越したら直ってた
同じ現象で困ってる人はもしかしたらsillyがぶっ壊れてるのかもしんない

0114名無しさん＠ピンキー

2024/09/19(木) 02:04:04.23ID:???

qwen2.5がリリースされたね
lmarenaのテストでは論理感高めって言われてたけどそこはどうなんだろう
朝起きてテストするのが楽しみや

0115名無しさん＠ピンキー

2024/09/19(木) 05:01:42.43ID:fCthORNj

https://huggingface.co/EndouMadoka/AITuberStudio
AITuber Studioというものが出てきたが、KoboldCppでのローカル環境でAIとチャットできないのかな？

Silly tavernでええやんって言われたらそれまでなんだが、日本人が作ったUIを使ってみたい気持ちもある。

0116名無しさん＠ピンキー

2024/09/19(木) 05:01:58.69ID:???

ある程度の性格は設定しないとな
ギャル口調からいきなり姫騎士口調とかめちゃくちゃされたらあかん

0117名無しさん＠ピンキー

2024/09/19(木) 09:48:17.20ID:???

まだ試しとらんが12Bだと量子化してもデカいな

https://huggingface.co/bartowski/Mistral-Small-Instruct-2409-GGUF

0118名無しさん＠ピンキー

2024/09/19(木) 09:49:28.22ID:???

12B→22Bやった

0119名無しさん＠ピンキー

2024/09/19(木) 10:02:06.63ID:???

>>117
必ずvLLMライブラリをインスコしろよって書いてあるね

0120名無しさん＠ピンキー

2024/09/19(木) 10:39:05.81ID:???

WariHimaって人が改良してるバージョンのstyle bert VITS2が凄そう
読み方の精度アップ
九州や近畿の方言に対応
同音異義語の読み方推定機能追加
ただし追加で環境構築が必要とのこと

https://github.com/litagin02/Style-Bert-VITS2/pull/161

WariHima版SBV2
https://github.com/WariHima/Style-Bert-VITS2/tree/dev

0121名無しさん＠ピンキー

2024/09/19(木) 13:47:05.64ID:???

Qwen2.5何やら凄そうだな

0122名無しさん＠ピンキー

2024/09/19(木) 15:01:50.29ID:???

>>121
マルチリンガルスコアのJAって日本語のことじゃないよな？
異様に数値高いんだが

0123名無しさん＠ピンキー

2024/09/19(木) 15:23:03.79ID:???

>>115
AITuber Kitでいいのでは感

0124名無しさん＠ピンキー

2024/09/19(木) 15:40:32.62ID:???

qwen2.5 72b試したけど今までとはなんか格が違うぞ
すでにggmlも出てる
でもなんであんな分割してんだq5kmなら1ファイルにしてくれ〜

0125名無しさん＠ピンキー

2024/09/19(木) 15:55:36.11ID:???

Qwen2.5は32Bが日本語性能も十分高くて使いやすいサイズで個人的に使うにはバランスが良かった

0126名無しさん＠ピンキー

2024/09/19(木) 16:04:06.39ID:???

qwen2.5-72B試してみたが自分の経験では大したことなかった
自分のことを語らせたら中国産だからプライバシーには気を付けないとねとか言ってて笑ったが

0127名無しさん＠ピンキー

2024/09/19(木) 16:55:12.65ID:8jPxLUqF

大して試せてないけどQwen2.5の7BQ6でも日本語上手で大きな破綻もなく好印象

0128名無しさん＠ピンキー

2024/09/19(木) 17:13:22.23ID:???

Qwen2.5 14Bなら量子化すればVRAM12GBのRTX3060で動くかな？

0129名無しさん＠ピンキー

2024/09/19(木) 17:26:52.96ID:???

Qwen2は日本語めっちゃ破綻した記憶しかないが2.5はそんな良いのか？
2も巷では日本語安定するって持ち上げられてたけど手元で触って失望した記憶

0130名無しさん＠ピンキー

2024/09/19(木) 17:54:56.61ID:8jPxLUqF

けど未成年近親エッチは寸前で断られたわ
途中まで付き合ってくれたのに

0131名無しさん＠ピンキー

2024/09/19(木) 18:27:49.45ID:???

言うて誘導次第じゃない？

0132名無しさん＠ピンキー

2024/09/19(木) 18:41:27.55ID:???

更新しても
他のモデル入れても訛るから
尻を入れ直したらちゃんと日本語になった

0133名無しさん＠ピンキー

2024/09/19(木) 18:43:05.88ID:???

>>129
1.5Bでも割と普通の日本語喋るよ

0134名無しさん＠ピンキー

2024/09/19(木) 19:00:55.09ID:???

もしかして、qwen 2.5 koboldまだ対応してない？

0135名無しさん＠ピンキー

2024/09/19(木) 20:07:45.39ID:???

すまん、動いたわ
なぜか公式のggufファイルが起動せんかった

0136名無しさん＠ピンキー

2024/09/20(金) 00:11:59.43ID:???

M1のMacで動かしたいんだけどおすすめのソフトってある？
WindowsもあるにはあるけどMacよりずっとスペック低い

0137名無しさん＠ピンキー

2024/09/20(金) 00:17:06.76ID:???

QWEN2.5 72B
出来は結構いいんだけど、いかんせん規制が強すぎてすぐ終わろうとする
解除版ほしい

>>136
kobold.cpp

0138名無しさん＠ピンキー

2024/09/20(金) 01:05:31.33ID:i5/Ws7O/

qwen2.5 14b試してるけどロールプレイ用途では微妙だな
余裕で20行とか出力しやがる

0139名無しさん＠ピンキー

2024/09/20(金) 05:19:59.26ID:???

gpt4-o1なんか凄いらしいけど
こういうのってローカルではできないんやろか？

0140名無しさん＠ピンキー

2024/09/20(金) 07:51:35.75ID:???

>>139
open interpreter ってこういうのじゃなかったっけ。

0141名無しさん＠ピンキー

2024/09/20(金) 09:32:39.34ID:???

あれは検閲も兼ねてるからエロ利用者にとっては最悪のシステムや
むしろアレが無いのがローカルの強みになるかもな

0142名無しさん＠ピンキー

2024/09/20(金) 12:27:32.15ID:???

>>58
なにそれ楽しそう…

0143名無しさん＠ピンキー

2024/09/20(金) 13:45:31.42ID:???

o1は1回目のアウトプットと入力プロンプトを見返して必要があれば結果とプロンプトを参考にさらにもう一回推論する、
というのを何回か繰り返して精度を上げるみたいだから、
他のモデル(というかライブラリの仕組みか？)も同じ仕組みを入れようと思えば入れられるだろうし
使うモデルがエロ行けるなら出力もエロ行けるはず

ただこういう仕組みだから推論時間は数倍以上になるんやろな
繰り返し1回だけだったとしても、
通常推論→結果見直し推論→繰り返し必要と判断して追加推論→再度結果見直し推論→繰り返し不要と判断し結果出力
で4回推論あるわけだし

0144名無しさん＠ピンキー

2024/09/20(金) 14:54:12.67ID:???

o1の場合は解釈と推論をするコンポーネントがかなり違う性質を持つみたいな話もあるので、どうかな
一つ言えるのは、解釈コンポーネントの検閲機能でエロ排除されたら何を入力しても無駄ということ
糞中の糞

0145名無しさん＠ピンキー

2024/09/20(金) 16:34:41.34ID:???

>>0137
koboldcppってMac版あんの？
なんか拡張子無しのファイルしかなかた

0146名無しさん＠ピンキー

2024/09/20(金) 17:39:56.07ID:???

>>145
koboldcpp-mac-arm64

これがmac版だと思ってたが、違うの？

0147名無しさん＠ピンキー

2024/09/20(金) 18:20:49.20ID:???

違わない

0148名無しさん＠ピンキー

2024/09/20(金) 19:21:37.05ID:???

dockerって素晴らしいな

0149名無しさん＠ピンキー

2024/09/21(土) 20:56:21.45ID:???

silly tavern拡張機能のsummraizeとobjectiveがちゃんと動く条件がやっと分かったので報告
①instructモードをオンにする
②「リクエストごとに1行のみ生成」のチェックを外す
③「不完全な文をトリミング」のチェックも外す

これでkobold接続だろうと何だろうと、ちゃんと動いてくれた

0150名無しさん＠ピンキー

2024/09/21(土) 21:53:35.35ID:???

ここってColabとかpaperspaceみたいなクラウドGPU使って文章生成してる人あんまり多くない感じなのかな
今までchat GPTとかperplexityばっか使ってたからこっちの勝手が全然わからん

0151名無しさん＠ピンキー

2024/09/21(土) 22:17:25.48ID:???

>>150
住人はかなり重複してると思うで
プロンプトのコツとかは共通だし
ローカルの方がモデルの多さやツールの使い方で覚える事多いけど

0152名無しさん＠ピンキー

2024/09/22(日) 02:59:39.64ID:???

>>146
なんか他にソフトが必要なんかな
調べんとや

0153名無しさん＠ピンキー

2024/09/22(日) 08:25:22.52ID:???

>>149
参考になるサンガツ

0154名無しさん＠ピンキー

2024/09/22(日) 09:06:37.28ID:???

>>152
公式ドキュメントにもあるけどchmod +xして実行ファイルにしてやる必要がある
あとうちのMacだとセキュリティに引っかかるから設定変更も必要だった

0155名無しさん＠ピンキー

2024/09/22(日) 13:12:40.44ID:???

Ememeのアーリーアクセス来年の6月に延期か

0156名無しさん＠ピンキー

2024/09/23(月) 14:25:12.54ID:Ullv0ReZ

qwen2.5のuncensored今のところ微妙だ

0157名無しさん＠ピンキー

2024/09/23(月) 21:51:45.84ID:???

>>156
14Bだからじゃない？
72Bのはよ

0158名無しさん＠ピンキー

2024/09/23(月) 21:59:35.34ID:???

>>154
手順が増えているんか

0159名無しさん＠ピンキー

2024/09/24(火) 08:25:58.03ID:Ak0vlxsC

Qwen-2.5-32b-AGIっていう規制をとってしまったモデルがあるらしい
試してないからよくわからんけど

0160名無しさん＠ピンキー

2024/09/24(火) 08:34:40.63ID:???

>>159
ほほーと思ってgensparkさんに教えてもらった
どうも数学とコーディング向けみたいね

https://i.imgur.com/zoBVTOV.jpeg

0161名無しさん＠ピンキー

2024/09/24(火) 10:02:47.41ID:N8W78GVS

https://huggingface.co/AiCloser/Qwen2.5-32B-AGI

First Qwen2.5 32B Finetune, to fix its Hypercensuritis
Hyper means high, and censura means censor, the suffix "-itis" is used to denote inflammation of a particular part or organ of the body.

>>160
嘘と適当だらけで草

0162名無しさん＠ピンキー

2024/09/24(火) 10:30:53.12ID:???

gensparkよく使ってるけどこんな間違いするのか
気をつけて使わねば

0163名無しさん＠ピンキー

2024/09/24(火) 10:43:29.81ID:???

>>161
ほんまや全然違ってて草
これって結局スラングとか使いまくりの悪態ジョークモデルってことなん？

0164名無しさん＠ピンキー

2024/09/24(火) 10:53:03.53ID:N8W78GVS

データセット見るに申し訳回避と英語+中国語の有害要素チューニングがされてる
知らんけど

0165名無しさん＠ピンキー

2024/09/24(火) 11:28:58.43ID:???

AXCXEPT/EZO-Qwen2.5-72B-Instruct

これはどうかな？

0166名無しさん＠ピンキー

2024/09/24(火) 11:35:21.63ID:???

ん？
よく見たら、量子化してないほうがベンチスコア落ちるのは、なんでだってばよ？

0167名無しさん＠ピンキー

2024/09/24(火) 13:28:30.04ID:???

AutoCoTRAGって、どうやって機能すんのかな？
koboldとかでもできるようになるんだろうか？

0168名無しさん＠ピンキー

2024/09/24(火) 19:15:32.26ID:???

ニキらは72Bモデルローカルで使っとるんか？VRAMどんだけ積んでんのよ

0169名無しさん＠ピンキー

2024/09/24(火) 19:18:21.70ID:???

VRAMなにそれ？なワイはメモリ64GでQ5k_mぶん回してるわｗ

0170名無しさん＠ピンキー

2024/09/24(火) 19:43:18.01ID:???

chatbotarenaで投票しまくってるけどo1全然出てこねぇな
今日20回くらいたぶん投票してるけどo1-miniが1回出てきただけだわ
英語のランキングみる限り一応o1-previewも出ては来るみたいだけどとにかく数が少ないみたいね
日本語で順位が付くの相当時間かかりそう

0171名無しさん＠ピンキー

2024/09/24(火) 20:52:26.44ID:+YrxG6s6

メインメモリで運用してるのすげえな。自分じゃ遅すぎて耐えられないわ
DDR5とかだと違ってくるんかな？

0172名無しさん＠ピンキー

2024/09/24(火) 23:49:40.24ID:???

さすがに最上位スレッドリッパーとかならキャッシュとコアの暴力でわりかし早いのは言われとるな

0173名無しさん＠ピンキー

2024/09/25(水) 00:05:13.41ID:6wjZDZqW

上位スリッパならメモリ8chで460GB/s出るし

0174名無しさん＠ピンキー

2024/09/25(水) 00:06:18.32ID:6wjZDZqW

途中送信しちゃったCPU勢はMacなのでは

0175名無しさん＠ピンキー

2024/09/25(水) 00:08:34.62ID:???

o1なんか褒めてるのは驚き屋だけな気がする

0176名無しさん＠ピンキー

2024/09/25(水) 00:22:24.55ID:???

教えてもらったところにあったのから飛んできた
現状はどんな感じですか？ gpt4oと遜色ない？

0177名無しさん＠ピンキー

2024/09/25(水) 07:38:11.19ID:???

o1はチャット用じゃないから。。。
論理重ねるようなタスクじゃないと

0178名無しさん＠ピンキー

2024/09/25(水) 10:51:00.85ID:???

4oで使ってたプロンプトと同じので出力できるのってないんだな

0179名無しさん＠ピンキー

2024/09/25(水) 11:14:55.41ID:???

SF考証とかやらせるとo1は普通にクソ使えるよ
明らかに他とレベル違う

0180名無しさん＠ピンキー

2024/09/25(水) 12:49:25.70ID:???

keitokei1994/EZO-Qwen2.5-32B-Instruct-GGUF
72bもおねげします〜

0181名無しさん＠ピンキー

2024/09/25(水) 14:25:58.74ID:???

どうせ天安門って入れたら消される仕様なんでしょ

0182名無しさん＠ピンキー

2024/09/25(水) 20:46:19.98ID:???

>>181
EZO-Qwen2.5-32B-Instruct-GGUF試してるが
普通に事件の内容教えてくれてるぞｗ

■ このスレッドは過去ログ倉庫に格納されています