なんJLLM部避難所 ★2

1002コメント390KB

なんJLLM部避難所 ★2

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:27:25.10ID:???0

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(スクリプト攻撃継続中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所
https://mercury.bbspink.com/test/read.cgi/onatech/1702817339/

-
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0308名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-vfni)

2024/05/14(火) 19:44:52.35ID:???0

このスレを彼らが読んでいる宣言でもしているならともかく
「好きにやらせればいいだろ高校生なんだから」くらいにしとけとは思う

0309名無しさん＠ピンキー (ﾜｯﾁｮｲ 0ba7-vJ54)

2024/05/14(火) 19:52:15.14ID:???0

ここpinkやし高校生は見たらあかん
いや18ならええんか

0310名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b95-JZQp)

2024/05/14(火) 20:01:22.91ID:???0

>>282
めちゃおもろかった、そんな評価基準あるねんな
オキニのモデルが軒並み高評価で、そうなるなってなった

0311名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-vfni)

2024/05/14(火) 23:45:27.65ID:???0

ちょっと聞きたいんだが、koboldとか使ってて、起動直後は思った通り動かないけど
ある程度推論させたら、ちゃんと動いてくれる（リセットしても）事ってあるかな？
以前、どこかで「このモデルは暖気が必要」って記事見た事あるけど、この事かな？

0312名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-JZQp)

2024/05/15(水) 00:01:06.52ID:???0

現状7Bしかローカルで快適な速度では動かんでしょ
AQMLなら14Bくらいまで可能かも知れないけど全然対応進む気配もないし

0313名無しさん＠ピンキー (ﾜｯﾁｮｲ 8b65-eIYT)

2024/05/15(水) 00:03:18.50ID:???0

淫夢…なんでもない

0314名無しさん＠ピンキー (ﾜｯﾁｮｲ 2bfd-3+jw)

2024/05/15(水) 00:26:16.37ID:???0

AQLMが導入されたら自前での量子化は諦めるしかないな
貧弱CPU勢の俺は量子化済みモデルをクレクレすることしかできない

0315名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b84-/Dhl)

2024/05/15(水) 02:15:24.16ID:???0

cohereAPIと某ボイスソフトAPIと電導オナホ全部連動させた
疲れたし冷静に考えると一体何やってんのか謎や

0316名無しさん＠ピンキー (ﾜｯﾁｮｲ 4fba-5B/7)

2024/05/15(水) 04:19:21.80ID:nwbA/qMz0

今の手探りな状態でのAI遊びは、長い人類史の中でもこの瞬間でしか味わえないと思うと
すごい時代に立ち会えたなと思う

0317名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f62-nguQ)

2024/05/15(水) 06:06:08.15ID:???0

上の方でもチラッと某記事に出てたLM Studio、こんなのも出てたんだね
何も気にせず使えるのはありがたいのぅ

0318名無しさん＠ピンキー (ﾜｯﾁｮｲ 5b7a-Bhq0)

2024/05/15(水) 08:28:25.02ID:???0

ゲームも過渡期が一番面白かったからな
毎回予想を超えてくるってのがね

0319名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-JZQp)

2024/05/15(水) 08:35:37.67ID:???0

>>282
CommandR+でもこChatGPTでもこの問題は余裕で間違うから本当に思考してる訳じゃないってことだよね
逆に何も考えてないのに統計とベクトル圧縮だけでここまで自然な文章を出してくるAIにも恐ろしいものを感じるけど

0320名無しさん＠ピンキー (ﾜｯﾁｮｲ bb04-Ivpr)

2024/05/15(水) 08:41:42.06ID:???0

rocmさえできてりゃStrixHaloの上位買っとけで100BぐらいまでのLLMメモリ問題大体解決しそうなのに全然その気配がない

0321名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr5f-rzf9)

2024/05/15(水) 08:54:08.69ID:???r

そこでLM Studioですよ
ROCmもしっかりサポート

0322名無しさん＠ピンキー (ﾃﾃﾝﾃﾝﾃﾝ MMff-XTDy)

2024/05/15(水) 09:01:45.75ID:PJ/DD1KrM

俺はGPT4All派

0323名無しさん＠ピンキー (ﾜｯﾁｮｲ fb92-EQUo)

2024/05/15(水) 10:40:22.68ID:???0

LM Studio、Command +R のAPIは使えないのか…

0324名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b84-/Dhl)

2024/05/15(水) 11:22:49.82ID:???0

>>274
動かしてみたけどこれは凄い。7Bx2とは思えない。
普段70Bとか触ってるけど、これで全然実用できると思う。
日本語モデルっていう事も考慮すると凄すぎる

0325名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b84-/Dhl)

2024/05/15(水) 11:28:33.50ID:???0

>>324
dddump/Japanese-TextGen-MoE-TEST-2x7B-NSFW-gguf
の話

0326名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-vfni)

2024/05/15(水) 14:07:29.36ID:???0

https://huggingface.co/nitky/Megac4ai-command-r-plus-gguf
誰が動かす環境あるんやって話だけど強いのは強そう

0327名無しさん＠ピンキー (ﾜｯﾁｮｲ cb11-+EhW)

2024/05/15(水) 14:48:24.47ID:nyS08PcY0

あーそれか
気になってはいるけど流石に動かせんわ
A100とかでq4がギリ乗るかって感じで厳しそうだしレビューもあんまり聞いたことない

0328名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ff8-CcWV)

2024/05/15(水) 15:07:27.51ID:???0

>>326
はえー使ってみたい

0329名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-vfni)

2024/05/15(水) 15:25:54.14ID:???0

いっそpoeとかみたいなネットサービスのほうが採用してくれないかね
でもpoeの独自規制に引っかかってCommandR+のフリーダムな良さが
消えちゃうやろか

0330名無しさん＠ピンキー (ﾜｯﾁｮｲ cb11-+EhW)

2024/05/15(水) 15:35:47.61ID:nyS08PcY0

そもそもCommand R Plusの重みデータは商用利用不可だから、サブスク機能があるpoeでは採用できない

0331名無しさん＠ピンキー (ﾜｯﾁｮｲ cb11-+EhW)

2024/05/15(水) 15:36:50.52ID:nyS08PcY0

今あるやつはAPI経由だからOKなんだと思う

0332名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-JZQp)

2024/05/15(水) 16:24:18.55ID:???0

Command R+に上手く話が転がるようなフリを投げるとめっちゃ筆が乗って長文になるのが笑える

0333名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ff8-CcWV)

2024/05/15(水) 16:38:21.25ID:???0

>>332
わかる
動揺すると文章もカオスになるから感情を感じるわ

0334名無しさん＠ピンキー (ﾜﾝﾄﾝｷﾝ MM7f-ORsk)

2024/05/15(水) 17:09:41.54ID:???M

nejumおせえんだけどこんなんでいいと思ってんの？作り直せよ

0335名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr5f-T/4c)

2024/05/15(水) 17:33:04.98ID:???r

>>332
どんな風に投げてるのか是非知りたい

0336名無しさん＠ピンキー (ﾜｯﾁｮｲ cb13-l/GH)

2024/05/15(水) 20:45:04.25ID:???0

来月には27BのGemma2がリリース予定、Llama3に匹敵
現行のGemmaでも日本語そこそこで商業利用OKだし期待

0337名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-vfni)

2024/05/15(水) 20:47:16.88ID:???0

ぬわーっ！

0338名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f82-JZQp)

2024/05/15(水) 22:48:33.94ID:Q+EZVuAM0

初心者丸出しの質問で申し訳ないんですけど、EasyNovelAssistantってファイルや文章をもとに学習させることって出来るんでしょうか？

0339!donguri (ﾜｯﾁｮｲ bba0-aVBI)

2024/05/15(水) 22:51:41.78ID:???0

基本的な学習は家庭環境では無理です。
LoRAという簡易学習ができるくらい

0340名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-AdtJ)

2024/05/15(水) 23:06:59.98ID:???0

AIにまでなんJの奴らみたいな返事されたら萎えるわｗ

0341名無しさん＠ピンキー (ﾜｯﾁｮｲ 5b7a-Bhq0)

2024/05/15(水) 23:37:44.95ID:???0

なんJシミュレータプロンプト誰か考えて

0342名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f71-3+jw)

2024/05/16(木) 00:10:58.70ID:???0

作った世界設定や人物設定とかをいちいちプロンプト書き換えるの面倒だから使ってるモデル合わせて学習させてぇ

0343名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f80-yODs)

2024/05/16(木) 00:13:38.81ID:???0

chatgptでGPT-4oを選択

5chの何でも実況Jのスレッドをシミュレートして下さい。
スレッドのタイトルは「なんJ◯◯部」

とりまこれでできた

0344名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f0a-XTDy)

2024/05/16(木) 00:27:49.35ID:???0

昔opus用のやつがあのスレに転がってたよな

0345名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-JZQp)

2024/05/16(木) 01:25:59.65ID:???0

>>282の問題、GPT-4oでも答えられなくて現行のAIの限界を感じる

0346名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b8d-/Dhl)

2024/05/16(木) 01:31:28.31ID:???0

AI技術の行き着く先がなんjのシミュレートは嫌過ぎる

0347名無しさん＠ピンキー (ﾜｯﾁｮｲ 4bc9-JZQp)

2024/05/16(木) 07:12:22.46ID:???0

ウミユキ＝サンが紹介してたMoE-TESTのひとの新モデルも良さそうね
プロット段階だけど安定してる
だけど違い解っとらん

https://huggingface.co/dddump/Japanese-Chat-Evolve-TEST-7B-NSFW-gguf

0348名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-vfni)

2024/05/16(木) 07:21:01.24ID:???0

>>344
◯問題
東京駅で山手線に乗り、有楽町駅を過ぎて新橋駅で降りた。明日は、この駅ではなく次の駅に用事がある。
ここでいう、「この駅」の名前を答えよ

↑
こうすると、今調整してるモデルなら正解する。
ちなcommand-r-plusで試したら、これでも間違える

0349名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f70-5B/7)

2024/05/16(木) 14:42:18.02ID:IWtMJ9ws0

俺もいつもこれで賢さの確認してたんだけど
chatGPT4oはちゃんと答えられるようになってるな

https://chat.openai.com/share/e5e5c497-0e9a-4b94-8627-417d6319f8fe

なお番組は出禁になる

0350名無しさん＠ピンキー (ﾜｯﾁｮｲ ab5d-EQUo)

2024/05/16(木) 15:07:57.16ID:???0

おれ「こんにちは」
ChatGPT４o「ニキは元気なんけ？」

0351名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-Mwej)

2024/05/16(木) 15:58:56.59ID:???0

そういやもはやこのスレなんJでもなんでもないな…いやめんどくさいからいいんだけど

0352名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b21-iBKv)

2024/05/16(木) 16:09:49.03ID:4moxrP400

フルスクラッチの日本語100Bモデル作ったらしいけどどんなもんやろね
GGUF上がったら試してみたいわ
https://huggingface.co/stockmark/stockmark-100b

0353名無しさん＠ピンキー (ﾜｯﾁｮｲ 2bb3-CDIS)

2024/05/16(木) 16:26:06.14ID:???0

ベースモデルはともかく、インストラクション版はIchikara-instructionだけでファインチューニングされてるみたいだからスレ民的には使えないだろうなぁ

0354名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-JZQp)

2024/05/16(木) 16:32:36.70ID:???0

FaceBookから盗まれたモデルを使わずゼロから学習させたデータか…多分駄目だろうな
このへんのダーティさの問題をクリアしようって試みはみんなパフォーマンス出ずに失敗してる
画像生成モデルなんて学習元どころか作成元すら匿名な奴しか生き残ってないしな

0355名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f70-5B/7)

2024/05/16(木) 16:51:49.07ID:IWtMJ9ws0

学習なんて昔からダーティだからな
わーくにの学問の基礎なんて遣隋使が「写しちゃダメ」って言われてる書物を勝手に写して持って帰ってきたものだし
その教典だって元はインドから勝手に持ち出してるし
なんならホモサピエンスのミラーニューロンは生物的に反則技で、余所の特技を模倣して後天的にスキルを身に付けていくのはあまりにもズルすぎる
学習から道具？とかいうものを作り出して牙と爪を外付けすることで、本来狩る側が支払うべきコストを踏み倒してるのも汚い
強い生物はその体重・膂力に見合ったエネルギーを消費する点で被捕食者より劣っていてバランスがとれていたのに
本来スカベンジャーに過ぎない猿どもが我々から牙を盗んだことは許されないクマよ

0356名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fc8-PuMj)

2024/05/16(木) 17:11:09.05ID:???0

ってかこれGENIACなのか
プロジェクト自体の名前は知ってるけど成果物見るのは初めてや

0357名無しさん＠ピンキー (ﾜｯﾁｮｲ db74-JPwS)

2024/05/16(木) 18:02:53.02ID:???0

48 nodes of a3 (8*H100) instancesを7 weeksってごいすー
ゼロから学習しようとしたらそのくらいかかるってことか

0358名無しさん＠ピンキー (ﾌﾞｰｲﾓ MMff-C9Al)

2024/05/16(木) 18:09:55.06ID:???M

何ならクローズドモデル提供してるとこだって学習のためのデータにかかる著作権法や個人情報保護法周りで完全にクリアなデータだけで構成されてるか？っていう問いには口もごもごせざるを得ないだろうしな
ダーティでないものであろうって姿勢は尊重したいが

0359名無しさん＠ピンキー (ﾌﾞｰｲﾓ MMff-C9Al)

2024/05/16(木) 18:16:37.87ID:???M

あーいやこれ経産省主導のやつか
パブコメの反響的にも綺麗なものですよってアピールしないとあかんって意識もあるんやろね

0360名無しさん＠ピンキー (ﾜｯﾁｮｲ bb26-Ivpr)

2024/05/16(木) 18:17:59.15ID:???0

AIに限らずテック系なんざEvilになったやつしか勝たんし残ってない

0361名無しさん＠ピンキー (ﾜｯﾁｮｲ 2bb3-CDIS)

2024/05/16(木) 18:29:33.92ID:???0

>>356
同じGENIACでPFNも100Bと1TのLLM作ってるはず
1Tが公開されたら（動かせんが）ガチでやばそう
とはいえそのレベルのモデルに十分学習させられるほど日本語データがないのではという気もするが

0362名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f13-5B/7)

2024/05/16(木) 18:30:14.83ID:???0

EasyNovelAssistantに
>>347 のモデルと同作者の新モデルJapanese-TextGen-Kageを追加しといたで

最大コンテキストサイズが伸びてきとるっぽい

https://huggingface.co/dddump/Japanese-TextGen-Kage-v0.1-2x7B-gguf
https://twitter.com/Zuntan03/status/1791037360588927169

0363名無しさん＠ピンキー (ﾜｯﾁｮｲ 2bb3-CDIS)

2024/05/16(木) 18:31:09.83ID:???0

Stockmarkの100BはMITだからUncensoredにファインチューニングしたりも自由だよ
とはいえ事前学習データも綺麗そうだからNSFW用途では難しいだろうな

0364名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f23-mzba)

2024/05/16(木) 19:58:40.58ID:???0

今Text generation web UIで使っているggufモデルを使って、
NSFWな文字列を含むコードやデータを生成させたいんですけど、
ChatGPTみたいなUIで使いたいときって、何かおすすめありますか？
今のところ候補はChatbotUIを考えています。

0365名無しさん＠ピンキー (ﾜｯﾁｮｲ bb9f-AdtJ)

2024/05/17(金) 03:17:09.58ID:D6edv+6v0

EasyNovelAssistant
UIからJapanese-TextGen-MoE-TEST-2x7B-NSFW落とそうとしたら良くわからんエラー出た
直接落としたJapanese-TextGen-MoE-TEST-2x7B-NSFW_iMat_Ch10_IQ4_XS.ggufを
Japanese-TextGen-MoE-TEST-2x7B-NSFW_iMat_IQ4_XS.ggufに改名したら使えた

0366名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f83-jKRS)

2024/05/17(金) 04:50:35.86ID:???0

>>365
↓のコミットでリネームされてダウンロードURLが変わったのが原因。
https://huggingface.co/dddump/Japanese-TextGen-MoE-TEST-2x7B-NSFW-gguf/commit/f39f2353116283a863d86d7406375c6904007364

0367名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f21-0f0G)

2024/05/17(金) 07:13:14.57ID:???0

>>365
ワイもついさっき全く同じことしたわ

0368名無しさん＠ピンキー (ｴﾑｿﾞﾈ FF7f-eNi+)

2024/05/17(金) 07:14:03.52ID:???F

あれおま環じゃなかったのか

0369名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f13-5B/7)

2024/05/17(金) 09:12:47.83ID:???0

>>365-368
不具合報告サンガツやで
修正しといた

0370名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-Mwej)

2024/05/17(金) 10:54:32.87ID:???0

ﾊｷﾞﾁｬ＆コマR+である程度満足してたんだけど、そろそろEasyNovelAssistantでエロ文章実績解除したいんだけど
走らせるLLMはみなさん今のとこ何がおすすめでやんしょ？
日本語のエロ文が自然に出せるやつも日進月歩みたいだから色々ありそうだけども

0371名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f3c-eNi+)

2024/05/17(金) 11:06:57.37ID:???0

>>370
すぐ上の
Japanese-TextGen-MoE-TEST-2x7B-NSFW_iMat_Ch10_IQ4_XS
がホット

0372名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-Mwej)

2024/05/17(金) 11:09:00.84ID:???0

>>371
ｻﾝｸｽ！

0373名無しさん＠ピンキー (ﾜｯﾁｮｲ 0bc0-Ag1v)

2024/05/17(金) 12:54:44.40ID:???0

>>291
かくいうワイも使うUIによって応答の印象が微妙に違ったりして困ってるが、Silly Tavernに関して言えばてキャラクターカード以外にも色々Jailbreakプロンプトとか知らんうちに適用されたりするから左のパネルの下の方あるチェックでいらんプロンプトは切ったほうがええで
https://files.catbox.moe/xuo61c.jpg

0374名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b52-mzba)

2024/05/17(金) 16:45:33.36ID:???0

色々組み合わせたくなって、Pythonで直に出力させてみているんだけど、
全く思うような出力にならなくて、改めて大葉やkoboldのありがたみを感じる
「こんにちは」にさえも、まともな回答が返ってこない
そして、少しでもエロい話題を振ると、かなりの確率で「1 :名無しさん@お腹いっぱい。」とか
スレッドを模した長文が出力される
ちなみにモデルはc4ai-command-r-v01

0375名無しさん＠ピンキー (ﾜｯﾁｮｲ 5bd8-JZQp)

2024/05/17(金) 16:54:31.27ID:nQBmVgaP0

Pythonで直ってことはローカル？量子化の影響なんかな？
ワイ、APIで触った感じでは結構ふつーにいう事聞いてくれた印象なんやが

0376名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fbf-PuMj)

2024/05/17(金) 17:02:13.37ID:???0

>>374
Command Rのテンプレートに従ってる？
<|START_OF_TURN_TOKEN|><|CHATBOT_TOKEN|>
ではじめないとまともな返答返さないよ

0377名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b52-mzba)

2024/05/17(金) 17:06:38.13ID:???0

>>375
はい、ローカルで、ollamaやllama-cpp-python経由で出力させています。
場合によっては一応「こんにちは」への回答っぽい語句も含まれる事ありますけど、余計な長文が付け足されたり、
あと大抵はどこかの一般的なブログの記事みたいなのが出力されます。
で、エロい内容だと何故かここのスレみたいな長文にw
モデルはc4ai-command-r-v01-Q8_0.ggufですが、とりあえず今他のも試し中です。

0378名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fbe-CcWV)

2024/05/17(金) 17:08:13.06ID:???0

silly tavernの日本語の情報全然無いから使い方よくわからんと使ってるわ

0379名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fbf-PuMj)

2024/05/17(金) 17:08:44.77ID:???0

llama-cpp-pythonは勝手に頭に<BOS_TOKEN>加えるから、それで変になってないかも見たほうがいい

0380名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b52-mzba)

2024/05/17(金) 17:16:19.44ID:bDW/lnbV0

>>376
>>379
情報ありがとうございます。確認してみます。

0381名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fbf-PuMj)

2024/05/17(金) 17:50:24.21ID:???0

>>380
なんとなく今は
from llama_cpp import Llama
model = Llama(...)
output = model("こんにちは")
みたいなことやってるんじゃないかと想像するけどこれはダメで、HuggingFaceに書いてあるフォーマットに従う必要がある

0382名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MMdf-bNnz)

2024/05/17(金) 19:15:14.00ID:eLiIPOkOM

一瞬R PlusをQ8で動かしてるのかと思ってビビった

0383名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr5f-mzba)

2024/05/17(金) 20:17:16.50ID:???r

>>376
https://docs.cohere.com/docs/prompting-command-r
このテンプレートに沿った内容で組み直したら、正しく出力してくれました。
ありがとうございます！

>>382
R+はiq2_xxsが精一杯...

0384名無しさん＠ピンキー (ﾜｯﾁｮｲ cb11-+EhW)

2024/05/17(金) 20:24:00.27ID:zuYrt3Vi0

>>383
R/R+含め最近のinstructモデルは基本こういうテンプレートがあってそれに従わないとまともに推論できないから、新しいモデル使う時は気をつけた方がいいかも
Llama 2ベースのモデル(KarakuriとかSwallowとか)とかは割と適当にやっても大丈夫だったんだけどね

0385名無しさん＠ピンキー (ﾜｯﾁｮｲ cb11-+EhW)

2024/05/17(金) 20:25:19.57ID:zuYrt3Vi0

ちなみにR+もテンプレートはRと一緒だったはずだから、そのプロンプトはR+でもそのまま使えるで

0386名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a5c-Pd4t)

2024/05/18(土) 05:40:26.72ID:???0

>>385
ありがとうございます。iq2_xxsですが、ちゃんと出力されました。
ただ日本語のおかしい感じがRのQ8より目立ってて
せめてQ4以上が動く環境が欲しくなりました。
※今はM1Max64GBです。

0387名無しさん＠ピンキー (ﾜｯﾁｮｲ 6b32-9INB)

2024/05/18(土) 06:40:00.12ID:???0

>>386
macいいのぉ
64Gならkarakuri70bのQ5_K_Mがヌルヌル動くんかな？

0388名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f11-y1Cx)

2024/05/18(土) 08:22:48.53ID:pfpFpeeW0

>>386
俺M2 Maxの64GBだけどiq4_xs(contextは8K)無理やり動かしてるよｗ
swap 8GBくらい行くけど一応macOSハングアップせず動く

0389名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Sp23-9INB)

2024/05/18(土) 09:02:04.78ID:???p

>>388
メモリ割り当て上限上げればQ5kmいけない？

0390名無しさん＠ピンキー (ﾜｯﾁｮｲ 0bbe-G7oj)

2024/05/18(土) 09:02:15.82ID:???0

IntelかAMDがVRAM大量に積んだ統合型CPU出せば結構需要あるだろうにな
LLMはメモリ勝負で画像生成とは全然違うんだし

0391名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Sp23-9INB)

2024/05/18(土) 09:03:09.76ID:???p

ああごめん
command-r+か

0392名無しさん＠ピンキー (ﾜｯﾁｮｲ e326-ErG6)

2024/05/18(土) 09:15:07.94ID:???0

AMDが出すだろ
帯域500ぐらいのメモリ64までツンだAPU

0393名無しさん＠ピンキー (ﾜｯﾁｮｲ 07a0-1/cm)

2024/05/18(土) 09:28:43.66ID:???0

64GBまでってのが残念だよな
256GBくらい行ければいいのに

0394名無しさん＠ピンキー (ﾜｯﾁｮｲ 3bf9-dsTG)

2024/05/18(土) 10:24:29.90ID:???0

あれ内蔵GPU相当よさそうだから、文章AIとかお絵かきAI推論させながら別のグラボで作業とかゲームとかしたいけど、別のグラボ接続するの無理らしいんだよね
悲しい……

0395名無しさん＠ピンキー (ﾜｯﾁｮｲ e326-ErG6)

2024/05/18(土) 11:07:05.15ID:???0

ニューラルボードも個人に売るより企業に売ったほうが儲かるし
個人が買って使う分にはnvidiaのGPUに比べて優位性あるわけじゃないから
LLM元年こねえなあ…

0396名無しさん＠ピンキー (ﾜｯﾁｮｲ 6aca-l6Q5)

2024/05/18(土) 12:40:12.94ID:???0

直に改善されるよ

0397名無しさん＠ピンキー (ﾜｯﾁｮｲ 4677-Fooe)

2024/05/18(土) 14:22:21.03ID:???0

>>387
karakuri70bのQ5_K_Mはまだ試していないですけど、
Q4_K_Mだったら結構余力がある感じだったので、多分いけそうですね。
command-r/r+が一段落したら、そっちでもやってみるつもりです。

0398名無しさん＠ピンキー (ﾜｯﾁｮｲ 4677-Fooe)

2024/05/18(土) 14:26:41.20ID:???0

>>388
それは朗報です。今早速ダウンロード中。
今やりたい事が、さほど速度は求めていないので（寝ている間に作成でもOKなくらい）
とりあえず動けばいいんですけどね〜。
将来もっと環境が良くなった時のための、下地作りみたいなものなので。

0399名無しさん＠ピンキー (ﾜｯﾁｮｲ fa09-8DGq)

2024/05/18(土) 15:25:00.73ID:???0

LLM赤ちゃんなんやが
箇条書きを文章のように清書したいんやが
そういうのに向いた設定とかモデルがあったら教えてほしい
試しにEasyNovelに投げたら箇条書きの続きを書き始めた

0400名無しさん＠ピンキー (ﾜｯﾁｮｲ 1e7a-8DGq)

2024/05/18(土) 15:29:05.04ID:???0

ChatGPTでは

0401名無しさん＠ピンキー (ﾜｯﾁｮｲ fa09-8DGq)

2024/05/18(土) 15:35:32.26ID:???0

>>400
Bingコパイに投げたら長すぎなのとエッチすぎた…

0402名無しさん＠ピンキー (ﾜｯﾁｮｲ 1b74-2zf9)

2024/05/18(土) 15:41:03.54ID:???0

日本語の理解がよくてエロも行けるとなると真っ先に思いつくんはCommand R+やな

0403名無しさん＠ピンキー (ﾜｯﾁｮｲ e312-HkKw)

2024/05/18(土) 15:44:42.83ID:???0

そういう用途ならGPT4やopusで脱獄するかcommandR+やろうね

0404名無しさん＠ピンキー (ﾜｯﾁｮｲ fa09-8DGq)

2024/05/18(土) 15:57:32.48ID:???0

>>402,403
サンガツ
SDのお絵描きAIの方とはまったく勝手が違うから
調べて一から勉強するわ

0405名無しさん＠ピンキー (ﾜｯﾁｮｲ e312-HkKw)

2024/05/18(土) 15:57:44.40ID:???0

>>399
ちなみにopusだとこんな感じ
むりやり一回に収めたから展開がめちゃくちゃ駆け足だけど

ttps://files.catbox.moe/w7evwc.png
ttps://files.catbox.moe/l8ruxf.png
ttps://files.catbox.moe/pajst7.png
ttps://files.catbox.moe/c96udt.png

0406名無しさん＠ピンキー (ﾜｯﾁｮｲ fa09-8DGq)

2024/05/18(土) 16:17:25.84ID:???0

>>405
ｻﾝｶﾞﾂ
勢いにワロタ
ワイの場合セリフ読みの台本みたいな感じになってるからどうなるかちょっとやってみるわ
登場人物二人の百合ものなんやが
どっちのセリフかわかるように各所に名前が書かれてるから箇条書きっぽくなってる
端から7000文字あるからプロットにしちゃ長すぎる感もある

0407名無しさん＠ピンキー (ﾜｯﾁｮｲ 2ba1-PoTj)

2024/05/18(土) 17:18:06.10ID:???0

>>398
うちだと４.5tps位出るから、ギリギリではあるがパフォーマンスはリアルタイムチャットできるくらい出るよ

あと、そういや昨日言い忘れたんだが、llama-cpp-pythonででかいモデル走らせるとき、コンストラクタの引数でuse_mlockをTrueに設定したほうがいい
そうしないとmacOSが推論のたびにメモリを開放するせいで推論前の待ち時間がめっちゃ伸びる

0408名無しさん＠ピンキー (ﾜｯﾁｮｲ 239f-s06i)

2024/05/18(土) 18:06:52.75ID:ldYAm+3u0

Kobold直接起動するとチャットできるんか
ガチャチャットなんてアホなことしてたわ

■ このスレッドは過去ログ倉庫に格納されています