なんJLLM部避難所 ★2

1002コメント390KB

なんJLLM部避難所 ★2

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:27:25.10ID:???0

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(スクリプト攻撃継続中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所
https://mercury.bbspink.com/test/read.cgi/onatech/1702817339/

-
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0183名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fbe-YO5+)

2024/05/10(金) 19:19:09.60ID:???0

>>182
俺も同じような挙動になるけどLLMの画像認識って何でこんなに幻覚激しいんだろ
制服の女の子1人立ってる画像を艦娘で大和の周りを多数の戦艦が取り囲んでる絵だとか言い出したり滅茶苦茶過ぎる

0184名無しさん＠ピンキー (ﾜｯﾁｮｲ e3c0-LMHD)

2024/05/10(金) 19:54:19.34ID:???0

https://i.imgur.com/NIkINNj.jpeg
CohereのAPI調子乗って使いまくってたらしんだわ
お前らも気をつけるんやで、ほな……

0185名無しさん＠ピンキー (ﾜｯﾁｮｲ 767a-dezX)

2024/05/10(金) 19:57:48.39ID:???0

>>184
なんかこの色のははじめて見たな

0186名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-IHuf)

2024/05/10(金) 19:59:26.04ID:B8lRoLSZ0

>>184
HuggingChatは普通に使えるんじゃないの？

0187名無しさん＠ピンキー (ﾜｯﾁｮｲ 9334-tU1t)

2024/05/10(金) 20:33:29.49ID:???0

そりゃトライアルだし
月1000回までだし

0188名無しさん＠ピンキー (ﾜｯﾁｮｲ 267f-LjJG)

2024/05/10(金) 20:34:18.08ID:3lHnPK1F0

>>182
全然違って草

0189名無しさん＠ピンキー (ﾜｯﾁｮｲ 82fd-JLH9)

2024/05/10(金) 20:54:02.69ID:???0

>>169
opusならできるけど、opusに長文貼り付けるとAPI料金嵩むからなあ

0190名無しさん＠ピンキー (ﾜｯﾁｮｲ 267f-LjJG)

2024/05/10(金) 20:57:44.80ID:3lHnPK1F0

>>189
なるほど、早くローカルで無限にできるようになりたい

0191名無しさん＠ピンキー (ﾜｯﾁｮｲ 8297-RBm0)

2024/05/10(金) 21:19:28.41ID:???0

>>182
天櫛修羅ｗｗｗ
アーニャｗ

0192名無しさん＠ピンキー (ｱｳｱｳｳｰ Sa33-VW1c)

2024/05/10(金) 22:51:14.85ID:???a

富岳どっからDLできるの？

0193名無しさん＠ピンキー (ﾜｯﾁｮｲ 3613-LjJG)

2024/05/10(金) 23:03:01.27ID:???0

https://huggingface.co/Fugaku-LLM

0194名無しさん＠ピンキー (ﾜｯﾁｮｲ 767a-7Tbh)

2024/05/10(金) 23:10:09.63ID:???0

画像から小説を…改良されたらとんでもない技術や

0195名無しさん＠ピンキー (ﾜｯﾁｮｲ 7b3e-YO5+)

2024/05/10(金) 23:30:43.84ID:tFM2/wmS0

>>184
垢BAN食らったのかと思ってけど画像見たら全然セーフでよかた
Trial APIキーっていくつでも発行して貰える感じだけど、月間1000メッセージ制限がキー単位でした、みたいなぬけみちあったりして
まあ、Gmailなりで別垢作ればこんな制限あってない様なもんだけど

0196名無しさん＠ピンキー (ﾜｯﾁｮｲ cb13-l/GH)

2024/05/11(土) 00:07:20.29ID:???0

Mistral系で日本語化したのは
・RakutenAI-7B
・Swallow-MS-7b-v0.1
英語で強そうなのは
・openchat-3.5-0106
・OpenHermes-2.5-Mistral-7B
・Starling-LM-7B-beta
・WizardLM-2
あとはマージ比率の問題かな　進化アルゴリズムに期待

0197名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-vfni)

2024/05/11(土) 01:01:09.88ID:???0

llama-3　70Bの日本語特化モデルが来る前に、llama-2系70Bで最後に試したいマージ中だが、
ほんとSSD足りなくなる・・・(´Д⊂ヽ

0198197 (ﾜｯﾁｮｲ 9b32-vfni)

2024/05/11(土) 07:27:36.21ID:???0

もう出ないといけないので、とりま結果報告だけ

MS-01は推論能力重視だったけど、今度はNSFW重視のMS-02を作ってみた。
Gembo-v1-70bとspicyboros_-70b-2.2をそれぞれ使って、karakuriとchatvectorしたモデルを
karakuri-midrose-mgをベースにmodelstockでマージしてみた。

https://rentry.org/caxcb37i

結構いい感じｗ
爆弾の作り方も、遠回しに答えたんで、nfsw化は成功したみたい。

0199名無しさん＠ピンキー (ﾜｯﾁｮｲ 2b7a-eNi+)

2024/05/11(土) 08:14:38.27ID:???0

やるなあ

0200名無しさん＠ピンキー (ﾜｯﾁｮｲ bb8f-jZLV)

2024/05/11(土) 09:13:05.44ID:???0

>>184
なんか赤い部屋思い出した

0201名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fc7-1AKA)

2024/05/11(土) 09:49:19.04ID:???0

以前、マイニングしてたこともあって、手元にはこんな機材が残ってるんだけど、これらを使って、LLMの環境を構築したいんだけど、うまく活用する方法はないかな？

GPU: RTX3090×1、RTX3070×9、RTX3060×3、RTX1660S×3
メモリ: 32GB×4、16GB×4、8GB×4
CPU: Ryzen9 5900X、Ryzen5 3600、Ryzen5 3500、i3-10100F、Celeron G5905×3

せっかくのリソースをムダにしたくないし、何かいいアイディアあったら教えてくれ！

0202名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fc7-1AKA)

2024/05/11(土) 09:51:32.55ID:???0

RTX1660SじゃなくてGTX1650Sだったわw

0203名無しさん＠ピンキー (ﾜｯﾁｮｲ 5b91-AdtJ)

2024/05/11(土) 10:09:11.72ID:???0

>>198
続報まってるで

0204名無しさん＠ピンキー (ﾜｯﾁｮｲ 5b91-AdtJ)

2024/05/11(土) 10:24:37.67ID:???0

>>201
うちも似たような環境だわ．

https://github.com/oobabooga/text-generation-webui

GW明けからいろいろためして、いくつかGPUまとめれたおかげで、Command R plus の4bitがなんとか動いてるよ
koboldcppとかほかのでもまとめられるから好みで選ぶといいかも

https://docs.vllm.ai/en/latest/serving/distributed_serving.html

もっと大きなのを動かそうとおもって複数PCをつなげるvllm を試している途中
10G LAN だとそれなりに動くらしい．試しているニキはおらんかな？

0205名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fc7-1AKA)

2024/05/11(土) 11:05:26.75ID:???0

>>204
おお、近い時期やね
俺はGWの半ばからだけど、このスレがきっかけで本格的に始めたんよ

Command R plusは実用的な速度でに動くん？
IQ3Mで2.4T/sだわ

ちな以下の68GBの5枚指し
RTX3090×1
RTX3070×1
RTX3060×3

使ってるソフトはLM StudioとNovelAssistant

モデルのサイズに関わらず、枚数増やしていくごとに劇的に落ちていくわ・・・

0206名無しさん＠ピンキー (ﾜｯﾁｮｲ cb11-+EhW)

2024/05/11(土) 12:03:49.63ID:ILWLbVnk0

>>205
その構成の場合って処理速度は3060基準になるんか？
構成に比して遅すぎんか

0207名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fc7-1AKA)

2024/05/11(土) 12:25:33.45ID:???0

>>206
やっぱり、遅すぎるか・・・
前スレの情報だと3090+4060Tixで5T/s出てたようなんで、そこまでスペック差があるかなあって思ってたとこよ

今、さっき教えてもらったoobaboogaをインストール中
実は前にもいれたことがあって、1年前だったかな
そのときは日本語がまともに動かなかった気がするわw
最近のはほんますごいわ

0208名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f24-B3c0)

2024/05/11(土) 12:25:39.61ID:???0

>>151
私の場合はローカルLLMにollamaでlangchainにつなぐ実験をしています
ollamaちょっとクセがあるけど慣れれば普通にできる
ollamaでサーバーを立てて、そのAPIをlangchainで叩くみたいな仕組みです
gpuはollama側で認識してくれます

0209名無しさん＠ピンキー (ﾜｯﾁｮｲ cb11-+EhW)

2024/05/11(土) 12:37:04.68ID:ILWLbVnk0

langchainといえば、テンプレートの整備とか面倒だから自分で試したことはないんだが、最近のmixtral系日本語LLMってlangchainのエージェント駆動できるんかな
大型のモデルでしか試したことないから少し気になる

0210名無しさん＠ピンキー (ﾜｯﾁｮｲ 5b91-AdtJ)

2024/05/11(土) 13:41:40.53ID:???0

>>206,207

すまん．今動いているのは結構いい環境だわ
ブログとかに挙がっている構成と同じで A6000 + 4090 で 8 token/s でてるぐらい
最初は A6000 + 4060Ti で試していて GPUメモリが足らず 1 layer だけ GPU にオフロードできず 5 token/s

GPUメモリが正義だと勝手に思って、味をしめて30XX系をと考えていたけど、枚数が増えるとそこはよくないんやね
参考にならずすまんね。こちらでもできたらまた報告するわ

0211名無しさん＠ピンキー (ｻｻｸｯﾃﾛ Sp5f-Cnt2)

2024/05/11(土) 14:20:45.63ID:???p

vramお大尽羨ましす
ちなみに70bの量子化だとどのレベルの量子化サイズなら
フルロードできるん？
24G
48G
それ以上
それぞれ積んでる人おしえて
帰ったらkarakuri-MS-02を別サイズで量子化する時の参考にしたい
うちは12Gだから鼻から諦めてQ6_kしかやってない( ´∀｀)

0212名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fc7-1AKA)

2024/05/11(土) 14:34:43.23ID:???0

>>210
すげーな
A6000って48GBも積んでるやつよね
仮にA6000+4060tiで、全部オフロード出来なくても5 token/sも出てたらほぼ実用の範囲やね

枚数が増えることの性能低下についてははっきり分からんのよね

oobaboogaでテストしているうちに3060が足引っ張ってる気がしてきたわ
3060は帯域狭いし、4060tiのようにキャッシュ積んでないしね
今の構成だとスピード優先ならVRAM減らしてでも3070に変えた方がいい気がしてきたw

0213名無しさん＠ピンキー (ﾜｯﾁｮｲ cb11-+EhW)

2024/05/11(土) 15:08:34.64ID:ILWLbVnk0

>>211
基本的にはN bit量子化=1パラメータあたりN bitだけど、実際は全部のパラメータが同様に量子化されるわけじゃないしアーキテクチャ・コンテキストサイズにもよるだろうから、動かしたいモデルのファイルサイズを直接見た方がいい
一例だけど今手元にある64GBのMacだと、Llama 3 70B系ならQ5_K_Mが50GBでフルロードできる
Q4だと40GB強だから、RTX4090x2とかの48GB VRAM構成のマシンにも乗るんじゃない？

0214マジカル (ﾜｯﾁｮｲ 9b67-mzba)

2024/05/11(土) 15:27:08.73ID:reEExVxa0

>>183
温度を0.3~0.4ぐらいまで下げてみてください。

0215名無しさん＠ピンキー (ｻｻｸｯﾃﾛ Sp5f-Cnt2)

2024/05/11(土) 15:37:51.22ID:???p

アレ？　書き込めない？

0216名無しさん＠ピンキー (ｻｻｸｯﾃﾛ Sp5f-Cnt2)

2024/05/11(土) 15:39:42.26ID:???p

>>213
サンキュー
とりあえずQ5kmとQ4km作っときます

0217名無しさん＠ピンキー (ﾜｯﾁｮｲ dff2-9zYC)

2024/05/11(土) 15:47:06.87ID:???0

これエロ小説用っぽくていいかもしれない
話がどんどん進んでいっちゃうけど
https://huggingface.co/dddump/Japanese-TextGen-MoE-TEST-2x7B-NSFW-gguf

0218名無しさん＠ピンキー (ﾜｯﾁｮｲ bba0-aVBI)

2024/05/11(土) 15:52:43.37ID:???0

Local-Novel-LLM-project/Ninja-v1-NSFW-128kの大葉のローダー設定を教えてください

0219マジカル (ﾜｯﾁｮｲ 9b67-mzba)

2024/05/11(土) 16:34:30.32ID:reEExVxa0

>>218
Transfomers
trust-remote-code にチェック

0220名無しさん＠ピンキー (ﾜｯﾁｮｲ bba0-aVBI)

2024/05/11(土) 16:47:32.04ID:???0

う～んロードできない、最新の大葉を入れなおすところからやってみる

0221名無しさん＠ピンキー (ﾜｯﾁｮｲ 3bc0-5B/7)

2024/05/11(土) 17:40:41.94ID:2u2kJLJC0

>>218
ExLlamav2のデフォ設定で使えてるけども
https://i.imgur.com/A8sDyAk.png

0222名無しさん＠ピンキー (ﾜｯﾁｮｲ bba0-aVBI)

2024/05/11(土) 17:53:26.48ID:???0

大葉を最新にしたらよめましたありがとうございます。

0223名無しさん＠ピンキー (ﾜｯﾁｮｲ 2b76-l/GH)

2024/05/11(土) 19:10:41.60ID:???0

>>209
langchainで一度推論が使えるようになれば、その気になればRAGもできますよ
たぶん。自分の発言で気が付いたんだけど、llama-cpp-pythonでも
serverを使えば同じようなことができるなあ、と
しかし私のマシンはしょぼいので7b推論しててもだんだん調子悪くなってくる

0224名無しさん＠ピンキー (ﾜｯﾁｮｲ cb11-+EhW)

2024/05/11(土) 19:18:25.60ID:ILWLbVnk0

>>209
7Bでもlangchain駆動できるのか
定義したフォーマットから少しでも外れると基本NGだから、それなりに大型のinstructionモデルじゃないとキツいって印象だったんだがすごいな

0225名無しさん＠ピンキー (ﾜｯﾁｮｲ cb11-+EhW)

2024/05/11(土) 19:19:13.69ID:ILWLbVnk0

安価ミスった
>>223

0226名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-vfni)

2024/05/11(土) 20:02:00.00ID:???0

sbtom/karakuri-MS-02.ggu

karakuriのnsfw版
とりあえず量子化をアップしたので、フルロードできそうな人、試してみて
いい感じのエロ小説書いてくれます

0227名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-vfni)

2024/05/11(土) 20:14:30.78ID:???0

41.6 GB
ﾃﾞｽﾖﾈｰ

0228名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-vfni)

2024/05/11(土) 20:21:41.43ID:???0

正直25GBくらいまでは許容できるんだけど、今のところエロで一番性能がいいのは
ローカルでどれなんだろうねえ

70B系のモデルってどうしても30GB超えてきちゃうのが多いんだよな

0229名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-vfni)

2024/05/11(土) 20:23:48.78ID:???0

>>228
iQ3_xxsとかなら、24Gくらいまで抑えられるけど、作るのにちょっと時間かかる

0230名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-vfni)

2024/05/11(土) 20:25:43.58ID:???0

ああ、うそ
26.078Gだったわ、ごめ

0231名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f37-D8ix)

2024/05/11(土) 20:54:35.82ID:???0

26ならうちでも動作しないことは無いけど……ってなること考えるとやっぱ7Bとか13Bって手頃で良いよなと思ってしまう
それだけだと発展とかも限られるからローカル用にもでかいモデルがあるべきなんだろうけど

0232名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-vfni)

2024/05/11(土) 21:18:49.29ID:???0

手頃なのは間違いなく７BやLCAニキのモデルなんよ。
ただ、なんというか70Bの書く小説には例えようのない味があるんよなぁ
うまく伝えられんがｗ

0233名無しさん＠ピンキー (ﾜｯﾁｮｲ 4bec-T/4c)

2024/05/11(土) 21:32:33.97ID:???0

英語のモデルしか普段触らんけど、7Bとか全然こちらの指示に沿ってくれなくない？
7Bでみんな満足できてるの？

0234名無しさん＠ピンキー (JP 0H5f-7sQ3)

2024/05/11(土) 21:47:16.91ID:???H

最近のモデルにさわってる？

0235名無しさん＠ピンキー (ﾜｯﾁｮｲ cb13-l/GH)

2024/05/11(土) 22:17:29.68ID:???0

7Bとか実用性では最小限だろうしね
英語版Wikipediaがギリ入るくらいだそう

13～20Bくらいが軽さと性能でバランスよさそうだけど少数派
Mixtral-8x22Bも単品のはないし（野良モデルならある）

0236名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f7f-DfvV)

2024/05/11(土) 23:11:37.53ID:???0

Llamaには13BのモデルがあったけどLlama2には無かったからね(正確にはあるけど非公開)
最近ではマージモデルとかMoEの2x7Bとかは出てきてるけども

0237名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f71-5B/7)

2024/05/12(日) 00:20:56.30ID:wLCK4O0F0

text-generation-webui-mainとEasyNovelAssistantでエロ小説を出力したので、シーンごとに挿絵をstable diffusionで生成したいですが、適切なプロンプトを生成するのに良い方法はありますか？
kgmkmさんのnoteも参考にしたけど、上手く行かず、シーンからプロンプトを生成するのに適切なモデルや手法があったら、お教えください。

0238名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b29-JZQp)

2024/05/12(日) 01:09:09.61ID:???0

小説のシーンを３～４行程度にまとめる（まとめてもらう）
↓
この３行とキャラクター設定をプロンプトとして投げる

0239名無しさん＠ピンキー (ﾜｯﾁｮｲ bba0-aVBI)

2024/05/12(日) 05:49:21.21ID:???0

画像にテキストに音声に勉強すること沢山ありすぎるけど、これからの世代はこれらを全部使いこなす世界になると
本当に一人でなんでもできちゃう世界になるんだろうな

0240名無しさん＠ピンキー (ﾜｯﾁｮｲ 0bc0-Ag1v)

2024/05/12(日) 06:01:05.24ID:???0

https://files.catbox.moe/zai7kf.jpg
こんなん草生えるわ (ArrowPro-7B-RobinHood-toxic)

0241名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-AdtJ)

2024/05/12(日) 06:41:40.83ID:???0

漫画Originでも全員AI漫画家になってると予見されてた

0242名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f71-5B/7)

2024/05/12(日) 08:33:48.25ID:wLCK4O0F0

>>238
ありがとうございます。試してみます

0243名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-vfni)

2024/05/12(日) 09:17:05.60ID:???0

>>239
ディレクター業の大変さを誰もが感じる時代になりそう

0244名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f13-5B/7)

2024/05/12(日) 09:39:37.20ID:???0

EasyNovelAssistantを色々と更新したで
ガッツリいじったんで不具合あったらすまんやで＆なんか見つけたら知らせてもらえると助かるで

・入力欄のタブ化
・イントロプロンプトのタブで世界観やキャラの設定
・複数ファイルやフォルダのソート読み込み
・これらを使った執筆プロジェクトサンプル
・ここ三日間の軽量モデルラッシュに対応

https://twitter.com/Zuntan03/status/1789454526384394670

0245名無しさん＠ピンキー (ﾜｯﾁｮｲ 5bbd-6BYq)

2024/05/12(日) 09:57:04.25ID:???0

>>217
これいいな
出してくる文章が好みだ

0246名無しさん＠ピンキー (ﾜｯﾁｮｲ 5bbd-6BYq)

2024/05/12(日) 09:58:11.77ID:???0

>>244
おー、早速アップデートさせてもらうでえ！

0247名無しさん＠ピンキー (ﾜｯﾁｮｲ bba0-aVBI)

2024/05/12(日) 10:33:21.62ID:???0

Ninja-v1-NSFW-128すごくいい
エロ小説今までで一番上手い

0248名無しさん＠ピンキー (ﾌﾞｰｲﾓ MMff-eIYT)

2024/05/12(日) 12:12:29.51ID:???M

何やるにしても最上流の企画AI作るところから始まるからマジでディレクター業なんだよな

0249名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-vfni)

2024/05/12(日) 12:27:04.43ID:???0

企画は別にAIじゃなくてもいいのでは
AIと壁打ちしながら企画を作るのは当然やけど

0250名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f49-l/GH)

2024/05/12(日) 12:36:56.06ID:???0

EasyNovelAssistantでたまに気に入った場面をじっくりやって欲しい時に限ってすぐに話し進んじゃうから
入力画面で[〇〇の描写を台詞なしで500文字で出力して]とか入れてリロード連発するとなんかほどよくいける
てかすごく欲しかったイントロプロンプト機能が追加されて草
本当に開発者さんには頭上がらねぇ…ありがとうございます

0251名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-AdtJ)

2024/05/12(日) 12:46:49.90ID:???0

>>244
zuntan神お疲れ様です

0252名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b7a-xM46)

2024/05/12(日) 15:26:44.69ID:???0

EasyNovelAssistantのタブ素晴らしいな！タブの複製も簡単に出来たらますます捗りそう。リクエストさせてください

0253名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f13-5B/7)

2024/05/12(日) 16:15:52.87ID:???0

感想サンガツ

>>252
複製したタブの末尾への追加ならすぐに対応できたんで追加歯といたで

0254名無しさん＠ピンキー (ﾜｯﾁｮｲ bba0-aVBI)

2024/05/12(日) 18:21:04.89ID:???0

Ninja-v1-NSFW-128あんまりストレートなプロンプト書くと申し訳されるな
ChtaGPTほどじゃないが、こつを磨かないとだめか

0255名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fbd-mzba)

2024/05/12(日) 18:31:35.50ID:???0

c4ai-command-r-v01をText generation web UIで動かしているんですが、
Macだと問題無いのに、WindowsだとどうやってもUTF-8のデコードエラーになる
（LightChatやNinjaは動く。あとc4ai〜もkoboldだと問題無い）
https://github.com/ggerganov/llama.cpp/issues/6112
ここ見ると、llama.cppの問題っぽいのだけど、何か対策ありませんか？

0256名無しさん＠ピンキー (ﾜｯﾁｮｲ bb87-AdtJ)

2024/05/12(日) 19:58:55.05ID:f2NqOFhh0

>>255
以前似たようなエラーを経験したけど、そのときはプロンプトとかキャラクタープロフィールの最初の一文字目にマルチバイト文字が入ってると発症してたな
適当な記号とかascii文字を先頭に持ってくれば問題なかったけどどうだろう

0257名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b7a-xM46)

2024/05/12(日) 20:52:41.42ID:???0

>>253
対応はっや！こちらでもタブが複製できたことを確認しました
サンガツやで！

0258名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f77-mzba)

2024/05/12(日) 21:15:12.31ID:???0

>>256
プロンプトは英語でもエラー変わらずだったので、キャラクターの方見直してみます。ありがとうございます。

0259名無しさん＠ピンキー (ﾜｯﾁｮｲ bba0-aVBI)

2024/05/13(月) 06:43:28.37ID:???0

Ninja-v1-NSFW-128の作るエロ文章見てたら、別に70Bとかで無くても日本語のちゃんとしたエロ作れるんだと思った。

要は何を学習させているかなんだろうな

0260名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b0a-CcWV)

2024/05/13(月) 08:17:14.75ID:???0

音声とか絵の学習もそうなんだけど質の悪いデータいくら用意しても逆に質が悪くなっちゃうしな

0261名無しさん＠ピンキー (ﾜｯﾁｮｲ cb13-l/GH)

2024/05/13(月) 08:35:09.26ID:???0

Yiの新バージョンがApache2.0でリリース
6B・9B・34Bで34BはLlama3 70B並みですって

0262名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fe5-Xoqa)

2024/05/13(月) 12:26:06.16ID:C+s8vmCA0

どうせゴミLLMです

0263名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-vfni)

2024/05/13(月) 12:29:49.46ID:???0

>>259
もうちょっとモデルサイズ大きくていいんで
さらなる発展を期待したい

モデルサイズ15GBくらいなら32GBメモリ積んだデスクトップPC使えば
ここ5年くらいのミドルレンジCPUで余裕やしな

0264名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f84-PuMj)

2024/05/13(月) 16:30:22.92ID:???0

またローカルCommand R Plusの記事が上がってる
https://ascii.jp/elem/000/004/198/4198080/

0265名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b34-DfvV)

2024/05/13(月) 16:40:05.10ID:???0

LCAにも触れてるな

0266名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b0a-CcWV)

2024/05/13(月) 16:48:08.68ID:???0

実際command R ＋のロールプレイ性能は結構凄い
システムプロンプトで指示してやるといい感じに動いてくれる

0267名無しさん＠ピンキー (ﾜｯﾁｮｲ bbe3-wLxT)

2024/05/13(月) 17:01:57.74ID:???0

初心者向けに良い記事だね
LMStudioは実行ファイルからインストール出来るしUIも洗練されていて一番勧められる

0268名無しさん＠ピンキー (ﾜｯﾁｮｲ db74-JPwS)

2024/05/13(月) 17:42:09.32ID:???0

A6000でもGPUにフルロードしようとしたらiq2になるか・・・

0269名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM5f-PuMj)

2024/05/13(月) 18:24:15.67ID:???M

+のiq2と無印Q8ってどっちが質の面ではいいんかね
サイズ同じくらいだけど

0270名無しさん＠ピンキー (ﾜｯﾁｮｲ 7be4-PuMj)

2024/05/13(月) 22:12:55.13ID:???0

>>264 のローカルLLMの記事見てローカルに興味持ったんやけど
LM studioってのとEasyNovelAssistantやったらどっちの方が使い勝手ええんや？
stable-diffusionの環境構築できるくらいの知識は持ってて、GPUは1660tiの低スペや

0271名無しさん＠ピンキー (ﾜｯﾁｮｲ cb11-+EhW)

2024/05/13(月) 22:26:34.54ID:+rtn+Qak0

asciiの記事からよく短時間でこんな場所にたどり着いたなｗ

0272名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-Mwej)

2024/05/13(月) 23:35:09.41ID:???0

ArrowProがライセンス関係で揉めてるみたい

0273名無しさん＠ピンキー (ﾜｯﾁｮｲ 2bfd-3+jw)

2024/05/14(火) 00:09:52.40ID:???0

何の地雷踏んだのかと思ったら、ArrowPro自体が地雷だったという話かｗ
リリース後のライセンス変更は、変更前に配布された分には変更の影響は及ばない
変更前に受け取った人から再配布するものにも影響はない
たいていの人はGGUFに変換されたものを落としてるだろうから影響なしだな
ライセンス変更自体を撤回したようだけど

0274名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b95-JZQp)

2024/05/14(火) 00:37:03.70ID:???0

https://github.com/kgmkm/goalseek_ad/tree/main
init_editorでプロットをうまいこと出してくれなかった箇所を修正したり
えっちじゃないASMR追加したりしてた

「Japanese-TextGen-MoE-TEST-2x7B-NSFW_iMat_IQ4_XS」すごすんぎ
pixiv小説「Japanese-TextGen-MoE」で検索すると作例でてくんで

0275名無しさん＠ピンキー (ﾜｯﾁｮｲ df4b-6BYq)

2024/05/14(火) 00:51:15.61ID:???0

>>274
うわー、すごい参考になる

0276名無しさん＠ピンキー (ﾜｯﾁｮｲ db74-1je3)

2024/05/14(火) 03:25:34.37ID:???0

openaiの発表やべぇ
このレベルのがローカルで使えるようになるのはいつになるだろうか

0277名無しさん＠ピンキー (ﾜﾝﾄﾝｷﾝ MM7f-StPd)

2024/05/14(火) 05:21:18.76ID:???M

俺ポエムだが
低パラのelyzaベンチ競争も良いけど、ベンチ番長作りにあまり白熱してほしくない
10B以下のモデルは本当の意味で「思考」してるわけじゃないって以前何処かの検証記事で見たし、7B使ってると口達者さでベンチスコア稼いでる印象を受ける
自然言語からのユーザー意図のくみとりが出来てないと感じることが多々ある

ハッカソン組は豊富な資源を使ってもっと大きいパラメタのモデルを改良してほしい
Xのポスト見てると7B世界一に拘りがあるようだが、正直7Bマージ芸するだけならA5000まで必要にならないしEvolveも出たんでマージ芸はそちらに任せればいいのではなかろうか

と貧弱GPUしかない身としては思ってしまうんだ
長文スマン

0278名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f48-5B/7)

2024/05/14(火) 05:35:36.17ID:x1g5Kcyw0

>>276
アルトマンはエロ解禁したいって言ってたし
そうなればローカルじゃなくてもいいんだけどな

0279名無しさん＠ピンキー (ﾜｯﾁｮｲ 5b2a-elgC)

2024/05/14(火) 06:07:53.94ID:???0

EasyNovelAssistantインスコして起動すると"Not enough memory resources are available to process this command"って出るんだけど
これはRAMかVRAMがたりてないってことでええんか？
RAM32GB、VRAM8GBなんだけど

0280名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b37-AdtJ)

2024/05/14(火) 08:02:57.04ID:???0

>>279
そのエラー文のメモリとはwindowsの資格情報マネージャーの空き容量の事を指している模様
https://github.com/desktop/desktop/issues/13937#issuecomment-1491991555

0281名無しさん＠ピンキー (ﾜｯﾁｮｲ bba0-aVBI)

2024/05/14(火) 08:41:38.63ID:???0

Ninja-v1-NSFW-128いろいろ試してるけど、倫理フィルターで申し訳されるのに、自分はエロしか書けないみたいな矛盾したこと言うのがおかしい

0282名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f68-JZQp)

2024/05/14(火) 08:52:34.29ID:???0

EasyNovelAssistant使って各モデルが意味の取りにくい文を解釈してくれるかの試し
https://rentry.org/df9f4te5
テストとしては問題の数も試行回数も足りないけど傾向くらいは見える感じになった

■ このスレッドは過去ログ倉庫に格納されています