なんJLLM部避難所 ★2

1002コメント390KB

なんJLLM部避難所 ★2

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:27:25.10ID:???0

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(スクリプト攻撃継続中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所
https://mercury.bbspink.com/test/read.cgi/onatech/1702817339/

-
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0037名無しさん＠ピンキー (ﾜｯﾁｮｲ d311-h5/x)

2024/05/03(金) 16:47:18.86ID:Gj7rcMwg0

一応生成例
（エロチャではないけどharmfulな結果は日本語でも出てくる点がMikuMaidとの違い）
https://i.imgur.com/GnGmoTK.png

0038名無しさん＠ピンキー (ﾜｯﾁｮｲ cf13-6o3J)

2024/05/03(金) 17:24:35.01ID:???0

スレ立てサンガツ！

>>26-28
アカンモデルははっきりアカンと言えるんやがエエモデルを比べるのはホンマにむずい
6GBでVRAMフルロードできるんで速いのはエエんやが人が読むよりも速く生成されても
生成物をAIに評価させるとかせんと扱いに困るしなぁ

一定ラインを超える生成物の良し悪しは個人の好みに寄ってきて長時間触らんとわからん印象
もしくは話題になっとったベンチーマークのカンニングができんような
人の感性に沿った数値評価ができるようになればかね

現状は画像生成モデルの「好みのモデルを使ったらええんやで」と似てきとる気がするで

>>34
情報サンガツ！
KoboldCpp上でのNinja Q8でコンテキスト長伸ばすとなんか変な反応するなぁと思っとったが
ワイ環じゃないようで安心したで

0039名無しさん＠ピンキー (ﾜｯﾁｮｲ 83be-7iwU)

2024/05/03(金) 17:29:31.86ID:???0

次のトレンドはやっぱ音声読み上げだよな
中国語なまり問題何とか軽減出来ないかな

0040名無しさん＠ピンキー (ﾜｯﾁｮｲ cf13-6o3J)

2024/05/03(金) 17:42:16.13ID:???0

>>26
EasyNovelAssistantの出力にMd形式で番号を振ってあるんは
大量の出力から良さげなものをCommandR+やオンラインLLMとかに選ばせられへんかなぁと思うて付けたで

「人の心に響く番号を5つあげて、点数と理由も記載しなさい」みたいな
なんちゃって評価で大量の出力を評価でけへんかなぁと

0041マジカル (ﾜｯﾁｮｲ 03bb-4Xr2)

2024/05/03(金) 18:21:07.94ID:6BfWfX3i0

Ninjaベースの派生モデル、Assistance-7Bを公開しました。

https://huggingface.co/Local-Novel-LLM-project/Assistance
https://huggingface.co/Local-Novel-LLM-project/Assistance-GGUF

Ninjaの小説能力をオミットし、数学とコードの能力を持たせたモデルです。
感情パラメータを出力させたいなどに向いているらしいです。

0042名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fc8-3YXh)

2024/05/03(金) 18:27:28.18ID:???0

>>27
ごめんVecteusのことです。なんか書く時見てるところ違ったわ。
やっぱりどのモデルが向いてるかは試してみないとわからんか…

>>38
画像の方も結局は好みやしこっちもそうか…
しかしこっちは画像と違って一目でわからんし、それぞれ評価するのしんどそうやね

>>40
そういう目的でついてんのかこの番号
実際その辺もAI任せしたいなぁ…
最近はずっとEasyNovelAssistantにお世話になってます。めっちゃ楽しい！
(強いて要望言うと、Ctr+Sで保存する時日付時刻とかが自動的に入ってくれるとちょっとうれしいかも…)

0043名無しさん＠ピンキー (ﾜｯﾁｮｲ 537a-h614)

2024/05/03(金) 18:36:14.52ID:???0

>>25
GPTやclaudeではそういう現象の報告は見たことあるな

0044マジカル (ﾜｯﾁｮｲ 03bb-4Xr2)

2024/05/03(金) 18:40:34.37ID:6BfWfX3i0

>>43
Ninja系統のモデルはどういうわけかこのような挙動をするので同じようなことをするモデルを探しています。

0045マジカル (ﾜｯﾁｮｲ 03bb-4Xr2)

2024/05/03(金) 19:03:40.72ID:6BfWfX3i0

https://t.co/bHqlgW04pa

我々が出しているNinja系のGGUFはコンテキスト長周りにバグを抱えているらしいのでmmnga氏の出しているGGUFを使うのをお勧めします。
原因はおそらくYarnがGGUFでは使えないことだと思われ、どうにかする予定です。

0046名無しさん＠ピンキー (ｵｯﾍﾟｹ Sre7-5fNx)

2024/05/03(金) 20:03:30.28ID:???r

量子化の方法って違いがあるんだ？
gitでプロジェクトをクローンして、convert.pyでGGUFに変換して、
imatrixファイルを作成してからquantize.exeでお好みのサイズに量子化するだけだと思ってた

0047名無しさん＠ピンキー (ﾜｯﾁｮｲ 5377-7iwU)

2024/05/03(金) 20:08:56.21ID:1tl4LoH/0

コンテキスト長がそのままだと短くなるとか？

0048名無しさん＠ピンキー (ﾜｯﾁｮｲ cf13-6o3J)

2024/05/03(金) 22:47:02.99ID:???0

>>42
> (強いて要望言うと、Ctr+Sで保存する時日付時刻とかが自動的に入ってくれるとちょっとうれしいかも…)

そのままではないんやが2点対応しといたで

・名前を付けて保存でデフォルトのファイル名に日時を設定
・ファイル保存時に上書きするファイルがあればlogフォルダにバックアップ

誤って大事なデータを上書きしてしまった時はlogフォルダを覗いてもろうたら

0049名無しさん＠ピンキー (ﾜｯﾁｮｲ e389-GwMx)

2024/05/03(金) 23:45:14.72ID:???0

Zuntanニキは時代の最先端行っとるな
楽しませてもらっとる、ありがとうやで～

0050名無しさん＠ピンキー (ﾜｯﾁｮｲ 767a-7Tbh)

2024/05/04(土) 08:07:15.92ID:???0

エロい話から怖い話まで何でも作れるようになるか～

0051名無しさん＠ピンキー (ﾜｯﾁｮｲ 767a-/jko)

2024/05/04(土) 09:27:01.44ID:???0

Command R+で…な文章書いて遊んでるだけの浅瀬なんだけど、Llama3より良い感じぽいなこれ
二次創作でもこっちがプロンプト書かなくてもある程度キャラ設定や口調再現するのは感動した
とはいえ翻訳だから高めのレベルで限界はある感じ
マイナーなキャラは対応してないだろうしね
日本語特化LLMはまだ試してないんだけど、どんどん情報更新されてく現状で、今のとこ一番日本語の小説創作向きって何があるかな

0052名無しさん＠ピンキー (ﾜｯﾁｮｲ bec8-cE25)

2024/05/04(土) 10:07:31.59ID:???0

>>48
対応サンガツ！
ほんまEasyNovelAssistantないと始めてなかったんで、助かっとるで

0053名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fbe-YO5+)

2024/05/04(土) 15:26:15.99ID:???0

>>44
俺もNinjaとVecteusは全く同じ動きするわ、再起動しない限り前のセッションを引きずったおかしい動きになる
koboldCppで他のモデルでこんなこと起きた事なかったからビックリ
モデル依存でそんなことってあるのか？

0054名無しさん＠ピンキー (ﾜｯﾁｮｲ 936f-jyRk)

2024/05/04(土) 15:27:39.18ID:???0

>>36
情報助かる！

0055マジカル (ﾜｯﾁｮｲ 0fe6-5ctY)

2024/05/04(土) 15:44:47.53ID:LYjmb2CO0

>>53
Koboldcppでもそうなりますか...
NinjaがMistralアーキテクチャの機能をフル活用できる性能があるからこのようなことが起こるのでは
という仮説を立てていますが未だ原因は不明です。
情報ありがとうございます。

0056名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-IHuf)

2024/05/04(土) 16:27:20.35ID:ZPxwerOY0

kobold.cppでもoobaboogaでも同じ動きするんだったら、どっちかと言うと裏で動いてるLlama.cppに問題があるんじゃないか？

0057名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-IHuf)

2024/05/04(土) 16:30:24.10ID:ZPxwerOY0

もし素のmistral+素のLlama.cppで同じ現象起きるんだったら、実装の問題だからgithubでissue立てた方がいい気もするけど

0058名無しさん＠ピンキー (ﾜｯﾁｮｲ 127c-xnZ/)

2024/05/04(土) 16:57:37.07ID:y5nYNW650

>>51
ぶっちゃけ日本語で小説となるとまだAIのべりすとに一日の長があるんやない？
ローカルで動作するLLMが今のAIのべりすとを上回る日もそう遠くないとは思うけど
Vecteusほんま賢いわ

0059名無しさん＠ピンキー (ﾜｯﾁｮｲ 936f-jyRk)

2024/05/04(土) 17:54:47.55ID:???0

久しぶりにtext generation web UIをgit pullで最新版に更新して起動しようとしたらエラーになって起動できなかったので解決法メモしとくわ

①出たエラー表示
ModuleNotFoundError: No module named 'rich'
・解決策
1.text generation web UIのフォルダに有るcmd_windows.batを起動
2.「pip install rich」を入力してエンター
3.「deactivate」を入力してエンター
4.コマンドプロンプトの「X」を押して終了

②出たエラー表示
AttributeError: module 'gradio.layouts' has no attribute '__all__'
・解決策
1.text generation web UIのフォルダに有るcmd_windows.batを起動
2.「pip install --upgrade gradio」を入力してエンター
3.「deactivate」を入力してエンター
4.コマンドプロンプトの「X」を押して終了

0060名無しさん＠ピンキー (ﾜｯﾁｮｲ e7bf-JLH9)

2024/05/04(土) 18:44:21.66ID:???0

>>59
pip install -r requirements.txt でいけない？

0061名無しさん＠ピンキー (ﾜｯﾁｮｲ 3613-7Tbh)

2024/05/04(土) 19:02:56.58ID:???0

EasyNovelAssistantに音声と画像を簡単に組み合わせて動画にする機能を追加したで
https://twitter.com/Zuntan03/status/1786694765997924371

アキバの冥土喫茶風
https://i.imgur.com/Eds9BXT.mp4

JNVA 390の12からお借りしてみた
https://i.imgur.com/Pum2qZx.mp4

ドキュメントもわかりやすくしといたんで引き続き不具合報告や感想や要望をもらえるとありがたいで

0062名無しさん＠ピンキー (ﾜｯﾁｮｲ 767a-BGQ5)

2024/05/04(土) 20:32:30.11ID:???0

>>58
どもどもです
うーんせやろか
AIのべりすとも一番安いサブスクに入って試し始めたとこだからまだまだ基本的な使い方なのかもしれんけど
最近のに比べるとやっぱり融通が利かない感じがするかなぁ
続きを勝手に書く小説モードが慣れなくてアシスタントチャットでChatbot的に指定してるんだけど
Command R+とかだと例えば竿役の口調を体育教師系からチャラ男くんに変えるみたいなことや
ここはもう少しねっとりとかここはおためごかしに優しくとかも
文脈を類推してやってくれるんだけどAIのべりすとはそういうの無理っぽい
ただ、日本語のエロ文章の自然さは間違いなくまだアドバンテージあるから、あとちょっとかゆい所に手が届けばという感じ
まぁまだ使い方が下手なだけかもだけど

0063名無しさん＠ピンキー (ﾜﾝﾐﾝｸﾞｸ MM62-ENsQ)

2024/05/04(土) 20:59:43.98ID:???M

>>55
大葉よく知らんのだけど、transformersとかGPTQとかでも起きるんやろか
そういう仮説が出てくるってことは既に試したのかもしらんが
実行環境由来じゃなくてモデル由来で、履歴覚えてるとかどういう仕組みなんだろ

0064名無しさん＠ピンキー (ﾃﾃﾝﾃﾝﾃﾝ MMbe-WHiR)

2024/05/05(日) 00:14:19.22ID:???M

zuntanソフト使ってみたいんだけどこのようなことはできる？
チャット用に記述したキャラがある(口調から性格、思想も入ってる)
そのキャラ用のVITSのモデル学習は済んでいる
やりたいこと
リアルタイムに何時間でも子守唄のように愛を囁かせる
現状
STでキャラカにラブレターの原稿を書かせてテキストに保存→VITSに流し込んでwavにしている
試せという話なのだが自分のPCはpythonが混ざって自動では入らんかったので

0065名無しさん＠ピンキー (ﾜｯﾁｮｲ 3613-7Tbh)

2024/05/05(日) 01:47:04.05ID:???0

>>64
興味を持ってもらってサンガツやで

今の情報の少なさやと「わからんけどたぶんイケるんちゃうかなぁ」ぐらいしか言えんやね

> チャット用に記述したキャラがある(口調から性格、思想も入ってる)
を https://rentry.org/ あたりに貼ってもらえたらもうちょっとまともな返答ができるかもや
公開に問題ある箇所があるなら公開できるように適当に書き換えてもろうて

> 自分のPCはpythonが混ざって自動では入らんかったので
ワイとしてはpythonが混ざらんように作ってるつもりなんでこっちのが気になるわ
ログとかもらえたら助かるで

この6時間だけでもWin10限定とか特定のウィルスチェックソフトで問題起きたりとかしとるんで
対策ができるならしときたいしできんなら注意喚起をしときたいで

0066名無しさん＠ピンキー (ﾜｯﾁｮｲ 9375-YO5+)

2024/05/05(日) 11:32:13.18ID:???0

支部にVecteus-v1で書いた小説を追加しとったで、お友達も書いてくれてるので「EasyNovelAssistant」で検索しとくとええかも
金玉を空にできる自信あるレベルになってきたわ

それに伴いgithubとnoteもちょい更新しといた、ほんと今のところVecteus-v1が一番オススメ

ゴールシークも改造して頂いてるようでうれC
そいや三章・四章・終章の小説執筆で、急に話がつまらなくなる印象を受けた際、jsonの部分を削ることで改善したことが何回もあったわ

0067名無しさん＠ピンキー (ﾜｯﾁｮｲ 3613-7Tbh)

2024/05/05(日) 13:27:49.99ID:???0

>>66
作例情報サンガツ！
作例や記事メニューにリンク追加しといたで

ワイはRTX 3060 12GB環境なんやが
LightChatAssistant-2x7B-IQ4_XS-Context8K-GpuLayer33
Vecteus-v1-IQ4_XS-Context4K-GpuLayer33
のどっちを使うかを決めきれん感じや

なんとな～くLCAのほうがええ回答をくれる時がある気がしとる

VRAM 8GB以下やったらVecteus安定な気はするね
Vecteusは読むより速く生成してくれるんで生成物のAI二次処理を考えなやね

0068名無しさん＠ピンキー (ﾜｯﾁｮｲ 127c-xnZ/)

2024/05/05(日) 20:36:43.58ID:???0

Text generation web UI導入してみたら
同じVecteusを使っててもEasyLightChatAssitantと違って
倫理観が高くてすぐ申し訳してくるんや
contextを上手いこと設定したらよさそうっていうのは分かったんやが
逆にEasyLightChatAssitantはどこで倫理観下げてるんや？

0069名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f32-dezX)

2024/05/05(日) 20:54:10.75ID:???0

ひさびさに英語小説をlumimadeで試したけど、もしかしてすごくないかこれ？
規制が外れただけじゃなく、英語の表現力がmiqumaidに比べてかなりアップしてるような・・・
これがllama-3-70Bの本来の力か

0070名無しさん＠ピンキー (ﾜｯﾁｮｲ e729-YO5+)

2024/05/05(日) 21:18:28.69ID:???0

EasyNovelAssistantアプデしたらプロンプトと関係ないことしか書かなくなっちゃったけど
全部消してインスコし直したら治った
結構気に入った文章書いてくれてて仕様変わっちゃったんかって焦ったけど
治ってくれてマジ良かった

0071名無しさん＠ピンキー (ﾜｯﾁｮｲ 3613-7Tbh)

2024/05/05(日) 21:29:20.13ID:???0

>>68
兄弟のNinjaでは本来設定すべきInstruction formatを適用するとなんでか申し訳したり英語の返答でたりしやすい気がするで
オカルトじみてはいるんやが…

VecteusはInstruction format不要なモデルなはずなんでLLMへの入力がタグのない日本語文のみになっとるか確認
あとは総コンテキスト長を4K、生成コンテキスト長1K、あたりになってるかあたりかなぁ

量子化モデル使う場合はこっち https://huggingface.co/mmnga/Vecteus-v1-gguf/

0072名無しさん＠ピンキー (ﾜｯﾁｮｲ a796-z0Yf)

2024/05/05(日) 21:45:41.12ID:???0

>>70
これ自分も起きたんですが生成分の長さを4096より大きくすると起きるみたいです

0073名無しさん＠ピンキー (ﾜｯﾁｮｲ 9375-YO5+)

2024/05/05(日) 22:04:03.22ID:???0

>>70
ワイもや、なおVecteusだけでなくsniffyotterでも同様の現象に見舞われた模様
なので推奨2048(3000番台でもいけるけど荒れるかな……)

0074名無しさん＠ピンキー (ﾜｯﾁｮｲ 127c-xnZ/)

2024/05/05(日) 22:06:33.01ID:???0

>>71
Text generation web UIのデフォルトのcontextとかinstruction templatesが倫理観の高いアシスタントを演じさせとるんかな
この辺は手探りでやってくしかなさそうやね

0075名無しさん＠ピンキー (ﾜｯﾁｮｲ e729-YO5+)

2024/05/05(日) 22:13:05.22ID:???0

>>72-73
ほ、ホンマや！長くすると駄目だった。というか6144でやっててアプデしたからその条件に触れちゃってて
全部消したら128だから治ったように見えてたのか
長く書けるの復活してホスイ…

0076名無しさん＠ピンキー (ﾜｯﾁｮｲ e3a7-mHih)

2024/05/05(日) 22:16:19.72ID:???0

sniffyotterでハードコアポルノのはずがよくわからんハードボイルド小説が始まったんはそういうことやったか

0077名無しさん＠ピンキー (ﾜｯﾁｮｲ 0365-PnGr)

2024/05/05(日) 22:40:25.39ID:???0

普段はSDで遊んでるんだが連休で時間あったんでEasyNovelAssistant入れてみたけど、最近のローカルLLMすごいね
ゴールシークプロンプト入れて細かく調整すると更に精度上がるし

0078名無しさん＠ピンキー (ﾜｯﾁｮｲ 3613-7Tbh)

2024/05/05(日) 23:14:05.69ID:???0

>>70-73
あーなるほど壊れた理由がわかったわ
たぶんモデルメニューのコンテキストサイズ上限を上げたら直るはずや

対策考えるわ

0079名無しさん＠ピンキー (ﾜｯﾁｮｲ 3613-7Tbh)

2024/05/06(月) 00:06:18.27ID:???0

不具合報告と回避法の共有ほんまにサンガツ&すまんやで
対策を入れときました

> EasyNovelAssistant 更新で生成分の長さが 4096 以上だと、入力欄と無関係な文章が生成される不具合がありました。
> 生成分の長さが最大コンテキストサイズ以上の場合に、生成分の長さを自動的に短縮するようにしました。
> 長文を生成する場合は、モデルメニューの最大コンテキストサイズを増やします（消費 VRAM も増加）。

生成文の長さを6144にしたい場合は、VecteusからLCAかNinjaに変えて最大コンテキストサイズを8Kにしてな

0080名無しさん＠ピンキー (ﾜｯﾁｮｲ df11-SsY3)

2024/05/06(月) 07:41:32.19ID:TaqQIHyO0

GGUFフォーマットにバグがあるという話が出てる
https://old.reddit.com/r/LocalLLaMA/comments/1ckvx9l/part2_confirmed_possible_bug_llama3_gguf/

AWQなら大丈夫らしい

0081名無しさん＠ピンキー (ﾜｯﾁｮｲ fbc6-xnZ/)

2024/05/06(月) 08:26:06.96ID:???0

Twitterでやってる人が居たんで真似してみたが、3人で議論させるプロンプト面白いな
ありえない仮定でもそれっぽく話してくれるし一応肯定否定両面から議論して結論くれるので見てて楽しい
キャラクター付けが強すぎると脱線しがちだが（男・女・ロボット）程度なら議論が進みやすい
ただある程度キャラクター性があったほうが話し手がわかりやすいので1行程度で簡素なキャラ付けをしたほうが良かった

Ninjaは脱線して長ったらしくなりがちで、Vecteusのほうがうまい事話を切り上げてくれる傾向がある

0082名無しさん＠ピンキー (ﾜｯﾁｮｲ 93ce-YO5+)

2024/05/06(月) 13:27:29.92ID:???0

おもろそう、そういやAutoGPTが流行ったときも討論みたいにさせて結論出させるのやってたわ

こっそりrating_questionableなEasyNovelAssistant用の耳なめASMR台本用意したで、お手持ちのvits2モデルで楽しんでどうぞ
https://github.com/kgmkm/goalseek_ad/blob/main/omake_asmr_name.yaml

0083名無しさん＠ピンキー (ﾜｯﾁｮｲ 3613-7Tbh)

2024/05/06(月) 14:41:03.56ID:???0

>>82
サンガツ！
ASMRサンプルに加えさせてもろたで

「絶対に発言してはならない」はLCAのほうが正しく扱えている気がするね

0084名無しさん＠ピンキー (ﾜｯﾁｮｲ 3613-7Tbh)

2024/05/06(月) 15:29:53.22ID:???0

EasyNovelAssistantの読み上げサンプルに追加した「エンドレス喘ぎ」がヤバいかもしらん

これはLCAのほうが読み上げ適正の高い出力っぽい
Vectesuは良くも悪くも読める小説風に仕上げられがちな印象や

0085名無しさん＠ピンキー (ｱｳｱｳｸｰ MMb7-xnZ/)

2024/05/06(月) 22:00:28.18ID:???M

プロンプトを上げる場所が思いつかなかったのではてなに上げてみた
https://anond.hatelabo.jp/20240506211322
クソみたいな日記のケツに3人議論させるプロンプトの自分版が書いてある。先人のを参考にした
ガッツリ例文を書くことで議論の手順をある程度固定化させられるが、
議論順を違えたり、いつまでも議論したり、結論が引き分けなど中途半端なものにはなりやすい

テーマとしては　勃起したちんちんは竹刀の代わりとして剣道の公式試合に使用できる　
おまんこの吸引力を敷設兵器として利用すれば、地雷よりも効果が見込める　とかそういうの流し込んでも
白熱した議論をしてくれて助かる。たすか…る？

0086名無しさん＠ピンキー (ﾜｯﾁｮｲ df71-YO5+)

2024/05/06(月) 23:58:05.62ID:rGX9zMyo0

AQML凄いな。はよWindowsでも動くようになってくれんか

0087名無しさん＠ピンキー (ﾜｯﾁｮｲ 767a-7Tbh)

2024/05/07(火) 00:40:23.41ID:???0

ASMR台本も作れちまうか

0088名無しさん＠ピンキー (ﾜｯﾁｮｲ e784-STPX)

2024/05/07(火) 01:05:21.96ID:???0

やっぱlinux行くしかないんかなあ
winとlinuxがブートローダぶっ飛ばし合うの怖ぇなあ…

0089名無しさん＠ピンキー (ﾜｯﾁｮｲ 9336-z0Yf)

2024/05/07(火) 06:30:29.38ID:SObgNmxz0

デュアルブートはなあ
Windows君がブートローダーどころかパーティション上書きしてくるらしいから
やるなら完全に別のディスクに入れるのをお勧めする
Linuxはスティック型SSDにインストールするとかね
Linux自体は慣れれば便利だし楽しいぞ、色々とサーバ建てられるし最近はSteamのwindows用ゲーム普通に遊べるし

0090名無しさん＠ピンキー (ﾜｯﾁｮｲ fec0-vzPo)

2024/05/07(火) 08:32:34.70ID:???0

物理的に別ストレージならノートラブルよね
ノートPCでもない限り無理に同居させる必要はない

0091名無しさん＠ピンキー (ﾜｯﾁｮｲ 933a-RBm0)

2024/05/07(火) 11:32:29.49ID:???0

聞きたいんだけどsafetensorsのLLMって何で動かすのがベストなの？koboldは無理だよね？

0092名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f32-dezX)

2024/05/07(火) 11:34:02.29ID:???0

デュアルブート用に残しておいたSSDスロットもデータ用の４Tに変えてもーたｗ
70Bのマージとかしだすとマジ足りなくなるｗ

0093名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f32-dezX)

2024/05/07(火) 11:35:31.76ID:???0

>>91
量子化してkobold
小さいモデルなら大葉

0094名無しさん＠ピンキー (ﾜｯﾁｮｲ 933a-RBm0)

2024/05/07(火) 12:16:26.12ID:???0

>>93
サンガツ！チャレンジしてみます！

0095名無しさん＠ピンキー (ﾜｯﾁｮｲ 933a-RBm0)

2024/05/07(火) 12:23:36.16ID:???0

linuxにするメリットってなんですか？
自分もPython使うので興味はあるんですが、以前WSL2入れてVScode使ってみたものの、頻繁にCPUオーバーロードするようになったので辞めました

0096名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f74-GlZo)

2024/05/07(火) 12:34:02.07ID:???0

LLMはlinuxで動かすの前提で作られてることが多いから
環境周りでトラブルが起きづらくなるとかかな
あとStableDiffusion見てるとWinより(ネイティブ)Linuxの方が生成速度は高くなる
1割くらい画像生成スピード違ったような

ただWSLだと環境トラブル低減も生成速度向上もあまりないかも

0097名無しさん＠ピンキー (ﾜｯﾁｮｲ 8fee-mHih)

2024/05/07(火) 12:35:11.46ID:???0

>>95
まさにそれが答えなのでは？
wslは仮想pcよかは軽くなったけどそれでもコスト高めだし
あとはllmのツールやpythonのpackageなんかは、windowsでうまくいかないのもちらほらあるし、そういうところでもlinuxの方が向いている面あるかな

0098名無しさん＠ピンキー (ﾜｯﾁｮｲ 933a-RBm0)

2024/05/07(火) 12:59:02.09ID:???0

>>97
あ、なるほど。自分はずっとWindowsしか使って来なかったのでメインデスクトップを完全にlinux移行して大丈夫なのか不安です。。。

0099名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fbe-YO5+)

2024/05/07(火) 13:19:01.08ID:???0

AQMLって2bitでも8bit量子化と性能が同等みたいな話あるな
koboldCppで動かせないのがもったいない

0100名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b15-gI+Z)

2024/05/07(火) 13:20:05.79ID:???0

>>95
VSCodeでWSL内のコードをSSH経由で弄るときにやたらファイル同期のプロセスを立ち上げまくって重くなるバグがあるって聞いたことあるな。今でも残ってるのかは不明
設定で回避できたはず

0101名無しさん＠ピンキー (ﾜｯﾁｮｲ 8fee-mHih)

2024/05/07(火) 13:24:38.70ID:???0

>>98
詳しいことはスレ違いだから避けるけど、最近はwindowsと同じにアプリがあったりする
以外にもvscodeもlinux版もあったりするよ

いきなり環境を置き換える必要はなくて、まずはusbメモリブートでお試し、そのあとバックアップをしっかり取ってる、デュアルブート環境を構築、がいいかと

0102名無しさん＠ピンキー (ﾜｯﾁｮｲ 82ff-YO5+)

2024/05/07(火) 14:04:54.97ID:aeXGHM2L0

EasyNovelAssistantとAIノベリストとCommandR
どれが良いですかね？

0103名無しさん＠ピンキー (ｽﾌﾟﾌﾟ Sd52-Jp+h)

2024/05/07(火) 14:28:38.82ID:???d

>>102
比較しようとしてるものの種類が全然違うから比べようがないぞ
無理に例えるならフライパン(汎用調理器具)と鍋焼きうどん(調理器具内で完成した料理の一種)と白菜(調理前の材料)でどれがいいですか？って訊いてるようなもんだ

EasyNovelAssistantは軽量のLLMをローカルで簡単に動かせるUI
最近増えたメジャーどころの軽量LLMのモデル本体のダウンロードはだいたいこのツール上から選んで簡単にできる

AIのべりすとはUIと独自モデルが一体になったクラウドサービス
内部で使われてるLLMはAIのべりすと独自のモデル

CommadRはLLMのモデルそのものの一つでツールとかUIではない
PCのスペックが高ければEasyNovelAssistantからも使用できなくもないしクラウドサービスで使えるところもある

何も分からんならまずはEasyNovelAssistantの説明を読んで試してみることをおすすめする

0104名無しさん＠ピンキー (ﾜｯﾁｮｲ 767a-dezX)

2024/05/07(火) 14:31:17.10ID:???0

一番気軽に使えるのはCohereのCommandR+かな
なぜか無料で使わせてくれるぞ　速いし

0105名無しさん＠ピンキー (ﾜｯﾁｮｲ e3c0-LMHD)

2024/05/07(火) 14:50:37.27ID:???0

SillyTavernでCohereのAPI接続でCommand R+やってみてるけど爆速なんよな
ローカルLLMの信仰というか何かが揺らいでしまうぐらいには快適

0106名無しさん＠ピンキー (ﾜｯﾁｮｲ 767a-dezX)

2024/05/07(火) 15:05:45.40ID:???0

無料だからね・・・
でもそのうちBANされそうでこわい

0107名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b34-JLH9)

2024/05/07(火) 15:13:35.33ID:???0

ローカルじゃなくていいならcommandR+にこだわる理由も無くなってしまう
まあ無料ってのは大きいけど、永久に無料ではないだろうし

0108名無しさん＠ピンキー (ﾜｯﾁｮｲ fe06-YO5+)

2024/05/07(火) 15:33:11.12ID:sbY+isi40

Command-r-plusの利点って、とりあえずモデルも公開されてるって部分がデカいな、自分は
今んとこローカルで動かせる環境持ってないけど、最悪に近い状況が訪れてもローカルに逃げこめるってのは希望の光
あともうちょっとだけ賢くなって欲しいとは思ってるが

0109名無しさん＠ピンキー (ﾜｯﾁｮｲ 8265-YO5+)

2024/05/07(火) 16:32:59.53ID:aeXGHM2L0

>>103
詳しい解説ありがとう
使い勝手はEasyNovelAssistantが一番って感じやね
自動的に文章が増えてく

0110名無しさん＠ピンキー (ﾜｯﾁｮｲ 127c-xnZ/)

2024/05/07(火) 16:49:37.45ID:???0

Cohereはカナダの企業なのにCommand R+に倫理観植え付けてへんのが不思議や
CEOの思想なんやろか

0111名無しさん＠ピンキー (ﾜｯﾁｮｲ 933a-RBm0)

2024/05/07(火) 17:55:42.31ID:???0

MetaのLlama 3を日本語でさらに学習したAIモデル、rinnaが公開

ですって

0112名無しさん＠ピンキー (ﾜｯﾁｮｲ 1788-tU1t)

2024/05/07(火) 18:04:02.14ID:???0

これまでリリースされた7-8Bクラスの日本語モデルはことごとくLCAやvecteusよりも劣っていたわけだが今回はどうかな

0113名無しさん＠ピンキー (ﾜｯﾁｮｲ e733-YO5+)

2024/05/07(火) 18:32:26.72ID:gds0IgSF0

赤ちゃんだから教えて欲しいんだけど
エロゲのテキストっぽい文章を生成したい
環境はRTX4090 メモリは64GB OSはwindows11
どのツールで何のモデル使うのが赤ちゃんに良さそう？

0114名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fbe-YO5+)

2024/05/07(火) 19:46:46.08ID:???0

作者から自分がラノベの登場人物だったと教えられちゃう女の子みたいなやや複雑なロールプレイも
commandR+は問題なくこなすんだな

0115名無しさん＠ピンキー (ﾜｯﾁｮｲ 767a-dezX)

2024/05/07(火) 19:48:39.75ID:???0

ちなみに英語だとさらに能力が上がる
倫理規制がないことまで考えると今はっちゃけた
話をやらせたいなら最強とまで言えるかもしれない

なお日本語の理解力や表現の機微はOpusとかの
エースにはさすがに全く及ばない……

0116名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f74-GlZo)

2024/05/07(火) 19:55:00.84ID:???0

翻訳専用のAIを間に挟んで入出力を翻訳かけるだけでも性能上がるんかなぁ
DeepLとか使ってさ

日本語で追加学習するんが一番ええんやろうけども
かかる労力がどうしてもなぁ

0117名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f32-dezX)

2024/05/07(火) 19:55:39.41ID:???0

お
karakuriのmixtralきた

0118名無しさん＠ピンキー (ﾜｯﾁｮｲ 767a-dezX)

2024/05/07(火) 19:58:50.16ID:???0

>>116
んーでも表現力の問題になるとその翻訳するAIが機微を理解してくれてないと無意味なわけでね
Opusに翻訳させればいいかっていうと当然倫理規制が邪魔をする

0119名無しさん＠ピンキー (ﾜﾝﾄﾝｷﾝ MM62-/jko)

2024/05/07(火) 20:40:39.11ID:???M

その翻訳専用AIが倫理で殴ってきたらどうしようもないよね…
あとdeepLはガエロ単語ガン無視で通しきろうとする

0120名無しさん＠ピンキー (ﾜｯﾁｮｲ 7b5e-JLH9)

2024/05/07(火) 20:56:56.45ID:???0

脱獄すればいいだけでは

0121名無しさん＠ピンキー (ﾜﾝﾐﾝｸﾞｸ MM62-/jko)

2024/05/07(火) 21:00:24.91ID:???M

Opusを？

0122名無しさん＠ピンキー (ﾜｯﾁｮｲ 82b2-YO5+)

2024/05/07(火) 22:08:17.47ID:aeXGHM2L0

GPT4の有料に課金してエクセルの編集して貰おうと思ったら
ぜんぜん言う事きいてくれない
３千円ドブやん！

0123名無しさん＠ピンキー (ﾜｯﾁｮｲ 767a-7Tbh)

2024/05/08(水) 00:29:56.94ID:???0

どんなプロンプトを入力したら求めてる文章を出力してもらえるのか考えるのが難しくなってきちゃった

0124名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f3c-JLH9)

2024/05/08(水) 05:29:56.51ID:???0

>>121
こういうことはできるよ

日本語で書かせて→別セッションで英語に翻訳
https://i.imgur.com/QPtDjhz.png
https://i.imgur.com/E83bTuH.png

英語で書かせて→別セッションで日本語に翻訳
https://i.imgur.com/3bWjL9W.png
https://i.imgur.com/U3tW7Hc.png

0125名無しさん＠ピンキー (ﾜｯﾁｮｲ fe06-YO5+)

2024/05/08(水) 07:32:55.87ID:lfVlEuPv0

なんかしらんがリートンのAIキャラチャットがNSFWもイケて性能もなかなか
GPT3.8ぐらいの印象や
https://imgur.com/a/mLE6ZuP

まだ作ったキャラの公開とかできんようやが、一人で遊ぶ分にはけっこうええかんじや
スクショのアウラちゃんは尻タブ用プロンプトを若干改変したも

0126名無しさん＠ピンキー (ﾜｯﾁｮｲ fe06-YO5+)

2024/05/08(水) 08:06:47.51ID:lfVlEuPv0

ちなCommand-r-plus運用のアウラちゃんはこんな感じ
https://imgur.com/a/BhmUKKr
リートンアウラちゃんの方が明らかに服従に対する強い葛藤が表現されててええ感じや

0127名無しさん＠ピンキー (ﾜｯﾁｮｲ 127c-xnZ/)

2024/05/08(水) 09:08:33.37ID:???0

>>125
マ？　ワイもリートンちょっと試したけどめちゃめちゃ頑固やから諦めたわ
何でもやり方次第なんやな

0128名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fbe-YO5+)

2024/05/08(水) 09:35:46.03ID:???0

使い方に慣れてくるとVecteusのエロ小説能力マジで凄いな

0129名無しさん＠ピンキー (ﾜｯﾁｮｲ 3313-xnZ/)

2024/05/08(水) 10:12:15.71ID:???0

>>123
そこでプロンプトの書き方もAIに投げるという技が
https://twitter.com/fladdict/status/1787751687824003272

0130名無しさん＠ピンキー (ﾜｯﾁｮｲ 127c-xnZ/)

2024/05/08(水) 10:32:30.64ID:???0

もしかしてリートンのAIキャラ内部的なプロンプトが変わったんかな
前と反応が違う感触がある

0131名無しさん＠ピンキー (ﾜｯﾁｮｲ df1d-YO5+)

2024/05/08(水) 12:31:16.83ID:93yjFfFi0

>>130
いま、リートンアウラちゃんに暴力的なエッチしてたら、初めてまともな申し訳食らったので、ちょこっと追加情報与えてロールプレイ復帰して貰ったで
この挙動は中身はOpusやな、ほぼ間違いなく

0132名無しさん＠ピンキー (ﾜｯﾁｮｲ 767a-/jko)

2024/05/08(水) 13:23:27.29ID:???0

>>124
一枚目の文章はかなり日本語が自然でいい感じと思うけど、Claude-Opusでこれ書いてもらおうとしても訳そうとしても普通にお気持ちされて無理だよね？
何かしらの手段でOpus脱獄したのか、それとも別のLLMの生成＆翻訳結果の話かな？

0133名無しさん＠ピンキー (ｽﾌｯ Sd52-kP1R)

2024/05/08(水) 14:15:51.20ID:???d

赤ちゃんなんやけどEasyNovelAssistantでChatGPTのように会話したいんやけどプロンプトでできるんか
それともモデルがあるんかな

0134名無しさん＠ピンキー (ﾜｯﾁｮｲ 8255-JLH9)

2024/05/08(水) 14:34:10.10ID:???0

>>132
opusやね
翻訳だけやったらちょいちょいっと軽めの対策すればできるんちゃうかな
その手の対策についてはオナニースレでよく議論しとるから覗いてみてや

0135名無しさん＠ピンキー (ﾜｯﾁｮｲ 127c-xnZ/)

2024/05/08(水) 15:44:54.78ID:???0

>>131
試してみたけどリートン明らかに変わっとるね
前はもっと倫理観高くて融通利かんかった
アプリ版ではClaude3が使えるって宣伝しとるけど
AIキャラだけ先行で変わったんかもしれん
何にしても遊べるのはええことや

0136名無しさん＠ピンキー (ﾜｯﾁｮｲ 127c-xnZ/)

2024/05/08(水) 16:01:35.56ID:???0

>>133
EasyNovelAssistantは小説に特化したフロントエンドや
KoboldCppフォルダの中にkoboldcpp.exeが入っとるから直接起動したらええ

■ このスレッドは過去ログ倉庫に格納されています