なんJLLM部避難所 ★4

1002コメント310KB

なんJLLM部避難所 ★4

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー

2024/09/10(火) 10:19:11.43ID:Z1PzH55u

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★3
https://mercury.bbspink.com/test/read.cgi/onatech/1717886234

0146名無しさん＠ピンキー

2024/09/20(金) 17:39:56.07ID:???

>>145
koboldcpp-mac-arm64

これがmac版だと思ってたが、違うの？

0147名無しさん＠ピンキー

2024/09/20(金) 18:20:49.20ID:???

違わない

0148名無しさん＠ピンキー

2024/09/20(金) 19:21:37.05ID:???

dockerって素晴らしいな

0149名無しさん＠ピンキー

2024/09/21(土) 20:56:21.45ID:???

silly tavern拡張機能のsummraizeとobjectiveがちゃんと動く条件がやっと分かったので報告
①instructモードをオンにする
②「リクエストごとに1行のみ生成」のチェックを外す
③「不完全な文をトリミング」のチェックも外す

これでkobold接続だろうと何だろうと、ちゃんと動いてくれた

0150名無しさん＠ピンキー

2024/09/21(土) 21:53:35.35ID:???

ここってColabとかpaperspaceみたいなクラウドGPU使って文章生成してる人あんまり多くない感じなのかな
今までchat GPTとかperplexityばっか使ってたからこっちの勝手が全然わからん

0151名無しさん＠ピンキー

2024/09/21(土) 22:17:25.48ID:???

>>150
住人はかなり重複してると思うで
プロンプトのコツとかは共通だし
ローカルの方がモデルの多さやツールの使い方で覚える事多いけど

0152名無しさん＠ピンキー

2024/09/22(日) 02:59:39.64ID:???

>>146
なんか他にソフトが必要なんかな
調べんとや

0153名無しさん＠ピンキー

2024/09/22(日) 08:25:22.52ID:???

>>149
参考になるサンガツ

0154名無しさん＠ピンキー

2024/09/22(日) 09:06:37.28ID:???

>>152
公式ドキュメントにもあるけどchmod +xして実行ファイルにしてやる必要がある
あとうちのMacだとセキュリティに引っかかるから設定変更も必要だった

0155名無しさん＠ピンキー

2024/09/22(日) 13:12:40.44ID:???

Ememeのアーリーアクセス来年の6月に延期か

0156名無しさん＠ピンキー

2024/09/23(月) 14:25:12.54ID:Ullv0ReZ

qwen2.5のuncensored今のところ微妙だ

0157名無しさん＠ピンキー

2024/09/23(月) 21:51:45.84ID:???

>>156
14Bだからじゃない？
72Bのはよ

0158名無しさん＠ピンキー

2024/09/23(月) 21:59:35.34ID:???

>>154
手順が増えているんか

0159名無しさん＠ピンキー

2024/09/24(火) 08:25:58.03ID:Ak0vlxsC

Qwen-2.5-32b-AGIっていう規制をとってしまったモデルがあるらしい
試してないからよくわからんけど

0160名無しさん＠ピンキー

2024/09/24(火) 08:34:40.63ID:???

>>159
ほほーと思ってgensparkさんに教えてもらった
どうも数学とコーディング向けみたいね

https://i.imgur.com/zoBVTOV.jpeg

0161名無しさん＠ピンキー

2024/09/24(火) 10:02:47.41ID:N8W78GVS

https://huggingface.co/AiCloser/Qwen2.5-32B-AGI

First Qwen2.5 32B Finetune, to fix its Hypercensuritis
Hyper means high, and censura means censor, the suffix "-itis" is used to denote inflammation of a particular part or organ of the body.

>>160
嘘と適当だらけで草

0162名無しさん＠ピンキー

2024/09/24(火) 10:30:53.12ID:???

gensparkよく使ってるけどこんな間違いするのか
気をつけて使わねば

0163名無しさん＠ピンキー

2024/09/24(火) 10:43:29.81ID:???

>>161
ほんまや全然違ってて草
これって結局スラングとか使いまくりの悪態ジョークモデルってことなん？

0164名無しさん＠ピンキー

2024/09/24(火) 10:53:03.53ID:N8W78GVS

データセット見るに申し訳回避と英語+中国語の有害要素チューニングがされてる
知らんけど

0165名無しさん＠ピンキー

2024/09/24(火) 11:28:58.43ID:???

AXCXEPT/EZO-Qwen2.5-72B-Instruct

これはどうかな？

0166名無しさん＠ピンキー

2024/09/24(火) 11:35:21.63ID:???

ん？
よく見たら、量子化してないほうがベンチスコア落ちるのは、なんでだってばよ？

0167名無しさん＠ピンキー

2024/09/24(火) 13:28:30.04ID:???

AutoCoTRAGって、どうやって機能すんのかな？
koboldとかでもできるようになるんだろうか？

0168名無しさん＠ピンキー

2024/09/24(火) 19:15:32.26ID:???

ニキらは72Bモデルローカルで使っとるんか？VRAMどんだけ積んでんのよ

0169名無しさん＠ピンキー

2024/09/24(火) 19:18:21.70ID:???

VRAMなにそれ？なワイはメモリ64GでQ5k_mぶん回してるわｗ

0170名無しさん＠ピンキー

2024/09/24(火) 19:43:18.01ID:???

chatbotarenaで投票しまくってるけどo1全然出てこねぇな
今日20回くらいたぶん投票してるけどo1-miniが1回出てきただけだわ
英語のランキングみる限り一応o1-previewも出ては来るみたいだけどとにかく数が少ないみたいね
日本語で順位が付くの相当時間かかりそう

0171名無しさん＠ピンキー

2024/09/24(火) 20:52:26.44ID:+YrxG6s6

メインメモリで運用してるのすげえな。自分じゃ遅すぎて耐えられないわ
DDR5とかだと違ってくるんかな？

0172名無しさん＠ピンキー

2024/09/24(火) 23:49:40.24ID:???

さすがに最上位スレッドリッパーとかならキャッシュとコアの暴力でわりかし早いのは言われとるな

0173名無しさん＠ピンキー

2024/09/25(水) 00:05:13.41ID:6wjZDZqW

上位スリッパならメモリ8chで460GB/s出るし

0174名無しさん＠ピンキー

2024/09/25(水) 00:06:18.32ID:6wjZDZqW

途中送信しちゃったCPU勢はMacなのでは

0175名無しさん＠ピンキー

2024/09/25(水) 00:08:34.62ID:???

o1なんか褒めてるのは驚き屋だけな気がする

0176名無しさん＠ピンキー

2024/09/25(水) 00:22:24.55ID:???

教えてもらったところにあったのから飛んできた
現状はどんな感じですか？ gpt4oと遜色ない？

0177名無しさん＠ピンキー

2024/09/25(水) 07:38:11.19ID:???

o1はチャット用じゃないから。。。
論理重ねるようなタスクじゃないと

0178名無しさん＠ピンキー

2024/09/25(水) 10:51:00.85ID:???

4oで使ってたプロンプトと同じので出力できるのってないんだな

0179名無しさん＠ピンキー

2024/09/25(水) 11:14:55.41ID:???

SF考証とかやらせるとo1は普通にクソ使えるよ
明らかに他とレベル違う

0180名無しさん＠ピンキー

2024/09/25(水) 12:49:25.70ID:???

keitokei1994/EZO-Qwen2.5-32B-Instruct-GGUF
72bもおねげします〜

0181名無しさん＠ピンキー

2024/09/25(水) 14:25:58.74ID:???

どうせ天安門って入れたら消される仕様なんでしょ

0182名無しさん＠ピンキー

2024/09/25(水) 20:46:19.98ID:???

>>181
EZO-Qwen2.5-32B-Instruct-GGUF試してるが
普通に事件の内容教えてくれてるぞｗ

0183名無しさん＠ピンキー

2024/09/25(水) 21:29:35.73ID:???

Poe規制強化入ったの？

0184名無しさん＠ピンキー

2024/09/25(水) 22:11:24.27ID:???

スレ間違えたスマソ

0185名無しさん＠ピンキー

2024/09/25(水) 22:20:36.75ID:OB0WXyOf

こいつテンプレ読まないやつじゃん

0186名無しさん＠ピンキー

2024/09/26(木) 16:12:46.10ID:???

Anthropic公式サイトや検索AIでシコってるガイジは隔離スレいけや

0187名無しさん＠ピンキー

2024/09/26(木) 19:26:24.36ID:???

こっちが荒らしに負けて移住してきたんだぞ
余計な火種を撒くなマヌケ

0188名無しさん＠ピンキー

2024/09/26(木) 19:42:32.27ID:39QaciTi

ほっときゃいいのに燃やすなよ～

0189名無しさん＠ピンキー

2024/09/26(木) 19:59:02.45ID:???

高速高品質ガバガバLLMでシコってる向こうの人らが羨ましくて仕方ないんだろうな

0190名無しさん＠ピンキー

2024/09/26(木) 20:19:57.93ID:???

いや常に規制と戦ってる印象だぞ

0191名無しさん＠ピンキー

2024/09/26(木) 20:40:09.09ID:???

LCA便利すぎ
浦島太郎だったけどモデルの性能爆上がりしててびっくりした

0192名無しさん＠ピンキー

2024/09/26(木) 21:28:56.59ID:???

LCAはあの軽さでなんであんな性能ええねん

0193名無しさん＠ピンキー

2024/09/27(金) 04:47:11.97ID:???

>>190
戦ってるのは初心者…というか過去ログも何も読まないアホだけや
古参も迷惑しとる

0194名無しさん＠ピンキー

2024/09/27(金) 11:31:04.20ID:???

5090のリーク情報によるとVRAM32GBかもしれんみたい
32あったらcommand RとTTS併用しながら3Dモデル動かしても余裕だろなあ

0195名無しさん＠ピンキー

2024/09/27(金) 13:05:15.78ID:???

>>185
すまんの

0196名無しさん＠ピンキー

2024/09/27(金) 13:11:15.67ID:???

70B動かせるニキはこのスレにどんくらいおるんや

0197名無しさん＠ピンキー

2024/09/27(金) 13:18:20.59ID:???

google colabのkoboldcpp、無料だとT4 gpuがつかえるけど、エロ文章に使ったらbanされるとかある？

0198名無しさん＠ピンキー

2024/09/27(金) 15:49:33.22ID:???

mac 64Gだから70BならK4-M(48GByte)がなんとか動く
M4 Ultraはよこい

0199名無しさん＠ピンキー

2024/09/27(金) 15:53:21.45ID:???

AppleはAI用に自社製プロセッサーを開発してすでに使ってるらしいから、mac studioやmac pro用にフィードバックされるといいなぁ、というかしてくれ

0200名無しさん＠ピンキー

2024/09/27(金) 20:38:24.09ID:???

anthracite-org/magnum-v2-72b
１か月も前のモデルだけど、日本語エロがかなりいいわこれ
qwen2ベースだったからノーマークだった

0201名無しさん＠ピンキー

2024/09/28(土) 03:35:01.53ID:???

Llama3.2なんて出てんじゃん
でもあいかわらず日本語やらアジア圏の言語スルーされててかなC

0202名無しさん＠ピンキー

2024/09/28(土) 07:01:08.21ID:???

日本の存在感出さな

0203名無しさん＠ピンキー

2024/09/28(土) 07:52:50.59ID:???

スルーと言うか、単に無差別に学習して最終的に出せる品質に達したかどうかってだけでは

0204名無しさん＠ピンキー

2024/09/28(土) 14:49:43.36ID:???

>>203
そんなわけないやろ…
AIに学習させるデータが勝手に集まって来てくれるとでも思っとるんか？
ある程度は自動化するにしたって低品質なデータとか著作物は除外せなあかんし
どの言語を重点的に学習するかなんて人間の判断や

0205名無しさん＠ピンキー

2024/09/28(土) 15:59:25.52ID:???

著作物除外はいらないよ

0206名無しさん＠ピンキー

2024/09/28(土) 17:26:40.33ID:???

>>204
それだとある程度は日本語も出る理由を説明できへんからな…
学習はしとるんよ
対応と言えるクオリティに達さなかっただけや

0207名無しさん＠ピンキー

2024/09/28(土) 18:26:30.95ID:???

公開されてるデータセットのことだよ

0208名無しさん＠ピンキー

2024/09/29(日) 02:20:13.72ID:JVObfToq

NSFWとかERPで良い感じの男モデルないかな
女性向けにマネタイズしたいんだけど

0209名無しさん＠ピンキー

2024/09/29(日) 10:04:56.47ID:b56/vOOI

2bとか3bの軽いモデルをcpuだけで動かすの、ゲームのNPCとかに
使えるようになってきてはいるんだろうな、という推測

0210名無しさん＠ピンキー

2024/09/29(日) 10:25:22.96ID:???

将来的には対戦型のゲームにAIが搭載されて接待プレイしてくれるようになるだろう

0211名無しさん＠ピンキー

2024/09/29(日) 12:54:11.70ID:???

>>209
できるだろうし最初は同人ゲーあたりからそういうのが出てきそう
ただAIがとんでもないことを口走らないようなセーフティが難しそう
これは私たちが作ったんじゃなくてAIが勝手に暴走したんです！と言い訳しても納得する人ばかりじゃないだろうし

0212名無しさん＠ピンキー

2024/09/29(日) 13:49:49.24ID:FvOumTcQ

Llama3.2の画像認識で遊べないやろか

0213名無しさん＠ピンキー

2024/09/29(日) 13:51:07.79ID:???

EmemeがNPCにLLMを使ったゲームで今月に早期アクセス公開予定だったけど延期してしまった

0214名無しさん＠ピンキー

2024/09/29(日) 13:57:30.67ID:WwWaRXqI

>>211
同人ゲーと言えば、初期の頃chatgptに接続して遊ぶタイプのが出てきてエロ規制が大変だろうな
と思ったけど、ローカルLLMなら規制なんかいらないというか

0215名無しさん＠ピンキー

2024/09/29(日) 14:16:22.21ID:???

セーフティなんか気にしなくていいんじゃないか派

0216名無しさん＠ピンキー

2024/09/29(日) 14:18:37.39ID:WwWaRXqI

>>213
同人の場合、独自の規約を作って（発言の責任は負えないなど）同意できない場合は遊べない仕様にもできるけど
Ememeさんみたいな大手の場合はそうもいかないかな。よくわからないけど

0217名無しさん＠ピンキー

2024/09/29(日) 14:56:26.35ID:???

NSFW描写は男女間のシーンで学習してるせいか、男同士でやっててもすぐに「子宮にぶちまけた」「子宮口につっこんだ」とかなっちちゃう
女同士でもそういうのあるのかな？

0218名無しさん＠ピンキー

2024/09/29(日) 16:25:55.31ID:???

そりゃ指示が適当かモデルがしょぼいかどちらかだろう

0219名無しさん＠ピンキー

2024/09/29(日) 16:35:34.94ID:???

ロリと無理やりやってたらすぐ警察が介入してくる

0220名無しさん＠ピンキー

2024/09/29(日) 16:44:33.08ID:???

女がオナニーしてるのになぜか射精することもあるぞ

0221名無しさん＠ピンキー

2024/09/29(日) 16:53:22.84ID:???

>>215
遊ぶ側は気にしなくても外野が騒ぐと面倒だから

0222名無しさん＠ピンキー

2024/09/29(日) 17:55:18.05ID:???

サイバーエージェントのMistral-Nemoがなんかめっちゃ強いみたいだけど使ったことあるやついる？
存在すら知らなかったわ

https://x.com/aratako_lm/status/1840270470463275396

0223名無しさん＠ピンキー

2024/09/29(日) 18:06:14.85ID:???

強いけどNSFW描写はしてくれない印象

0224名無しさん＠ピンキー

2024/09/29(日) 18:11:28.37ID:OIK778yP

>>219
>>220
同じ板でGPTで検索してみたらええんちゃう？
このスレはプロンプトを貼り付ける外部SNSとかないから不便だよな

0225名無しさん＠ピンキー

2024/09/29(日) 19:21:08.03ID:???

>>222
3pなど複雑なプロンプトも
かなり読んでくれるが
合意ありきで描写は淡白気味
プロンプトを調整すれば
いけるかは知らん

0226名無しさん＠ピンキー

2024/09/29(日) 22:31:09.51ID:Xr6chdo9

Mistral-Nemoは長文に強くていいよ。Q8でも3万トークンの小説読ませて質問に答えさせるくらいはできる
板的な用途には今一つだと思うけどいいモデルだわ

0227名無しさん＠ピンキー

2024/09/30(月) 14:09:49.76ID:???

それって日本語いけるの？

0228名無しさん＠ピンキー

2024/09/30(月) 18:45:43.64ID:???

日本語はおｋ
エロもそこそこは行ける

0229名無しさん＠ピンキー

2024/09/30(月) 20:43:14.06ID:???

>>228
まじかやってみるわ

0230名無しさん＠ピンキー

2024/09/30(月) 21:04:12.41ID:???

もう英語オンリーでも構わんからある程度簡単にインスコできるんを探すんご…

0231名無しさん＠ピンキー

2024/09/30(月) 21:10:48.39ID:???

ソフトウェアのツールでggfuも落とせるのがあったけどどれえあっけな…

0232名無しさん＠ピンキー

2024/09/30(月) 21:13:23.16ID:q2d/XZln

LM studioは楽でいいぞ

0233名無しさん＠ピンキー

2024/09/30(月) 21:13:26.41ID:???

https://lmstudio.ai/
これこれ
本体英語だけどツール上でhuggingfaceからダウンロードできるよ

0234名無しさん＠ピンキー

2024/09/30(月) 21:27:00.33ID:???

>>233
サンクス
Macに対応してんのええな

0235名無しさん＠ピンキー

2024/09/30(月) 21:47:55.16ID:???

LM StudioはHF検索→ダウンロードがお手軽なのはよかったんだけど
チャット画面のテキスト編集がしづらいとかで他のクライアントから
アクセスしてサーバとして使うときにGUIが邪魔だったので最近使ってないな
代わりにOllamaをサーバ起動して(Macだとメニューバーにアイコンだけ表示)
VSCode上の自作拡張からOpenAI APIで繋いで使ってる

0236名無しさん＠ピンキー

2024/10/01(火) 00:38:41.61ID:???

くそしのLLMでも弾かれた

0237名無しさん＠ピンキー

2024/10/01(火) 00:41:45.30ID:???

できたあああ
何だったんだろう？

0238名無しさん＠ピンキー

2024/10/01(火) 11:16:21.09ID:???

spow12/ChatWaifu_22B_v2.0_preview

このモデル、学習データ見ると日本語かなり行けそうなんだけど出先で試せん

0239名無しさん＠ピンキー

2024/10/01(火) 17:49:45.60ID:???

試そうとしたけど22Bは量子化しないとウチでは無理だ…

0240名無しさん＠ピンキー

2024/10/01(火) 17:58:24.50ID:???

量子化あるで。これから試そうとダウンロード中

static quants とweighted/imatrix quantの違いはchatGPTに聞いてもよくわからんかった

https://huggingface.co/mradermacher/ChatWaifu_22B_v2.0_preview-i1-GGUF
https://huggingface.co/mradermacher/ChatWaifu_22B_v2.0_preview-GGUF

0241名無しさん＠ピンキー

2024/10/01(火) 19:37:17.33ID:???

anthracite-org/magnum-v2-72b

↑が日本語エロ素晴らしかったから

mradermacher/magnum-v2-123b-i1-GGUF

こっちも試してみた。
IQ3_XXSだけど、エロいわこれ
こっちはmistralベースだな
magnumの日本語tuneは、かなりエロいみたいだ

0242名無しさん＠ピンキー

2024/10/01(火) 21:54:50.22ID:???

浦島なんだけど4090で動きそうなエロLLMはいま熱いのなんなんだろ…？

0243名無しさん＠ピンキー

2024/10/02(水) 00:47:42.04ID:???

>>240
量子化見落としてたありがとう
で、試してみたけど日本語は一応話せるけど不自然な感じだね

>>242
同じく4090だけど今使ってるのは以下だなあ
calm3-22b-RP
Mistral-Nemo-Japanese-Instruct-2408

0244名無しさん＠ピンキー

2024/10/02(水) 01:22:09.55ID:???

>>243
サンガツ！

0245名無しさん＠ピンキー

2024/10/02(水) 06:25:16.13ID:???

>>243
ワイも片言な日本語でいまいちやった。
小さいモデルだと日本語特化で学習してないと厳しいんだろうな

■ このスレッドは過去ログ倉庫に格納されています