なんJLLM部避難所 ★3

1002コメント349KB

なんJLLM部避難所 ★3

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ 93c0-oLG6)

2024/06/09(日) 07:37:14.82ID:???0

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★2
https://mercury.bbspink.com/test/read.cgi/onatech/1714642045/

-
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0488名無しさん＠ピンキー (ｽｯｯﾌﾟ Sdaa-fDgB)

2024/07/16(火) 08:00:46.57ID:???d

差分は面倒なのでSDで1枚絵だけ作ってる

0489名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-urh9)

2024/07/16(火) 08:01:49.92ID:???0

5070はVRAM 12GBみたいだし5080以上は高くて手が出しにくいから
3080 10GBから4070 ti superに換装しようと思ってるんだけどやっぱり迷うな
7Bを使えるようになったらだいぶ変わるんだろうか

0490名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a20-gu6S)

2024/07/16(火) 08:10:56.22ID:???0

>>489
7BモデルQ8+SBV2読み上げ+sillyの3Dモデル表示でVRAM15~16GB食ってる感じやで

0491名無しさん＠ピンキー (ﾜｯﾁｮｲ ffde-8Vzh)

2024/07/16(火) 11:45:04.75ID:???0

傷だらけのLORA～

0492名無しさん＠ピンキー (ﾜｯﾁｮｲ 6a36-rbI2)

2024/07/16(火) 12:25:16.61ID:???0

>>485
公式で何キャラか配布してなかったかな？
女化学者みたいな立ち絵を白衣のと全裸のを落とした覚えがある

0493名無しさん＠ピンキー (ﾜｯﾁｮｲ 1a25-yQBO)

2024/07/16(火) 12:50:55.38ID:???0

sillyの専用スレってある？

0494名無しさん＠ピンキー (ﾜｯﾁｮｲ 8e14-aXFj)

2024/07/16(火) 17:55:25.19ID:nkLqJhH+0

anthropicって結構いい感じだけど、すぐ会話続けられなくなっちゃうな
chatGPTは同じ会話の中で無限にずっと続けられるのに
APIで動かせばこの制限なくなるのかな

0495名無しさん＠ピンキー (ﾜｯﾁｮｲ e323-ZeM8)

2024/07/16(火) 18:02:37.32ID:???0

「会話続けられなくなる」とは？？
そんな経験ないけど…

0496名無しさん＠ピンキー (ﾜｯﾁｮｲ 07b5-TzXM)

2024/07/16(火) 21:37:13.63ID:???0

セッションごとのトークン数制限に達しましたってやつ？

0497名無しさん＠ピンキー (ﾜｯﾁｮｲ 8e14-aXFj)

2024/07/16(火) 23:01:52.88ID:nkLqJhH+0

https://i.imgur.com/BoY7CtV.jpeg
こういうやつ
課金すれば制限なくなるけど主目的がNSFWだから気乗りしない
だからこのスレにいるわけだけど

0498名無しさん＠ピンキー (ﾜｯﾁｮｲ 8e14-aXFj)

2024/07/16(火) 23:19:42.66ID:nkLqJhH+0

>>496
それ

やっぱclaudeは頭の良さがダンチだな
ローカルでこのレベルが動けば良いのに

0499名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a10-17sR)

2024/07/17(水) 04:51:18.48ID:???0

無課金でセッション延々続けたいなら本家よりPoeの方がいいんじゃないの
ChatGPTでオナニースレの方が向いてる話題だと思うけど

0500名無しさん＠ピンキー (ﾜｯﾁｮｲ 0786-4dff)

2024/07/17(水) 08:25:31.44ID:???0

完全にスレチだけど少しでも安くあげるならソフバン系の回線を一ヶ月だけ契約してperplexityの1年無料を貰うのが吉

0501名無しさん＠ピンキー (ﾜｯﾁｮｲ ffa5-8Vzh)

2024/07/17(水) 09:13:17.65ID:???0

(´・ω・`)ソフバンか。。。

0502名無しさん＠ピンキー (ﾜｯﾁｮｲ 1adb-ZeM8)

2024/07/17(水) 10:45:43.49ID:???0

エロ目的だと課金に気乗りしないの意味がよくわからん
BANされるかもみたいな話？
オナニースレでもほとんど報告ないし万が一されても返金されるから気にする必要ないぞ

0503名無しさん＠ピンキー (ﾜｯﾁｮｲ 0ac9-Dhm2)

2024/07/17(水) 10:52:38.36ID:???0

API使えよ

0504名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-urh9)

2024/07/17(水) 10:57:10.60ID:???0

今までオリキャラだけでやってたけどchub.aiでキャラクターカード落としてみたらすごくよく出来てるな
ハーレムチャットもまともに機能してるわ

0505名無しさん＠ピンキー (ｼｬﾁｰｸ 0C0f-TjJb)

2024/07/17(水) 11:14:50.34ID:???C

>>500
ソフバンだけどエロやりすぎたらバンされるかな？

0506名無しさん＠ピンキー (ﾜｯﾁｮｲ 2b4e-gu6S)

2024/07/17(水) 11:18:12.96ID:???0

>>504
そこいいよね
上で表情差分画像の話が出てたけど、そのサイトは表情差分付きって条件で絞って検索出来るから捗る
画像だけ拝借して別キャラに使い回しても良いわけで

0507名無しさん＠ピンキー (ﾜｯﾁｮｲ 1adb-ZeM8)

2024/07/17(水) 11:22:59.50ID:???0

>>505
perplexityではまずされない
自分はperplexityで◯リ調教とか日常的にやってるけど平気だしオナニースレでもperplexityBANされたなんて報告は一度もない
とはいえいつかお咎めが来る可能性はあるのでそこは自己責任で
というかお咎めが行くとしたらまずanthropicからperplexityに向けて行くんだけどね
そこからさらに個人やソフバンに行く可能性はなくもない

0508名無しさん＠ピンキー (ﾜｯﾁｮｲ ff32-Xuj+)

2024/07/17(水) 14:00:24.85ID:???0

sillyはフロントエンドでしかないってのは上記で言われてる通りだけど
silly自体が多機能過ぎて語るべき事が多いんだよな、繋ぐだけならその辺に情報はあるとはいえ
ちなみに日本語モデルだと表情切り替えちゃんと機能してない気がするけどどう？文章に関係なく笑顔になるとか
英文モデルを自動翻訳に通す使い方だと多分正確な表情出てる

0509名無しさん＠ピンキー (ﾜｯﾁｮｲ ff32-Xuj+)

2024/07/17(水) 14:11:02.20ID:???0

あと表情差分は確かに多少自動化して作れた方がありがたい気はする、comfyUIでワークフロー組んだら作れないかな
立ち絵用意して、背景透明化ぐらいは人間の力入れて
comfyUIのimg2imgで顔部分マスクして、目の色の情報だけ全共通で入れて、いくつかの表情差分をワンボタンで量産する所までは思い付いた

0510名無しさん＠ピンキー (ﾜｯﾁｮｲ 2b92-gu6S)

2024/07/17(水) 14:58:54.94ID:???0

SBV2についても色々語りたい事多いんや
チュパ音モデル公開してくれたから、まずお気にのモデルとマージして大量にチュパ台詞を読み上げ、WAVで保存
このWAVをお気にの音声素材に追加して学習すれば通常会話とチュパ台詞を両立させたモデルが作れるんとちゃう？と閃いたんやが結果は微妙やった
チュパ時の喘ぎ声は上手く追加出来たものの、チュパ音がほぼ聞こえないくらい小さくなったり派手に音割れしたりでおかしくなってまう

0511名無しさん＠ピンキー (ﾜｯﾁｮｲ 0758-8qQ8)

2024/07/17(水) 15:04:01.79ID:???0

silly tavernのworld info やvector strageを使いこなすのはユーザーにも温度が必要だな

0512名無しさん＠ピンキー (ﾜｯﾁｮｲ 0717-urh9)

2024/07/17(水) 15:14:05.57ID:uvhJPCNY0

>>510
チュパ音モデルとのマージでチュパセリフ行けるか？
ワイも試したけど、うまく行かんかったな…
通常のマージよな？

0513名無しさん＠ピンキー (ﾜｯﾁｮｲ 2b31-gu6S)

2024/07/17(水) 15:42:38.36ID:???0

>>512
通常マージやで
それも微妙なとこで、声質0.5の他全部チュパモデルのままって配合で精一杯やった
それ以上お目当てモデル側に寄せると音がおかしくなる
ささやき声でも似たような感じやったしSBV2のマージって思ったより自由度が低い感覚だわ

0514名無しさん＠ピンキー (ﾜｯﾁｮｲ 0780-urh9)

2024/07/17(水) 16:11:31.07ID:uvhJPCNY0

>>513
あー理解した、マージの時点であかんかったという話か
ささやきマージうまく行かんかったとこも一緒や

通常会話と喘ぎ声の同居まではそこそこ何とかなるけど、チュパ音語同居はやっぱりちと厳しそうやな…

0515名無しさん＠ピンキー (ﾜｯﾁｮｲ 2ba0-4dff)

2024/07/18(木) 01:47:08.29ID:???0

>>508
つい最近silly知ってモデルはninja-v1RPでやってみたけど確かに表情はあんまり切り替えてくれない。
自分の環境だと大体caringになる。

立ち絵はDiffRepromっていう差分画像を生成するA1111拡張がこの用途に適してると思う。
変えたい領域をプロンプト(表情なら目・眉・顔)を指定するとその領域を検知して差分画像を生成してくれる。
背景透過はtransparent-backgroundでフォルダごと投げれば一括で処理してくれてます。

0516名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a8e-ZeM8)

2024/07/18(木) 05:55:55.61ID:???0

こういうのに向いてる拡張あったよなあーと思ってたけど、そうだ、diffrepromだ
ありがとう

0517名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-urh9)

2024/07/18(木) 05:56:29.74ID:XiQ9ntNl0

尻タブで使う画像の解像度ってトークン数に影響するの？
koboldだと解像度が影響するってどこかのモデルに書いてあったんだけど尻タブはどうなのか

0518名無しさん＠ピンキー (ﾜｯﾁｮｲ 0780-urh9)

2024/07/18(木) 10:13:58.56ID:5V/aR5gj0

マルチモーダルで使う画像の話なら、バックエンドとフロントエンドに関して理解してない部分があるんとちゃうか？
尻タブはマルチモーダルとは関係なく、立ち絵や背景にも画像使えるがそっちの話なら関係ないで

0519名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a8e-ZeM8)

2024/07/18(木) 10:23:44.94ID:???0

>>517
モデルに読み込ませる画像という意味ならそりゃ大きいほどトークン食うでしょ
Sillytavernで表示させる画像という意味ならただのUIの話だからトークンとか関係ないぞ

0520名無しさん＠ピンキー (ﾜｯﾁｮｲ 8e21-4dff)

2024/07/18(木) 10:54:38.63ID:???0

>>508
英文じゃないと感情判定ができないっぽい
Translate text to English before classificationにチェックを入れると
APIで自動翻訳させた英文を通すようになるから日本語モデルでも表情出るはず

0521名無しさん＠ピンキー (ﾜｯﾁｮｲ fffe-Xuj+)

2024/07/18(木) 13:20:51.36ID:???0

>>520
教えてくれてありがとう
確かに表情機能のとこにチェックボックスがあった
表情分類AIに投げる文章を英訳してくれる機能やね

0522名無しさん＠ピンキー (ﾜｯﾁｮｲ 0bbe-urh9)

2024/07/18(木) 14:57:34.89ID:???0

commandR+に慣れるとoppusとか規制酷過ぎて頭おかしくなるわ、脱獄しないと何もまともに出力しない

0523名無しさん＠ピンキー (ﾜｯﾁｮｲ e321-daXG)

2024/07/18(木) 15:13:31.34ID:7oQKjOiW0

規制の少なさ
Command R plus>>>>>Claude>>GPT4>>>>>Gemini だな
ところでグーグルのvertex AIでCommand R plusとかのファインチューニングってできるのかね？最近存在知ったからやれることよく分かってないが

0524名無しさん＠ピンキー (ﾜｯﾁｮｲ 469b-ZeM8)

2024/07/18(木) 15:55:59.55ID:???0

なんで規制なんて相手にするかな
何も考えずに脱獄文放り込めば4oまではほぼ無規制になるのに

0525名無しさん＠ピンキー (ﾜｯﾁｮｲ 2fc7-8IuK)

2024/07/19(金) 03:19:31.11ID:???0

版権キャラローラしてチャットしたら「理想のキャラ押し付けるな」みたいな反応が来たがどうしてもデータが偏る

0526名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-urh9)

2024/07/19(金) 09:05:44.48ID:???0

>>518-519
あーなるほどそういうことか
画像を読み込んでプロンプトを出力させるようなモデルだと画像の解像度とかが問題になる場合があるわけね
尻タブの立ち絵とかアイコンの解像度をどうしようか考えてただけだから
気にせずデカい画像使うわ

0527名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr23-gbio)

2024/07/19(金) 11:35:11.50ID:???r

なんUにあった本スレがスクリプトで落ちたけど一応立て直すか？

0528名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾘ Sp23-TjJb)

2024/07/19(金) 12:29:00.58ID:???p

今立ててもすぐ潰されそうやなぁ( ；∀；)

0529名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a74-3Cn0)

2024/07/19(金) 13:20:03.93ID:???0

このスレへの誘導のリンクだけ貼っとけばええんでない？
どんぐりLv4とかにしちゃってもいいかもしれない

0530名無しさん＠ピンキー (ﾜｯﾁｮｲ 2f95-4dff)

2024/07/19(金) 14:52:34.62ID:???0

全員こっちに移動して誰もいないんやから本スレはもうこっちやないの

0531名無しさん＠ピンキー (ｽﾌﾟﾌﾟ Sdaa-vJcf)

2024/07/19(金) 16:32:35.92ID:???d

どんぐりレベル4強制表示で立ててここへの誘導貼っとくに一票

0532名無しさん＠ピンキー (ﾜｯﾁｮｲ e387-aXFj)

2024/07/19(金) 17:11:28.37ID:SnWdQ7Z20

Mistral NeMoってのが出たけどどんな感じだろ

0533名無しさん＠ピンキー (ﾜｯﾁｮｲ 6a0c-urh9)

2024/07/19(金) 18:16:14.54ID:T7ONqz8t0

Mistral-Nemo試したいんだけどkoboldでもollamaでも動かないんだよなあ

0534名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr23-wTuR)

2024/07/19(金) 18:23:37.23ID:???r

llama.cppで変換できなかった

0535名無しさん＠ピンキー (ﾜｯﾁｮｲ 6b32-Ru/f)

2024/07/19(金) 23:11:39.31ID:???0

pfnet/Llama3-Preferred-MedSwallow-70B

llama3 swallowに、医学知識学習させたモデルで、あまり期待してなかったけど、
なんか、いいぞこれ
llama3ともswallowとも違う　普通にエロいｗ（脱獄不要）
文字欠け等の気になる点はあるけど、（量子化のせいか？）なんか、ベクトルが違うんだわ

まあ、最近のllama3-swallowにがっかりした分、よけいに出来が良く見えるんだが・・・
mmnga氏が量子化出してくれてるから、すぐ試せるで。ワイはQ5K_Mで試した。

0536名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-G/Qc)

2024/07/20(土) 08:51:19.45ID:???0

いい加減VRAM64GBくらい積んだGPUどっか出してくれないとなぁ
AMDはどうせ業務用作ってないんだからNvidiaに嫌がらせする意味でもそういうの出してくれよ

0537名無しさん＠ピンキー (ﾜｯﾁｮｲ bb5a-XX+G)

2024/07/20(土) 11:46:43.78ID:???0

AIバブル弾けない限り無理
一応AMDは次世代APUはLPDDRXを内蔵多チャネル接続して広帯域にしたやつを
64だか128ぐらいまでは積むよみたいな事言ってる

0538名無しさん＠ピンキー (ﾜｯﾁｮｲ 2b76-Ydgy)

2024/07/20(土) 11:48:56.81ID:a9PC+EpH0

AMDはソフトウェア周りがNVIDIAと比べて弱すぎて話にならん

0539名無しさん＠ピンキー (ﾜｯﾁｮｲ bb5a-XX+G)

2024/07/20(土) 11:52:55.96ID:???0

rocmがやる気なさすぎてnvidiaが独禁扱いされないように公開するやつのおこぼれ食ったりとか
ライセンス違反上等の暗黒パワーのZLUDA使う現状が情けない

0540名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f7a-DLab)

2024/07/20(土) 12:20:29.98ID:???0

NPUとかVRAM後乗せサクサクのやつが発展する方に期待しとく

0541名無しさん＠ピンキー (ﾜｯﾁｮｲ 2b6f-VXyX)

2024/07/20(土) 13:44:52.12ID:???0

VRAM後載せは期待しない方がいい
高速なメモリほど後載せできないから、後載せできるシステムは帯域が狭くなる
推論は帯域が大事なので遅いメモリを後載せできても嬉しくない

0542名無しさん＠ピンキー (ﾜｯﾁｮｲ 2be5-3SVq)

2024/07/20(土) 16:16:00.68ID:???0

うえの方でだれか言ってた普通の時は普通の会話で、突然エロくなってまた普通に戻るみたいなの、
cohereのcommand-r-plusで普通にできるけど、もう解決ずみかな
プロンプトにほんの少しだけエロの設定が必要だけど

0543名無しさん＠ピンキー (ﾜｯﾁｮｲ df17-35Um)

2024/07/20(土) 16:52:04.94ID:???0

だってLLMは入力も出力も屁みたいなデータ量だもん
マシンパワーの効率は誰がどう考えても一極集中のほうが良い

0544名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f04-8WH3)

2024/07/20(土) 17:52:47.15ID:???0

どうしてこうLLM=ローカルと誤解している人が多いんだ

0545名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fef-JWDL)

2024/07/20(土) 19:02:44.54ID:???0

lをLocalやと思ってしまったんやろなあ

0546名無しさん＠ピンキー (ﾜｯﾁｮｲ df52-DpAb)

2024/07/20(土) 19:04:22.08ID:???0

Local Language Modelsか

0547名無しさん＠ピンキー (ｽｯｯﾌﾟ Sd7f-yWQ+)

2024/07/20(土) 19:41:00.70ID:???d

け、め？だ

0548名無しさん＠ピンキー (JP 0Hdf-3SVq)

2024/07/20(土) 20:11:55.17ID:Wfa8J/rBH

5090でcommand-r-plus乗せられるようになるだろか(´･ω･｀)

0549名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f5d-DLab)

2024/07/20(土) 20:41:25.08ID:???0

80GBくらい必要なんでしょ？
無理ゲー

0550名無しさん＠ピンキー (ﾜｯﾁｮｲ fb7e-RMyG)

2024/07/20(土) 21:51:15.67ID:???0

cohereのCEOがcommandシリーズの日本語対応を重視するって言ってるな

0551名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b3d-TapC)

2024/07/20(土) 22:33:20.41ID:TXaeG/Gy0

日本人が多く使ってるのかな？
高レベルのエロ文章目当ての変態が多そうだが
そういや日本語特化モデルのカラクリての最近知ったけどお試し使用できる場所ないから性能謎だな

0552名無しさん＠ピンキー (ﾜｯﾁｮｲ 2be5-3SVq)

2024/07/20(土) 22:42:49.76ID:???0

542だけどapiの話ね。語弊があったようですみません
ちなみに何か月か前に登録してからまだトライアルのままだな（最初に5ドル分くらいもらえる）
結構、使ったのに。

0553名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-oq5P)

2024/07/20(土) 23:43:08.63ID:???0

>>551
自分的にはkarakuri70bは日本語モデルの中ではダントツ
エロ小説もなりきりチャットも高レベル
マージモデルもいい

0554名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f09-Z7fG)

2024/07/21(日) 00:16:10.77ID:???0

4090で普通に動く一番おすすめのLLMって何だろ？

0555名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f9f-V2rD)

2024/07/21(日) 00:47:19.36ID:???0

>>554
健全な用途ならgemma2 27b Q5かな vram24GBに収まる範囲では日本語性能ダンチ

0556名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f5d-DLab)

2024/07/21(日) 01:04:49.37ID:???0

エロが得意な14B前後くらいのモデルって無いんかな
それくらいならsilly tavernで読み上げながら使っても24GB以内に収まりそうなんだけど

0557名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b7c-fado)

2024/07/21(日) 02:17:50.83ID:n5P3y1pp0

>>548
ローカルで動作させる事の有無はおいといて、command-R+は実質mac一択
PCだとバス幅(PC64bit。mac512bit)やアクセスチャンネル数(2-4ch、mac 8ch)が
少なすぎるし改善の見込みもない(ATXとDDRじゃ無理)
AppleはMにした時ここに大幅に手をいれた
その代わりRAMの交換とかできなくなった
ただこれはインテル時代もそうだったからユーザーは慣れてるのかも

0558名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b63-G/Qc)

2024/07/21(日) 05:54:03.04ID:nICSglqJ0

不健全な用途です！！！

0559名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-G/Qc)

2024/07/21(日) 08:55:37.01ID:???0

GDDRなんて4GBが数千円の原価なんだからいくらでも最初から組み込めるだろうに
どこのメーカも異様な利益率のえぐい商売してるよなぁ

0560名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f55-MkDR)

2024/07/21(日) 09:55:51.88ID:???0

油断すると即転がり落ちるからしゃーないで
開発費もうなぎ登りなんやし

0561名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b8b-V2rD)

2024/07/21(日) 11:23:53.79ID:yxK3IHYk0

>>548
5090を1枚買う価格(40万？)で
4060Tiか3090の中古を複数枚揃えたらいける

0562名無しさん＠ピンキー (ﾜｯﾁｮｲ bb5a-XX+G)

2024/07/21(日) 12:16:16.59ID:???0

AIバブル終わった瞬間平身低頭して過剰在庫処理のVRAM128GBモデルとか売ってくるんやろか

0563名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f9f-V2rD)

2024/07/21(日) 12:40:48.05ID:???0

A100がお手頃価格になれば2本刺しでも300Bクラスまでは射程に入るからローカルLLMはバブル崩壊後が本番やな

0564名無しさん＠ピンキー (ｼｬﾁｰｸ 0Cdf-oq5P)

2024/07/21(日) 14:00:25.47ID:???C

pfnet/Llama3-Preferred-MedSwallow-70B
なるほど分かったぞ
年齢や局部の描写で規制かけたら医学用途に使えないって事かっw
こいつは捗る(*ﾟ∀ﾟ*)

0565名無しさん＠ピンキー (ﾜｯﾁｮｲ bba0-TapC)

2024/07/21(日) 14:05:27.11ID:???0

>>553
良いこと聞いた
70b使ってるってことはローカルじゃないよね？グーグルクラウドとか使ってやってる？

0566名無しさん＠ピンキー (ｼｬﾁｰｸ 0Cdf-oq5P)

2024/07/21(日) 14:36:53.46ID:???C

>>565
すまんローカル
小説作成なら70bの遅さでも耐えられるようになったんだわ(*´ω`*)

0567名無しさん＠ピンキー (ﾜｯﾁｮｲ bba0-TapC)

2024/07/21(日) 16:58:08.56ID:9WdbabI50

>>566
スゲー　遅くても動かせてるのがすごい

0568名無しさん＠ピンキー (ﾜｯﾁｮｲ 3bc0-8WH3)

2024/07/21(日) 17:46:17.28ID:???0

メモリ64GB積めば誰でもできるぞ
なお速度

0569名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b86-40Y5)

2024/07/21(日) 17:52:16.47ID:BtuxjxIZ0

昨日初めて導入したけどまだAIのべりすとより使いこなせへんわ
Uのスレがちょうど消えとって探すの苦労したわ

0570名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f07-Nv8D)

2024/07/22(月) 08:39:17.86ID:???0

64GBあればフルCPUでcommand-R+ Q4でも動くしな。
まぁ流石に遅いので、無印command-Rに下書きさせて、R+に清書させると効率がいい。

0571名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-G/Qc)

2024/07/22(月) 13:45:27.69ID:???0

RTX4000シリーズに数か月で大幅に性能低下する欠陥が発覚
共通して使用されてるグリスが原因だから殆どのメーカが巻き込まれるとのこと

0572名無しさん＠ピンキー (ﾜｯﾁｮｲ df0b-h671)

2024/07/22(月) 13:54:22.07ID:???0

hbmに頼らない設計てできないの？
普通のメモリなら512gbでもいけるのに

0573名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b58-fado)

2024/07/22(月) 14:15:08.37ID:/3lGviXt0

HBMはDDRの5〜20倍くらい転送速度が稼げる
LLMはとにかくメモリーの速度を要求する
mac(max以上)はDDRであってもコントローラー2倍積んでる特別仕様
ただHBMは物理的にローハンマー攻撃に弱いので実行用のメモリーとして使いづらい
マルチCPUでLLM動作させるとCPUが割と暇になってしまう
これはメモリーの出し入れ待ちな為

0574名無しさん＠ピンキー (ﾜｯﾁｮｲ df0b-h671)

2024/07/22(月) 16:33:01.58ID:???0

ありがとう
そっかー(´・ω・`)

0575名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f74-1Aj4)

2024/07/22(月) 20:08:28.50ID:???0

普通にGDDRでいいから48GBの4090とかでてくれたらねぇ・・・
4090にモデル収まれば20token/sとか出るし
実用上10token/sも出れば目で追えないくらい早いだろうから性能的にはもう十分なんだよな

まぁそれが6000Adaですって話なんかも知らんけど
なお値段

0576名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-srET)

2024/07/22(月) 21:50:41.98ID:???0

adaでなければなんとか

0577名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc5-G/Qc)

2024/07/22(月) 23:13:55.05ID:LhChVRuW0

llama.cppがMistral-Nemoに対応したからちょっと使ってみたけど表現規制とかはなさそうだね
というかちょっと口説いたら銃の作り方も教えてくれるから論理観ガバガバかも？

0578名無しさん＠ピンキー (ﾜｯﾁｮｲ 2b58-Ydgy)

2024/07/23(火) 12:22:32.48ID:???0

Calm3試してる人いる？めっちゃ性能は良いみたいだけどエロはどうなのか気になる

0579名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b08-DLab)

2024/07/23(火) 12:35:36.02ID:???0

calm3の22B chat、まともに動かないや
暫定版って事が関係してるのかもしれんけど
gemma2 27Bの方が圧倒的にサクサク動く

0580名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-G/Qc)

2024/07/23(火) 13:50:24.56ID:???0

Claude3.5 sonnetって70Bであの性能なんだよな
そのうちローカル実行可能なモデルがsonnetの性能に追い付き追い越すようになったら
小説の世界でも人間は駆逐されるね

0581名無しさん＠ピンキー (ﾜｯﾁｮｲ abf8-32+k)

2024/07/23(火) 14:12:27.94ID:B0KOMJMy0

ローカルである必要は？

0582名無しさん＠ピンキー (ﾜｯﾁｮｲ fb32-G/Qc)

2024/07/23(火) 14:30:50.35ID:???0

AIを上手く使える人間が台頭するだけだろ

0583名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-srET)

2024/07/23(火) 14:45:00.23ID:???0

>>581
こんなヤヴァイプロンプト、ローカル以外で使えるわけないやろ

0584名無しさん＠ピンキー (ﾜｯﾁｮｲ 4fc6-pSzm)

2024/07/23(火) 14:47:16.37ID:???0

>>581
API料金が高いから
現状のAIビジネスが成功しないのはAPI料金が高すぎるんだよ

0585名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-G/Qc)

2024/07/23(火) 14:52:40.66ID:???0

>>583
大手のチャットログが個人情報と紐づいて流出したらとんでもないことになるやろうなｗ
絶対ハッカーグループは狙ってると思うわ

0586名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f30-XTc+)

2024/07/23(火) 15:49:08.64ID:hb4CmLgU0

3.5 sonnetが70Bってどこ情報なん

0587名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f8e-srET)

2024/07/23(火) 16:23:33.85ID:???0

APIはむしろ安くないか
ビジネス用途ならGPT-4oとか安すぎるくらいだ
ローカル使いたいのは検閲とかされたくないしNSFWなんでもアリなチャットしたいってのが大きい

0588名無しさん＠ピンキー (ﾜｯﾁｮｲ 4fc6-pSzm)

2024/07/23(火) 16:50:23.89ID:???0

>>587
クソたけえよ
個人や企業内用途ならまだしも
不特定多数がアクセスして使わせるなら現状の価格では成り立たん

■ このスレッドは過去ログ倉庫に格納されています