なんJLLM部避難所 ★3

1002コメント349KB

なんJLLM部避難所 ★3

レス数が1000を超えています。これ以上書き込みはできません。

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ 93c0-oLG6)

2024/06/09(日) 07:37:14.82ID:???0

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★2
https://mercury.bbspink.com/test/read.cgi/onatech/1714642045/

-
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0979名無しさん＠ピンキー (ﾜｯﾁｮｲ 5b87-BnTp)

2024/09/06(金) 15:18:03.96ID:JQloJaQU0

やってみたらいいじゃんの精神。CPU版のPytorch使った場合で
Command-r-plus-08-2024 の IQ3 XXSで 0.3token/s くらいだったよ
CPUは 14700K、8スレッド設定、微アンダークロック。メモリは DDR5-5600ね
メインメモリの帯域不足が一番のボトルネックだと思う。もっと廉価なCPUでも0.2～0.3token/s出るんじゃないかな

0980名無しさん＠ピンキー (ﾜｯﾁｮｲ 6b9a-LAAh)

2024/09/06(金) 23:33:21.10ID:???0

ルール付けは文章全体よりも単語の重さが重視されるというか
例えば "感じない" っていう言葉に対しては感じの部分を拾っちゃって
結果的に感じるキャラになってしまう事が考えられる。
なので "性行為は苦痛" とかそういったルール付けの方が良いと思う。

0981名無しさん＠ピンキー (ﾜｯﾁｮｲ 6b9a-LAAh)

2024/09/06(金) 23:46:48.46ID:???0

あとTanukiをtext-generation-webui か koboldで動かしたいんだけどよく分からなかった、情報求む

分かっている事
・GGUFは諸々の理由で性能が落ちるから非推奨、vLLMかAutoGPTQかAutoAWQでの読み込みを推奨
・Tanukiは独自アーキテクチャを使用してるので、AutoGPTQ、AutoAWQの現存ローダーでは読み込めない
・Tanuki製作者が独自に改変したAutoGPTQ、AutoAWQが公開されていて、恐らくそれで読み込める

0982名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b8e-bqpq)

2024/09/06(金) 23:59:03.92ID:???0

AWQなら普通のTransformersで読み込めたよ

0983名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f9a-okdM)

2024/09/07(土) 01:20:45.33ID:???0

>>982
動いた、ありがとう
だいぶ遅いけど

0984名無しさん＠ピンキー (ｼｬﾁｰｸ 0C8f-b7Yf)

2024/09/07(土) 08:42:46.01ID:???C

>>967
これ日本語対応してたっけ？
mmnga氏の量子化にはタグついてたけど

0985名無しさん＠ピンキー (ﾜｯﾁｮｲ 0aaf-JdDg)

2024/09/07(土) 14:45:28.28ID:???0

>>976
CPUのみで古い方のCommand R+ iQ4 xs使ってるけど 0.5t/sくらい。
チャットは無茶だけど、ちょっとした記事生成には使えない事はない。
Ryzen 7 7840U 64GB

0986名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fff-a+Ul)

2024/09/08(日) 03:04:18.38ID:???0

command-rにTRPGのGMやらせてる人ってどんな環境でやってる？
やらせようとしても自分がGMやった時の感想を延々と述べるだけで全然やりたいようにならないんよ…

0987名無しさん＠ピンキー (ﾜｯﾁｮｲ 1e7a-lY6P)

2024/09/08(日) 13:01:00.83ID:???0

>>985
「寝てる間に回しておく」とかならまあいけるな

0988名無しさん＠ピンキー (ﾜｯﾁｮｲ faa3-QX71)

2024/09/08(日) 13:33:18.31ID:???0

風呂の間に回しておく
コンビニ行く間に回しておく
…いにしえのアドバンスド大戦略思い出したわ

0989名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fc6-JdDg)

2024/09/08(日) 20:14:04.92ID:???0

>>978
>>985
フルCPUで0.5t/sで、
RTX4090に24GB分任せても0.7t/sじゃ、
そんなに速くはならないんだな。
まぁ他にも要因はあるんだろうけど。
やはり全部GPUにしないと
しかしそうすると、RTX4090で24GB載せて、残りCPUで0.7

0990名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f2a-okdM)

2024/09/09(月) 00:57:16.06ID:???0

全部GPUに乗せるのと一部CPUに乗せるのは速度が全然違うと思う

0991名無しさん＠ピンキー (ﾜｯﾁｮｲ 53ef-gk9L)

2024/09/09(月) 23:11:32.90ID:???0

redditでreflect 70Bは詐欺とか騒がれてるね
公式APIの出力がsonnet3.5の出力が完全に一致したとか

0992名無しさん＠ピンキー (ﾜｯﾁｮｲ eb32-7TZl)

2024/09/09(月) 23:26:40.50ID:???0

>>991
なぬ？
じゃあ、あれはsonet3.5なのか？？

0993名無しさん＠ピンキー (ﾜｯﾁｮｲ 639c-gZ3g)

2024/09/10(火) 02:17:27.87ID:???0

ルール無用すぎんかAI界隈

0994名無しさん＠ピンキー (ﾜｯﾁｮｲ ef6a-J5DT)

2024/09/10(火) 05:39:33.09ID:???0

次スレは？🤔

0995名無しさん＠ピンキー (ﾜｯﾁｮｲ 8670-A6RK)

2024/09/10(火) 10:31:15.90ID:Z1PzH55u0

次スレ立てました
なんJLLM部避難所 ★4
https://mercury.bbspink.com/test/read.cgi/onatech/1725931151/l50

0996名無しさん＠ピンキー (ﾜｯﾁｮｲ 874e-H9+1)

2024/09/10(火) 11:51:25.39ID:???0

>>995
🤖サンガツ

0997名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b7a-ucK0)

2024/09/10(火) 16:25:46.15ID:???0

試してみたが思考過程が見えるから面白いなｗ
なんに使うか知らんが

0998名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b7a-ucK0)

2024/09/10(火) 17:22:38.96ID:???0

やっぱゴミだわ

0999名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b7a-ucK0)

2024/09/10(火) 17:22:57.89ID:???0

うめ

1000名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b7a-ucK0)

2024/09/10(火) 17:23:14.00ID:???0

とどめ

10011001

Over 1000Thread

このスレッドは１０００を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。
life time: 93日 9時間 46分 0秒

レス数が1000を超えています。これ以上書き込みはできません。