なんJLLM部 避難所 ★6
レス数が1000を超えています。これ以上書き込みはできません。
0001名無しさん@ピンキー2025/02/13(木) 21:16:02.49ID:KkRdf1Mm
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC(できれば+3060 12GB以上)でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部 避難所 ★5
https://mercury.bbspink.com/test/read.cgi/onatech/1735186391/
0975名無しさん@ピンキー2025/03/22(土) 08:17:32.48ID:???
>>974
ああっcmd上でやっちまった!
根本的に間違えとったでごわす、すまんやでそしてありがとうやで
llamacppはDLすらしとらんかった
Vramは24、Dramは128や

そんでllamacppで調べたら全部コマンドラインなんかこれ……
GUIが欲しいわ!GUIを見せて頂戴!

qwq-32b-q4_k_mで例文を書く作業に戻るンゴ
0978名無しさん@ピンキー2025/03/22(土) 09:06:26.64ID:???
>>977
ちゃうちゃう
>>793
こっちや
あとそんだけメモリあるならq8_0いったらんかいw
それとmagnum 123bもかなりええで
0979名無しさん@ピンキー2025/03/22(土) 09:44:35.27ID:???
モデルによって違うかもしれんけど、キャラクターカードに
「セックスが大好き」「淫乱」とか入れるとAIの方から求めてくるエロキャラになるから
カードを作り込めば接待もできそうではある
0981名無しさん@ピンキー2025/03/22(土) 10:38:59.57ID:???
>>980
同じ人のところに
mradermacher/c4ai-command-a-03-2025-GGUF
ってi1がついてない方にQ8はあるで
magnum123bも同じ人がアップしてくれてる
この人はcmdで結合できる形式でアップしてくれるからいつも利用してるわ
ただアップ量多すぎて探しにくいから
名前とモデル名で検索かけんと見つけにくいw
0982名無しさん@ピンキー2025/03/22(土) 13:52:55.35ID:???
>>981
大いにサンガツやで
いまc4ai-command-a-03-2025.i1-Q6_K.gguf 88G読み込めたわ
メモリ111G使っとるわ……ブラウザ複数でタブ開いとるとQ6がギリやね

「紅茶の茶葉の種類おしえて」って聞いたら
5分くらいでも(512 / 1982 tokens)だわ
もう眠くなってきたんやけど……寝るわ……
アドバイスくれた二キありがとやで!
0985名無しさん@ピンキー2025/03/22(土) 21:22:50.03ID:12vzIl0e
文章打つのめんどくさいからTRPG方式にして
1
とかしか返信しないワイ低みの見物
0986名無しさん@ピンキー2025/03/22(土) 22:31:40.63ID:???
5080に48GB搭載した奴で値段90〜100万
5090に96GB搭載した奴がアリバイ価格143万、実売推定180~200万
そう考えると150万ほどのM3 512GBはかなり優秀よな
0987名無しさん@ピンキー2025/03/22(土) 23:25:09.36ID:???
>>984
画像はLoraとかのメモリいる処理をmacでやって
生成は速度重視でwinでやろうと思ってる
0988名無しさん@ピンキー2025/03/23(日) 06:22:46.68ID:???
c4ai-command-a-03-2025.i1-Q6_K.gguf やってみたで
確かに賢い、27Bあたりとは核が違う感じ

遅いのだけが悔しいンゴ
リアルタイムでの会話を楽しむのは無理やね
なるほどこれは速いマシンが欲しくなるわ
0990名無しさん@ピンキー2025/03/23(日) 08:02:03.14ID:???
150万出す気があるんだったらGPU借りた方が良いような気もする
安いところだったら丸280日分あるから毎日2時間遊ぶとしておよそ9年分
もちろん価格が上がる可能性はあるが
0991名無しさん@ピンキー2025/03/23(日) 08:19:12.66ID:???
>>989
4090、DDR4(128G)、kobold+Silly
まだいじり初めてよう解らん状態なんやが、これで参考になるやろか
最初の一文目
CtxLimit:2076/4096, Amt:94/350, Init:0.01s, Process:1645.92s (1.20T/s), Generate:257.60s (0.36T/s), Total:1903.52s
最後の一文
CtxLimit:3772/4096, Amt:26/350, Init:0.04s, Process:23.50s (1.19T/s), Generate:74.96s (0.35T/s), Total:98.47s
トータル秒が最初が1903と長いのは方向性を決めかねているからなねえ
0992名無しさん@ピンキー2025/03/23(日) 08:42:32.10ID:???
>>991
情報サンクス
0.35はなんかちょっと遅い気がする
kobold起動する時cudaモードにしてる?
q6のせいかもしれんけど
0994名無しさん@ピンキー2025/03/23(日) 08:45:55.44ID:???
最近の半導体製品の価格高騰は TSMCやらの設備投資費増大が大きいから、お金がある人がバンバン使ってくれればコスト下落が加速されて庶民にもメリットありそう
0996名無しさん@ピンキー2025/03/23(日) 09:40:41.88ID:???
512gb必要なのはdeepseekだけだからdeepseekあきらめて100bクラスをq6あたりで動かすことを目標にすると
192gbありゃ十分なんだけどそれでも結局m2かm3しか選択肢が今のところないのよね

project digits(名前変わったけど正式名称忘れた)が256gbに増えてくれたらなぁ
3000ドルが4500ドルくらいになったとしてもm3 macの価格見たら十分勝負できるんと違うかな
0998名無しさん@ピンキー2025/03/23(日) 10:06:45.40ID:???
>>992
loboldcppのcudaモードって、起動してからの項目じゃなくて
一からビルドせんとあかんのね……

git clone https://github.com/LostRuins/koboldcpp.git
cd koboldcpp
mkdir build
cd build
cmake .. -DLLAMA_USE_CUDA=ON
make -j
したあとvisualstudioでビルドして、出来たkoboldcpp.exeを
./koboldcpp --use-cuda
て事なんかな、いま調べてビルド中や、ありがとうやで
出来たら比較の数値貼るわ
0999名無しさん@ピンキー2025/03/23(日) 10:35:07.84ID:???
>>998
待て待て
起動してからcudablustだっけ
今出先やから確認できんが
デフォだとcpuモードになってるから切り替えるだけや
1000名無しさん@ピンキー2025/03/23(日) 14:46:38.53ID:04LraJ6I
質問いいですか?
10011001Over 1000Thread
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。
life time: 37日 17時間 30分 37秒
レス数が1000を超えています。これ以上書き込みはできません。

ニューススポーツなんでも実況