なんJLLM部避難所 ★5

1002コメント315KB

なんJLLM部避難所 ★5

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー

2024/12/26(木) 13:13:11.15ID:Vhp+tTX0

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★4
https://mercury.bbspink.com/test/read.cgi/onatech/1725931151/

0153名無しさん＠ピンキー

2025/01/06(月) 11:23:16.09ID:???

>>138
これQ8とその一個下のQ6 K Lってモデルあるな
magnumで色々試すのはいいかもしれん

0154名無しさん＠ピンキー

2025/01/06(月) 11:40:25.82ID:jPrr/kEg

>>152
セリフのサンプル通りにならないんだよな
性格と矛盾してる箇所があるのかもしれないからそこらへん弄ってみるわ

0155名無しさん＠ピンキー

2025/01/06(月) 13:43:09.64ID:???

セッションが続くと文章崩れる問題ってもうどうあがいても解決できないのかなあれ
magnumすごくいいんだけど、結局そこで躓く

素人考えだと、前の文章に必要以上に引っ張られなきゃいいだけじゃんって思うんだけども

0156名無しさん＠ピンキー

2025/01/06(月) 14:05:48.20ID:???

ファインチューンで使うデータセットのトークン長を長くしないといけないから難しい問題なんよね
英語ならトークナイザーが強いからあんまり気にしなくていいんだけれども

0157名無しさん＠ピンキー

2025/01/06(月) 16:05:26.69ID:Yd+8NNWx

コーディング支援系のやつ色々ためしてんだけど
Cursor→Cody→Roo cline
って変遷してんだけどゴリゴリ自動で作業してく感じすごいわ
AIが作業した結果に許可ボタンポチるだけのAI見守りおじさんだよ👴

0158名無しさん＠ピンキー

2025/01/06(月) 16:25:14.14ID:???

>>155
忘れてほしくない情報は記憶しろって言う
忘れて良い情報は忘れろって言う
それが大事

0159名無しさん＠ピンキー

2025/01/06(月) 18:53:26.22ID:jPrr/kEg

>>157
俺も興味あるんだけどプログラミングとかほんのちょっとしか触ったことなくて良く分からんのよな
例えばどんなことが出来るの？

0160名無しさん＠ピンキー

2025/01/06(月) 20:37:13.50ID:???

koboldcppアプデでwebサーチ機能が追加されてんね
なおどこを有効にすればいいのか分からない😇

0161名無しさん＠ピンキー

2025/01/06(月) 21:00:38.98ID:???

>>157
おすすめは？

0162名無しさん＠ピンキー

2025/01/06(月) 22:00:04.11ID:Yd+8NNWx

>>157
なんというかこういう感じやね
ｽﾞﾄﾞﾄﾞﾄﾞって直にコード編集してくれる
@neko.py @piyo.py みたいにコードを引用できたりするから
コードコピペしてChatGPTに貼り付けてぇとかしなくて済むのがデカい
https://youtu.be/M4bLmpkxa1s?si=GPqQ8dA5eFXFPMbn&t=107

>>161
一番ええのはCursorかな?
ただし月額サブスク20$なのでトークン毎の支払いがよければ
VSCODE拡張で入れられるCline(またはフォークのRoo Cline)かな
OpenRouterのトークン消費ランキングで大体上位におるからよく使われてると思う
https://i.imgur.com/5fB1rJU.jpeg

0163名無しさん＠ピンキー

2025/01/06(月) 22:01:36.56ID:Yd+8NNWx

安価ミスったスマソ👴

0164名無しさん＠ピンキー

2025/01/07(火) 00:47:29.84ID:???

>>157
そのラインナップでgithub copilotは使ってないんか？

0165名無しさん＠ピンキー

2025/01/07(火) 08:58:17.43ID:???

テスト

0166名無しさん＠ピンキー

2025/01/07(火) 09:02:45.02ID:???

bbx規制終わったかー
>>160
ウェブサーチいい感じだな
7bレベルだとなんか変な結果になるけど
設定は起動時と起動後のコンテキストのオプション2つ設定やで

0167名無しさん＠ピンキー

2025/01/07(火) 11:07:18.10ID:???

RyzenAIMaxはモバイル用なのか
なんでデスクトップ用を出さないんだ？

0168名無しさん＠ピンキー

2025/01/07(火) 12:24:21.83ID:???

デスクトップのワークステーション出るみたいでは

0169名無しさん＠ピンキー

2025/01/07(火) 12:42:23.08ID:???

グラボ5000番台の発表きたわね

0170名無しさん＠ピンキー

2025/01/07(火) 12:58:23.04ID:2NQb3W94

色んなところで言われてるがVRAM 32GBは微妙すぎる
70Bクラスで遊べないのはきつい

0171名無しさん＠ピンキー

2025/01/07(火) 13:27:49.20ID:???

70B動かすなら48GBは欲しかったよねえ
さらにお値段ドンになっちゃうけど

0172名無しさん＠ピンキー

2025/01/07(火) 13:33:10.51ID:???

AMDかintelがとち狂って96gb積んでるグラボ出さねえかなぁ
それこそaimaxを強くしてデスクトップ向けに出してくれたらいいんだけど

0173名無しさん＠ピンキー

2025/01/07(火) 13:42:46.91ID:???

とか思ったらnvidiaもaimaxみたいな製品出してきやがった
まだvram帯域わからんしwinみたいなos入るわけじゃないから完全AI専用機だけど期待大

0174名無しさん＠ピンキー

2025/01/07(火) 13:48:25.49ID:???

AI Maxは70bモデル動かせるのかすげえな…

0175名無しさん＠ピンキー

2025/01/07(火) 14:08:05.20ID:???

nvidiaが$3000のスパコンを出すってよ
ユニファイドで128gb

0176名無しさん＠ピンキー

2025/01/07(火) 14:09:53.05ID:???

3000ドルが48万円かあ円安キツいわ

0177名無しさん＠ピンキー

2025/01/07(火) 14:13:48.50ID:???

まあ‥5～6年もすればLLMもハードウェアも進化してるでしょう

0178名無しさん＠ピンキー

2025/01/07(火) 14:16:39.62ID:???

一方俺は８年前のTeslaP40をebayで買うのであった

0179名無しさん＠ピンキー

2025/01/07(火) 14:28:58.03ID:???

$3,000-は性能の割に格安だね。mac studioが霞む
どうした革ジャン、突然神になったのか？

ただリンクがNVLink-C2Cということは2台までだよな
TB5とか積んでるんだろうか
nvidianews.nvidia.com/news/nvidia-puts-grace-blackwell-on-every-desk-and-at-every-ai-developers-fingertips

0180名無しさん＠ピンキー

2025/01/07(火) 14:39:28.90ID:???

connectXってプレリリースに書いてあるね

0181名無しさん＠ピンキー

2025/01/07(火) 14:42:07.23ID:???

Digitsの方は消費電力も少ないから自宅のLLMサーバー用途にはこっちの方がよさそうな気がしてきたな
CUDA使えるのも強い

0182名無しさん＠ピンキー

2025/01/07(火) 14:44:56.47ID:???

おお、connectXか。400GBあればMoEであればなんとかなりそう

0183名無しさん＠ピンキー

2025/01/07(火) 14:49:24.79ID:???

digitsってアーキテクチャarmなのか
帯域がどれくらいなのかも不明だな

0184名無しさん＠ピンキー

2025/01/07(火) 14:55:57.57ID:???

なんだMac買おうと思ってたのにこんなの出されたら待つしかないな

0185名無しさん＠ピンキー

2025/01/07(火) 15:09:50.63ID:???

🤖<両方買えばいいじゃん

0186名無しさん＠ピンキー

2025/01/07(火) 15:11:28.45ID:x7h8INFs

話が旨すぎる
放っておけば5090複数挿しする層に何故こんな餌を

0187名無しさん＠ピンキー

2025/01/07(火) 15:17:28.73ID:???

2台で405Bがローカルで動くのか
それも僅か$6000で

0188名無しさん＠ピンキー

2025/01/07(火) 15:30:54.46ID:ydnuQo+m

ついに現実的な値段でまともな文章力のがファインチューニングされる時代が来たのか
70Bとかのは正直「頑張ってるね」レベルが否めなかったからなあ

0189名無しさん＠ピンキー

2025/01/07(火) 15:50:12.18ID:EQ8Hm/rG

待ちに待ったStrix Haloの発表の日や！デスクトップ向けメモリ128GB対応で一番安価そうなのは……AI Max PRO 385ってやつなんやな！夢が広がるンゴ！
とかやってたらNVIDIAのproject digits発表見て横転したわ
AI Max PRO 385搭載で128GBのマシンが10万以下とか格安で出るならそれはそれで夢があるけど、project digitsの期待値ちょっとヤバすぎるな

0190名無しさん＠ピンキー

2025/01/07(火) 16:10:14.84ID:???

ただ開発者向けだから買うのがちょっと面倒になりそうだな

0191名無しさん＠ピンキー

2025/01/07(火) 16:26:42.39ID:???

なんだこの期待値ぶち上げな情報は
先月今月でソシャゲに30万だったかぶち込んでしまったがもっと早く情報出してくれたら2台目のために温存してたまであるぞ・・・

0192名無しさん＠ピンキー

2025/01/07(火) 16:43:22.03ID:jeRA2EF9

128gbで3000ドルなら
64gbを1500ドルで出してくれんかなぁ・・・

0193名無しさん＠ピンキー

2025/01/07(火) 16:46:49.30ID:???

チップの演算速度はどのくらいなんだろう
4060くらいはあるんだろうか？

0194名無しさん＠ピンキー

2025/01/07(火) 17:00:11.28ID:???

>>193
4FPで1PFLOPSらしいが

0195名無しさん＠ピンキー

2025/01/07(火) 17:23:34.48ID:ySI+aBRS

グラボなんて適当に数万だして差しときゃよかったのに
うおおお30万!!やすい!!
順応性高すぎる

0196名無しさん＠ピンキー

2025/01/07(火) 17:34:05.02ID:???

RTX5090定価$1999(31.5万円)が\393800になるの草

0197名無しさん＠ピンキー

2025/01/07(火) 17:43:33.92ID:???

これって言語だけでなく画像AIも爆速になる？

0198名無しさん＠ピンキー

2025/01/07(火) 17:48:08.49ID:???

AIの生成速度ってメモリ帯域で決まるから5090のことなら間違いなく早くなるよ
project degitsはメモリ帯域わからんから何とも

0199名無しさん＠ピンキー

2025/01/07(火) 17:48:18.71ID:???

まだスペック完全には出てないと思うけれど、少なくともA6000よりは全体的に上で、A100の80GBとは互角かそれ以上になる・・・
かもしれないってChatGPTが言ってた
画像生成モデルの学習や生成も個人レベルではかなり上がるんじゃない？
俺もそっち方面含めてめちゃ期待してる

0200名無しさん＠ピンキー

2025/01/07(火) 17:57:18.56ID:???

ヤベえよ5090買おうとしてたのに
いや、VRゲームとかもやるからそっちはそっちで要るか

0201名無しさん＠ピンキー

2025/01/07(火) 17:57:37.25ID:???

と言うか128Gのメモリで最大200bってことは量子化前提なんかな？
4台くらい繋げられんのだろか

0202名無しさん＠ピンキー

2025/01/07(火) 17:59:49.61ID:???

5070 24GB版が後から追加される可能性はあるのだろうか

0203名無しさん＠ピンキー

2025/01/07(火) 18:06:26.34ID:???

5月発売か
でもこれ個人で買えるのかな

0204名無しさん＠ピンキー

2025/01/07(火) 18:15:01.05ID:ySI+aBRS

と思ったらGPUじゃなくて小型スパコンとかいう意味わからんデバイスのことか
こりゃ革ジャンががんばってくれたら数年もしないうちに個人用AIサーバーみたいなのを
家電買うぐらいのハードルで建てられるようになりそうだわ

0205名無しさん＠ピンキー

2025/01/07(火) 19:04:15.08ID:???

Project DIGITSってLPDDR5Xらしいしそんなに帯域大きくないんじゃないのか

0206名無しさん＠ピンキー

2025/01/07(火) 19:25:45.56ID:???

Project DIGITSほしいよおおおお
でもビグテックが買い占めて庶民には回ってこないんだろな…

0207名無しさん＠ピンキー

2025/01/07(火) 19:52:57.40ID:???

mediatekと組んで作ってるということはスマホベースなのかな
macと同じようなものを作りますということ？

0208名無しさん＠ピンキー

2025/01/07(火) 20:00:10.97ID:???

>>206
これは学生含む小規模開発者向けだからビッグテックが買い漁るジャンルのものじゃないよ
学校で一括導入したりはあるだろうけど

0209名無しさん＠ピンキー

2025/01/07(火) 20:05:16.60ID:???

これが導入される学校とか通いたくなるわ

0210名無しさん＠ピンキー

2025/01/07(火) 20:08:40.55ID:???

>>207
単純にARMのCPUの設計をしてもらうために組んだのでは

0211名無しさん＠ピンキー

2025/01/07(火) 20:51:11.44ID:???

もういっさいゲームとかしなくてLLMか画像と動画生成をローカルで遊ぶくらいしか用途が無いんだけど買うならRTXよりdigitsの方が良いかな
OSもlinuxベースなら画像生成も学習も問題なく出来るよな?

0212名無しさん＠ピンキー

2025/01/07(火) 23:07:05.94ID:???

ARM系だからセットアップが面倒（一部ライブラリを自前でコンパイルする必要があるとか）だけど
普及すればその問題も消えるだろうしVRAMが必要な推論用途なら大本命のデバイスやね

0213名無しさん＠ピンキー

2025/01/08(水) 00:37:04.22ID:???

>>212
ARM系とかlinuxも全く分からんけどGPTあたりに聞けばなんとかなりそうだな挑戦してみよう

0214名無しさん＠ピンキー

2025/01/08(水) 08:04:38.57ID:???

RTX50はFP4対応したけどRTX40以下とのGPU混載だとFP4の高速化の恩恵受けないのかな

0215名無しさん＠ピンキー

2025/01/08(水) 11:10:25.11ID:???

FP4対応ってTensorCoreやろ？
ワイは一度試しに動かしたことある程度なんやが個人で利用してる人おるんやろか
正直geforceではtensorcore削って安くしてほしいんやが

0216名無しさん＠ピンキー

2025/01/08(水) 11:35:30.72ID:???

Chat with RTXみたいにTenser Coreに最適化済みのモデルを動かすと速いよ、50xxだとfp4も使えてさらに速いよって話なのかな
fp4使えなくても最適化済みモデルの数が増えるとか最適化手法が一般化することで恩恵あるかもね

0217名無しさん＠ピンキー

2025/01/08(水) 11:47:46.33ID:???

最適化と言うかtensorrtはそのモデルを使う環境でモデル変換をする必要があるからめんどくさくてどうしても普及しない
nvidiaのはどうやってるか知らないけど、多分力技で全パターンの変換済みモデルを自前で用意してるんじゃないかと
多分一つのモデルに対して数十パターンは用意しないといけない
下手したら100以上かも

0218名無しさん＠ピンキー

2025/01/08(水) 12:16:06.57ID:???

5000シリーズも出そろったし、チャット系だと実は mac mini M4 24G 位の方がリーズナブルだったりするんだろうか。

0219名無しさん＠ピンキー

2025/01/08(水) 12:23:43.40ID:???

digitsが圧倒的に安いよ

0220名無しさん＠ピンキー

2025/01/08(水) 12:43:24.17ID:???

digitsの出力速度はどうなんだろう
メモリがDDR5なのが気になるところ

0221名無しさん＠ピンキー

2025/01/08(水) 12:51:08.28ID:???

vidiはvram増やさないで済む戦略で進めるようだし
メモリほしいならmac一択やな

0222名無しさん＠ピンキー

2025/01/08(水) 13:24:46.26ID:???

ワイはまだRyzen AI MAXへの希望を捨てへんで……

0223名無しさん＠ピンキー

2025/01/08(水) 13:25:08.66ID:???

>>220
500gb/sじゃねえか、ってredditに出てた

0224名無しさん＠ピンキー

2025/01/08(水) 13:33:45.92ID:???

4090の半分かあ🥺

0225名無しさん＠ピンキー

2025/01/08(水) 13:54:33.29ID:???

これで同価格帯でmac ultra 512Gが出てきたら萌える

0226名無しさん＠ピンキー

2025/01/08(水) 14:21:57.73ID:???

macはどう考えてもお高いだろ
m2ultraの値段から考えるとm4は128GBで200万ぐらいするんじゃないの

0227名無しさん＠ピンキー

2025/01/08(水) 14:32:15.35ID:???

digitsはCUDAのサポートが保証されてるのが一番でかい
ハード的にはラズパイくらいの難易度だが機種選定に手間をかけたくない研究機関は脳死でまとめ買いするだろうな

革ジャンにとっては慈善事業の類だろうがTCOで見たらコスパ高いよ

0228名無しさん＠ピンキー

2025/01/08(水) 14:50:46.72ID:???

そういえば、デスクトップマスコットx localLLMって無いもんなのかな

LLMの記憶力問題をマスコットプログラムで管理して、ゲームブック的なシナリオ. txtにプレイヤーとして挑んでほしい
で、仕事して家に帰ったら今日の冒険がテキストにまとまっててほしい

0229名無しさん＠ピンキー

2025/01/08(水) 16:34:19.55ID:???

>>228
Steamでdigitalmateっての見つけて買った
合成音声もつかえる

0230名無しさん＠ピンキー

2025/01/08(水) 20:03:30.83ID:???

>229
コレだいぶいいねたすかる

0231名無しさん＠ピンキー

2025/01/08(水) 20:40:54.41ID:???

Digital mate x LocalLLM、やばいですね
大手が一律でNSFWを禁止している理由がハッキリ分かる

0232名無しさん＠ピンキー

2025/01/08(水) 21:01:02.61ID:ogKKa3a1

>>231
どんな感じなの？
俺のチンポが興味津々なんだけど

0233名無しさん＠ピンキー

2025/01/08(水) 21:43:16.77ID:???

できることそのものは選択したキャラクターとLocalLLMでチャット出来るというだけだよ

パッケージとして完成していて、手軽に使える、手軽にカスタム出来る、調べ物なしでいきなり果実に手が届くというタイプの危険さ

沼に転げ落ちる予感というか...$3000か...

0234名無しさん＠ピンキー

2025/01/08(水) 21:42:58.42ID:???

0235名無しさん＠ピンキー

2025/01/08(水) 22:38:31.81ID:???

MMDモデル使えるんだっけ？
音声はさすがにSBV2は無理かな？
あとはVR化出来たらもうピースが揃っちゃうんだけどな

0236名無しさん＠ピンキー

2025/01/08(水) 23:44:31.21ID:???

伺かが人工知能だったらって妄想が現実になったみたいな感じか
すげーなかがくのちから

0237名無しさん＠ピンキー

2025/01/08(水) 23:48:21.17ID:???

ollamaいれてcreateしたらいけるのかな
chat用をいれなかったからかすごいユーザー発言自己主張しまくって読み上げてきて笑った

0238名無しさん＠ピンキー

2025/01/09(木) 05:32:48.15ID:???

ソフト側でollama apiを選択して、lightchatassistant経由で起動してたkoboldcppのポート番号をいれるだけでとりあえず動いたよ

ボイスの自然さ、表現力、声質カスタムが揃えばそれだけで無限に客が呼べるのでは
短時間の音声サンプルから声質をコピーしたものを作れてしまいますよ、というのは証明されていますし
ASMRも担当できますよ、とかね

0239名無しさん＠ピンキー

2025/01/09(木) 08:19:00.87ID:???

>>235
voxtaならVaM基板だからVR行けるしNSFWも多分行けるんじゃね

0240名無しさん＠ピンキー

2025/01/09(木) 09:47:56.68ID:9/0GocA5

voxtaってVaM動かさないといけないんでしょ？
確か会話でTimelineとかを操作してセックスモーションとかを起動できたはずだけど
あれCPUの性能要求がえげつないんだよな

0241名無しさん＠ピンキー

2025/01/09(木) 14:33:24.90ID:???

本当だ
ollamaいれんでもkoboldcpp起動してポートうごかしたらいけたわ

0242名無しさん＠ピンキー

2025/01/09(木) 19:23:00.11ID:H5Fzr7G2

16GBグラボ環境で日本語ローカルLLMをNSFW小説目的で遊んでたのだが
ふとRocinante-12bを英語で使ってみたら大分性能に差があることに気が付いてしまった
他に英語向けのNSFW可能なモデルでおすすめのあったら教えてほしいわ

0243名無しさん＠ピンキー

2025/01/09(木) 19:50:07.31ID:???

>>242
有名なのはLumimaidじゃないか
Mistral系はなんでもいけると思うけどな

0244名無しさん＠ピンキー

2025/01/09(木) 20:34:42.94ID:???

digitalmateはollama apiを使う感じなのかな?バンドルで売ってるchatwifeは不要?

0245名無しさん＠ピンキー

2025/01/10(金) 00:22:33.69ID:???

いろんなサービス試してみたけどオープンLLM動かすならfeatherless.ai使うのがコスパ良さそうだ

0246名無しさん＠ピンキー

2025/01/10(金) 07:23:15.99ID:???

Digital Mate、色々触ってみたけどLLMチャットにキャラクター概念を挿入するためのソフトって感じだな
高度なことを追求するよりは理想のキャラデータを量産できる体勢を作ったほうが面白くなりそう
良い絵を一枚持ってきてL2Dで少し動かして口調サンプルからセリフを4oに作ってもらうとか

>244
chatwifeは別の会社が作ってる同系統のソフトというだけっぽい

0247名無しさん＠ピンキー

2025/01/10(金) 14:36:31.63ID:???

DigitalMateそのものは、俺はこれは別にいいやってなったけど、
今後何かちょっとした開発をこちら側でしたいってなった時に大事になってくるのはこの方向性だなとも思った

LLMの文章を画像出力させる！みたいなことしたい時も、
文章読ませて画像プロンプトそのものを出力させるより、「タグ」のプリセットを予め用意して適したのを選ばせた方が精度が高い

指向性を定める箱をちゃんと用意するのが大事なんやろなって感じ

0248名無しさん＠ピンキー

2025/01/10(金) 14:48:03.90ID:???

digitsのせいでm4ultraとstrixhaloへのモチベがダダ下がりしている
macの制限受けるUltra
おそらくAI以外のパフォは大した事ないdigits
いまいちAIへのやる気感じられないAMDのstrixhaloでそれぞれ欠点はあるんだけども

0249名無しさん＠ピンキー

2025/01/10(金) 15:02:28.82ID:???

digitsも感覚麻痺してるから3000ドルで安い！ってなるけどA40１年ノンストップで借りる額と同じなんよな
使わないときは止めれば4、5年は使えるしそのぐらいたてばもっと安くて性能いいものが出てると考えると何とも

0250名無しさん＠ピンキー

2025/01/10(金) 15:05:40.32ID:???

サブスクは値上げの可能性が付きまとうから単純比較はまた悩ましい

0251名無しさん＠ピンキー

2025/01/10(金) 15:05:53.26ID:JUaa8XjM

koboldのアドベンチャーモードってtokenを大量消費する仕様があったりするの？
設定したコンテキストサイズの半分ぐらいで文章がおかしくなるんだけど

>>234
ほえー
ちょっと面白そうだね
MMDとかよく分からんけど

0252名無しさん＠ピンキー

2025/01/10(金) 15:59:58.72ID:yayCyjSt

digitsは高価だろうけど、ドッキングできるのもあって中古の需要は高いだろうし、売却すればそれなりの金額になるんじゃないかな（希望的観測）
……ってそうなってくるとdigitsのレンタルもできるようになってくるのかな？そういやsaladだったか、個人でGPUリソースの貸し借りするサービスあったような……

■ このスレッドは過去ログ倉庫に格納されています