なんJLLM部避難所 ★8

1002コメント348KB

なんJLLM部避難所 ★8

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ f3c0-9L8h)

2025/05/10(土) 22:18:32.02ID:0Ak3eO5y0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★7
https://mercury.bbspink.com/test/read.cgi/onatech/1742709485/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0270名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-kszJ)

2025/06/04(水) 11:20:24.86ID:4a8LWwHM0

shisa-ai/shisa-v2-llama3.1-405b-GGUF

だれか試せる人おらんかな？
moeじゃない405Gの日本語finetune

0271名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-FcjO)

2025/06/04(水) 11:31:44.32ID:tZNJnqlN0

ここで試せるみたいだけどな
https://chat.shisa.ai/

0272名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-kszJ)

2025/06/04(水) 13:50:12.73ID:4a8LWwHM0

>>271
おおサンキュ！
早速試したが、R１並みにいいかも
webだから規制入ってるけどローカルならどうなんだろ

0273名無しさん＠ピンキー (ﾜｯﾁｮｲ 874b-8b1H)

2025/06/04(水) 13:52:41.06ID:QI5L+ngp0

ちょっと試しただけだけどllama3.1はもう古い感じがした
計算リソース食ってる割には...他のLLMの進化が早すぎるんよ

0274名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-FcjO)

2025/06/04(水) 13:55:54.58ID:tZNJnqlN0

30Bくらいでもっと賢いモデルあるからな

0275名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-kszJ)

2025/06/04(水) 14:20:58.21ID:FaYK2mPb0

最近70bを誰も作ってくれない。
オナシャス

0276名無しさん＠ピンキー (ﾜｯﾁｮｲ 42e3-L/D9)

2025/06/04(水) 19:08:02.68ID:a5Ck1WYB0

3.1なんてもう化石だろjk

0277名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fba-RMgv)

2025/06/04(水) 19:33:05.22ID:AUnMmnLx0

>>275
70Bなんか動かせるマシン持ってるやつ少ねえよってのと最近は性能大幅に落としてもいいからエッジデバイスでいかにそれっぽいのを動かせるかに研究が移ってるっぽいからなあ

0278名無しさん＠ピンキー (ﾜｯﾁｮｲ b6bc-lbRc)

2025/06/04(水) 19:56:58.96ID:FvknF98Q0

>>269
やっぱりそうかぁ
以前、内容や名詞をスクリプトで自動的に組み合わせて生成した金太郎飴みたいなデータセット1万件ぐらいを使ってLoRA作成したんだけど
推論結果が同じく金太郎飴みたいになってて全く使い物にならなかったんよ
質問文は自力で頑張って用意してそれをLLMに蒸留させてデータ作成するのが一番現実的そうやね
ただOpenAIは蒸留に対する検知厳しくなったみたいだしローカルLLMで蒸留させるしかないのかな

0279名無しさん＠ピンキー (ﾜｯﾁｮｲ 9bb4-8b1H)

2025/06/05(木) 00:50:24.68ID:vfrFHp0+0

こういう失敗談はとても助かる

0280名無しさん＠ピンキー (ﾜｯﾁｮｲ 87b4-8b1H)

2025/06/05(木) 01:05:48.18ID:4oFyB0gw0

Gemma3の70Bくらいが欲しいよね

Llama3.1 405Bの位置が低すぎる
huggingface.co/blog/gemma3

0281名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-0Pot)

2025/06/06(金) 21:02:06.42ID:39L0KRnH0

ゼロから開発された日本向けのLLMが久々に出た
普通のLLMというよりドキュメント読解特化らしいが
https://stockmark-tech.hatenablog.com/entry/2025/06/03/101007

0282名無しさん＠ピンキー (ﾜｯﾁｮｲ 9fcc-bdW6)

2025/06/07(土) 00:48:13.65ID:39KDc2wv0

>>281
Instruct版のSpaceあったので遊んでみたけど、ハルシネーション抑制、ってあったけどInstruction Followig、Groundnessともに怪しい感じでこれで4o越えは評価のスコープを思いい切り絞らないと、って印象
文体は自然でそこそこなので惜しい感じ
フルスクラッチ日本語モデルって点では今後に期待
111B多言語対応のCommand-a越えを期待してたんだけど...

0283名無しさん＠ピンキー (ﾜｯﾁｮｲ a332-e2Mg)

2025/06/07(土) 00:54:28.31ID:2LZ+XKfV0

>>282
それ古い方じゃないかな？
今回のはマルチモーダルモデルなので用途が違うかな

0284名無しさん＠ピンキー (ﾜｯﾁｮｲ 9fcc-bdW6)

2025/06/07(土) 01:08:50.77ID:39KDc2wv0

>>283
あ、そうかも
いまもう一回検索したらStockmark-2-VL-100BではSpace出てない感じだった
楽しみが増えた、ありがとう

0285名無しさん＠ピンキー (ﾜｯﾁｮｲ 57d9-3NuF)

2025/06/08(日) 03:19:31.62ID:UOHeZNXa0

Stockmarkは…うん…界隈の人だとある程度察すると思う

0286名無しさん＠ピンキー (ﾜｯﾁｮｲ 47c0-Thn+)

2025/06/08(日) 08:58:53.34ID:TAduKfL90

なんかあるの？

0287名無しさん＠ピンキー (ﾜｯﾁｮｲ 9f9f-KD4N)

2025/06/08(日) 10:04:02.91ID:oyT8Ugh80

おま感を相手にしても仕方がないです

0288名無しさん＠ピンキー (ﾜｯﾁｮｲ b702-e2Mg)

2025/06/08(日) 13:35:11.36ID:YarQEdH80

GENIACにオルツが入ってるから何でも胡散臭く見える

0289名無しさん＠ピンキー (ﾜｯﾁｮｲ 2fe1-QsL+)

2025/06/08(日) 15:02:38.74ID:j1hFi/dg0

胡散臭さより完成品の質で戦えよ

0290名無しさん＠ピンキー (ｼｬﾁｰｸ 0Cef-w202)

2025/06/08(日) 15:19:30.63ID:sqNXLGRgC

>>285
以前試したが小説目的だとまさしく話にならないレベルで速攻消した思い出

0291名無しさん＠ピンキー (ﾜｯﾁｮｲ 57d9-3NuF)

2025/06/08(日) 16:32:28.96ID:UOHeZNXa0

>>286
別になんか悪いことしてるとかではないんだけど、シンプルにこのスレ民的には全く期待しなくて良いと思うというお話

0292名無しさん＠ピンキー (ﾜｯﾁｮｲ d36a-jj0/)

2025/06/08(日) 18:57:30.93ID:CFh7R3fZ0

ストックマークってだめな会社なん？🤔

0293名無しさん＠ピンキー (ﾜｯﾁｮｲ a332-e2Mg)

2025/06/08(日) 19:40:31.40ID:UHwTbmjA0

世間一般ではダメじゃないかもしれんがスレの評価が低かっただけ
でも、どんなベンチマークの評価よりこのスレの評価の方が参考になるんだわｗ

0294名無しさん＠ピンキー (ﾜｯﾁｮｲ 57d9-3NuF)

2025/06/09(月) 09:28:56.23ID:ljure9hs0

Aratako/NemoAurora-RP-12B

これLumimaidとかMagnum-v4とか混ざってるから良さげな雰囲気あるな
仕事終わったら試してみるわ

0295名無しさん＠ピンキー (ﾜｯﾁｮｲ a391-X6eQ)

2025/06/09(月) 10:42:30.45ID:7NcIMP7U0

一応モデル作るだけ評価は出来るが比較対象のレベル低すぎてお察し
なんで100Bと14B並べてイキってんねん

0296名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-gw/n)

2025/06/09(月) 19:26:55.13ID:DmjpgrPE0

Aratakoってワイの一番のお気に入りのcalm3-22b-RP-v2作った神か？
NemoAurora-RP-12B触ってみるわ

0297名無しさん＠ピンキー (ﾜｯﾁｮｲ 57d9-3NuF)

2025/06/10(火) 01:12:25.58ID:QqWnFUnK0

NemoAuroraちょっと試したがかなり饒舌な感じで淫語とかも普通に出やすいな
この人のモデルにしては珍しく小説系とかそっち寄りな感じがする
この辺はHimeyuri-12Bとかをマージしてる影響かな？エロ系はかなり自然な感じ
その分何回も会話してるとだんだん応答が長くなって行きがちだから適度に過去会話をカットしてあげると良さそう（SillyTavernとかなら楽）
README読むとコンテキスト長32kで学習されてるみたいだけど実際そこまでいけるならかなり実用性ありそう

0298名無しさん＠ピンキー (ﾜｯﾁｮｲ 8732-+HAl)

2025/06/10(火) 09:27:53.11ID:+5w+8cqP0

エロokの配信サイトとか最近やと何処がええんやろ？ワイのAIライバーをニキらのオモチャにしてみたい

0299名無しさん＠ピンキー (ﾜｯﾁｮｲ 67a9-6htt)

2025/06/10(火) 13:51:16.95ID:PsRM1reD0

Rplay縺ｨ縺具ｼ

0300名無しさん＠ピンキー (ﾜｯﾁｮｲ d36a-Lyjn)

2025/06/10(火) 14:58:04.41ID:yNzdttZM0

文字化け野郎がまた来た😅

0301名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM9f-gAZ+)

2025/06/10(火) 15:08:44.69ID:v+MevKZDM

Mac miniなんか買っちゃうから……🥺

0302名無しさん＠ピンキー (ﾜｯﾁｮｲ d36a-Lyjn)

2025/06/10(火) 15:45:35.63ID:yNzdttZM0

設定変えてみてよ

0303名無しさん＠ピンキー (ﾜｯﾁｮｲ 8732-+HAl)

2025/06/10(火) 16:51:31.40ID:+5w+8cqP0

fc2とかええかなって思ったけどツールでコメント拾う手法が確立されてないんか

0304名無しさん＠ピンキー (ﾜｯﾁｮｲ dbc6-lhAm)

2025/06/10(火) 16:54:28.40ID:MHXZZmsT0

EVO X2届いた
とりあえず窓の認証済ませてからLinux入れるか

0305名無しさん＠ピンキー (ﾜｯﾁｮｲ 9fe1-rHdl)

2025/06/10(火) 17:45:08.50ID:ZERmxKIi0

>>304
wktk

最初何動かすん？

0306名無しさん＠ピンキー (ﾜｯﾁｮｲ 3349-bdW6)

2025/06/10(火) 19:15:35.13ID:A45Fjgnl0

>>304
パフォーマンスリポートよろしく

0307名無しさん＠ピンキー (ﾜｯﾁｮｲ a373-59eZ)

2025/06/10(火) 20:13:11.90ID:CUlHtuh60

Aratako/NemoAurora-RP-12B（Q3_K_S）触ってみた。
・一から書かせるのは微妙…？やっぱすぐ「以下省略」とか記号連発とかしてくる。
・チャット時の性格は、変な頑固さがなくて割と素直かも。法律・倫理に反する嘘を理詰めで教え込むのに成功した。
・なんか「NHK」好き過ぎん？よく出るような。あんまり脈絡なく「それで、NHKがNHKのNHKによるNHKのためのNHKNHKNHKNHK...」とか出た時は吹いた。
・既存短編を読み込ませて架空の読者コメントを書かせた場合の自然さ、理解力、多様さは過去一かも。

0308名無しさん＠ピンキー (ﾜｯﾁｮｲ 7be8-3NuF)

2025/06/10(火) 22:09:58.40ID:MZrw5Gh50

>>307
小説書かせてる感じ？RPって付いてるしこの人の後悔してるデータセットとか見ても基本はロールプレイ用じゃないかな
読者コメント書かせるのはある種のRPなのか…？

0309名無しさん＠ピンキー (ﾜｯﾁｮｲ 4fc6-njQc)

2025/06/10(火) 22:10:53.87ID:oH+/RirL0

12BでQ3_K_Sってタブレットでやってるのか

0310名無しさん＠ピンキー (ﾜｯﾁｮｲ a373-59eZ)

2025/06/11(水) 00:00:19.46ID:OXBPwywy0

>>308
読み込ませたのは過去の簡易TRPGリプレイ。
一応RPだけど、GM（AI）やNPC（AI）と自分の発言以外に地の文も有りで、ラノベ的。

>>309
CPU（Ryzen 5 7530U）＋メモリ16GB（DDR4 8GB*2）のサブノートPC。
GPUが安くなったらメインPC（13年使用）組み直そうと思ってるが安くならんな…
その予算50万あるんで今でもそこそこの組めそうなんだが、今は時期が悪い。

0311名無しさん＠ピンキー (ﾜｯﾁｮｲ 9fec-gw/n)

2025/06/11(水) 01:12:30.21ID:hsCV2UWY0

magistralはqwqやqwen3と違って日本語ネイティブ推論できるっぽいしクリエイティブ用途だと悪くなさそうね

0312名無しさん＠ピンキー (ﾜｯﾁｮｲ 97fe-4A8D)

2025/06/11(水) 04:48:51.38ID:OcgwiSKm0

>>310
2年後くらいにはミニPCの進化でグラボよりええかもしれんね

いまスマホでもメモリ16Gでてきてるし
SoCもAI対応うたってるのあるしなんならLLMも積める言うてるし
シャオミも独自SoC作ったし
スマホもどうなるやろなあ

0313名無しさん＠ピンキー (ﾜｯﾁｮｲ 3759-4HIq)

2025/06/11(水) 08:17:40.01ID:3Ney+1wL0

AndroidならすでにGemma-3nがそこそこまともに動いてびびった

0314名無しさん＠ピンキー (ﾜｯﾁｮｲ a332-e2Mg)

2025/06/11(水) 10:36:53.57ID:9rHkzdr90

Magistral-Medium　は出んのかな？

0315名無しさん＠ピンキー (ﾜｯﾁｮｲ eb09-6GmA)

2025/06/11(水) 11:20:15.92ID:qnK6TeFS0

Mistral自体のMediumも公開されてないから無さそう

0316名無しさん＠ピンキー (ﾜｯﾁｮｲ a342-WjW6)

2025/06/11(水) 11:29:03.07ID:XAorkN430

なんかこう、知識はないけど賢いモデルってのは出てこないもんかね
8Bくらいだけどfunction callingしてネットなりを検索して勝手に小説なりを読んで応用効かせて書いちゃうみたいな
そんなことできる頃にはシンギュラっちゃってるだろうが

0317名無しさん＠ピンキー (ﾜｯﾁｮｲ b7bf-X6eQ)

2025/06/11(水) 11:36:03.24ID:AgCMDhvR0

賢くない奴がネットで得た知識だけで語るって地獄やんけ
ネット検索自体がゴミになっててそこから正しい情報吸い上げるには常識が必要なんちゃうか

0318名無しさん＠ピンキー (ﾜｯﾁｮｲ a332-e2Mg)

2025/06/11(水) 11:42:27.37ID:9rHkzdr90

>>315
Large出すタイミングでMediumを解放すると期待してる

0319名無しさん＠ピンキー (ﾜｯﾁｮｲ cfac-bdW6)

2025/06/11(水) 12:44:55.54ID:Y1jv/Uee0

知識はないけど理解力と推論力が凄い、ってのは魅力ある
それこそが真の意味での知性ではないかと

0320名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr2f-1c5u)

2025/06/11(水) 16:28:16.31ID:v338i4Eyr

言語モデルである限り理解力＝知識ベースだから難しいのでは
言語に頼らずニューロンをシミュレーションするモデルが必要だ

0321名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr2f-1c5u)

2025/06/11(水) 16:58:35.91ID:v338i4Eyr

redditでスレが立ってたshisa-ai/shisa-v2-llama-3.1-405bって日本語最強モデルはどうなんだろ
東京にスタジオがあるらしいけど初めて知った

方言とか口調や人称ニュアンスが再現できる方向に進化してほしいな

0322名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr8f-YMx6)

2025/06/11(水) 17:03:10.46ID:FX+5gD3Jr

賢さ自体をよそから手に入れればよさそう
MCP時代のモデルは、何が分からないのかを判断する能力と、どこで聞けば良いのかだけを持っていればいいのかもしれん

0323名無しさん＠ピンキー (ﾜｯﾁｮｲ a332-e2Mg)

2025/06/11(水) 17:31:20.09ID:9rHkzdr90

>>321
デモで試したが悪くはなかったよ。
でもmagnum123bは超えてない感触だった

0324名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f4e-bdW6)

2025/06/11(水) 17:42:25.04ID:0gofb7V30

4070tiで動く小説特化のオススメモデルある？

0325名無しさん＠ピンキー (ﾜｯﾁｮｲ eb09-6GmA)

2025/06/11(水) 21:07:01.38ID:qnK6TeFS0

NvidiaのProRLって方法で1.5Bが7Bレベルの推論出来るようになったって話があるし
言語モデルは単純に記憶してるだけじゃなくて概念を理解して学習してるとかの話もあって
中小規模モデルでももっと賢くできそうな気配あるよ

0326名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fd1-dZZ6)

2025/06/12(木) 08:02:59.68ID:4K9Ttd3d0

単純な知識量はモデルサイズに比例するとして、理解力と分離できたらいいんだけどね
MCPでWebから検索するのは危険だから、別な知識タンクがあるといいんだけど
そうなればモバイルでも知識はSSD、理解力は内部メモリに分離できそう
研究者の方々は当然そういうことはやってるんだろうけど

0327名無しさん＠ピンキー (ﾜｯﾁｮｲ 47c8-bdW6)

2025/06/12(木) 10:48:03.22ID:hOd2zX6t0

>>324
4070tiなら12GBのVRAMに収まるようにって考えるかもしれないけど、
小説目的ならチャットみたいにリアルタイムな応答は必ずしも必要ないからメインメモリも使ってでっかいモデル動かすのもありやで

0328名無しさん＠ピンキー (ﾜｯﾁｮｲ e706-dQbS)

2025/06/12(木) 12:50:43.97ID:gKcALsx50

パソコン工房
RTX5090 最安34万円

0329名無しさん＠ピンキー (ﾜｯﾁｮｲ e7c6-+0+a)

2025/06/12(木) 15:16:57.17ID:fUVDRnpn0

304だけどbartowski/Mistral-Large-Instruct-2411-GGUF-IQ4_XS(65.43GB)で軽くテストした
Windows11ProのLM Studio v0.3.16でVRAMデフォの64GB(Vulkan)設定、Context4096で1.33 tok/s前後
M.2に挿したOCuLink拡張ボード経由でTeslaP40接続してDebian12のDocker(text-generation-webui-cuda)でContext4096、P40のVRAMギリギリまでGPUオフロード、EVO-X2のVRAMはBIOSから512MBまで下げた状態で1.81 tokens/s

不思議だったのはWindowsでタスクマネージャー起動させながら見てたらLM StudioだとモデルをVRAMに読み込んでCPUが使われてて、窓でtextgen-portable-3.4-windows-vulkanを使ってみたらメインメモリとVRAMをそれぞれ消費してGPUを使ってた
llama.cppのVerかパラが違うっぽい？

0330名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MMdf-J9Ai)

2025/06/12(木) 16:31:08.42ID:QS6LCztLM

>>328
安すぎて買ったわ
これでRTX5090とRTX3090x3台の構成になる見込み

0331名無しさん＠ピンキー (ﾜｯﾁｮｲ af3c-vkRs)

2025/06/12(木) 17:09:17.15ID:jx/xHN1T0

ノートの5090だけど70Bとかほとんど動かないレベルで遅いんだけど設定が悪いのかなぁ

0332名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MMdf-J9Ai)

2025/06/12(木) 17:20:00.25ID:QS6LCztLM

>>329
レポ乙

EVO X2の素の設定だと1.33 tok/s
EVO X2+TeslaP40だと1.81 tok/s

下はVRAMは最下限？の512MBにしてCPUとして動作させた。
あと、グラボ指すところがないからM.2スロットを使ってTeslaP40繋いだという理解でいいのかな？

0333名無しさん＠ピンキー (ﾜｯﾁｮｲ e7c6-+0+a)

2025/06/12(木) 17:27:24.06ID:fUVDRnpn0

>>332
そうそう、それで合ってる
見づらい書き方ですまんかった

0334名無しさん＠ピンキー (ﾜｯﾁｮｲ 5732-0ZYx)

2025/06/12(木) 21:04:13.21ID:5bDEFtJd0

情報足りんからエスパーだけど多分それで正常とみた

0335名無しさん＠ピンキー (ﾜｯﾁｮｲ 9fec-gw/n)

2025/06/12(木) 21:09:53.56ID:5QWCQaBe0

知ってたけどdenseモデルだととんでもなく遅いな
40万出せば組める3090 x3で10tok/sくらい出るから電源問題すら無視するならそっちの方が良さそう

0336名無しさん＠ピンキー (ﾜｯﾁｮｲ afc7-J9Ai)

2025/06/13(金) 12:46:54.38ID:ycw22muJ0

EVO XはMoEモデルだと速いんかな？

0337名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f7a-gw/n)

2025/06/13(金) 22:12:27.22ID:scS7NRIV0

>>330
３台はすごいな、消費電力的にも。。
どんなモデルでも動かせるんじゃないか

0338名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f7e-kPMq)

2025/06/13(金) 23:11:59.05ID:Z6mL9jb40

>>331
70Bなら40Gは超えるから32Gの5090x1では厳しいだろ
もしx1.5が出たらいけるけど

0339名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f7e-kPMq)

2025/06/13(金) 23:14:37.51ID:Z6mL9jb40

>>337
3スロットx3?
凄すぎです
所謂ラックマウントなのか会社レベル
vram増やすにはいいけど電源問題もありなかなか

0340名無しさん＠ピンキー (ﾜｯﾁｮｲ 4654-x40H)

2025/06/14(土) 01:37:39.18ID:sDfDV4np0

>>329
LLM用にRyzen AI 395 マシン買うか迷ってたから参考になったわ
1.33tok/sは厳しいな

型落ちMacBookPro(M3 Max/128GB)で
Mistral-Large-Instruct-2411-IQ4_XS: 4.4tok/s
Mistral-Large-Instruct-2411-MLX_Q4: 4.8tok/s
くらい出るから大人しく次のMacStudioまで待つわ…

0341名無しさん＠ピンキー (JP 0H47-zi4d)

2025/06/14(土) 02:00:38.73ID:uPbPRNr/H

ローカルでLLMを動かせると、そのローカルLLMのAPIを発行して、ネット上のAPIを入力して動かすツールを、全部無料で動かせるってことだよね？
VSCodeとか

0342名無しさん＠ピンキー (ﾜｯﾁｮｲ de63-oaEo)

2025/06/14(土) 05:35:23.70ID:ws+NN3Wn0

そうわよ

0343名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ac7-389c)

2025/06/14(土) 05:57:14.07ID:lHmYYg7j0

>>337
>>339
さすがにあのデカさで3枚は直挿し無理なんで、ライザーで伸ばしてオープンエアで運用してるよ
電力ヤバいからPL絞って1枚200Wちょいにしてる
ちなみにマザボはお古だけどグラボが4スロット刺せるやつ

0344名無しさん＠ピンキー (ﾜｯﾁｮｲ d332-XzYo)

2025/06/14(土) 07:37:59.41ID:6yTb6ssu0

EmemeTownまた延期してるな
開発しているうちにどんどん性能が上がっていくLLMをゲームに組み込むのは難しいのか

0345名無しさん＠ピンキー (ｼｬﾁｰｸ 0C8f-k5nI)

2025/06/14(土) 08:55:58.88ID:9oyQ8bR5C

llama.cppをdockerで動かしてる人
cuda toolkitとかはネイティブじゃなくてdocker内にインスコしてる？
sdの環境ではcuda11にしたいから上手く使い分けれればいいんだけど

0346名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f1f-TYhh)

2025/06/14(土) 12:46:56.14ID:0A7B7v9/0

12Bとか使ってるけど日本語の言い回しとか下手すぎるな～一部の7Bのが賢く思えるレベルで文脈おかしくなる。

0347名無しさん＠ピンキー (ﾜｯﾁｮｲ 536c-zrJ9)

2025/06/14(土) 16:15:00.81ID:WieRbmVS0

モデルによるとしか

0348名無しさん＠ピンキー (ﾜｯﾁｮｲ 8ec8-XzYo)

2025/06/14(土) 18:34:42.83ID:+FoI+g7x0

EVO X2とX1ってどれぐらい性能違うの？
どっちも64GBだとして

0349名無しさん＠ピンキー (ﾃﾃﾝﾃﾝﾃﾝ MMc6-zi4d)

2025/06/14(土) 21:15:48.33ID:3evgydKRM

>>341
ローカルで動くVeo3みたいな動画生成AIも組み合わせれば、制限なしで動かし続けて2時間映画も作れちゃうのか
いいな

0350名無しさん＠ピンキー (ﾜｯﾁｮｲ 8716-mn0h)

2025/06/14(土) 22:58:48.11ID:szfIMr/I0

>>329 >>340 mac studio M4 Max 128Gだと6.14tk/sだった
M5 maxがすごいらしいから待った方がよさげ

0351名無しさん＠ピンキー (ﾜｯﾁｮｲ 8716-mn0h)

2025/06/14(土) 23:17:54.82ID:szfIMr/I0

MoEモデル慣れてると古いモデル(Mistral-Large)は出だしが遅いな。賢いんだけどね

0352名無しさん＠ピンキー (ﾜｯﾁｮｲ 0687-x40H)

2025/06/15(日) 00:15:48.43ID:Y7Z3RiM40

>>350
ベンチマーク助かる
BookとStudioの差もありそうだけどM3Max→M4Maxで40%高速化はでかいな
M5Max期待できそう

0353名無しさん＠ピンキー (ﾜｯﾁｮｲ 876e-DoF/)

2025/06/15(日) 02:43:02.47ID:beLggd390

>>341
動く（動くとは言っていない）
みたいな状態にはなるけどな
プログラミング用途ならclaudeかcopilotなら定額だしgeminiは無料枠デカいしローカル使う必要ないんじゃないか？

0354名無しさん＠ピンキー (ﾜｯﾁｮｲ 8a9f-SMqR)

2025/06/15(日) 08:57:49.67ID:Gc8LYewz0

品質がどうでも良い用途ならローカルでもいいんじゃないの？

0355名無しさん＠ピンキー (ﾜｯﾁｮｲ 8a9f-SMqR)

2025/06/15(日) 08:58:17.26ID:Gc8LYewz0

誰もおもちゃで遊ぶ自由はあるよ

0356名無しさん＠ピンキー (ﾜｯﾁｮｲ 53a4-zEtn)

2025/06/15(日) 12:48:49.42ID:asyHaMnJ0

5090で動画生成
4090で画像生成
3090複数台(または4060Ti/5060Ti)でLLM/VLM
GPUでできる個人レベルの理想形はこんな感じか

0357名無しさん＠ピンキー (ｼｬﾁｰｸ 0C8f-k5nI)

2025/06/15(日) 13:10:13.47ID:MYIJ3ndnC

rtx pro 6000 なら全部できるな・・・(　ﾟдﾟ)

0358名無しさん＠ピンキー (ﾜｯﾁｮｲ ab51-zEtn)

2025/06/15(日) 13:58:14.76ID:FMZ4Nx8L0

なおrtx pro 6000買うだけの金があれば中古3090を10台以上買える模様
高杉

0359名無しさん＠ピンキー (ﾜｯﾁｮｲ bb06-mn0h)

2025/06/15(日) 13:58:34.94ID:Ncme8x5z0

>>341
CLINEでLM Studioをサーバーにして使ってる
賢さと知識量はどうにも商用には敵わないけど
ローカルだとAWSのキー丸出しで質問できるのは楽
使い分けだよね

0360名無しさん＠ピンキー (ﾜｯﾁｮｲ 8bbe-lMTP)

2025/06/15(日) 14:19:23.69ID:M6KtWCeJ0

RTX PRO 6000とかのデータセンター向けGPUを家庭で使うと音で気が狂うかも知れない

0361名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ac7-389c)

2025/06/15(日) 15:07:17.70ID:J0lRA3xE0

>>360
用途がAIなら別室におくのがいいね
エアコンは必須だけど

0362名無しさん＠ピンキー (ﾜｯﾁｮｲ 4694-DoF/)

2025/06/15(日) 15:31:08.58ID:MF5Sb5IZ0

>>359
その用途だとむしろバカなLLMを使ってる方が危なくないか？
承認者の人間側が十分に賢い前提ならまた違うのかもしれんが

0363名無しさん＠ピンキー (ｼｬﾁｰｸ 0C8f-k5nI)

2025/06/15(日) 15:40:46.82ID:MYIJ3ndnC

>>360
Q-max版なら300wやで
悩ましいわw

0364名無しさん＠ピンキー (ﾜｯﾁｮｲ ff7e-dlS4)

2025/06/15(日) 16:41:56.82ID:vPaDJgaB0

>>360
うるさいの？
(驚いたことに)むしろスロット数少ないらしいしパワー少なそうに見えたけど
まあどうせ自分では買えないから関係ないけど

0365名無しさん＠ピンキー (ﾜｯﾁｮｲ 4aec-zEtn)

2025/06/15(日) 16:54:33.29ID:MtwqcsDn0

workstation版は5090のFEと同等だから許容できる騒音だろうけど300W版はシロッコファンだから地獄みたいな騒音やろな

0366名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-cSwH)

2025/06/15(日) 17:28:22.67ID:XRl2xzHc0

>>360
RTX Pro 6000はワークステーション向けやで。
画像生成スレの御仁も使ってるぞ

0367名無しさん＠ピンキー (ﾜｯﾁｮｲ 4627-5Ay1)

2025/06/15(日) 17:43:15.98ID:2cJwswtU0

>>364
最近のグラボが何のためにスロット多いかというとヒートシンクの表面積を大きくして風量の多い大型ファン積むことで少しでも低回転で効率よく冷却するためであって
600Wで2スロットとなると容赦なく高回転でぶん回していると思う
ワークステーション用だから人のいる部屋に置くことなんて想定してないだろうし

0368名無しさん＠ピンキー (ﾜｯﾁｮｲ 8ec8-XzYo)

2025/06/15(日) 19:48:47.54ID:UhSA0j090

ワークステーションはサーバじゃないから人のいる部屋で使うんじゃないの

0369名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ea0-5Ay1)

2025/06/15(日) 19:50:19.40ID:DOZZlZdu0

AIやるのにPCケースなんて使わねぇよな
マイニング筐体

■ このスレッドは過去ログ倉庫に格納されています