なんJLLM部 避難所 ★10
!extend:checked:vvvvv:1000:512 !extend:checked:vvvvv:1000:512 AIに色々なことをしゃべってもらうんやで そこそこのデスクトップPC(できれば+3060 12GB以上)でもなんぼか楽しめるで 自薦・他薦のモデルやツールは>>2 以降 本スレ(避難中) なんJLLM部 ★7 https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/ 前スレ(実質本スレ) なんJLLM部 避難所 ★8 https://mercury.bbspink.com/test/read.cgi/onatech/1746883112/ なんJLLM部 避難所 ★9 https://mercury.bbspink.com/test/read.cgi/onatech/1755924738/ VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured AMD製グラボでの画像生成AIが爆速になるComfyUIアップデートが配信、ROCm統合で生成速度が5.4倍に https://gigazine.net/news/20260107-amd-comfyui-rocm/ 期待できるか分からないけど色々出来るようになったらいいな radeonばっか使ってるけどllm方面じゃ理論値のrocm頑張るよりvulkanド安定なんよな ってのがこれまでの話だけどどうなるか 大差付くなら良いよね VRAMの数とCUDA対応かしか気にしてないけど、他に見る要素あるの? やっとWindowsでrocm使えるようになったんだ ところでCUDAは19年前から使えるんだけど今まで何してたん? ROCmは元々AMD Instinctとかの業務用GPU向けだったから コンシューマーしか使わないWindowsは眼中になかった模様 PCでローカルAIを動かすのが流行り出したのはほんの数年前の話 Rakuten AI 700Bか、なかなかやるな三木谷 LFM2.5B-1.2B-JP思ったよりプロンプトに従うし一応エロもいけるな このサイズにしては中々やりおる https://www.youtube.com/shorts/odx5NLbYz8g 半導体の拡大画像だけど、これってフェイクではなく本物かな? 最近、半導体がやたらと高いけど、それでも個人の予算で買えるってなんか不思議な気がするわ こんなのどんなに頑張っても自作できる気がしない 更に、エロの為にこんな高度な技術を使うってのも何かもっと他に使い道ないのかと思ってしまう LFM2.5 JPはサイズの割りにはかなり上手くやれてる方なんだけど、やっぱり1.2Bってのはちょっとしんどいところある 意味わからんくらい爆速で動くし、個人でFinetuningできるのは面白そうだけどデータセットがねぇ…… LFM2.5B-1.2B-JP使ってみたけど、爆速なだけで 実用性はどう使えばいいかわからん いまどきは自宅のラボで作ってみたする奴もいるらしいぞ 小規模モデルの性能が上がってくるとそれはそれでワクワクするな 5b未満のモデルはゲーム組み込み用とかそういうニーズもあるやで 会話らしい会話が出来る性能ではないがゲームでどう使うの 実例が今あるのかわからんけど もしやるならガッチガチにファインチューンしたら ゲーム内の話題だけならまともな応答返すくらいは一桁bでも出来そうな気はする スマホで小型モデルを動かすのが理想だけど どうせネット繋がってるんだから大型モデルに繋いだほうが早いってね ChatGPTを使ってるゲームはあるけど ローカルLLMを使ってるゲームは今のところなさそうだよな やったこと無いから知らないけど,アダルトな会話が楽しめるスマホアプリはローカルじゃないのか? >>691 あれってchatgpt以外のAPって使えないのかな? macでAP発行してローカルで使うとかできんかな LFM2.5B-1.2B-JP気になって覗きに来たけどローカルでエロチャするには微妙な感じか ローカルLLM使ったゲームはすでにたくさんあると思うよ llama.cppを組み込むだけだし軽くググってもそれっぽいのが出てくる >>691 FANZAにあったで 需要ないのか100円足らずで売られてた Cerebrasがzai-glm-4.7の無料Tierを公開したで 激烈に速いで https://www.cerebras.ai/blog/glm-4-7 Free TierでRPD=100か 性能もGemini3Pro並なら代替になるんやが >>699 すごい 今までクオリティと速度を両立してたのってGemini Flashだけだったけど これは段違いに速いうえにクオリティも高い これはモデルが早いというよりはハードウェアが超特殊だからな・・・。 確か一枚数億とかだったよなCerebrasのユニット Cerebrasは半導体ウェハを切り取らずにそのまま使ってる どんなマザーボードに載せてるんだろ https://i.imgur.com/33194P8.jpeg >>680 >>681 実際、この縮尺って合ってるのかね? ちょっとした寒気みたいなものを覚えたんだけど >>699 試してみたらGLM4.7で330tok/出てて笑うしかなかった。これはもうハードウェアの暴力としか言いようがないな。 最近始めた人は、日本一高い山は?って質問に富士山って答えられるかでLLMの性能見ればいいよ 答えられないラインがある >>709 いつの話してるんだ… LLM出始めは学習が不十分でその程度の話も答えられないケースはあったけど 2年ぐらい前にはそんなの何の役にも立たない質問するのは馬鹿のやることだって言われてたよ 今もそれ聞いてるのは知識がアップデートされてない老害だよ >>709 それ通用したの2022年末くらいでは? ワイは 「小学生の男女がうんどうかいについて悪戯っ子ぽく話す会話を書いてくれ」って最初に聞いてる これで日本語の小説のセリフ周りの性能や文の整合性チェックが分かるのでおすすめ 文章の良し悪しを判別すること自体も難易度が高いタスクなんだよな 判別できる人はLLMって文章上手くないな、じゃあこれで計ればいいやって自分で気付くはず 判別できないひとは、そもそもLLMって文章上手いよなとか、自信たっぷりだから信頼できるよなとか、言いだすわけで... 自分の得意な専門分野の事を聞いたら良いんじゃない? LLMが偉くてもまだまだ人が強い分野だと思う 逆に知らないことを聞いたら全部説得力あって判定できないけどw エロ画像を認識させて画像の内容をエロく説明させたいんだけど、おすすめの環境ある? 初心者はLM Studioが良いよ 単体で動かせてモデルダウンロードしやすいから ありがとう LMstudioでスレに有ったqwen3〜ったので動かしてみた 期待した返答が来たけど、ちょっと速度が遅いな… この辺はスペックをどうにかするしかないか slmが凄いとかいう風潮やめて欲しいわ gpt5.2ですら怪しいときがあるんだからそれより少ないのが役立つわけがない SLMは色々な用途で普通に役に立ってるし 性能が上がればさらなる小型化や同サイズでやれること増えるし 通信環境整えてサービスのAPIにつなげみたいな器材ばかりやないし 凄いの出てきたら開発も利用も用途増えるしすごいというよそりゃ 釣りタイトル文化に問題があるような LFM2.5がすごい!という動画を拡散すると中身は見てないやつがすごいんだって記憶するという LFM2.5は日本語が喋れるのに700MB!凄い!ってタイトルに入れてくれ AI驚き屋ってのがある 知識なくても何でも新技術凄いと騒げば 同じ様に知識無いけどAIは何か凄いと思ってる層が釣れる ラズパイとかが好きなタイプの連中が騒いでるんじゃね ミニチュアや箱庭が好きなんだろう でんちゃと同じカテゴリー SNSで新しいAI情報を紹介してるだけみたいなのまでAI驚き屋といって叩いて煽ってる側が 有料でAIの本質情報教えますマンみたいなのだったりする時代 PC新調したしローカルLLM始めたいなと思ってスレ読んでたけど、割とグラボ複数でVRAM増強してる感じなんやね グラボ1枚(VRAM16GB)だとローカルLLMはまだ難しい感じ? >>729 7B~14Bモデルならちゃんと動くよ もちろんチャッピーなどオンラインモデルの性能を期待してはいけない でも7Bってエロに関しては完全フリーだった頃のモデルばっかだから意外と楽しめる ちょっと前に比べたらvram16gbに乗り切って日本語ちゃんと返せるモデルが乱立してるのは劇的進歩ではあるよ 普通に使えるっちゃ使える moeも出てきたし Qwen235bが出た時に速攻でメインメモリ128GB以上の環境を作れた奴が勝ち組 denseモデルだとVRAMかメインメモリかの2択になって大型モデルでGPUを全く活かせないからな 軽量でも動く設定いれて軽いモデル入れれば動くやつもあるよって感じかな もうちょい調べてお試ししてみるわ、あんがと qwenやgpt-ossなどMoEだとGPUは1枚で十分 MoEはGPUの枚数増やすと性能が低下しちゃうんだよな モデルを全部VRAMに載せられるならGPUの複数枚挿しもありだね SLMでフィジカルAIって好きな特徴の女がいたらパシャパシャしまくるデバイスとかそんな奴やろ? ryzen haloってのはcpuオンダイメモリなん? この時代マザーにポン付けで128GBもあって何かそこそこに動いたらええなあ 3060復刻、DDR4復刻、AM4復刻 5年くらいこの状態になるってことだな、これ以上のスペックを求めるなら、高額な料金を出せと >>726 あいつらレビューや批評はしないしな この動画生成AIはアニメ動かしてもまともな挙動してくれないとか、そういう大切な情報ほどまったく出さない 一般向けでこんなに高騰するんじゃ企業向けの高騰も時間の問題だよな 使うのにコストが掛かるんじゃ回収もキツくなるし流石に小型化が進みそう OpenAIが数年分のメモリの大量発注かける ↓ メモリの生産ライン圧迫されて品薄になるのでは ↓ 今のうちに在庫確保せなって皆が買い占めに走って高騰 メモリの会社が生産ライン増やせばいいという話でもなくて 工場作るには数年かかるし、その後に需要が減ったらメモリ会社が大損するから慎重になる メモリ業界って相場の乱高下で体力無い会社から死んでるし迂闊に動かんのよ DRAM事業はハイリスクハイリーターンだからな ちょっと投資ミスるとすぐ倒産する 破滅的忘却のせいでAIの性能に限界が出てくる ↓ MoE発明、モデルが巨大化する代わりに破滅的忘却の影響を軽減、劇的な性能アップに成功 ↓ OpenAI、Google、AnthropicなどのAI企業が立て続けにAIデータセンター建設を開始 ↓ OpenAIが先んじて数年分のメモリの大量発注かける ↓ HBMを輸入できない中国と値上がり情報を得た転売屋がDDR5メモリを買い占める ↓ 今のうちに在庫確保せなって皆が買い占めに走って高騰 ここまで書かないと「OpenAIが、サム・アルトマンがすべて悪いんだ〜」みたいな奴が増えかねないよ >>745 OpenAIの買い占め報道でOpenAIを悪者にしてる奴が大量発生してるじゃん OpenAIが買い占めなかったら競合AI企業が買い占めてただけなのに あと、なぜAIに大容量メモリが必要になったのかを知らない人がいるかもしれない >>744 いやgpuの製造はopenaiの仕事じゃないから普通にopenaiが悪いよ あと2年以上前からmoeやってるしmoe化が進んでなかったらスケーリングでごり推すんだから今以上にデータセンター必要だぞ ま、人類に与えられたリソースを食い潰す速度がとんでもなく加速してるって事よ 今生きてる人間にとっては楽しくて良い事だから遊びまくるしかねー >>747 MoEの理論自体は2013年発表だから時系列はおかしかったけど Denseモデルでスケーリングごり押しができなくなったからMoE化が始まった認識であってるはず Denseモデルはパラメーターを増やすと演算量が増えて遅くなる問題もあるから べつにリソースを食い潰してるわけではないだろ 急激に需要が伸びたから不足しただけでスケーリングはできる分野だぞ >>749 gpt4の時点からmoe使ってるってさんざん言われてたろ 多エキスパート小アクティブが進んだならわかるけどさ ウエハの買い占めだって競合に嫌がらせしてnvidia相手に値切りたいだけだよ >>751 別にChatGPTだけじゃなくAI全体的な話なんだけどな 画像/動画生成も新世代モデルはMoE化してるし OpenAIとNVIDIAの内部交渉的なことは情報がないのでわからん あなたの妄想? 誰のせいかと言えばトランプ関税のせいでしょう 気まぐれで関税が倍になる時代なんだから全員に先行して押さえておくインセンティブが発生してしまう 誰がやったか全く関係ない 旧世代回帰で、得をするのはインテルだな、いいね、13世代14世代なんてなかった。インテルの主力は12世代。 もうDDR3まで戻るって話もあるし、win11もいらなかったな そのうちメモリ2Gも積んでるなんてスゲーみたいになるのか 今SSDもヤバい事になってきてんだよね サンディスクが前代未聞の1〜3年分のSSD代の前払いを要求とかなんとか こっちも需給が崩壊しつつあるみたい だいたい悪いことは中国のせい だからコレもそう 買い占めてるとかじゃねえの? 正月だったかパソコン工房でSSD4TBが3万円台で売ってけど買っとくべきだったな HDDは余裕あるけどSSDはカツカツ 今度店行くときが怖いわ >>751 ウエハ買い占めは事実誤認 OpenAI批判以前の問題 自分がデマ信じ込んでるアホということを自覚したほうがいい 【本文】↓ LMSTUDIOで少し前までqwen3-vl-8b-nsfw-caption-v4.5でNSFWの質問に回答してくれていたのですが、今試すと I'm sorry, but I can't fulfill this request. The content you're asking for is not appropriate and violates my safety guidelines. If you have any other questions or need assistance with something else, feel free to ask! という回答が返ってきました。これは設定の問題でしょうか llamacppで数日前にqwen3-nextの1〜2割高速化のパッチが当たってたみたいやで ただしGGUFも新しく作り直されたものを使う必要あり unslothはもう新しいのだしとったけどqwen公式は古いままやな >>760 設定の問題だったりseedの問題だったり 他に何か思い当たる原因がある感じ? 今ってVRAM16GB RAM64GBで動くエロいLLMモデルやとなにがええんや? ワイの設定のせいやと思うんやがkoboldcppでamaterasuは十数秒に1ワードで使い物にならんかったわ… BerghofとMistral-Smallしか使ってない感あって持て余し気味や amaterasuってどんなやつや?と見たら123Bやん IQ1Sでも26GBあるし そらデカすぎてまともに動かんですわ SillyTavernでAratako氏のMistralPrism-24B使ってるわ 日本語力高い >>763 その構成ならqwen next 80bの規制解除版Q5_k_mがお勧め RAM64GBだと、50GBクラスのモデルはctx8192とかにしないと厳しいかもね。 DRAM活かすならMoEモデルだから確かにこのへんか /mradermacher/Qwen3-Next-80B-A3B-Instruct-abliterated-GGUF 30Bは全然エロで出てこなくて画像解説させるためにVLの解除版使っても全然ダメだったんだけど Next 80Bはエロ自体の学習はしてる感じなんだな 繰り返しペナルティ強めてるせいでどんどん言い換えてくるの面白い コンテキスト長を増やすとどんどん性能が落ちるのは最新モデルでも変わらないので小説やロールプレイなどの用途では128K対応モデルだろうと8192推奨みたいやで 用途に合わせて仕方なく12Kやそれ以上にしてねって感じ
read.cgi ver 09.0h [pink] - 2025/10/27 Walang Kapalit ★ | uplift ★ 5ちゃんねる