なんJLLM部 避難所 ★8
0001名無しさん@ピンキー 転載ダメ (ワッチョイ f3c0-9L8h)2025/05/10(土) 22:18:32.02ID:0Ak3eO5y0
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC(できれば+3060 12GB以上)でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部 避難所 ★7
https://mercury.bbspink.com/test/read.cgi/onatech/1742709485/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
0068名無しさん@ピンキー (ワッチョイ 3ffb-S5D2)2025/05/12(月) 08:53:36.79ID:NreAwN7e0
>>63
量子化レベルに関わらずパラメータ数の多いモデルの方が賢いと言われているけど、流石にq1とかq2に量子化されたモデルはあまり賢くないと感じる
できれば8bit、最低6bitくらいで使用できるモデルが目安じゃなかろうか
個人的には4bitもちょっと性能低下が顕著かなと感じているところ
0069名無しさん@ピンキー (ワッチョイ 7fa0-m4Fo)2025/05/12(月) 09:04:53.60ID:ZpuTV0NJ0
俺も6bitが限界だと思ってる。4bitだと25%くらい成績が落ちるらしい
雑談だとわかりづらいけどロジックで25%の低下は仕事に使えん
100bで2bitはロマン
0072名無しさん@ピンキー (ワッチョイ 3ffb-S5D2)2025/05/12(月) 11:14:36.99ID:NreAwN7e0
>>71
そのグラフを見ると確かに4bitでも問題なさそうに見える
巷でも4bitならOKとされているのも理解しているけど、自分の環境で実際に出力されたものを比較すると明らかにq6、q8の方が良い結果を出す確率が高く感じる
小説しかり、コーディングしかり
0076名無しさん@ピンキー (ワッチョイ 13bd-9L8h)2025/05/12(月) 13:14:44.15ID:5F0YL1Av0
文章のベンチマークは難しいよね
ベンチ結果は良くても文章としては「?」ってのもあるだろうし

自分たちが人力で日本語のドスケベ評価するしかないんや!
0077名無しさん@ピンキー (ワッチョイ 737a-KB/z)2025/05/12(月) 13:28:26.10ID:CVsmR3mp0
llmにとって簡単なタスク、地の文と丁寧語>話の一貫性>>>キャラの言動と口調って感じがする
qwen3-4Bですら地の文と丁寧語はそこそこ自然
データが豊富なんやろね
0078名無しさん@ピンキー (ワッチョイ 3f7a-kIO2)2025/05/12(月) 13:31:22.63ID:eUjAc2ML0
grok3に版権キャラの情報を収集させてから全力でなりきってって指示しても微妙だからな
今のはここが変、そこが日本語としておかしいってダメ出し続けると確かに偽物感は消える
でもそれと引き換えに話の柔軟さが消えて返答がワンパターンになっていく
ルールでがんじがらめにされてる感じやね
0079名無しさん@ピンキー (ワッチョイ cfa9-O94U)2025/05/12(月) 13:56:12.95ID:4tsgHbNM0
ロールプレイ依頼時に画像も収集してきてflux1あたりの高級な画像生成モデルのLoRA勝手に作って
応答するたびにそのコメントに合った画像を生成する・・・
のは今でも技術的にはできそうやけどそこまでの高機能なのは需要なさそうで作る人もいなさそうやな
0080名無しさん@ピンキー (ワッチョイ efab-KB/z)2025/05/12(月) 13:57:26.53ID:RozHuKzp0
ワイ、grok-3-betaとかfast-betaで條澤広ちゃん憑依させてあそんどるけど、モデルの素地が理系頭なのが関係してか、プロンプトで固めなくてもかなり広ちゃんで満足や
口調に関しては特徴的な語尾を中心に10個例示した程度だけで、特に例文に入れてないのに「ワクワクするね?」とか言ってきてくれてめっちゃ広ちゃんで嬉しい
0081名無しさん@ピンキー (ワッチョイ 439a-o2kj)2025/05/12(月) 14:19:17.32ID:VR31sma10
ローカルのスレだけどローカルモデルに限らないならキャラなりきりはGeminiが抜けてる感じがあるな
こういうのはモデルの規模が物を言うからローカルはまだ厳しい
0082名無しさん@ピンキー (ワッチョイ efab-KB/z)2025/05/12(月) 14:27:01.37ID:RozHuKzp0
Geminiって倫理フィルターどうなん?
0084名無しさん@ピンキー (ワッチョイ 3fec-9L8h)2025/05/12(月) 15:16:16.71ID:xpvanbmK0
>>66
チャットテンプレートやモデル自体の目的が違うからやろね
Wannabeは入力欄を自動的にwanabi 24bで学習させた形式に変換してるから内部的にはtekken V7(mistral small3)のチャットテンプレートなんや
kobold(自動的にqwen3のチャットテンプレートを使用)なら動くけどwannabeでは動かないのはそういうことや
そもそもWannabeは指示文から何から何までガッチガチに専用モデルに合わせてるから一般的なモデルを組み合わせるならEasyNovelAssitantの方がええやろな
プロンプトやチャットテンプレートを指定できたはずやし
0086名無しさん@ピンキー (ワッチョイ 3ff3-OGf6)2025/05/12(月) 19:00:14.45ID:WYVgugKJ0
ベンチマークというものは攻略可能だから、で性能差が1%!って出たらこの指標はもう死んでるなと解釈するのが妥当では
差があることなんて触ってみれば誰にでもわかる話だし
0087名無しさん@ピンキー (ワッチョイ 3f7e-KB/z)2025/05/12(月) 22:03:20.50ID:fBtqwjV90
https://cohere.com/research/papers/how-does-quantization-affect-multilingual-llms-2024-07-05
(1)量子化の有害な影響は人間の評価で明らかであり、自動指標はその悪影響を大幅に過小評価していることを発見しました。自動タスク全体での日本語の平均1.7%の低下は、現実的なプロンプトで人間の評価者が報告した16.0%の低下に相当します。
(2)言語は量子化によって異なる影響を受け、非ラテン文字言語への影響が最も大きいです。
(3)数学的推論などの難しいタスクは最も急速に低下します。
0089名無しさん@ピンキー (ワッチョイ 33ca-aBcW)2025/05/13(火) 05:19:05.25ID:thJbNjvA0
>>70
サンガツやで
前スレニキのいう通りやったね、それを確認したかったんや
擬音ばかりになってもうた

>>84
なるほどそういう仕組みやったんたね
ワイのような初心者にはオートマみたいな便利さがあってホンマに助かっとるけど
そこから外れるピーキーなモデルもあるんやな
ありがとうやで
0092名無しさん@ピンキー (ワッチョイ 4338-m4Fo)2025/05/13(火) 11:23:40.44ID:5FBdETti0
>>87 ありがとう
自分が見たのはこれじゃないけど8/4bit量子化の表があるね
人間評価の項目で、日本語はわからんでもないけど
フランス人が厳しいのかひどい評価になってる

また103BだとMGSM(多言語数学ベンチ)で 8.8%の低下だけど
35Bだと 13.1%だから体感は酷い事になりそうだ
0095名無しさん@ピンキー (ワッチョイ 7f7e-fS5K)2025/05/13(火) 14:58:49.37ID:cTHuCwdA0
>>93
これはコンテキストウィンドウというより、コンテキストにどれだけ突っ込むかが問題で、設定でどれだけウィンドウを広げても実際にうまく扱えるのはせいぜい4K程度(というモデルが多い)、って話なんじゃないかな
0097名無しさん@ピンキー (ワッチョイ bf35-6cIy)2025/05/13(火) 15:20:52.29ID:UKC8ykUW0
>>90
違う

今までもvision対応していたが、コマンドラインの場合、
普通のLLMを使うときは "llama-simple -m モデル名 -p プロンプト"
VLMを使うときは "llama-llava-cli -m モデル名 --mmproj mprojモデル --image 画像 -p プロンプト"
のように違うコマンドで対応していた

今回対応したのはllama.cpp標準のWebUIで使う場合("llama-server -m モデル名 ")

今までWebUIで使うときはブラウザから文字しか入力できなかったんだけど、今回の
アップデートで画像を入力できるようになった

ちなみに内部でllama.cppを使用しているkoboldcppのWebUIでは前から画像入力に対応している
0100名無しさん@ピンキー (ワッチョイ 3fec-9L8h)2025/05/13(火) 20:37:06.85ID:O2T+dFUm0
コンテキスト長が伸びれば伸びるほど性能下がるのは体感通りだな
例えばgemini 2.5 proだと10万トークンまではほぼ劣化なし、20万までは性能やレスポンス低下が見えるけどまあ使える、20万以降はハルシネーションや現在のタスクと過去のタスクの混乱が増えてまともに使えないって感じ
ローカルの微調整モデルだと学習時のコンテキスト長が短い(大体4096以下)だからより顕著やろしな
0101名無しさん@ピンキー (ワッチョイ cfa9-wTYv)2025/05/13(火) 21:11:35.45ID:/+QPsiaf0
IntelハイエンドGPU持ってないし
GPUそのままにVRAMマシマシラインナップとか全然やれると思うんだよな・・・
GDDR6でいいから30万くらいで128GB版とか

そういうラインナップそろえだしたらソフト側の対応は勝手にみんながやってくれるだろうし
Intelやってくれへんかなぁ
0104名無しさん@ピンキー (ワッチョイ 7399-KvkU)2025/05/14(水) 19:44:16.14ID:Zo1jp2G/0
今ってユニファイドメモリじゃないPCはCPUやNPUで動かしてRAMで動かしてるの?
0105名無しさん@ピンキー (ワッチョイ 53ce-9L8h)2025/05/15(木) 02:18:09.89ID:c4xck2YD0
intelはB580x2+48GBか。
B580にチップ間接続用のポートとかあるとは思えないから、
たぶんPCIeブリッジで繋いでるだけだろうな。
それでも48GBはかなり良い。
0108名無しさん@ピンキー (ワッチョイ 5389-9L8h)2025/05/15(木) 20:12:31.82ID:HU+ywqaX0
Silly Tavernでキャラ設定を1500tokens記述してもうまくいかないのはこのためか
Content Lengthは受付可能な長さであって理解している長さではないとは……
0109名無しさん@ピンキー (ワッチョイ cf20-/WPO)2025/05/15(木) 21:35:05.54ID:s6ZPhXWD0
ローカルで今のGeminiくらいのレベルの動かせたら最高なんやけどなあ
0111名無しさん@ピンキー (ワッチョイ a3f0-LVTp)2025/05/16(金) 01:02:22.93ID:zPRIPccK0
コンテキストサイズが大きくても知ってる奴には大して喜ばれないのがそれやな
どうせコンテキスト増えたらまともに動かんの知ってるから
0112名無しさん@ピンキー (ワッチョイ cf7a-pbnj)2025/05/16(金) 01:21:23.76ID:KWeVTs2u0
vRAM16GBぐらいでAIのべりすとレベルが動いてくれたらかなり満足する気がする
あいつオーパーツすぎんだろ
0114名無しさん@ピンキー (ワッチョイ cf7a-pbnj)2025/05/16(金) 02:45:45.21ID:KWeVTs2u0
今というか数年前のAIのべりすとが凄いなって話、いまだ進化してるんだろうか

あそこまで日本語の文章紡げてなおかつどっかの汎用モデルそのまみ動かしてるとかじゃないから日本語圏のネタとかが通じること多いし
0115名無しさん@ピンキー (ワッチョイ 4387-9L8h)2025/05/16(金) 05:05:22.21ID:NDKGOZfP0
intelマザーってx16スロットをx4x4x4x4に分割したかったらXeonからになるのね・・・
今あるA770-16GB2枚をさらに増やすためにリグフレームやら諸々そろえてうっきうきで組んでたら、
中古で買ったz690マザーがx8x8分割しか出来なかったわ。
AMDの方はB450とかでもx4x4x4x4分割設定あったから普通に出来るもんだと思ってた。
0119名無しさん@ピンキー (ワッチョイ 3fec-9L8h)2025/05/16(金) 17:05:13.56ID:X0xY2ZKE0
>>117
gemma3 12b qwen3 14bが出てきてるからもう少ししたら色々とファインチューニングモデル出てくると思うよ
ベースモデルから検閲厳しいからこのスレの使い方的には微妙だろうけど
0124名無しさん@ピンキー (ワッチョイ c0a9-dAft)2025/05/17(土) 05:18:37.87ID:KGLngktH0
intel arc b770が16GBで出るかもって噂出てて、
さらにボードベンダーからb580を2個使った48GBのカードが出てくるって噂と合わせると
将来的にb770を2個使った64GBのモデルが出てきてもおかしくない・・・?
0125名無しさん@ピンキー (ワッチョイ be33-heYV)2025/05/17(土) 08:27:38.26ID:IODRfGV/0
むしろ中国がLLMに特化した
ミニPC出してきてもおかしくない……

4090魔改造するならそういうのも頼むで……!
禁輸くらっとらん素材なら潤沢にできるやろ頼むわ
0128名無しさん@ピンキー (ワッチョイ edbe-eIEy)2025/05/17(土) 10:46:50.48ID:1ZXEfXBW0
AI半導体に関してはAMDとIntelが期待外れだったってのもある

Huaweiは自社チップ向けにTensorFlowやPyTorchのバックエンドを作る位の技術力はあるし、プロセスが数年遅れててもデータセンターならゴリ押しできる

AI研究者の半数以上は中国人って調査もあし、当のプロセス進化も足踏み状態
ここはみんなで協力して乗り切るのが人類全体利益になると思うんだけどね
0129名無しさん@ピンキー (JP 0H07-heYV)2025/05/17(土) 14:20:31.96ID:eir/EweWH
CUDAがなぁ(´・ω・`)
0130名無しさん@ピンキー (ワッチョイ 00bc-mR1Y)2025/05/17(土) 14:25:14.32ID:jvzrCaRm0
LLMモデルに検閲無しのファインチューニングしたいんだけど既存のNSFWファインチューニングニキらは一体どこのデータセット使ってるんや…
まさか自分で1から準備するとかないよね?
0132名無しさん@ピンキー (ワッチョイ 00bc-mR1Y)2025/05/17(土) 15:32:18.86ID:jvzrCaRm0
>>131
ありがてぇ…
0134名無しさん@ピンキー (ワッチョイ 00bc-mR1Y)2025/05/17(土) 16:26:04.09ID:jvzrCaRm0
>>133
あれ傑作よなワイも低俗で上質なデータセット欲しい
無駄に理屈的(小説的)じゃない言い回しが臨場感あってよい
ハートマーク多用する低俗な言い回しも合ってる
漫画の絡み中の短いセリフとかを学習させまくってるのかな
0135名無しさん@ピンキー (ワッチョイ da7a-xkjl)2025/05/17(土) 16:37:00.90ID:sObGMPqJ0
多分そうだと思う
小説から学習させたのがNSFWでエロ同人から学習させたのがERPなんじゃないかな
喘ぎ声のバリエーションが豊富で他のモデルみたいに出し惜しみせず喘ぎまくるし
しかもアナルを責めた時だけおほっ♡とか、んおおっ!?って言い出すのほんと解像度高くて笑う
0136名無しさん@ピンキー (ワッチョイ be75-WIAZ)2025/05/17(土) 17:13:20.99ID:w9ZW+JGn0
20万くらいでgpt4クラスが動くようにしてくれ
チューニングできるなら3.5でもいいけど
0142名無しさん@ピンキー (ワッチョイ bee2-u0sY)2025/05/18(日) 12:07:11.17ID:VSENzPC/0
w
0144名無しさん@ピンキー (ワッチョイ e6f0-fjSQ)2025/05/18(日) 23:56:08.64ID:7V5PApoN0
「リグ続き。
A770に続いて手持ちのRTX2070も認識せず。
押し入れから引っ張り出してきたGT710とGTXX660は問題なく動作する。
GT710とGTX660を同時にPCIe x16に接続しても両方認識する。
ライザーカードのPCIe電源ライン用にSATA電源を接続しているのだが、
電源供給が足りないのだろうか。
電源供給量が多いライザーカードを探してみないと。
見つかるかな?」
この文章をバイオハザードの研究員の日記風に改変してください。
0147名無しさん@ピンキー (ワッチョイ cd08-eKVg)2025/05/19(月) 15:16:19.08ID:J3NCIUm50
kobold AIってLoRA使える?
インストールして起動してみたものの使い方わかんねぇ
検索しても情報少ないのな
0152名無しさん@ピンキー (ワッチョイ 007a-jzjh)2025/05/20(火) 00:41:54.88ID:ft2LOxrW0
google ai studioで全然Androidの仕様とかわかってないのに個人使用では実用レベルのスマホアプリ作れちまった

ハルシネーション起こして正しくない文字列で参照してたり、何度手直してもダメな実行順で関数記載しちゃったりとかはあったけど
バグ部分の違和感さえ人間が気づければほぼリライト任せる形でここまで作れちゃうの革命すぎる
0154名無しさん@ピンキー (ワッチョイ eaec-fjSQ)2025/05/20(火) 01:01:52.98ID:hbszdRYX0
システム的にはにどう認識されるのか気になる
単なる24GB x2として認識されるのかちゃんと単一のGPUという扱いになるのか
例えば古のRadeon R9 295X2だとGPU間をpcie gen3 x48で繋いでたらしいから同じような仕組みなのかな pcie gen5 x48だとしたら6000Gbps 750GB/sだから単一GPUとして48GB使えてもおかしくない
帯域幅的にLLM的だとゲームチェンジャーにはならないと思うが動画勢にとっての救世主やろな 画像生成の3060的なポジション
0155名無しさん@ピンキー (ワッチョイ 557e-fjSQ)2025/05/20(火) 01:27:15.60ID:XMQcDkMw0
B580のままだろうから接続は
B580 x16 ブリッジ x16 B580
だと思うよ。
PCIeインターフェースの面積も馬鹿にならんし。
0156名無しさん@ピンキー (ワッチョイ eaec-iXKU)2025/05/20(火) 02:12:15.86ID:hbszdRYX0
仕様でてた
{
2基のArc Pro B60はそれぞれPCI Express 5.0 x8で接続されるため、利用に際してはマザーボード側がPCI Express 5.0 x16からx8 + x8へのレーン分割をサポートしている必要があります
}
内部ブリッジすら無さそうね 前のSSDが積める4060tiのGPU版か
0157名無しさん@ピンキー (ワッチョイ 557e-fjSQ)2025/05/20(火) 02:53:31.23ID:XMQcDkMw0
リグを組むのが簡単になる感じね。良いね。

リグ続き。
2枚あるAcer Predator BiFrost Intel Arc A770 OC 16GBが極端に気難しい疑惑が出てきた。
何か気に食わないことがあるとすぐに安全増値が働くっぽい。
昨日届いたマイニング用のx1ライザーだとRTX2070は動くようになった。
このライザーにはPCIe6ピン電源端子があり、電源供給が改善されたからだと思う。
でもAcer Predator BiFrost Intel Arc A770 OC 16GBは動かない。
もう何も分からないから分割とかしない普通のライザーを尼でポチッた。
これで動くと良いなぁ。
0158名無しさん@ピンキー (ワッチョイ c5e1-dnmW)2025/05/20(火) 05:24:29.80ID:vmRqygBx0
48GBはただのニコイチカードやな、コレジャナイ感

https://www.tomshardware.com/pc-components/gpus/maxsun-unveils-intel-dual-gpu-battlemage-graphics-card-with-48gb-gddr6-to-compete-with-nvidia-and-amd

24GBはワークステーション向けらしいけど単品販売は500ドル前後、日本やと10万くらいか?
https://www.tomshardware.com/pc-components/gpus/intel-launches-usd299-arc-pro-b50-with-16gb-of-memory-project-battlematrix-workstations-with-24gb-arc-pro-b60-gpus
0161名無しさん@ピンキー (オッペケ Srd3-IbdF)2025/05/20(火) 09:48:13.99ID:olru+zVKr
Azure AI FoundryとWindowsのMCP対応によって、MCPを上手に扱えるローカルLLMのニーズが出てきそう
日本語FTしたLLMのニーズってどこにあるのか 謎だったけど、ココにあるのか
0162名無しさん@ピンキー (ワッチョイ eaec-iXKU)2025/05/20(火) 10:14:13.60ID:hbszdRYX0
同じVRAM48GB族の中古A6000が50万 RTX 8000が25万 PRO5000が新品80万だから20万以内なら革命だな
逆に24GB版はFP8がいらない用途なら値段含め中古のRtx3090で良さそう
0165名無しさん@ピンキー (ワッチョイ ec8a-Y0zr)2025/05/20(火) 11:03:48.71ID:V9CsxRbp0
DGXはドライバーが不安だ。いまデータセンター用のBlackWellでも大混乱中
あと128Gじゃ足りないんよ。256G以上の出してくれ。バス幅が足りないのはこの際おいといて
でもマザー直付けなら1024bitくらいほしい
PS2が4096bitなんだからできる筈?
HMBのメインメモリ用の改良が進んでるからDDRからの脱却も期待、とはいえ個人用だと2年後くらいか?
レスを投稿する


ニューススポーツなんでも実況