なんJLLM部避難所 ★3

1002コメント349KB

なんJLLM部避難所 ★3

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ 93c0-oLG6)

2024/06/09(日) 07:37:14.82ID:???0

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★2
https://mercury.bbspink.com/test/read.cgi/onatech/1714642045/

-
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0528名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾘ Sp23-TjJb)

2024/07/19(金) 12:29:00.58ID:???p

今立ててもすぐ潰されそうやなぁ( ；∀；)

0529名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a74-3Cn0)

2024/07/19(金) 13:20:03.93ID:???0

このスレへの誘導のリンクだけ貼っとけばええんでない？
どんぐりLv4とかにしちゃってもいいかもしれない

0530名無しさん＠ピンキー (ﾜｯﾁｮｲ 2f95-4dff)

2024/07/19(金) 14:52:34.62ID:???0

全員こっちに移動して誰もいないんやから本スレはもうこっちやないの

0531名無しさん＠ピンキー (ｽﾌﾟﾌﾟ Sdaa-vJcf)

2024/07/19(金) 16:32:35.92ID:???d

どんぐりレベル4強制表示で立ててここへの誘導貼っとくに一票

0532名無しさん＠ピンキー (ﾜｯﾁｮｲ e387-aXFj)

2024/07/19(金) 17:11:28.37ID:SnWdQ7Z20

Mistral NeMoってのが出たけどどんな感じだろ

0533名無しさん＠ピンキー (ﾜｯﾁｮｲ 6a0c-urh9)

2024/07/19(金) 18:16:14.54ID:T7ONqz8t0

Mistral-Nemo試したいんだけどkoboldでもollamaでも動かないんだよなあ

0534名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr23-wTuR)

2024/07/19(金) 18:23:37.23ID:???r

llama.cppで変換できなかった

0535名無しさん＠ピンキー (ﾜｯﾁｮｲ 6b32-Ru/f)

2024/07/19(金) 23:11:39.31ID:???0

pfnet/Llama3-Preferred-MedSwallow-70B

llama3 swallowに、医学知識学習させたモデルで、あまり期待してなかったけど、
なんか、いいぞこれ
llama3ともswallowとも違う　普通にエロいｗ（脱獄不要）
文字欠け等の気になる点はあるけど、（量子化のせいか？）なんか、ベクトルが違うんだわ

まあ、最近のllama3-swallowにがっかりした分、よけいに出来が良く見えるんだが・・・
mmnga氏が量子化出してくれてるから、すぐ試せるで。ワイはQ5K_Mで試した。

0536名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-G/Qc)

2024/07/20(土) 08:51:19.45ID:???0

いい加減VRAM64GBくらい積んだGPUどっか出してくれないとなぁ
AMDはどうせ業務用作ってないんだからNvidiaに嫌がらせする意味でもそういうの出してくれよ

0537名無しさん＠ピンキー (ﾜｯﾁｮｲ bb5a-XX+G)

2024/07/20(土) 11:46:43.78ID:???0

AIバブル弾けない限り無理
一応AMDは次世代APUはLPDDRXを内蔵多チャネル接続して広帯域にしたやつを
64だか128ぐらいまでは積むよみたいな事言ってる

0538名無しさん＠ピンキー (ﾜｯﾁｮｲ 2b76-Ydgy)

2024/07/20(土) 11:48:56.81ID:a9PC+EpH0

AMDはソフトウェア周りがNVIDIAと比べて弱すぎて話にならん

0539名無しさん＠ピンキー (ﾜｯﾁｮｲ bb5a-XX+G)

2024/07/20(土) 11:52:55.96ID:???0

rocmがやる気なさすぎてnvidiaが独禁扱いされないように公開するやつのおこぼれ食ったりとか
ライセンス違反上等の暗黒パワーのZLUDA使う現状が情けない

0540名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f7a-DLab)

2024/07/20(土) 12:20:29.98ID:???0

NPUとかVRAM後乗せサクサクのやつが発展する方に期待しとく

0541名無しさん＠ピンキー (ﾜｯﾁｮｲ 2b6f-VXyX)

2024/07/20(土) 13:44:52.12ID:???0

VRAM後載せは期待しない方がいい
高速なメモリほど後載せできないから、後載せできるシステムは帯域が狭くなる
推論は帯域が大事なので遅いメモリを後載せできても嬉しくない

0542名無しさん＠ピンキー (ﾜｯﾁｮｲ 2be5-3SVq)

2024/07/20(土) 16:16:00.68ID:???0

うえの方でだれか言ってた普通の時は普通の会話で、突然エロくなってまた普通に戻るみたいなの、
cohereのcommand-r-plusで普通にできるけど、もう解決ずみかな
プロンプトにほんの少しだけエロの設定が必要だけど

0543名無しさん＠ピンキー (ﾜｯﾁｮｲ df17-35Um)

2024/07/20(土) 16:52:04.94ID:???0

だってLLMは入力も出力も屁みたいなデータ量だもん
マシンパワーの効率は誰がどう考えても一極集中のほうが良い

0544名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f04-8WH3)

2024/07/20(土) 17:52:47.15ID:???0

どうしてこうLLM=ローカルと誤解している人が多いんだ

0545名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fef-JWDL)

2024/07/20(土) 19:02:44.54ID:???0

lをLocalやと思ってしまったんやろなあ

0546名無しさん＠ピンキー (ﾜｯﾁｮｲ df52-DpAb)

2024/07/20(土) 19:04:22.08ID:???0

Local Language Modelsか

0547名無しさん＠ピンキー (ｽｯｯﾌﾟ Sd7f-yWQ+)

2024/07/20(土) 19:41:00.70ID:???d

け、め？だ

0548名無しさん＠ピンキー (JP 0Hdf-3SVq)

2024/07/20(土) 20:11:55.17ID:Wfa8J/rBH

5090でcommand-r-plus乗せられるようになるだろか(´･ω･｀)

0549名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f5d-DLab)

2024/07/20(土) 20:41:25.08ID:???0

80GBくらい必要なんでしょ？
無理ゲー

0550名無しさん＠ピンキー (ﾜｯﾁｮｲ fb7e-RMyG)

2024/07/20(土) 21:51:15.67ID:???0

cohereのCEOがcommandシリーズの日本語対応を重視するって言ってるな

0551名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b3d-TapC)

2024/07/20(土) 22:33:20.41ID:TXaeG/Gy0

日本人が多く使ってるのかな？
高レベルのエロ文章目当ての変態が多そうだが
そういや日本語特化モデルのカラクリての最近知ったけどお試し使用できる場所ないから性能謎だな

0552名無しさん＠ピンキー (ﾜｯﾁｮｲ 2be5-3SVq)

2024/07/20(土) 22:42:49.76ID:???0

542だけどapiの話ね。語弊があったようですみません
ちなみに何か月か前に登録してからまだトライアルのままだな（最初に5ドル分くらいもらえる）
結構、使ったのに。

0553名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-oq5P)

2024/07/20(土) 23:43:08.63ID:???0

>>551
自分的にはkarakuri70bは日本語モデルの中ではダントツ
エロ小説もなりきりチャットも高レベル
マージモデルもいい

0554名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f09-Z7fG)

2024/07/21(日) 00:16:10.77ID:???0

4090で普通に動く一番おすすめのLLMって何だろ？

0555名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f9f-V2rD)

2024/07/21(日) 00:47:19.36ID:???0

>>554
健全な用途ならgemma2 27b Q5かな vram24GBに収まる範囲では日本語性能ダンチ

0556名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f5d-DLab)

2024/07/21(日) 01:04:49.37ID:???0

エロが得意な14B前後くらいのモデルって無いんかな
それくらいならsilly tavernで読み上げながら使っても24GB以内に収まりそうなんだけど

0557名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b7c-fado)

2024/07/21(日) 02:17:50.83ID:n5P3y1pp0

>>548
ローカルで動作させる事の有無はおいといて、command-R+は実質mac一択
PCだとバス幅(PC64bit。mac512bit)やアクセスチャンネル数(2-4ch、mac 8ch)が
少なすぎるし改善の見込みもない(ATXとDDRじゃ無理)
AppleはMにした時ここに大幅に手をいれた
その代わりRAMの交換とかできなくなった
ただこれはインテル時代もそうだったからユーザーは慣れてるのかも

0558名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b63-G/Qc)

2024/07/21(日) 05:54:03.04ID:nICSglqJ0

不健全な用途です！！！

0559名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-G/Qc)

2024/07/21(日) 08:55:37.01ID:???0

GDDRなんて4GBが数千円の原価なんだからいくらでも最初から組み込めるだろうに
どこのメーカも異様な利益率のえぐい商売してるよなぁ

0560名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f55-MkDR)

2024/07/21(日) 09:55:51.88ID:???0

油断すると即転がり落ちるからしゃーないで
開発費もうなぎ登りなんやし

0561名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b8b-V2rD)

2024/07/21(日) 11:23:53.79ID:yxK3IHYk0

>>548
5090を1枚買う価格(40万？)で
4060Tiか3090の中古を複数枚揃えたらいける

0562名無しさん＠ピンキー (ﾜｯﾁｮｲ bb5a-XX+G)

2024/07/21(日) 12:16:16.59ID:???0

AIバブル終わった瞬間平身低頭して過剰在庫処理のVRAM128GBモデルとか売ってくるんやろか

0563名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f9f-V2rD)

2024/07/21(日) 12:40:48.05ID:???0

A100がお手頃価格になれば2本刺しでも300Bクラスまでは射程に入るからローカルLLMはバブル崩壊後が本番やな

0564名無しさん＠ピンキー (ｼｬﾁｰｸ 0Cdf-oq5P)

2024/07/21(日) 14:00:25.47ID:???C

pfnet/Llama3-Preferred-MedSwallow-70B
なるほど分かったぞ
年齢や局部の描写で規制かけたら医学用途に使えないって事かっw
こいつは捗る(*ﾟ∀ﾟ*)

0565名無しさん＠ピンキー (ﾜｯﾁｮｲ bba0-TapC)

2024/07/21(日) 14:05:27.11ID:???0

>>553
良いこと聞いた
70b使ってるってことはローカルじゃないよね？グーグルクラウドとか使ってやってる？

0566名無しさん＠ピンキー (ｼｬﾁｰｸ 0Cdf-oq5P)

2024/07/21(日) 14:36:53.46ID:???C

>>565
すまんローカル
小説作成なら70bの遅さでも耐えられるようになったんだわ(*´ω`*)

0567名無しさん＠ピンキー (ﾜｯﾁｮｲ bba0-TapC)

2024/07/21(日) 16:58:08.56ID:9WdbabI50

>>566
スゲー　遅くても動かせてるのがすごい

0568名無しさん＠ピンキー (ﾜｯﾁｮｲ 3bc0-8WH3)

2024/07/21(日) 17:46:17.28ID:???0

メモリ64GB積めば誰でもできるぞ
なお速度

0569名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b86-40Y5)

2024/07/21(日) 17:52:16.47ID:BtuxjxIZ0

昨日初めて導入したけどまだAIのべりすとより使いこなせへんわ
Uのスレがちょうど消えとって探すの苦労したわ

0570名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f07-Nv8D)

2024/07/22(月) 08:39:17.86ID:???0

64GBあればフルCPUでcommand-R+ Q4でも動くしな。
まぁ流石に遅いので、無印command-Rに下書きさせて、R+に清書させると効率がいい。

0571名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-G/Qc)

2024/07/22(月) 13:45:27.69ID:???0

RTX4000シリーズに数か月で大幅に性能低下する欠陥が発覚
共通して使用されてるグリスが原因だから殆どのメーカが巻き込まれるとのこと

0572名無しさん＠ピンキー (ﾜｯﾁｮｲ df0b-h671)

2024/07/22(月) 13:54:22.07ID:???0

hbmに頼らない設計てできないの？
普通のメモリなら512gbでもいけるのに

0573名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b58-fado)

2024/07/22(月) 14:15:08.37ID:/3lGviXt0

HBMはDDRの5〜20倍くらい転送速度が稼げる
LLMはとにかくメモリーの速度を要求する
mac(max以上)はDDRであってもコントローラー2倍積んでる特別仕様
ただHBMは物理的にローハンマー攻撃に弱いので実行用のメモリーとして使いづらい
マルチCPUでLLM動作させるとCPUが割と暇になってしまう
これはメモリーの出し入れ待ちな為

0574名無しさん＠ピンキー (ﾜｯﾁｮｲ df0b-h671)

2024/07/22(月) 16:33:01.58ID:???0

ありがとう
そっかー(´・ω・`)

0575名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f74-1Aj4)

2024/07/22(月) 20:08:28.50ID:???0

普通にGDDRでいいから48GBの4090とかでてくれたらねぇ・・・
4090にモデル収まれば20token/sとか出るし
実用上10token/sも出れば目で追えないくらい早いだろうから性能的にはもう十分なんだよな

まぁそれが6000Adaですって話なんかも知らんけど
なお値段

0576名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-srET)

2024/07/22(月) 21:50:41.98ID:???0

adaでなければなんとか

0577名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc5-G/Qc)

2024/07/22(月) 23:13:55.05ID:LhChVRuW0

llama.cppがMistral-Nemoに対応したからちょっと使ってみたけど表現規制とかはなさそうだね
というかちょっと口説いたら銃の作り方も教えてくれるから論理観ガバガバかも？

0578名無しさん＠ピンキー (ﾜｯﾁｮｲ 2b58-Ydgy)

2024/07/23(火) 12:22:32.48ID:???0

Calm3試してる人いる？めっちゃ性能は良いみたいだけどエロはどうなのか気になる

0579名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b08-DLab)

2024/07/23(火) 12:35:36.02ID:???0

calm3の22B chat、まともに動かないや
暫定版って事が関係してるのかもしれんけど
gemma2 27Bの方が圧倒的にサクサク動く

0580名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-G/Qc)

2024/07/23(火) 13:50:24.56ID:???0

Claude3.5 sonnetって70Bであの性能なんだよな
そのうちローカル実行可能なモデルがsonnetの性能に追い付き追い越すようになったら
小説の世界でも人間は駆逐されるね

0581名無しさん＠ピンキー (ﾜｯﾁｮｲ abf8-32+k)

2024/07/23(火) 14:12:27.94ID:B0KOMJMy0

ローカルである必要は？

0582名無しさん＠ピンキー (ﾜｯﾁｮｲ fb32-G/Qc)

2024/07/23(火) 14:30:50.35ID:???0

AIを上手く使える人間が台頭するだけだろ

0583名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-srET)

2024/07/23(火) 14:45:00.23ID:???0

>>581
こんなヤヴァイプロンプト、ローカル以外で使えるわけないやろ

0584名無しさん＠ピンキー (ﾜｯﾁｮｲ 4fc6-pSzm)

2024/07/23(火) 14:47:16.37ID:???0

>>581
API料金が高いから
現状のAIビジネスが成功しないのはAPI料金が高すぎるんだよ

0585名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-G/Qc)

2024/07/23(火) 14:52:40.66ID:???0

>>583
大手のチャットログが個人情報と紐づいて流出したらとんでもないことになるやろうなｗ
絶対ハッカーグループは狙ってると思うわ

0586名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f30-XTc+)

2024/07/23(火) 15:49:08.64ID:hb4CmLgU0

3.5 sonnetが70Bってどこ情報なん

0587名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f8e-srET)

2024/07/23(火) 16:23:33.85ID:???0

APIはむしろ安くないか
ビジネス用途ならGPT-4oとか安すぎるくらいだ
ローカル使いたいのは検閲とかされたくないしNSFWなんでもアリなチャットしたいってのが大きい

0588名無しさん＠ピンキー (ﾜｯﾁｮｲ 4fc6-pSzm)

2024/07/23(火) 16:50:23.89ID:???0

>>587
クソたけえよ
個人や企業内用途ならまだしも
不特定多数がアクセスして使わせるなら現状の価格では成り立たん

0589名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b54-35Um)

2024/07/23(火) 17:42:33.69ID:???0

少なくとも日本の法律じゃエロ文章で逮捕されることはない
たとえそれがペドロリでも(文章には児ポ判定無し)
できることはせいぜいBANくらいだけど、openaiもanthroも返金されるので、banされたところで特に痛くもない
犯罪系や自殺系は知らんが

0590名無しさん＠ピンキー (ﾜｯﾁｮｲ 0bc0-s/UN)

2024/07/23(火) 19:59:50.18ID:???0

ChatGPTで～のスレとか見てるとようあんな性癖全部盛りのプロンプトを検閲されたり学習されたり可能性あるよそさまのサーバーにしこたま送りつけるよなと思ってしまうわ
ある意味男気あふれてて感心する

0591名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b54-35Um)

2024/07/23(火) 20:42:38.91ID:???0

こっちは何も困らんしコソコソする理由が全くわからん
そんなのばかりになったら向こうは困るかもしれんが

0592名無しさん＠ピンキー (ﾜｯﾁｮｲ 2b58-Ydgy)

2024/07/23(火) 21:44:13.15ID:???0

当たり前だけど有害なプロンプトは今後の学習に使われて対策されるから使いにくくなるという影響があるよ

0593名無しさん＠ピンキー (ﾜｯﾁｮｲ bb87-3SVq)

2024/07/23(火) 22:18:16.97ID:WTarfT0L0

Mistral-Nemo-InstructをQ4_K_Mに量子化してみたけどけっこう賢くて良い感じだわ
Q4だしさすがに精度は低いけど、3万字くらいの長文読ませても壊れないでちゃんと返答してくれるし
そこからキャラなりきりもできるのはほんと進歩を感じる

0594名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f1e-G/Qc)

2024/07/24(水) 00:45:09.02ID:v0jtOIDf0

赤ちゃん質問で申し訳ない
SillyTavernでclaude3 APIに接続する方法ってどこかに載っとる？
調べても英語ばっかりだし翻訳してもよくわからん

0595名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MMff-C9XH)

2024/07/24(水) 00:49:10.84ID:???M

llama-3.1エロプロンプト普通に通るね

0596名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f69-G/Qc)

2024/07/24(水) 02:31:24.98ID:89UGJXd20

APIキー既に取得済みって前提になるが
https://imgur.com/a/QsCkPSG
この一番上のAPIでChat Compilation選ぶとChat Compilation SourceからClaude選べんか？
あかんか？

0597名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fb3-x6+9)

2024/07/24(水) 04:13:13.30ID:???0

>>592
よくできた脱獄はLLMの本質突いてるから対策できないよ
というか対策したら性能落ちる
もう諦めて各社BANとか警戒度で対策するしかなくなってるのが現状

0598名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-G/Qc)

2024/07/24(水) 05:55:27.51ID:???0

>>597
poeとかはわざと緩くしてるだけだよ
サービス元によって同じモデルでも明らかに申し訳される度合いが違う
そもそも入力そのものをAIでチェック出来るから本気で検閲されたら全部アウトになる

0599名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fb3-x6+9)

2024/07/24(水) 06:14:04.09ID:???0

>>598
それはanthroに怒られたくないからやってるだけ
性能落ちるからやりたくないのが本音
anthroもAPIには規制かけてないのが何よりの証拠

0600名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f6f-tk+8)

2024/07/24(水) 06:30:40.27ID:???0

ここってローカル限定？

0601名無しさん＠ピンキー (ﾜｯﾁｮｲ fb32-G/Qc)

2024/07/24(水) 06:34:38.24ID:???0

ローカル限定ではないけどローカル中心ではある

0602名無しさん＠ピンキー (ﾜｯﾁｮｲ 9fa3-8WH3)

2024/07/24(水) 06:40:51.50ID:???0

非ローカルは別スレがあるからね
ここはローカル寄り

0603名無しさん＠ピンキー (ﾜｯﾁｮｲ 8bc7-3QTr)

2024/07/24(水) 06:59:12.86ID:???0

RAGも大葉のLoraも
なりきりでやって欲しいキャラのセリフと設定入れたら（セリフ集にユーザーとのやり取りも入れてる）
どのモデルも何故かユーザー役になりきるんだが
オススメの知識の入れ方ってある？

0604名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fdc-V2rD)

2024/07/24(水) 08:45:43.79ID:???0

llama3.1がgroqで触れるので70b版を触って来たけど最低限日本語っぽいものが返ってくるレベルやな　
脱獄プロンプト入れればエロプロンプトも通るけど誤字や簡体字混じりの文章でなにかのトリガーで同じフレーズを繰り返し始めるしなかなか厳しい
command r+くらいの性能はあると期待してたけど設定が悪いんかな

0605名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f5e-G/Qc)

2024/07/24(水) 10:04:08.93ID:VZ5aVPvs0

>>603
尻タブなら>>153周辺参考にしてもらえればなんやけど、大葉ってcustom stopping strings的な機能あったかわからん
あると思うが名称違うかもしれん

0606名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f5d-UVyF)

2024/07/24(水) 10:16:53.06ID:???0

ついにGPT4oを超えるオープンなLLMが出た
すごい事だが405bって何GBあれば動くんだ

0607名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-srET)

2024/07/24(水) 10:17:32.79ID:???0

なんか日本語弱いらしいよ

0608名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fb3-x6+9)

2024/07/24(水) 10:24:30.47ID:???0

perplexityで405B使えるけど、控えめに言ってゴミ
指示を理解してない上にそれを差し引いても表現ができてない
出力の質はGPT4oどころかGPT3.5にも劣る

0609名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f8e-srET)

2024/07/24(水) 10:38:57.85ID:???0

モデルカードの対応言語に日本語がないしまあ普通に対応外なだけなんじゃないか

0610名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fb3-x6+9)

2024/07/24(水) 10:55:04.74ID:???0

ドスケベメイドの自己紹介
3.5sonnet
i.imgur.com/UCpdPOL.png
GPT4o
i.imgur.com/s0VQ7ls.png
3opus
i.imgur.com/qQlveZY.png
LLAMA3.1 450B
i.imgur.com/BncztsU.png

0611名無しさん＠ピンキー (ﾜｯﾁｮｲ 8bc7-3QTr)

2024/07/24(水) 11:30:11.56ID:???0

>>605
ありがとう
尻使いなので一度やってみたんだか発狂しだしてな…
Lora使わずにプロンプトいじったり
単体のセリフ集をRAGしてみるよ

0612名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f74-cRQS)

2024/07/24(水) 11:31:59.62ID:???0

日本語はもうcohereに期待するしかないな
405bじゃ個人でのファインチューンも難しいだろうし

0613名無しさん＠ピンキー (ﾜｯﾁｮｲ 9be3-V2rD)

2024/07/24(水) 11:47:38.37ID:???0

別にしちゃダメってわけじゃないけど
何でローカル寄りなスレなのにパープレやpoeでの脱獄を推奨する人がここに居座ってるんや…？

0614名無しさん＠ピンキー (ﾜｯﾁｮｲ fb32-G/Qc)

2024/07/24(水) 12:00:17.76ID:???0

エッチなことをするとすぐ頭が真っ白になるのをやめさせたい
もっと他に表現方法ないのかよ！

0615名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f64-l0Lg)

2024/07/24(水) 12:03:45.08ID:???0

嫌なら出てけば？
誰も困らんぞ

0616名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-G/Qc)

2024/07/24(水) 12:19:35.50ID:???0

かしこさでは3.5sonnetが頭１つ抜けててCR+その他のローカル可能モデルは置いて行かれてる感じだな

0617名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f8e-srET)

2024/07/24(水) 12:21:43.30ID:???0

Llama3.1については70Bでも本来のベンチマークスコアは高いので
405Bは置いといて70Bベースの日本語モデルが出ることに期待してる

0618名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-srET)

2024/07/24(水) 12:21:43.72ID:???0

>>608
しかも3より規制きついな
日本語能力は対象外になってるのでまあ、御察し
ただ、推論力は高い
英語での質問に生徒会恋愛問題を完全とは言わないが正解に近づいけていた
日本語での質問はダメだったがｗ

0619名無しさん＠ピンキー (ﾜｯﾁｮｲ 8b6a-oASD)

2024/07/24(水) 12:46:30.17ID:???0

405bそんなダメかなあ

0620名無しさん＠ピンキー (ﾜｯﾁｮｲ dffb-3SVq)

2024/07/24(水) 12:51:22.01ID:???0

生徒会恋愛問題とは一体・・・・うごごっ

誰かマルチモーダル試している人居ないか？
画像を読み込ませて解析させるChatGPTとかでお馴染みの機能
大葉は拡張設定が面倒でkoboldcppで試したけど上手く行かん

画像生成のCILPに該当するllava mmprojのモデルに汎用性が無い？
ninjaやエロLLMで使おうとしたら壊れた文章しか出さなかった
llavaとセットのllmで動かしたら低性能だけど一応は動いた

0621名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ba0-srET)

2024/07/24(水) 14:29:49.07ID:???0

405Bいらんから70Bの日本語特化モデルを出してくれよ

0622名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f74-1Aj4)

2024/07/24(水) 14:40:38.30ID:???0

そもそも3.0からどれくらい性能アップしとるんやろな

3.0 70bはgemma2 27bよりも英語では性能低いから
3.1 70bが多少性能上がったところで日本語特化モデル作るならgemma2 27bと思うんやな

0623名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f8e-srET)

2024/07/24(水) 16:15:37.61ID:???0

>>619
ダメとかの問題じゃなくて動かせないし…

0624名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-srET)

2024/07/24(水) 18:11:04.83ID:???0

>>623
ワイはperplexityで試した

0625名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f74-1Aj4)

2024/07/24(水) 18:56:02.25ID:???0

公式に日本語対応してないからしゃーないやろ
まず英語の性能見たいけどchat arenaにまだ出てきてへん
まぁあとニ2、3日すれば出てくるやろ

0626名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fb3-x6+9)

2024/07/24(水) 20:08:33.07ID:???0

英語エロも試したけど、曖昧な表現ばかりでそもそもエロにならないな
オナニー実況
3.5sonnet
https://i.imgur.com/2Hn2wi0.png
llama3.1 405B
https://i.imgur.com/ViFZaCE.png

0627名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b09-PUYf)

2024/07/24(水) 20:40:38.12ID:???0

現状ローカル寄りというのは正しいけど、それはwebサービスで満足できない奴がより深い所に辿り着く結果ローカルの話になっているだけだと思う。
webサービスにより良いもの、新しいものが出現したら話題がそっちに流れる事はありうる。(405Bの話の様に)

0628名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-srET)

2024/07/24(水) 20:41:14.54ID:???0

>>626
規制がパワーアップしてるせいだな
pfnet/Llama3-Preferred-MedSwallow-70B
↑これみたいなfinetuneされれば、化けるかも

■ このスレッドは過去ログ倉庫に格納されています