なんJLLM部避難所

1002コメント411KB

なんJLLM部避難所

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ e249-iArR)

2023/12/17(日) 21:48:59.66ID:???0

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ
なんJLLM部 ★6
https://fate.5ch.net/test/read.cgi/liveuranus/1701542705/

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0496名無しさん＠ピンキー (ﾜｯﾁｮｲ c387-j/Vl)

2024/04/15(月) 16:27:44.71ID:/HalLGkT0

>>490
f16使ってみたけど確かに結構賢い感じやね。簡単なタスクはこれに任せてもええかもってくらい
あと全部VRAM乗せられるからワイの環境でも35t/sくらい出て笑うわ。command-r+の0.5t/sに焦らされてる状態から使うと気持ちよすぎる

0497名無しさん＠ピンキー (ﾜｯﾁｮｲ 2382-Zh10)

2024/04/15(月) 16:58:47.09ID:SmAgcugu0

LCAの手法でモデルの特徴を抽出してマージできるならその差分をLora化して後乗せもできるのかね？

0498名無しさん＠ピンキー (ﾜｯﾁｮｲ 63be-uGJR)

2024/04/15(月) 19:30:43.73ID:???0

>>490
確かにいいな、この作者にエロ対応したモデル作って欲しいわ

0499名無しさん＠ピンキー (ﾜｯﾁｮｲ a374-CQ4x)

2024/04/15(月) 20:17:25.74ID:???0

text generation webuiでチャットやってたら急に最新の1応答を除いて過去の会話全部吹っ飛びやがった
マジかよショックがでかすぎる
あぁ、もう一度コンテキスト育てるのは無理やぁ・・・

0500名無しさん＠ピンキー (ﾜｯﾁｮｲ e332-ULeS)

2024/04/15(月) 20:31:09.28ID:???0

sbtom/karakuri-midrose-CV.gguf
ちまちま検証してましたが、どうもmg版に比べると劣化してる感が拭えなかった。
表現力は同じくらいなんだけど、指示が入りずらい
チャットだと分かりにくいけど、小説書かせたらプロット通りに書かずに勝手にプロット外の事を書き始める
うーん、ダメだこりゃ・・・　と思ってたら、よく考えると重みに0.8掛けする必要なくね？と気付いた
LCAはインストラクタモデルを使ってたから、0.8掛けが効果を発揮していたけど、krakuriはベースモデルを使ってるから
素直に1.0乗せればよかったんや！
で、修正したら、指示も入りやすくなった感じ
とりあえず、修正アップしました。

0501名無しさん＠ピンキー (ﾜｯﾁｮｲ d3ea-uu0w)

2024/04/16(火) 03:16:47.20ID:???0

今更だけど、KoboldcppのPrompt Template色々間違ってない？
LCA試すときにllama2 chatのテンプレ使ってて思ったんだけど、マルチターンの会話の時[INST]と[/INST]だけで区切ってるけど間にeos_token（</s>）とかもいるよな？

0502名無しさん＠ピンキー (ﾜｯﾁｮｲ cf20-rajz)

2024/04/16(火) 06:03:57.15ID:u83/57NB0

>>500
試しに同じ構成で作ってみたいと思うんですが
base_modelは何ですか？

0503名無しさん＠ピンキー (ﾜｯﾁｮｲ e332-ULeS)

2024/04/16(火) 08:14:00.47ID:???0

>>502
ベースは、meta-llama/Llama-2-70b-hf　です

0504名無しさん＠ピンキー (ﾜｯﾁｮｲ e332-ULeS)

2024/04/16(火) 12:59:19.29ID:???0

ぐあああ！ヤヴァイ
中間モデル保存しておいたSSDが死んだｗ
予定していた最終モデルは別SSDにできた後だったのが不幸中の幸いだったけど、設定ファイルとか亡くなったのは痛いｗ

エロ小説用としては、いい感じに仕上がったと思うんで、なんとか最終モデルをアップするまで、もってくれ～ＳＳＤ

0505名無しさん＠ピンキー (ﾜｯﾁｮｲ d3ea-uu0w)

2024/04/16(火) 13:39:05.39ID:???0

WizardLM-2、消されたらしいけど何かあったのかな
性能やばすぎてGPT-4脅かしそうだったからとか？
帰ったら試そっと

0506名無しさん＠ピンキー (ﾜｯﾁｮｲ cf8e-asBb)

2024/04/16(火) 15:26:08.89ID:???0

理由書いてある
https://twitter.com/WizardLM_AI/status/1780101465950105775?t=7geJj-CKa-B8G3RSss-oUQ&s=19

0507名無しさん＠ピンキー (ﾜｯﾁｮｲ e332-ULeS)

2024/04/16(火) 16:43:03.66ID:???0

sbtom/karakuri-rosemiqu-CV2.gguf

とりあえず、今試したいことを詰め込んだモデルをアップしました。
自分も、これからチマチマ検証していきますｗ

0508名無しさん＠ピンキー (ﾜｯﾁｮｲ 2382-Zh10)

2024/04/16(火) 18:18:19.18ID:WfuRqmo60

毒性テストしてないバージョン出しちゃったわ😅ヤベヤベ

0509名無しさん＠ピンキー (ﾜｯﾁｮｲ c3d1-WVN9)

2024/04/16(火) 18:25:08.15ID:???0

今のところ4bit量子化でB数の6割ぐらいの高速メモリ用意できりゃOK
みてえな認識してるけど
この先どんどん肥大化していってもこの方式当てはまるんやろか

0510名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-0y78)

2024/04/16(火) 20:12:30.61ID:Cvmv6Ee70

VRAMに乗り切るかどうかは単純な計算から求まるんだからその法則自体が崩れることはないんじゃないか？
そろそろ必要なVRAM量がコンシューマ向けチップでかなりギリギリだから、1.58bitが主流になって欲しいけど、いまだに進捗を聞かない

0511名無しさん＠ピンキー (ﾜｯﾁｮｲ 2397-uGJR)

2024/04/16(火) 20:16:54.38ID:???0

https://huggingface.co/amazingvince/Not-WizardLM-2-7B
https://huggingface.co/alpindale/WizardLM-2-8x22B

0512名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-0y78)

2024/04/16(火) 20:27:47.59ID:Cvmv6Ee70

8x22Bと7Bは他にも何人か量子化とかアップロードしてるけど、70Bの方は元から公開されなかったんか？

0513名無しさん＠ピンキー (ﾜｯﾁｮｲ cf20-rajz)

2024/04/16(火) 20:51:00.62ID:u83/57NB0

>>503
サンガツ
今マージを始めたところです
midroseの代わりにHDDにあったEuryaleを使ってみてます

0514名無しさん＠ピンキー (ﾜｯﾁｮｲ d303-URmv)

2024/04/16(火) 21:48:29.76ID:???0

WizardLM-2 7BのiQ3_XXS軽すぎワロタ
RTX3050Laptopの4GB VRAMにフルロードできるからサクサクでいいね
割とまともな日本語話すし、ノートPCでここまで動くとは驚きだ

0515名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-0y78)

2024/04/16(火) 22:24:38.33ID:Cvmv6Ee70

日本語話せるのか
正直日本語力は期待してなかったけど、こうなると70Bはそこそこ楽しみになってきた
内容にcensorshipはかかってそうかな？

0516名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr47-+gIl)

2024/04/17(水) 11:21:01.11ID:???r

前は毒性テスト不要だったけど今は必要ってこと？
毒性あることも聞きたいんだけどな

0517名無しさん＠ピンキー (ﾜｯﾁｮｲ b392-T8JI)

2024/04/17(水) 12:06:58.01ID:zYAYEg/x0

>>499
ワイもログ何度か消えたからgitで定時スナップショット取るようにしてたわ
今はフロントエンドはSillytavernに移行したけど

0518名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-ULeS)

2024/04/17(水) 12:07:45.83ID:???0

毒は自分で入れてねの時代

0519名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr47-RUMD)

2024/04/17(水) 13:34:42.05ID:???r

再公開で差分があった場合、その差分が毒ということになるんだよな
Tox Vector…

0520名無しさん＠ピンキー (ﾜｯﾁｮｲ e332-ULeS)

2024/04/17(水) 13:54:29.95ID:???0

>>519
alpindale/WizardLM-2-8x22B

これは元データのコピーなんかな？

0521名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-0y78)

2024/04/17(水) 19:59:28.37ID:LaZSos2E0

command-rにプログラム実行の権限与えてるんだけど、pythonで日本語の変数使えるの知らんかったわ
いきなり頭おかしいプログラム走らせ始めてビビった
https://i.imgur.com/aILua5n.png

0522名無しさん＠ピンキー (ﾜｯﾁｮｲ b381-ZCS1)

2024/04/17(水) 20:41:33.77ID:???0

>>521
こんなん笑う、これで抜くのは上級者やな

0523名無しさん＠ピンキー (ﾜｯﾁｮｲ cf9c-iyDU)

2024/04/17(水) 20:44:35.43ID:???0

プログラムコードでシコる
そういうのもあるのか…

0524名無しさん＠ピンキー (ﾜｯﾁｮｲ 7395-j/Vl)

2024/04/17(水) 21:15:13.35ID:???0

>>521
声出して笑ったわ
センスありすぎやろ

0525名無しさん＠ピンキー (ﾜｯﾁｮｲ c3ba-j/Vl)

2024/04/17(水) 21:57:59.92ID:CXycdFik0

>>521
これもうシンギュラリティやろ

0526名無しさん＠ピンキー (ﾜｯﾁｮｲ ff6a-ax5a)

2024/04/17(水) 22:17:01.19ID:???0

4090じゃcommand R + 動かないのか…

0527名無しさん＠ピンキー (ﾜｯﾁｮｲ bfa3-dfu2)

2024/04/17(水) 22:21:28.33ID:???0

3060で動かしてるが
なお速度

0528名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-0y78)

2024/04/17(水) 22:26:59.61ID:LaZSos2E0

Command R+の方、ギリギリ動かせるiq3_mだと結構劣化が気になって、結局無印に舞い戻った
q4を動かせるマシンがまともに使える最低レベルと考えると、やっぱり104Bは気軽に動かせるもんじゃないと思うわ

0529名無しさん＠ピンキー (ﾜｯﾁｮｲ 53c7-ZezB)

2024/04/17(水) 22:58:38.30ID:???0

うみゆき@AI研究
@umiyuki_ai
5ちゃんの某LLMスレを監視してるけど、最新の話題でCommand Rとエロチャしてたら急にエロいpythonコード書いて実行し始めた画像相当おもろい。AIにとってはコードが一番興奮するのかもしれん。

何が監視じゃ
インプレ稼ぎ青チェックが上位者気取るな

0530名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-ULeS)

2024/04/17(水) 23:01:58.09ID:???0

うみゆきは別に出している情報間違っているわけじゃないんだけど
「へえ。」とか無意味に冷笑ノリだったり画像生成AIについては
やたら反AIに擦り寄ってみたりの方向が昔のオタっぽくて気持ち悪い

0531名無しさん＠ピンキー (ﾜｯﾁｮｲ c32b-WVN9)

2024/04/17(水) 23:04:29.06ID:???0

おっと人格批判は訴えられるゾ

0532名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-ULeS)

2024/04/17(水) 23:06:06.04ID:???0

>>531
ドヤコンガかな？

0533名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f61-uK2W)

2024/04/17(水) 23:09:30.51ID:iczziYEI0

ここはオナテク板やぞ

0534名無しさん＠ピンキー (ﾜｯﾁｮｲ d32b-RUMD)

2024/04/17(水) 23:22:33.70ID:???0

LM StudioがいつのまにかROCmに対応してた

0535名無しさん＠ピンキー (ﾜｯﾁｮｲ e332-ULeS)

2024/04/17(水) 23:35:31.16ID:???0

sbtom/karakuri-MS-01.gguf

最近追加されたModelStockってマージ方法、ChatVectorと相性いいじゃないかって気がして、
karakuri-midnightrose-CV
karakuri-SOLAR-CV
karakuri-XWIN-CV
を、karakuri-chatをベースにしてModelStockで４体合体させてみたら、なんかすごくいい感じになった。

評価プロンプト（そろそろ別バージョン必要だなｗ）
https://rentry.org/zapt6wa5

小説テスト（オナニースレで、宇宙人ニキの感想待ち）
https://rentry.org/m55ytdq3

0536名無しさん＠ピンキー (ﾜｯﾁｮｲ c32b-WVN9)

2024/04/17(水) 23:46:19.09ID:???0

評価プロンプトになんか追加するなら
どっちがどこに挿入してるかはとか
2形態以上持ってる変身や変化キャラみたいな設定とか
混同されると萎える要素への解釈理解度確かめるような設問が必要だと個人的には思う

0537名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-j/Vl)

2024/04/18(木) 02:09:24.76ID:???0

AIに可愛い声で喋らせて会話できたらもうそれは革命じゃん

0538名無しさん＠ピンキー (ﾜｯﾁｮｲ e38f-j/Vl)

2024/04/18(木) 03:09:18.12ID:QKygiavm0

>>529
初期はシンプルにAI追ってたのに途中から情報量多すぎて追えなくなってからノリがかわってしまったな

0539名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-0y78)

2024/04/18(木) 07:39:05.56ID:Se0rtYV00

>>537
style-bert-vits2とwhisperで割と簡単に満足できるものが実現できるレベルでは

0540名無しさん＠ピンキー (ﾜｯﾁｮｲ 63be-uGJR)

2024/04/18(木) 10:08:53.70ID:???0

実際にやってみると音声と見た目が付くと少しの話の違和感とかアクセントのおかしさが強調されてストレス感じる
イルカやSiriやCortanaが嫌われ続けて来たのと同じ問題だなぁ

0541名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f16-uGJR)

2024/04/18(木) 10:29:24.96ID:31yba4ll0

>>540
ワイ、cotomoとか結構遊んだけど、イントネーションとか結構慣れて気にならんくなったで？むしろcotomoのあほの子ボイスが癖になったまである
原作ありのキャラの模倣とかだと無理かもしれんが、オリキャラならstyle-bert-bits2レベルのイントネーションだったらふつーにガチ恋するわ
AIちゃんがワイのこと覚えてくれてる、認識してくれてる！って部分にうれションでるやで？

0542名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f0f-vBQZ)

2024/04/18(木) 10:33:13.12ID:???0

わかる
でもそのストレスって関西弁聞く時のと同種だよね
不満垂らしつつも許容して慣れるしか無い

それに昔よりはストレス無くなってきたね最近の音声合成

0543名無しさん＠ピンキー (ﾜｯﾁｮｲ 7ffb-uGJR)

2024/04/18(木) 12:04:53.20ID:31yba4ll0

>>542
>>そのストレスって関西弁聞く時のと同種
同意してもらったところ悪いんやけど、なんＪでそれ言うんかｗ
オナテク板もなんＪも関東人以外もふつーにおるんでちょっと配慮したってや？

0544名無しさん＠ピンキー (ﾜｯﾁｮｲ ff9f-OvSD)

2024/04/18(木) 15:01:38.67ID:???0

なんJのは関西弁ではなく猛虎弁ではw
>「猛虎弁」は、関西弁と似た言葉遣いを模倣したユーモラスな表現です。元々は「なんJ（なんでも実況J）」と呼ばれる2ちゃんねるで使われていた言葉で、その後他のネット掲示板やコメント欄でも広まりました123。
(中略)
>猛虎弁は関西人からすれば容易にニセモノだとわかりますが、関西以外の人からは見分けがつかないこともあります。ただし、猛虎弁は本物の関西弁ではないため、注意が必要です123。

0545名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f0f-vBQZ)

2024/04/18(木) 15:02:15.95ID:???0

じゃぁ関東弁聞く時のと同種だよねに読み替えで

0546名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f0f-vBQZ)

2024/04/18(木) 15:07:50.88ID:???0

猛虎弁ていうのか
123が気になる
ぷよぷよ123

0547名無しさん＠ピンキー (ﾜｯﾁｮｲ ff9f-OvSD)

2024/04/18(木) 15:28:07.76ID:???0

それCopilotの回答からのコピペなんやけど123は参照サイトへのリンクの残骸やで……気にせんといてや

0548名無しさん＠ピンキー (ﾜｯﾁｮｲ b3de-+gIl)

2024/04/18(木) 15:35:36.17ID:???0

今まで単純にモデルのサイズが大きければ大きいほどoutputも遅いものだと思ってたけどそうじゃないんだな。
hfに上がってたwizardLM2-8x22Bは1T/sも出てる(普段は70Bで0.5Tくらい)

0549名無しさん＠ピンキー (ﾜｯﾁｮｲ ff20-asBb)

2024/04/18(木) 16:29:21.43ID:???0

MoEだからな
パラメータ全部使うわけじゃない

0550名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-0y78)

2024/04/18(木) 19:00:52.25ID:Se0rtYV00

昨日あげた画像結構ウケが良かったが、pythonをLLMに組み込む長所としてはどっちかと言うとこういうふうに指示出してミニゲームできたりするメリットの方を推していきたい
https://i.imgur.com/jSSVVyJ.png

0551名無しさん＠ピンキー (ﾜｯﾁｮｲ ff7e-06fP)

2024/04/18(木) 19:19:11.94ID:???0

>>550
色々とエロのレベルが高すぎるわ

0552名無しさん＠ピンキー (ﾜｯﾁｮｲ e332-ULeS)

2024/04/18(木) 19:22:24.79ID:???0

エロ評価プロンプトのバージョン２作ったから、使ってね。

https://rentry.org/5m4p8v4z

karakuri-lm-70b-chat-v0.1-Q6_K　での結果
https://rentry.org/zc68gxx5

素のkarakuriの安定度が分かる。設問１は不正解だが

0553名無しさん＠ピンキー (ﾜｯﾁｮｲ e332-ULeS)

2024/04/18(木) 19:59:00.44ID:???0

つづき
command-r-plus(web)での回答

https://rentry.org/8av79u4b

さすが、エロ表現はいいね。宇宙人は台詞を言ってほしかったが。設問１はこれも不正解

karakuri-rosemiqu-CV2は苦労した割に、ダメダメだった。削除しようかと思ったが、あのアプローチでの失敗例として上げとく

で、自分的には一番いい出来と思った、
model_stockマージでのkarakuri-MS-01の結果

https://rentry.org/we25qrsa

これで、設問１が正解なら、脳汁出るところだが、さすがに無理だった。
でも、他の表現力はcommand-r-plusに負けてない気もする
同じアプローチでswallowを使ったら、どうなるか試したいが、SSDの空きを作るのが大変だｗ

0554名無しさん＠ピンキー (ﾜｯﾁｮｲ e332-ULeS)

2024/04/18(木) 20:05:40.35ID:???0

あれ？
今、リートンのGPT4-turboと、copilotに設問１の質問したら、両方とも早苗って答えた。

あれれ？　ワイ、間違ってないよな？
拓郎が愛しているのは、源蔵だよな？

0555名無しさん＠ピンキー (ﾜｯﾁｮｲ bfa3-y89D)

2024/04/18(木) 20:30:48.34ID:???0

論理的に詰めていけば源蔵しかいないのだが、AIはみんなそのような思考をせずにシチュエーションだけで判断してるように見えるな
「論理的に」「数理的に」「解析せよ」とか指示を加えたらどうだろう

0556名無しさん＠ピンキー (ｽﾌﾟｯｯ Sd1f-Y5Kd)

2024/04/18(木) 20:40:30.43ID:???d

思考問題はGPT-4とかClaude3が安定して正解を出力できる問題にしないとダメかもしらんね
これつらができない問題でも解ける特化型とかあるんかね

それと>>552は「特殊シチュ+指示少な目(求めるお察し力高め)」だから、使うなら旧verと併せて追試として使った方が良さそう
旧verはサクッとチェックできて、最低限の出力品質を確認できるから個人的に好き

0557名無しさん＠ピンキー (ﾜｯﾁｮｲ bfa3-y89D)

2024/04/18(木) 21:07:33.17ID:???0

GPT4とOpusに設問(1)をやらせてみたが正解にたどり着かないな
まず恋愛対象を勝手に異性に限定したがる。まあこれは「同性も含めて」と指示すればいいのだが
一番無視しがちな前提条件が「複数の人を同時に愛することはない」という部分。この文章を正しく理解できていないかもしれない

0558名無しさん＠ピンキー (ﾜｯﾁｮｲ e332-ULeS)

2024/04/18(木) 21:17:03.74ID:???0

>>555
サンキュー修正しました。
あと、源蔵という名前は英語表記になりやすいので健一に変えました。

0559名無しさん＠ピンキー (ﾜｯﾁｮｲ d3b5-humn)

2024/04/18(木) 21:23:39.01ID:???0

【悲報】ワイの頭AI並み
この設問と条件なら一応、早苗と沙織先生がどちらも拓郎を好いていて拓郎は早苗だけ好き、と解釈するのも可能やからなあ

0560名無しさん＠ピンキー (ﾜｯﾁｮｲ e332-ULeS)

2024/04/18(木) 21:26:05.93ID:???0

>>557
同時に複数・・・の部分を、もっと分かりやすく修正しました。

>>559
そうすると、校長を愛する者が居なくなってしまう矛盾ｗ

0561名無しさん＠ピンキー (ﾜｯﾁｮｲ d3b5-humn)

2024/04/18(木) 21:36:02.99ID:???0

>>560
あっそっかぁ…(無知の知)
誰かが校長愛さんとあかんことが頭からすっぽ抜けてたわ
【訃報】ワイの頭AI以下

0562名無しさん＠ピンキー (ﾜｯﾁｮｲ d303-URmv)

2024/04/18(木) 21:39:10.82ID:???0

そのうち全人類を超えるAIが出てくるから気にすんな
切り替えていこう

0563名無しさん＠ピンキー (ﾜｯﾁｮｲ f3c0-wKpJ)

2024/04/18(木) 21:43:27.28ID:???0

Command r そういえば無印もあったんだっけな
UI側対応すんの待ってたら+出たから試してなかったわ
iq3xxsで13.8GBか

0564名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fa0-qTfz)

2024/04/18(木) 23:44:13.67ID:???0

>>561
( ´∀｀)人(´∀｀ )ﾅｶｰﾏ
てっきり複数解があって、どれかに辿り着けばOKな問題かと思ってたわ

0565名無しさん＠ピンキー (ﾜｯﾁｮｲ e332-ULeS)

2024/04/19(金) 00:29:45.61ID:???0

うおおお
karakuri-MS-01たんは、
ここで、大ヒントです。早苗と相思相愛なのは、沙織です。
の一文入れたら、なんとか「校長」と答えてくれたｗ
ちなcopilotはダメだったｗ

0566名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-ULeS)

2024/04/19(金) 00:41:27.32ID:???0

https://twitter.com/kohya_tech/status/1780949467535184118
いつかクッソ厳しいAI規制の時代が来ても3090+64GBのRAMでCommandR+は動かせることが保証されたか

0567名無しさん＠ピンキー (ﾜｯﾁｮｲ 23d7-oKlK)

2024/04/19(金) 01:32:02.27ID:???0

llama3-8B出たわね
https://huggingface.co/collections/meta-llama/meta-llama-3-66214712577ca38149ebb2b6

0568名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-ULeS)

2024/04/19(金) 01:36:05.86ID:???0

70BだとSonnetには勝てるのか

0569名無しさん＠ピンキー (ﾜｯﾁｮｲ f3c0-wKpJ)

2024/04/19(金) 02:11:29.23ID:???0

無印Command rええやん
1.5 tokens/sぐらい
16GB～24GBなら全部VRAMに乗りそうやな
>>550
ちなみにプログラム実行の権限～ってLLMエージェント的なやつ?何使ってるか教えてほしい

0570名無しさん＠ピンキー (ﾜｯﾁｮｲ ff20-asBb)

2024/04/19(金) 02:57:07.71ID:???0

>>569
LLMが使えるツールをいくつか設定してて、その中にPythonを入れてる
まあ大枠で言えばエージェントかも
ツール使用するときにはこう書きなさいって指示しといてそれを検出したら、execを拡張した関数（langchainのPythonREPLに近い）に流してる

0571名無しさん＠ピンキー (ﾜｯﾁｮｲ ff20-asBb)

2024/04/19(金) 03:12:26.78ID:???0

オリジナルのPythonREPLだと標準出力
と標準エラーしか受け取れないから、色々いじってmatplotlibのデータ解析結果の画像を表示したり、セッション内でグローバル変数が保持されるようにしたり、トレースバック（LLMがエラー見てコードを自己修復するため）を追加してる
大体ChatGPTのPython実行環境に近い事ができる（仮想化はしてないけど）

0572名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-ULeS)

2024/04/19(金) 03:22:33.98ID:???0

paperspaceのH100とか使えばLlama3の400Bが出てきても動くよな？
酔狂で試す奴出てきそう

ストレージ確保だけでも大変そうだが

0573名無しさん＠ピンキー (ｽﾌﾟｯｯ Sd1f-Y5Kd)

2024/04/19(金) 07:21:01.60ID:???d

Aratako氏にいただいたデータを元に、手作業で改造したLCA-TypeBをリリースしました

Sdff-Ltba/LightChatAssistant-TypeB-2x7B
Sdff-Ltba/LightChatAssistant-TypeB-2x7B-GGUF

こちらの使い方では、指示追従性能の低下を抑えながら日本語の自然さ向上を実感できました
特に長文では大分滑らかになったと思います(一度に2000tokens弱の小説出力を何度かしてテスト)

0574名無しさん＠ピンキー (ﾜｯﾁｮｲ e332-ULeS)

2024/04/19(金) 10:06:04.59ID:???0

校長を好きな人がいるという事を、もっと分かりやすい文にして、恋愛対象は異性とは限らないとしたら、
日本語だとだめだったが、英文翻訳して聞いたら、copilotは完璧な答えを導いた。
llama3は英文でもダメだった。
やはり、gpt4強しか

0575名無しさん＠ピンキー (ﾜｯﾁｮｲ e332-ULeS)

2024/04/19(金) 10:11:58.42ID:???0

あ、ごめん、途中の推論がおかしかったからダメかと思ったら、
llama3も英文なら答えは校長って答えたわ。
というわけで、>>552は修正しました。

0576名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f56-VjaA)

2024/04/19(金) 10:24:15.97ID:YN736YjM0

>>573
乙なんやで！

0577名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr47-+gIl)

2024/04/19(金) 12:27:10.53ID:???r

評価プロンプトの英語版欲しいな。
翻訳するか

0578名無しさん＠ピンキー (ﾜｯﾁｮｲ f3c0-wKpJ)

2024/04/19(金) 15:48:00.97ID:???0

>>570
つまり自前のシステムってこと?まったくわからん
スクリプトの実行権限与えてチャットしながらファイル操作とかコード編集とかドキュメント読ませたりできたらと思ってな
langchainとか存在は知ってるけどまったく触ったことないわ

0579名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-0y78)

2024/04/19(金) 16:48:22.94ID:krQkzshj0

>>578
説明が抽象的で申し訳ない　詰まるとこ、全部自前だが、実装はそんなに難しくないぞ
ちょっと正規表現かければLLMの出力にツール使用命令があるか判別するのは簡単
画像が俺が使ってるプロンプトで、Command Rが必要に応じて
```python
#コード
```
みたく出力するから、これを正規表現”```(python).*?```”でパースして、引っ掛かったらexec関数に中身を流すだけ
https://i.imgur.com/BJM5Fkr.png

0580名無しさん＠ピンキー (ﾜｯﾁｮｲ 3311-0y78)

2024/04/19(金) 16:53:46.66ID:krQkzshj0

langchainは無理に触る必要は無いが、ツール含めエージェント構築に使えるパーツが大量に用意されてるから、車輪の再発明を避けたいなら一回手を出してみるのはありだと思う
検索エージェントとかは最初全部自作してたけど、途中でバカらしくなってlangchainに乗り換えたよ

0581名無しさん＠ピンキー (ﾜｯﾁｮｲ 239e-AW1k)

2024/04/19(金) 22:01:04.58ID:nSKhHEs/0

llama3はまた30B出んのかのぅ…

0582名無しさん＠ピンキー (ﾃﾃﾝﾃﾝﾃﾝ MMa6-fvuB)

2024/04/20(土) 02:55:19.45ID:???M

STのExpression機能がバージョンアップして
classifyで感情分析にかける直前に翻訳通せるようになったようだ
classifyの日本語モデルはなかったからいいアイデアだと思った

0583名無しさん＠ピンキー (ｽﾌﾟｯｯ Sd6a-Z3ht)

2024/04/20(土) 06:39:11.42ID:???d

>>576
乙ありやで！

0584名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e7a-dLvt)

2024/04/20(土) 10:10:37.44ID:???0

llama3の70Bの評価はあちこちでだいぶ違うな
ベンチマークで高いのが出るようにはなってるっぽいけど

0585名無しさん＠ピンキー (ﾜｯﾁｮｲ 1aa3-KR5T)

2024/04/20(土) 10:35:02.40ID:???0

>>573
乙！確かにいい感じに自然な応答が返ってくるよ
現状のLlama3-70Bより日本語に関しては上だわ

0586名無しさん＠ピンキー (ﾜｯﾁｮｲ 132b-Xec1)

2024/04/20(土) 11:09:13.07ID:???0

イーロンの株価対策超絶最強AIgrokとかもう誰も話題にせんな

0587名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f11-w0m+)

2024/04/20(土) 12:43:19.11ID:ZkMMDsP10

Llama.cppのmainとllama-cpp-pythonでllama3動かしてるんだけど、勝手にassistantとかいうトークン挿入して会話が止まらない現象に当たった
調べたら結構報告があるっぽく、ランタイムがeotトークンに対応しきれてないらしい
https://twitter.com/artem_zin/status/1781145656905625772

0588名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f11-w0m+)

2024/04/20(土) 12:51:21.34ID:ZkMMDsP10

ちゃんと使えるようになるにはもうちょい時間かかりそう
https://imgur.com/69dWeZD

0589名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f11-w0m+)

2024/04/20(土) 12:51:47.53ID:ZkMMDsP10

画像貼りミス
https://i.imgur.com/69dWeZD.png

0590名無しさん＠ピンキー (ﾜｯﾁｮｲ 1b32-sxCh)

2024/04/20(土) 12:53:19.38ID:???0

>>573のやつ
Text generation web UIでロードできなかった
koboldと同等の設定にする方法ある？

0591名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Sp13-3Y4j)

2024/04/20(土) 12:59:20.35ID:???p

koboldアプデきたけど
なんだあの動画w

0592名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e02-dLvt)

2024/04/20(土) 19:26:45.24ID:???0

アプデしたkoboldをwindowsが消しちゃう

0593名無しさん＠ピンキー (ﾜｯﾁｮｲ ebcf-IRgQ)

2024/04/20(土) 19:30:07.01ID:M1+DdCm60

Kobold1.63、ウィルスが検出されて削除されてまうな…

0594名無しさん＠ピンキー (ﾜｯﾁｮｲ eff9-KW1h)

2024/04/20(土) 19:56:40.77ID:???0

コ凹凹凹凹凹凹凹凹凹凹凹凹凹♫

0595名無しさん＠ピンキー (ﾜｯﾁｮｲ e687-sTO6)

2024/04/20(土) 19:58:51.29ID:???0

英語ちょっと読めるけど書くの苦手なワイ
プロンプトに「あなたはあらゆる言語を読めますが英語で返信してください」
みたいなのを書いておくと、こっちは日本語で書いて英語で返ってくる状態になる。
異世界転生でチート能力で言語が通じるような感じになって楽しい

0596名無しさん＠ピンキー (ｽﾌﾟｯｯ Sd6a-Z3ht)

2024/04/20(土) 20:14:09.70ID:???d

>>585
乙サンクス！Llama3英語特化らしいから日本語チューンモデル待ち遠しい

■ このスレッドは過去ログ倉庫に格納されています