なんJLLM部 避難所 ★3
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@ピンキー 転載ダメ (ワッチョイ 93c0-oLG6)2024/06/09(日) 07:37:14.82ID:???0
!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC(できれば+3060 12GB以上)でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部 避難所 ★2
https://mercury.bbspink.com/test/read.cgi/onatech/1714642045/

-
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured
0627名無しさん@ピンキー (ワッチョイ 4b09-PUYf)2024/07/24(水) 20:40:38.12ID:???0
現状ローカル寄りというのは正しいけど、それはwebサービスで満足できない奴がより深い所に辿り着く結果ローカルの話になっているだけだと思う。
webサービスにより良いもの、新しいものが出現したら話題がそっちに流れる事はありうる。(405Bの話の様に)
0632名無しさん@ピンキー (ワッチョイ 0fd5-upSA)2024/07/25(木) 04:21:16.00ID:V89ZaqLA0
>>629
llama-3.1とELYZAの悪魔合体モデルか
0633名無しさん@ピンキー (ワッチョイ 0fd5-upSA)2024/07/25(木) 04:22:54.23ID:V89ZaqLA0
Ninjaにllama-3.1追加してください
0634名無しさん@ピンキー (ワッチョイ bbbb-TapC)2024/07/25(木) 04:31:57.45ID:G9bWACJA0
>>629
はえーな
こんなでかいモデルのファインチューニングそんなすぐできるもんなのか
0638名無しさん@ピンキー (ワッチョイ 5f9f-YxOV)2024/07/25(木) 09:14:19.76ID:???0
https://huggingface.co/aixsatoshi/Meta-Llama-3.1-8B-Instruct-plus-Swallow
>Swallow-8Bは追加の日本語継続事前学習により日本語が大変流暢なLlama-3派生モデルです。
>このBranchとLlama3との差分ベクトルを、アップグレードされた新しいMeta Llama-3.1-8B-Instructに移植しました。
>Meta-Llama-3.1-8B-Instruct + 0.7*(tokyotech-llm/llama-3-Swallow-8b - meta-llama/Meta-Llama-3-8B)
0644名無しさん@ピンキー (ワッチョイ 5f74-cRQS)2024/07/25(木) 11:22:43.26ID:???0
chat arena見てたらいつの間にか言語別のランキング見れるようになってるな
結局日本語でもローカルで使えるモデルで一番高いのgemma2 27bだけど
日本語投票数少ないからもっと日本語でやらなあかんな
0647名無しさん@ピンキー (ワッチョイ 5f30-XTc+)2024/07/25(木) 12:27:14.89ID:kmDdavSa0
llama3.1に「山崎春のパン祭り」の説明させても不正解でがっかり
nemotronはシールと景品に言及できるあたり知識ベース自体はしっかりしてんのかな
0649名無しさん@ピンキー (ワッチョイ 4b09-PUYf)2024/07/25(木) 13:09:05.83ID:???0
たまに話に出てるMedSwallow-70B使ってみたけど、それなりに賢いしなんかエロい。
ただ書かれてる通り挙動がおかしい。
色々出てきても結局MoE-TEST-2x7B-NSFWが一番まともな気がする。
0650名無しさん@ピンキー (ワッチョイ 0f8e-srET)2024/07/25(木) 18:12:04.46ID:???0
mistral-large、3bitくらいまで量子化しないと動かんけどとりあえず試してみたがエロも普通に通るし日本語も自然だな
6t/sくらいしか出ないからまだあんまり試せてないけどもうちょっといろいろ触ってみる
0661名無しさん@ピンキー (ワッチョイ fb5a-V2rD)2024/07/25(木) 23:57:00.64ID:???0
ほへー構成メインか……どのレベルなんやろ
自分は起承転結やら個々のエピソードまでは構成するけど
・険悪だった二人が◯◯というきっかけで仲良くなるシーンを1000文字で
みたいなフォーマットで書いてくれるなら
かなり創作の手助けになるんやが

エロでいうと
・フェラだけで1000文字で
といっても三行で終わらせて本番始めるモデルばかりで辛い
0663名無しさん@ピンキー (ワッチョイ fb32-G/Qc)2024/07/26(金) 03:31:04.84ID:???0
どもる文章がおかしくなることがよくあるな
「い、今やろうとしたところだ!」が正しい形なのに
「こ、今やろうとしたところだ!」となって漢字の読みを考慮しないことがある
Q5とか使ってるからなのか

>>862
裏でのやり取りごと消去って出来ないのかな?
0664名無しさん@ピンキー (ワッチョイ 9bab-G/Qc)2024/07/26(金) 05:14:52.62ID:???0
>>660
ファイル名書き換えたら読み込んでくれるで。
例えば、kagemusya-7b-v1.5-q8_0の部分をkagemusya-7b-v1Q8_0に書き換える。
わいは使わんやつの名前に書き換えて、色々試してるで。
0665名無しさん@ピンキー (ワッチョイ fb32-G/Qc)2024/07/26(金) 05:24:42.48ID:???0
Mistral-Nemo-Instruct-2407.Q5_K_M.ggufでエッチなことさせて遊んでるけど
単なるロールプレイ会話よりもハメ撮り動画の実況解説みたいなことをさせた方が本領発揮するな
0667名無しさん@ピンキー (ワッチョイ fb32-G/Qc)2024/07/26(金) 06:53:05.18ID:???0
>>666
アルファベットなら頭文字の連続だけでどもりを表現できるけど
読みがたくさんある漢字だと色んなパターンを丸暗記するしかないのか
間違えることなくどもらせるのはかなり難しそうだな
0678名無しさん@ピンキー (ワッチョイ 9b93-b7mV)2024/07/26(金) 18:07:53.12ID:???0
>>670
新参なもんでまだ全然分かってない。すまぬ。
このスレに出てきてないものだと、Antler-7B-evolve、
EZO(common/humanitiesの2つ)があるから試してみて。

Antler-7B-evolveはKagemsyaみたいな用途で使えると思う。
0679名無しさん@ピンキー (ワッチョイ 1bbe-G/Qc)2024/07/26(金) 21:29:01.00ID:???0
3.5sonnetがマジでかしこいな
ちゃんと設定すればそこそこ複雑な設定のゲームも進行させられる
この技術がPCゲームに応用されたら凄いことになるんだろうけどなぁ
0680名無しさん@ピンキー (ワッチョイ cb11-FnV+)2024/07/26(金) 21:33:05.12ID:zWi3niPt0
Mistral Large 2
脱獄なしで設定書くだけでもNSFW出力してくれて大変良い
ロリNGとかも特になさそう
若干繰り返し癖はある
https://i.imgur.com/09DNkK1.png
0682名無しさん@ピンキー (ワッチョイ 3311-Mtf7)2024/07/27(土) 00:14:33.14ID:s9nYYsMX0
>>681
量子化のレベルはIQ3_M(モデルサイズ55GB)で、64GBのunified memoryにロードしてる
意外と量子化による影響はあまり感じない(ちゃんと計測したらなんらかの劣化はあるだろうが)
0683名無しさん@ピンキー (ワッチョイ e720-7i3u)2024/07/27(土) 00:14:48.90ID:lT0n9RUP0
>>680
いいねー
こういうオープンソースが増えるのは明るい未来に繋がる
0687名無しさん@ピンキー (ワッチョイ 7bc1-/CG0)2024/07/27(土) 15:18:05.92ID:???0
>>683
オープンソースじゃないんだよなぁ
たぶんフラッグシップモデルの開示はする予定じゃなかったんだろうけど

オープンソースと言えるのはApache2.0ライセンスやMITライセンスのやつ
LlamaもGemmaも制限があるし、Mistral Large2は研究用だから研究にしか使えない
Gemmaライセンスは違法なことや公序良俗に反することに使うなってだけで制限が緩いけどね
0688名無しさん@ピンキー (ワッチョイ 3311-Mtf7)2024/07/27(土) 18:52:19.55ID:s9nYYsMX0
上にあるサイバーエージェントのやつも試してみた
Finetuningでバカになってる感じもあまりないし、いいかもしれない
https://i.imgur.com/DASmyky.png
0693名無しさん@ピンキー (ワッチョイ be87-x+oO)2024/07/28(日) 00:24:38.08ID:???0
Mistral-Large-Instruct-2407-Q6_K がM3Max 128GBで動いた
ちょっと試した感じだとCommand R+より賢そうだけどめちゃくちゃ遅い
Command R+で行けたNSFWプロンプトは申し訳されてしまったので
ある程度の規制はされてるっぽい
0694名無しさん@ピンキー (ワッチョイ 3311-Mtf7)2024/07/28(日) 00:32:07.72ID:9iQh5kAD0
Mistral Large 2が遅いのはパラメータ数がでかいからというより、日本語が1トークン/文字になってることの方が影響大きい気がする
R+はtpsは決して早くはないけど、トークナイザが最強だからモデルサイズに比して体感かなりストレス少ない
0696名無しさん@ピンキー (ワッチョイ 3311-Mtf7)2024/07/28(日) 00:44:26.47ID:9iQh5kAD0
>>695
システムが占有するunified memory 10GBくらいを差し引いても、量子化したモデルならもうちょい大きめのでも動きそうじゃね?
Mistral NeMoとかいけると思うんだけど
0701名無しさん@ピンキー (ワッチョイ 3311-Mtf7)2024/07/28(日) 12:44:00.71ID:9iQh5kAD0
>>700
どのファイル使ったかわからんけど、catコマンドで結合した?
0703名無しさん@ピンキー (ワッチョイ 3311-Mtf7)2024/07/28(日) 13:14:51.07ID:9iQh5kAD0
>>702
いや、そうじゃなくて
モデルサイズが大きいとmmnga氏の場合、*.gguf.aと*.gguf.bっていう二つに分割されてることがある
その時は、シェルコマンドのcatを使って結合しないとllama.cppで読めないと思う
0706名無しさん@ピンキー (ワッチョイ 3311-Mtf7)2024/07/28(日) 13:37:10.24ID:9iQh5kAD0
>>705
調べてみたら、llama-3.1とllama.cppのバージョンに関するissueがoobaboogaに上がってた
https://github.com/oobabooga/text-generation-webui/issues/6270
ただ、うちの環境だと今のバージョンのllama-cpp-pythonでもllama-3.1読めてるからちょっと謎
0708名無しさん@ピンキー (ワッチョイ e3c8-05lm)2024/07/29(月) 00:12:26.20ID:???0
>>678
何度も質問してすいません

Antler-7B-evolveなどのモデルにおいて
以下のように分かれている場合は
どのようにすればEasyNAで使用できるんでしょうか

(model-00001-of-00002.safetensorsと
model-00002-of-00002.safetensorsの2つ)

例えば結合したりバッチファイルの書き替え方などがあるんでしょうか
0709名無しさん@ピンキー (ワッチョイ 9373-Xto+)2024/07/29(月) 19:19:02.85ID:???0
間違ってるかもしれんけど、それ量子化されてない気がするからどのみちやめた方がいいと思う
duyntnet/Antler-7B-evolve-imatrix-GGUF あたりにしたら?
huggingfaceの検索欄にAntler-7B-evolveって打ち込んだら出るはず
0710名無しさん@ピンキー (ワッチョイ 6fbe-RfJN)2024/07/29(月) 21:21:46.80ID:???0
WEBのAPIはマジで規制厳し過ぎなんだよな
エロはまだしも少しでも政治的要素が入ると駄目だから核戦争後の世界を扱うお約束のサバイバル小説ですら検閲されまくる
NATOやアメリカ、中国、ロシアの単語を直接出すのは勿論、欧州の某国みたいにぼかしてもNG
Jアラートとかの単語も少しでも与党側へネガティブとみなされると全削除なんて核戦争の詳細は全部ぼかさないと駄目だった
とにかく政治に対する検閲が異常
0711名無しさん@ピンキー (ワッチョイ e3c8-05lm)2024/07/29(月) 21:38:01.41ID:???0
>>709
助言ありがとうございます

SDと勘違いして.safetensors自体で
そのまま使用できると考えておりました

.ggufとの違いを理解していませんでした
申し訳ありませんでした
0721名無しさん@ピンキー (ワッチョイ 928b-RfJN)2024/07/30(火) 18:17:10.61ID:sqT3r6O70
>>720
なんてモデル?
0723名無しさん@ピンキー (ワッチョイ 928b-RfJN)2024/07/30(火) 18:59:13.28ID:sqT3r6O70
>>722
ty
0726!donguri (ワッチョイ 7b12-em/f)2024/07/30(火) 19:57:44.16ID:???0
いがいだったけどllama-3-elyza-jp-8bで申し訳されなかったかな。
最近、エロOKな流れになってるのかな。日本語が自然で好きなんですよね
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況