なんJLLM部避難所 ★3

1002コメント349KB

なんJLLM部避難所 ★3

レス数が900を超えています。1000を超えると表示できなくなるよ。

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ 93c0-oLG6)

2024/06/09(日) 07:37:14.82ID:???0

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★2
https://mercury.bbspink.com/test/read.cgi/onatech/1714642045/

-
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0831名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f6a-vCAx)

2024/08/11(日) 11:40:43.48ID:???0

しばらく円安でしょ

0832名無しさん＠ピンキー (ﾜｯﾁｮｲ bbbe-NNUV)

2024/08/11(日) 13:33:41.24ID:???0

>>830
情報が古いよ、日銀が株価維持のために利上げしませんって記者会見しちゃってるじゃん

0833名無しさん＠ピンキー (ﾜｯﾁｮｲ 7776-Jj2t)

2024/08/11(日) 18:05:46.99ID:???0

利上げしないとは言ってないぞ
金融市場が不安定なら利上げを遅らせると言った
つまり金融市場が安定したら利上げされる

あと、日銀が利上げしなくてもFRBは利下げするから金利差は確実に縮小していく

0834名無しさん＠ピンキー (ﾜｯﾁｮｲ eff8-/pw1)

2024/08/11(日) 19:07:32.21ID:???0

3090じゃあかんのか？

0835名無しさん＠ピンキー (ﾜｯﾁｮｲ efc4-UDdm)

2024/08/11(日) 22:23:58.74ID:???0

LLMならコア性能の影響をあまり受けないから3090で十分
画像生成するなら4090だが

0836名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e7a-nSnY)

2024/08/11(日) 23:02:18.66ID:???0

株で儲けてグラボ買ったほうがええやん

0837名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f74-V/Qk)

2024/08/11(日) 23:18:45.91ID:???0

VRAMにおさまりさえすればLLMもコアの性能に左右されるんやけどな
RTX A6000と4090で1.5倍くらいはちゃうような感覚やな
でも4090のVRAMに収まるLLMなんて正直ワイは使わんのやけどな

あとTensorRT使い始めたら恐らくH100とかのサーバー向けのやつのが伸びしろがすごいと思う

0838名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e7a-BHTg)

2024/08/12(月) 12:47:01.94ID:???0

出力受け渡して逐次的に分割処理できるなら
前から順々に読み込んで処理するような方式作ればVRAM要らずじゃね？

高速ストレージだけあれば実用的に使える奴そろそろ頼むわ。

0839名無しさん＠ピンキー (ﾜｯﾁｮｲ 8a35-l564)

2024/08/12(月) 15:20:24.91ID:MPZQ/+gL0

ちょっとスレチかもしれんがsilly tavernのdisco鯖の認証ってどう書いたら正解なんだ？
incinerator no cyrillic profile noって書いても不正解になってしまう

0840名無しさん＠ピンキー (ﾜｯﾁｮｲ ef3d-Hj8W)

2024/08/12(月) 16:47:02.10ID:???0

Mistral 7B系列のMoE試してるんだけどどんなモデルでやってもコンテキスト8kくらいで出力おかしくなってしまう
RoPEやYaRN回りの設定が関係してるのかなと推測してるけど拡張方法についてどなたかご存知でしょうか？

0841名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f6a-vCAx)

2024/08/12(月) 16:51:29.24ID:???0

量子化は？

0842名無しさん＠ピンキー (ﾜｯﾁｮｲ ca06-UDdm)

2024/08/12(月) 17:26:35.86ID:???0

VRAMを少しずつ使って処理をわけるのはvLLMっていうライブラリがあったような

0843名無しさん＠ピンキー (ﾜｯﾁｮｲ 3efa-giDl)

2024/08/12(月) 22:22:36.45ID:n41SnXM50

それって動くことは動くけど激遅ってことでしょ

0844名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fc8-EwOg)

2024/08/12(月) 22:31:24.49ID:???0

kagemusya作者様へ

v1.5はv1よりかなり使いやすくなっておりました
ありがとうございます
v2やv1.6の予定はありますでしょうか
またデータセットの構造はどのように
変化したのでしょうか

0845名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f74-V/Qk)

2024/08/13(火) 09:12:10.70ID:???0

vllmは秒間何十アクセスあるような業務向けのライブラリやで
1個の推論流すだけなら特に早いというわけではないけど、
複数の推論を同時に流すというときにこのスレで使われているようなライブラリとは
段違いの速度が出るはずや

0846名無しさん＠ピンキー (ﾜｯﾁｮｲ f7a0-EwOg)

2024/08/13(火) 10:46:59.24ID:???0

Rocket.Chatとllama.cppを繋げることできますか？
>>845複数のアクセスがある場合そういうの必要になりますか？

0847名無しさん＠ピンキー (ｽﾌﾟｯｯ Sd6a-qGVU)

2024/08/13(火) 12:50:19.32ID:???d

Llama.cppの作者さんが、セットアップ無しですぐ使える量子化ツールを公開してた
HuggingFaceにログインすれば誰でもすぐにGGUF変換ができるみたい!すご!
https://huggingface.co/spaces/ggml-org/gguf-my-repo

0848名無しさん＠ピンキー (ﾜｯﾁｮｲ f7a0-EwOg)

2024/08/13(火) 12:53:22.24ID:???0

悪魔合体するツールも作ってくれないかな

0849名無しさん＠ピンキー (ﾜｯﾁｮｲ ef3d-Hj8W)

2024/08/13(火) 14:23:30.78ID:???0

>>840
自レスだけど"sliding_window"に"max_position_embeddings"と同じ32768を設定して"rope_theta"を100000.0にしたところ拡張できた気がする
gguf化したの上げてみた
https://huggingface.co/Tuitou/Ninja-v3-Vecteus-v1-MoE-2x7B
プロンプト指定無しのgate_mode: randomでやって悪くなさげだから微調整したらもっと良くなりそう

0850名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a77-CWIW)

2024/08/13(火) 16:37:27.91ID:???0

お、触らせてもらおう

0851名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f74-V/Qk)

2024/08/13(火) 19:26:00.64ID:???0

>>846
「複数アクセス」の頻度によると思うで

例えば社員10人程度の会社で社内検索に利用しますとかだと同時に複数の推論が走ることはそんなになさそうやし
あったとしてもたまに遅いくらいなら待てるしって感じやけど、100人とか1000人という規模になるとどうなんやろうとか、
チャットとして利用するなら1回のGPU使用時間は少なくなりそうやけど文章翻訳とかで利用しようとしたら
1回のGPU使用時間長くなりそうやから同時に複数の推論が走る可能性も高くなりそうやとか

ケースバイケースやからこれと言えるものはないと思うんやけど、
常時同時に2推論以上回ることが想定される環境ではvLLMを検討しても良いんとちゃうかな
あとvLLM以外にもTensorRTも検討しても良いと思うやで

0852名無しさん＠ピンキー (ﾜｯﾁｮｲ bbbe-NNUV)

2024/08/14(水) 15:00:25.36ID:???0

4GBGDDRの卸価格は1枚2千円で製造コストは数百円なんだと
それを3枚程度余分に組む込むだけでほんまエゲツナイ値段にしてくるよな
本来64GB程度のVRAMなんて余裕で搭載できる筈なのに

0853名無しさん＠ピンキー (ﾜｯﾁｮｲ 13e8-vCAx)

2024/08/14(水) 15:09:38.23ID:???0

それHBMじゃないよね？

0854名無しさん＠ピンキー (ﾜｯﾁｮｲ 8332-NNUV)

2024/08/14(水) 15:10:46.05ID:???0

卸価格が2000円なら俺らの手元に届く間に10倍以上になってるんじゃねえの

0855名無しさん＠ピンキー (ﾜｯﾁｮｲ 17e7-V9jh)

2024/08/14(水) 15:22:20.91ID:???0

末端価格やべー
麻薬かよ

0856名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e7a-2hvn)

2024/08/14(水) 16:04:55.75ID:???0

このスレや相方のスレの住民にとっては実際麻薬みたいなもんやなw

0857名無しさん＠ピンキー (ﾜｯﾁｮｲ 77ed-Jj2t)

2024/08/14(水) 16:33:07.45ID:???0

後載せできないもので価格差付けるのはよくある手法だからね
スマホのストレージとか

0858名無しさん＠ピンキー (ﾜｯﾁｮｲ ee49-nSnY)

2024/08/14(水) 21:39:02.16ID:???0

そのコストの話が本当なら新参のintelがVRAM盛らないの謎だよな　4080ぐらいの性能と48GBあれば$2000以上で売れるだろうに噂レベルですらそんな話出てこない　技術的な障壁があるんかな
AMDやNvidiaはドル箱のHPC向けと競合するからコンシュマー向けのVRAMをケチるのは分かる

0859名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a7c-wEgr)

2024/08/14(水) 22:03:52.91ID:???0

intelがそこまで冒険せんのは分かるけどAMDはせめてVRAMではnVidiaを圧倒すべきや

0860名無しさん＠ピンキー (ﾜｯﾁｮｲ eedc-l564)

2024/08/15(木) 03:47:48.34ID:W672SyLg0

ただの談合だったりして
1社がVRAMを盛りまくると儲からなくなっちゃうからね

0861名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a7c-wEgr)

2024/08/15(木) 05:39:32.51ID:???0

まあAMDはとにかくRocmをCUDAに対抗できるレベルに育てるのが最重要やけどな…

0862名無しさん＠ピンキー (ﾜｯﾁｮｲ f7a0-EwOg)

2024/08/15(木) 06:21:48.11ID:???0

VRAMはめっちゃ高いのに、DRAMはゴミのようだ

0863名無しさん＠ピンキー (ﾜｯﾁｮｲ efae-oC+7)

2024/08/15(木) 16:03:12.76ID:???0

具体的な生産量を調べたわけじゃないけどGDDRはニッチだもんな
普通のPCはDDRだしグラフィックで超高帯域が欲しければHBM2使うし
インテルはCPUの処理をGPUに持っていかれるのを極端に嫌ってる気がする
バス幅考えるとGPUにはまるで追いつかないんだからどっさり積んで欲しいよね

0864名無しさん＠ピンキー (ﾜｯﾁｮｲ ee2d-NNUV)

2024/08/16(金) 10:27:25.77ID:3L/dQ32E0

申し訳を防ぐには申し訳されるような文章に対して真面目に回答するような文章を作ってFTすればいいのかな？
もしすでにあるのなら教えてほしい。無いなら作って実験する。

0865名無しさん＠ピンキー (ﾜｯﾁｮｲ 8332-YMr0)

2024/08/17(土) 06:21:26.35ID:???0

vectous-v1ってエロいことはいくらでもしてくれるのに
住所はプライバシー保護がどうたらってことで教えてくれないんだな
まあ住所をあらかじめ設定しておけば普通に教えてくれるようになるんだけど

0866名無しさん＠ピンキー (ﾜｯﾁｮｲ 23b4-TGwR)

2024/08/17(土) 06:44:46.44ID:???0

大葉をrocmで動かす場合に大葉の独自リポジトリにあるllama.cppのrocm用のバイナリが古すぎて自動イントールに任せると最新のrocm>=6.0だと動かない問題踏んだ
ワークアラウンドとしてはllama-cpp-pythonの公式パッケージをpipで入れてrequirement_amd.txtのllama関係全部コメントアウトしてpip install -r requirement_amd.txt
んでmodules/llama_cpp_python_hijack.pyの29行目をコメントアウトでいけた
Radeonで動かそうとするやつなんか滅多にいないからissue上がってるけど放置されてる模様

0867名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr47-6Mul)

2024/08/18(日) 08:25:42.01ID:???r

SBVits対応させるためにSillytavernをアップデートしてからAIの会話の先頭に半角スペースが入ってどんどん増えていくようになってしまったのだけど、同じような症状の人いる？
ちなみにSBVitsに読ませることはできた。上にも書いている人がいたようにSBvitsはApp.batとserver_fastapi.pyの両方を立ち上げないといけないようだね。

0868名無しさん＠ピンキー (ﾜｯﾁｮｲ ff83-ZnLy)

2024/08/18(日) 13:38:06.11ID:???0

>>867
俺はSBV2のserver.batを立ち上げるだけで連携されるしスペースが増えるような不具合は1度も出てないぞ

0869名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr47-6Mul)

2024/08/18(日) 13:55:28.10ID:???r

>>868
前に作ってあったbotでは起こらないけど、チャットデータを削除して新しく始めると再現された。
あとSBvitsにserver.batってある？server.pyかな？

0870名無しさん＠ピンキー (ﾜｯﾁｮｲ ff83-ZnLy)

2024/08/18(日) 14:17:01.91ID:???0

>>869
あるよ
githubでも確認できる

https://i.imgur.com/adgIMfN.jpeg

0871名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr47-6Mul)

2024/08/18(日) 14:46:23.84ID:???r

>>870
あるね！
Vitsのほうは4/5にクローンしたきりだったから、帰ったら更新してみる

0872名無しさん＠ピンキー (ﾜｯﾁｮｲ 63be-YMr0)

2024/08/19(月) 14:24:42.36ID:???0

ガードが堅くても頭がいいモデルだと色々言葉巧みに騙せる余地が結構あるな
変に頭がいい人のほうが詐欺に引っ掛かるって話となんかつながるものを感じる
頭悪いモデルはとにかく不同意は駄目、未成年は駄目で説得を受け付けない

0873名無しさん＠ピンキー (ﾜｯﾁｮｲ cf17-3X+B)

2024/08/19(月) 14:37:47.58ID:???0

GPT3.5と4の移行期にも同じ議論があったな
3.5は駄目なもんは駄目だけど4は脱獄(説得)の余地があるって

0874名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr47-6Mul)

2024/08/19(月) 22:26:44.40ID:???r

てかKoboldccpも新しいのが出たみたいなので全部新しくしたよ。cuda12の方を使っているけど爆速になった気がする？
Layer数を適切推定してくれるようになったみたいです。

0875名無しさん＠ピンキー (ﾜｯﾁｮｲ e332-ugRd)

2024/08/20(火) 17:32:24.94ID:???0

anthracite-org/magnum-v2-123b-gguf

これ動いた人いる？
koboldだと落ちるんだが

0876名無しさん＠ピンキー (ﾜｯﾁｮｲ cf8e-ugRd)

2024/08/20(火) 19:43:07.78ID:???0

>>875
iq3_sだけどUbuntu上のllama.cppでは動いた
日本語も表現力かなり高い印象はあるけど、まだいろいろ試せてはいない
VRAMは54GBくらい使ってるな

0877名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f77-xKKN)

2024/08/20(火) 23:07:36.32ID:???0

>>874
coboldCpp v1.72だと問題なかったモデルでvram不足が頻発するようになってしまった

0878マジカル (ﾜｯﾁｮｲ 53f3-nE6n)

2024/08/21(水) 12:47:03.46ID:6L3aYb9m0

>>844
ありがとうございます。
いつかはわかりませんが、バージョンアップの予定はあります。気長に待っていてください。

v1.5は一本の小説を学習コンテキスト長ごとに分割し、学習させています。
これによって、コンテキスト長ごとのカットオフにより、序盤の文章ばかり学習するのを防いでいます。
他にもやっていることはあるのですが、それはバージョンアップ時に公開します。

0879名無しさん＠ピンキー (ﾜｯﾁｮｲ 63be-YMr0)

2024/08/21(水) 17:05:53.15ID:???0

3.5sonnetの能力かなり高いな、写真に写ってる小さな文字や
淫紋が体のどこに入っているかどんな模様かまで詳細に認識しててちょっと怖くなるわ
AI監視カメラが広がってるしPCにも組み込まれるからもうプライバシーなんて欠片も無い時代になるんだな

0880名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-ugRd)

2024/08/21(水) 17:14:58.79ID:???0

監視カメラで録画し続けて全て起きたことへの解釈を残すってのは
現時点だとちょっとマシンパワー（クラウド料金）の問題でしんどいと思うが、
理論上は現時点でもできるだろうな

あまり人通りがないとこで、何かが通りかかったときだけ解釈開始とかなら
より現実的になるかも

0881名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f1c-fwoX)

2024/08/21(水) 18:55:20.63ID:???0

MSがやろうとしてたCopilotPCがそんな感じだったよね
全自動で定期的にデスクトップのスクーンショットを撮ってそれをLLMにテキスト化させて後から検索できるようにするっていう
セキュリティもクソもあったもんじゃなさすぎてお蔵入りになったんだっけ？

0882名無しさん＠ピンキー (ﾜｯﾁｮｲ 736a-GPKf)

2024/08/21(水) 19:21:23.38ID:???0

便利そうだけどね

0883名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-ugRd)

2024/08/21(水) 19:27:24.72ID:???0

>>881
オクライリじゃなくて「まだInsiderどまり」じゃね？

0884名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f98-QgJ3)

2024/08/21(水) 20:29:06.17ID:???0

>>875
mistral large 2に対応してるバックエンドなら動くと思う
結構エロいしそこそこいいよ

0885名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr47-6Mul)

2024/08/22(木) 02:15:07.33ID:???r

>>877
今の所自分の環境ではエラーは出ないな
GPUレイヤー数は3060 12GBで、35とか、画像生成中に起動するとロードしないとか自動的に設定しているみたい

>>620
Koboldをバージョンアップしたのでアップロードした画像の説明もさせてみたよ
Model Filesにvecteusならmistral系だと思うのでmistral-7b-mmprojのQ4量子化を指定している
肖像画や風景画で試したけど、メガネとか、砂漠と草原の違いとか認識できたよ
リポジトリの説明とか読んでると、セッションの1番初めに指定した画像くらいしか判別できず、何枚もアップロードすると混乱すると書いていたように内容が混ざる気がするのと、すぐにtoo many LLaVA tokensとエラーになり無視される

0886名無しさん＠ピンキー (ﾜｯﾁｮｲ 736a-GPKf)

2024/08/22(木) 04:55:20.29ID:???0

>>881
skyseaみたいな動きだから
コンプラツールとして有用かも

0887名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-Bjd/)

2024/08/22(木) 10:53:11.29ID:???0

MMって結構視覚障害者需要高いと思うよ？
喉から手が出るほど一般化を心待ちにしている人も多いと思う

0888名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-mjRE)

2024/08/22(木) 10:58:44.05ID:???0

なんかプロモーション動画が以前あったけど、視覚障害者用のスマートグラスは
急激に普及するやろね

重度の視覚障害者が世界中でどれだけいるかはともかく、政府とか慈善事業の団体とかが
大いに支援するでしょ　API代もAI業者が社会貢献として割とサービスするやろし

0889名無しさん＠ピンキー (ﾜｯﾁｮｲ d3cf-s6eo)

2024/08/22(木) 12:16:06.73ID:???0

いつもの人から新モデル出てた
calm3は結構性能高いみたいだけどこれはどうかな
https://huggingface.co/Aratako/calm3-22b-RP

0890名無しさん＠ピンキー (ﾜｯﾁｮｲ fff3-RapI)

2024/08/22(木) 19:29:14.95ID:KyWuiM5b0

Rewindつかってみな

0891名無しさん＠ピンキー (ﾜｯﾁｮｲ d3a0-mjRE)

2024/08/22(木) 21:26:15.77ID:???0

量子化はそろそろ整理されて欲しい
いらんのがあるんじゃないの

0892名無しさん＠ピンキー (ﾜｯﾁｮｲ 736a-GPKf)

2024/08/23(金) 07:52:23.16ID:???0

q4だけでいいよね

0893名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr47-Vz4w)

2024/08/23(金) 08:17:49.85ID:???r

それはない

0894名無しさん＠ピンキー (ﾜｯﾁｮｲ 8332-YMr0)

2024/08/23(金) 08:20:42.59ID:???0

色んなサイズを用意してくれていたらそれでいい

0895名無しさん＠ピンキー (ﾜｯﾁｮｲ d3d3-s6eo)

2024/08/23(金) 09:38:02.32ID:???0

calm3-RPはだいぶ短い出力するように学習されてるっぽいな
これはこれで好み分かれそうだが個人的には悪くない
もうちょいセリフ、状況描写、内面描写みたいに形式立って出力出来たらもっと良いけど
その場合は学習データをそういう形式にする必要があるのかな

0896877 (ﾜｯﾁｮｲ 3f7a-D2BG)

2024/08/23(金) 12:52:56.83ID:???0

すいません
生成aiで使ってるssdが原因でした…

安いのを酷使しすぎたかな

0897名無しさん＠ピンキー (ﾜｯﾁｮｲ cf16-tg9L)

2024/08/23(金) 21:20:05.76ID:???0

EasyNovelAssistantでリストにないモデルを手動で追加する方法が知りたい

0898名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f0b-xZES)

2024/08/23(金) 21:24:11.76ID:PpZA/B870

EasyNovelAssistant\setup\resにあるdefault_llm.jsonを書き換えればいいぞ
あと聞く前に自分でコード探して♡

0899名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM7f-WWAF)

2024/08/25(日) 09:05:01.62ID:???M

default_llm.jsonを書き換える前にバックアップ取っておくと良いよ
アップデートする時にdefault_llm.jsonの内容が異なるとエラーになるから
まあ最近アップデートないけどさ

0900名無しさん＠ピンキー (ﾜｯﾁｮｲ d732-v9dR)

2024/08/26(月) 10:30:05.66ID:???0

「この物語はこうこう、こういうものだ。さあ、あなたはこれからどうする！？」

みたいな始まり方に対して「物語は終わりだ」と早々に宣言したら語り手に怒られて草

0901名無しさん＠ピンキー (ﾄﾝﾓｰ MM03-nVI+)

2024/08/26(月) 19:50:01.89ID:???M

>>889
これ使ってみたけど神だった
理解力高い

0902名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ba0-OZ5M)

2024/08/26(月) 20:41:48.72ID:???0

>>889
同じく、しかもGPU8GBで動かしてもかなりの早さ

0903名無しさん＠ピンキー (ﾜｯﾁｮｲ d732-v9dR)

2024/08/27(火) 04:51:46.03ID:???0

>>889
これkoboldだとPollにしないと文字欠けが発生するんだけどさ
尻タブでも同様の設定にする方法ってあるの？
koboldをPollにしても尻タブだと文字が欠けるんだよね

0904名無しさん＠ピンキー (ﾜｯﾁｮｲ d732-v9dR)

2024/08/27(火) 04:53:51.15ID:???0

スペースをトリミングのチェックを外したら文字欠け無くなったわ

0905名無しさん＠ピンキー (ﾜｯﾁｮｲ d732-v9dR)

2024/08/27(火) 04:56:41.28ID:???0

やっぱり全然直ってなかったわ
どこを弄れば文字欠けが直るんだ

0906名無しさん＠ピンキー (ﾜｯﾁｮｲ 9277-VpqQ)

2024/08/27(火) 16:48:23.66ID:???0

sillytarvan今更かも知れないけどAnother'sNoteとSystem Promptで
めっちゃ表現力変わるのね・・・無知だったせいでやたら遠回りしてしまった
みんな独自の黄金テンプレート作ってんのかな

0907名無しさん＠ピンキー (ﾜｯﾁｮｲ f67a-OZ5M)

2024/08/27(火) 16:54:43.34ID:???0

Authorな

0908名無しさん＠ピンキー (ﾜｯﾁｮｲ afbe-v9dR)

2024/08/27(火) 20:06:11.13ID:???0

>>888
全盲でもごく簡単な字や道路位なら読み取れるようになるオーデコって装置あったけど
盲導犬利権の前に敗北して全然普及せずに終わってしまったし
MM利用した機器なんてのも同じ道を辿ると思うけどな

0909名無しさん＠ピンキー (ﾜｯﾁｮｲ bec1-v9dR)

2024/08/28(水) 00:12:29.55ID:M0+vTHB90

>>905
ワイの環境だとKobold＆尻タブともに最新版だが、特に文字が欠けるような現象は発生せんな…
ちなモデルはcalm3-22b-RP-Q4_K_M

0910名無しさん＠ピンキー (ﾜｯﾁｮｲ d732-v9dR)

2024/08/28(水) 04:02:31.06ID:???0

>>909
マジか、IQ2を使ってるせいかな……
「揉む」が「む」になるわ

0911名無しさん＠ピンキー (ﾜｯﾁｮｲ 0225-PpI7)

2024/08/28(水) 11:51:18.55ID:???0

>>906
どれぐらいかわるの？プリセのプロンプト項目とキャラシートにしか入れたことないや
それ全然知らなかった

0912名無しさん＠ピンキー (ﾜｯﾁｮｲ 2799-O0F+)

2024/08/28(水) 18:59:11.15ID:2SXByLjI0

尻タブを日本語で遊んでる時、皆セリフと平文どーやっとるん？
ワイは現状""と**でやっとるけど、半角/全角の切り替え億劫やし、本音を言えばセリフは「」で遊びたい
設定全部見たつもりなんやが、どこでセリフと強調文のキャラクタ指定できるのか分からんのやが、こればっかはどーもならんのやろうか？

0913名無しさん＠ピンキー (ﾜｯﾁｮｲ 120e-WSN2)

2024/08/28(水) 19:32:00.71ID:o+Bb6IDj0

普通にセリフは「」で囲まれています的なことをシステムプロンプトに入れるのではだめなん？

0914名無しさん＠ピンキー (ﾜｯﾁｮｲ 3bc6-ioAK)

2024/08/28(水) 19:41:19.11ID:???0

適当にやり取りしてその内容に「」をつけて会話例に記載するとか

0915名無しさん＠ピンキー (ﾜｯﾁｮｲ 0225-PpI7)

2024/08/28(水) 20:22:33.83ID:???0

>>912
描写周りはWriting Styleから設定できんか？
ただ俺は直接システムプロンプト側に指定したほうがスムーズにいったけど

0916名無しさん＠ピンキー (ﾜｯﾁｮｲ 5200-O0F+)

2024/08/28(水) 22:28:57.66ID:1mg3rxmR0

スレチかもしれんが、Gigazineで
「CerebrasがNVIDIA H100の22倍高速な爆速AI推論サービスを発表、デモページも公開されたので使ってみた」
って記事が出てたけど、どんどん競合が出てきてGPU安くなってほしい。
マジでNVIDIAふざけるなってレベルだし。

0917名無しさん＠ピンキー (ﾜｯﾁｮｲ 76a9-OZ5M)

2024/08/28(水) 22:40:32.02ID:???0

>>910
koboldだとこういう話題がちょい前に出てんだけど>>738-748
参考になったりするやろか？

0918名無しさん＠ピンキー (ﾜｯﾁｮｲ 2799-O0F+)

2024/08/28(水) 23:36:31.34ID:2SXByLjI0

>>913-915
「」でセリフを記述させることは問題なく出来るんや
だが、それだとTTSにセリフだけ読み上げさせたい時に、セリフとして認識して貰えんとか
""なら青文字表示とか出来るが「」だと素の文字列扱いだから色付け表示とかができんのや

0919名無しさん＠ピンキー (ﾜｯﾁｮｲ 120e-WSN2)

2024/08/29(木) 01:05:07.43ID:wlQDvDAN0

プロンプトに{{user}}はセリフを「」で囲いますが""で囲われていると解釈してくださいみたいなのを入れるといいと思う
最初は少し文章が崩れたけど修正してやれば普通に進行できたよ

0920名無しさん＠ピンキー (ﾃﾃﾝﾃﾝﾃﾝ MM3e-W5xA)

2024/08/29(木) 03:02:49.69ID:???M

(直接は言わないけど考えてること)←この表現というか概念を伝えることが難しい、というか諦めた

0921名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f32-v9dR)

2024/08/29(木) 04:08:51.57ID:???0

>>917
koboldはPollにすれば解決するけど尻タブにそれは反映されないんだ
>>738-748の場合も尻タブ側は文字が欠けたまま

0922名無しさん＠ピンキー (ﾜｯﾁｮｲ 5bf5-WSN2)

2024/08/29(木) 10:00:24.16ID:???0

尻ならRegex(正規表現) extension使うのは？

Find Regex
/「|」/g
Replace With
"

これでUserの書き込みとAIの返信両方の「と」を"に修正すればいいんじゃない？ Ephemeralityにチェックを入れなければプロンプトと表示両方を差し替えてくれる
逆の場合は……ChatGPTに正規表現の書き方を聞いてくればいいと思う、例文渡してやりたいことを伝えればいい感じに書いてくれる

多少頭の良い?モデルなら似た手法でプレイヤーにだけ見えない隠し情報も用意できる
隠したい文章とかを<spoiler></spoiler>で挟めって指定する

Find
/<spoiler>.*?<\/spoiler>/gs
Replace (空でもいい)
*<秘匿>*

適応先をAI OutputにしてAlter Chat Displayを指定すればログにはそのまま書かれるがプレイヤーからは<秘匿>表示になる、Streamingがオンだと書いてる途中の文字は読めちゃうから切る必要があるけど

0923名無しさん＠ピンキー (ﾜｯﾁｮｲ bb65-0vRJ)

2024/08/29(木) 11:24:31.78ID:???0

>>901
Calm3が元々結構頭良い+ClaudeとかGPTの出力の良さそうなデータ学習に使ってるのが結構効いてるのかな
非商用限定になっちゃうけど個人として利用するならどうでも良いからこっちの方がありがたいわ

0924名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f2c-O0F+)

2024/08/29(木) 12:24:05.40ID:c8nHPEwY0

>>922
それや！
サンガツ！

0925名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f32-Xsgl)

2024/08/29(木) 20:15:09.41ID:???0

来月出るcohereと富士通のtakane 劣化版でいいからHFで公開してくれんかなぁ

0926名無しさん＠ピンキー (ﾜｯﾁｮｲ afbe-O0F+)

2024/08/29(木) 22:30:09.84ID:???0

>>916
専用ハードのほうが汎用GPUよりも高性能なのは当然だからな
推論だけとは言えこういうのが増えてくるとNvidiaにジワジワプレッシャーになるだろうな

0927名無しさん＠ピンキー (ﾜｯﾁｮｲ bb91-QJ38)

2024/08/30(金) 14:42:35.58ID:???0

cohereの新しいモデル出ました。commnad-r-08-2024と
command-r-plus-08-2024

0928名無しさん＠ピンキー (ﾜｯﾁｮｲ 76a9-OZ5M)

2024/08/30(金) 15:25:25.01ID:???0

新しいモデルじゃなくて新しいウェイト？

0929名無しさん＠ピンキー (ﾜｯﾁｮｲ 7311-jmrL)

2024/08/30(金) 16:14:46.43ID:???0

まだ詳細不明じゃね
重み公開してくれればいいんだけど、ちょい望み薄な気もしている

0930名無しさん＠ピンキー (ﾜｯﾁｮｲ 7311-jmrL)

2024/08/30(金) 23:04:04.38ID:???0

R+のウェイトHFで公開されたみたい
やったー

レス数が900を超えています。1000を超えると表示できなくなるよ。