なんJLLM部 避難所 ★3
レス数が950を超えています。1000を超えると書き込みができなくなります。
0001名無しさん@ピンキー 転載ダメ (ワッチョイ 93c0-oLG6)2024/06/09(日) 07:37:14.82ID:???0
!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC(できれば+3060 12GB以上)でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部 避難所 ★2
https://mercury.bbspink.com/test/read.cgi/onatech/1714642045/

-
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured
0858名無しさん@ピンキー (ワッチョイ ee49-nSnY)2024/08/14(水) 21:39:02.16ID:???0
そのコストの話が本当なら新参のintelがVRAM盛らないの謎だよな 4080ぐらいの性能と48GBあれば$2000以上で売れるだろうに噂レベルですらそんな話出てこない 技術的な障壁があるんかな
AMDやNvidiaはドル箱のHPC向けと競合するからコンシュマー向けのVRAMをケチるのは分かる
0860名無しさん@ピンキー (ワッチョイ eedc-l564)2024/08/15(木) 03:47:48.34ID:W672SyLg0
ただの談合だったりして
1社がVRAMを盛りまくると儲からなくなっちゃうからね
0863名無しさん@ピンキー (ワッチョイ efae-oC+7)2024/08/15(木) 16:03:12.76ID:???0
具体的な生産量を調べたわけじゃないけどGDDRはニッチだもんな
普通のPCはDDRだしグラフィックで超高帯域が欲しければHBM2使うし
インテルはCPUの処理をGPUに持っていかれるのを極端に嫌ってる気がする
バス幅考えるとGPUにはまるで追いつかないんだからどっさり積んで欲しいよね
0864名無しさん@ピンキー (ワッチョイ ee2d-NNUV)2024/08/16(金) 10:27:25.77ID:3L/dQ32E0
申し訳を防ぐには申し訳されるような文章に対して真面目に回答するような文章を作ってFTすればいいのかな?
もしすでにあるのなら教えてほしい。無いなら作って実験する。
0865名無しさん@ピンキー (ワッチョイ 8332-YMr0)2024/08/17(土) 06:21:26.35ID:???0
vectous-v1ってエロいことはいくらでもしてくれるのに
住所はプライバシー保護がどうたらってことで教えてくれないんだな
まあ住所をあらかじめ設定しておけば普通に教えてくれるようになるんだけど
0866名無しさん@ピンキー (ワッチョイ 23b4-TGwR)2024/08/17(土) 06:44:46.44ID:???0
大葉をrocmで動かす場合に大葉の独自リポジトリにあるllama.cppのrocm用のバイナリが古すぎて自動イントールに任せると最新のrocm>=6.0だと動かない問題踏んだ
ワークアラウンドとしてはllama-cpp-pythonの公式パッケージをpipで入れてrequirement_amd.txtのllama関係全部コメントアウトしてpip install -r requirement_amd.txt
んでmodules/llama_cpp_python_hijack.pyの29行目をコメントアウトでいけた
Radeonで動かそうとするやつなんか滅多にいないからissue上がってるけど放置されてる模様
0867名無しさん@ピンキー (オッペケ Sr47-6Mul)2024/08/18(日) 08:25:42.01ID:???r
SBVits対応させるためにSillytavernをアップデートしてからAIの会話の先頭に半角スペースが入ってどんどん増えていくようになってしまったのだけど、同じような症状の人いる?
ちなみにSBVitsに読ませることはできた。上にも書いている人がいたようにSBvitsはApp.batとserver_fastapi.pyの両方を立ち上げないといけないようだね。
0872名無しさん@ピンキー (ワッチョイ 63be-YMr0)2024/08/19(月) 14:24:42.36ID:???0
ガードが堅くても頭がいいモデルだと色々言葉巧みに騙せる余地が結構あるな
変に頭がいい人のほうが詐欺に引っ掛かるって話となんかつながるものを感じる
頭悪いモデルはとにかく不同意は駄目、未成年は駄目で説得を受け付けない
0874名無しさん@ピンキー (オッペケ Sr47-6Mul)2024/08/19(月) 22:26:44.40ID:???r
てかKoboldccpも新しいのが出たみたいなので全部新しくしたよ。cuda12の方を使っているけど爆速になった気がする?
Layer数を適切推定してくれるようになったみたいです。
0878マジカル (ワッチョイ 53f3-nE6n)2024/08/21(水) 12:47:03.46ID:6L3aYb9m0
>>844
ありがとうございます。
いつかはわかりませんが、バージョンアップの予定はあります。気長に待っていてください。

v1.5は一本の小説を学習コンテキスト長ごとに分割し、学習させています。
これによって、コンテキスト長ごとのカットオフにより、序盤の文章ばかり学習するのを防いでいます。
他にもやっていることはあるのですが、それはバージョンアップ時に公開します。
0879名無しさん@ピンキー (ワッチョイ 63be-YMr0)2024/08/21(水) 17:05:53.15ID:???0
3.5sonnetの能力かなり高いな、写真に写ってる小さな文字や
淫紋が体のどこに入っているかどんな模様かまで詳細に認識しててちょっと怖くなるわ
AI監視カメラが広がってるしPCにも組み込まれるからもうプライバシーなんて欠片も無い時代になるんだな
0880名無しさん@ピンキー (ワッチョイ cf7a-ugRd)2024/08/21(水) 17:14:58.79ID:???0
監視カメラで録画し続けて全て起きたことへの解釈を残すってのは
現時点だとちょっとマシンパワー(クラウド料金)の問題でしんどいと思うが、
理論上は現時点でもできるだろうな

あまり人通りがないとこで、何かが通りかかったときだけ解釈開始とかなら
より現実的になるかも
0881名無しさん@ピンキー (ワッチョイ 8f1c-fwoX)2024/08/21(水) 18:55:20.63ID:???0
MSがやろうとしてたCopilotPCがそんな感じだったよね
全自動で定期的にデスクトップのスクーンショットを撮ってそれをLLMにテキスト化させて後から検索できるようにするっていう
セキュリティもクソもあったもんじゃなさすぎてお蔵入りになったんだっけ?
0885名無しさん@ピンキー (オッペケ Sr47-6Mul)2024/08/22(木) 02:15:07.33ID:???r
>>877
今の所自分の環境ではエラーは出ないな
GPUレイヤー数は3060 12GBで、35とか、画像生成中に起動するとロードしないとか自動的に設定しているみたい

>>620
Koboldをバージョンアップしたのでアップロードした画像の説明もさせてみたよ
Model Filesにvecteusならmistral系だと思うのでmistral-7b-mmprojのQ4量子化を指定している
肖像画や風景画で試したけど、メガネとか、砂漠と草原の違いとか認識できたよ
リポジトリの説明とか読んでると、セッションの1番初めに指定した画像くらいしか判別できず、何枚もアップロードすると混乱すると書いていたように内容が混ざる気がするのと、すぐにtoo many LLaVA tokensとエラーになり無視される
0888名無しさん@ピンキー (ワッチョイ cf7a-mjRE)2024/08/22(木) 10:58:44.05ID:???0
なんかプロモーション動画が以前あったけど、視覚障害者用のスマートグラスは
急激に普及するやろね

重度の視覚障害者が世界中でどれだけいるかはともかく、政府とか慈善事業の団体とかが
大いに支援するでしょ API代もAI業者が社会貢献として割とサービスするやろし
0890名無しさん@ピンキー (ワッチョイ fff3-RapI)2024/08/22(木) 19:29:14.95ID:KyWuiM5b0
Rewindつかってみな
0895名無しさん@ピンキー (ワッチョイ d3d3-s6eo)2024/08/23(金) 09:38:02.32ID:???0
calm3-RPはだいぶ短い出力するように学習されてるっぽいな
これはこれで好み分かれそうだが個人的には悪くない
もうちょいセリフ、状況描写、内面描写みたいに形式立って出力出来たらもっと良いけど
その場合は学習データをそういう形式にする必要があるのかな
0896877 (ワッチョイ 3f7a-D2BG)2024/08/23(金) 12:52:56.83ID:???0
すいません
生成aiで使ってるssdが原因でした…

安いのを酷使しすぎたかな
0898名無しさん@ピンキー (ワッチョイ 7f0b-xZES)2024/08/23(金) 21:24:11.76ID:PpZA/B870
EasyNovelAssistant\setup\resにあるdefault_llm.jsonを書き換えればいいぞ
あと聞く前に自分でコード探して♡
0899名無しさん@ピンキー (オイコラミネオ MM7f-WWAF)2024/08/25(日) 09:05:01.62ID:???M
default_llm.jsonを書き換える前にバックアップ取っておくと良いよ
アップデートする時にdefault_llm.jsonの内容が異なるとエラーになるから
まあ最近アップデートないけどさ
0900名無しさん@ピンキー (ワッチョイ d732-v9dR)2024/08/26(月) 10:30:05.66ID:???0
「この物語はこうこう、こういうものだ。さあ、あなたはこれからどうする!?」

みたいな始まり方に対して「物語は終わりだ」と早々に宣言したら語り手に怒られて草
0903名無しさん@ピンキー (ワッチョイ d732-v9dR)2024/08/27(火) 04:51:46.03ID:???0
>>889
これkoboldだとPollにしないと文字欠けが発生するんだけどさ
尻タブでも同様の設定にする方法ってあるの?
koboldをPollにしても尻タブだと文字が欠けるんだよね
0906名無しさん@ピンキー (ワッチョイ 9277-VpqQ)2024/08/27(火) 16:48:23.66ID:???0
sillytarvan今更かも知れないけどAnother'sNoteとSystem Promptで
めっちゃ表現力変わるのね・・・無知だったせいでやたら遠回りしてしまった
みんな独自の黄金テンプレート作ってんのかな
0908名無しさん@ピンキー (ワッチョイ afbe-v9dR)2024/08/27(火) 20:06:11.13ID:???0
>>888
全盲でもごく簡単な字や道路位なら読み取れるようになるオーデコって装置あったけど
盲導犬利権の前に敗北して全然普及せずに終わってしまったし
MM利用した機器なんてのも同じ道を辿ると思うけどな
0909名無しさん@ピンキー (ワッチョイ bec1-v9dR)2024/08/28(水) 00:12:29.55ID:M0+vTHB90
>>905
ワイの環境だとKobold&尻タブともに最新版だが、特に文字が欠けるような現象は発生せんな…
ちなモデルはcalm3-22b-RP-Q4_K_M
0912名無しさん@ピンキー (ワッチョイ 2799-O0F+)2024/08/28(水) 18:59:11.15ID:2SXByLjI0
尻タブを日本語で遊んでる時、皆セリフと平文どーやっとるん?
ワイは現状""と**でやっとるけど、半角/全角の切り替え億劫やし、本音を言えばセリフは「」で遊びたい
設定全部見たつもりなんやが、どこでセリフと強調文のキャラクタ指定できるのか分からんのやが、こればっかはどーもならんのやろうか?
0913名無しさん@ピンキー (ワッチョイ 120e-WSN2)2024/08/28(水) 19:32:00.71ID:o+Bb6IDj0
普通にセリフは「」で囲まれています的なことをシステムプロンプトに入れるのではだめなん?
0916名無しさん@ピンキー (ワッチョイ 5200-O0F+)2024/08/28(水) 22:28:57.66ID:1mg3rxmR0
スレチかもしれんが、Gigazineで
「CerebrasがNVIDIA H100の22倍高速な爆速AI推論サービスを発表、デモページも公開されたので使ってみた」
って記事が出てたけど、どんどん競合が出てきてGPU安くなってほしい。
マジでNVIDIAふざけるなってレベルだし。
0918名無しさん@ピンキー (ワッチョイ 2799-O0F+)2024/08/28(水) 23:36:31.34ID:2SXByLjI0
>>913-915
「」でセリフを記述させることは問題なく出来るんや
だが、それだとTTSにセリフだけ読み上げさせたい時に、セリフとして認識して貰えんとか
""なら青文字表示とか出来るが「」だと素の文字列扱いだから色付け表示とかができんのや
0919名無しさん@ピンキー (ワッチョイ 120e-WSN2)2024/08/29(木) 01:05:07.43ID:wlQDvDAN0
プロンプトに{{user}}はセリフを「」で囲いますが""で囲われていると解釈してくださいみたいなのを入れるといいと思う
最初は少し文章が崩れたけど修正してやれば普通に進行できたよ
0922名無しさん@ピンキー (ワッチョイ 5bf5-WSN2)2024/08/29(木) 10:00:24.16ID:???0
尻ならRegex(正規表現) extension使うのは?

Find Regex
/「|」/g
Replace With
"

これでUserの書き込みとAIの返信両方の「と」を"に修正すればいいんじゃない? Ephemeralityにチェックを入れなければプロンプトと表示両方を差し替えてくれる
逆の場合は……ChatGPTに正規表現の書き方を聞いてくればいいと思う、例文渡してやりたいことを伝えればいい感じに書いてくれる



多少頭の良い?モデルなら似た手法でプレイヤーにだけ見えない隠し情報も用意できる
隠したい文章とかを<spoiler></spoiler>で挟めって指定する

Find
/<spoiler>.*?<\/spoiler>/gs
Replace (空でもいい)
*<秘匿>*

適応先をAI OutputにしてAlter Chat Displayを指定すればログにはそのまま書かれるがプレイヤーからは<秘匿>表示になる、Streamingがオンだと書いてる途中の文字は読めちゃうから切る必要があるけど
0923名無しさん@ピンキー (ワッチョイ bb65-0vRJ)2024/08/29(木) 11:24:31.78ID:???0
>>901
Calm3が元々結構頭良い+ClaudeとかGPTの出力の良さそうなデータ学習に使ってるのが結構効いてるのかな
非商用限定になっちゃうけど個人として利用するならどうでも良いからこっちの方がありがたいわ
0924名無しさん@ピンキー (ワッチョイ 4f2c-O0F+)2024/08/29(木) 12:24:05.40ID:c8nHPEwY0
>>922
それや!
サンガツ!
0932名無しさん@ピンキー (ワッチョイ eb11-g2Sb)2024/08/31(土) 00:54:28.29ID:???0
>>931
公式ページで触った限り無修正っぽいんだけど、新しいバージョンはセーフモードをつけるか任意に選べる仕組みがあるらしいから、それが関係してるのかも
0935名無しさん@ピンキー (ワッチョイ 3b32-n3tr)2024/08/31(土) 21:33:01.44ID:???0
公式も、hf版も試したが、web版では両方とも規制入っているね。
ローカルにiQ4_xs落として試したら、無修正だった。
やっぱ、これをQ6以上の量子化でサクサク遊べるPC欲しいな
0936名無しさん@ピンキー (ワッチョイ 6be1-BnTp)2024/08/31(土) 22:10:05.05ID:otTtyNax0
>>934
いうて文字列ですやん?
0938名無しさん@ピンキー (ワッチョイ 6ba1-BnTp)2024/08/31(土) 23:12:15.70ID:ccAmi0zu0
Q6をサクサクとなると
VRAM96GB欲しい感じだから個人レベルだと割と絶望的だな
0939名無しさん@ピンキー (ワッチョイ df01-FQQr)2024/09/01(日) 00:29:43.90ID:???0
silly tavernを立ち上げたままstyle bert VITS2のeditor.batを起動したらバグってしまった
本来ならeditor画面が立ち上がるはずなのにsillyの壊れた画面が出てくるようになった
これの直し方分かります?
0940名無しさん@ピンキー (ワッチョイ 6f91-BnTp)2024/09/01(日) 03:50:08.96ID:???0
redditとかだとP40*4を使って1600$くらいでLLM用のPC組んだとかよく見るね
4~5t/sくらいかつ古い世代故の制約も多くサクサクではないと言われたらそれまでだけど
0942名無しさん@ピンキー (ワッチョイ 3bd1-FQQr)2024/09/02(月) 17:08:18.34ID:???0
>>939
今入れてるSBV2とは別にもう1回SBV2をインスコしたら解決した
正常化を確認したら後から入れた方は消しても大丈夫
多分SBV2editorとsillyの鯖のポートが被ってるからおかしくなったのかな?
詳しくないから分からんが同じ症状になる人は多いと思うから一応報告しときます
0943名無しさん@ピンキー (ワッチョイ df60-tNfx)2024/09/03(火) 00:39:16.67ID:mXVwCDnq0
command-r-plus-08-2024は言葉の使い方はうまくなったが
プロンプトの解釈能力が下がったかこれ
0950名無しさん@ピンキー (ワッチョイ df30-N6M4)2024/09/03(火) 18:05:02.56ID:C1zVTS0r0
「GPT4より高スコア」なんて触れ込みは腐る程見てきた奴らだ、面構えが違う
0954名無しさん@ピンキー (ワッチョイ 4bd0-bqpq)2024/09/04(水) 12:09:32.74ID:???0
Tanukiはベンチマークだけ高いわけじゃなくて人間評価でもだいぶ強いみたいだしちゃんと性能は高い
まぁエロの方は少なくともファインチューニングなしだと無理そうだが
0957名無しさん@ピンキー (ワッチョイ bbbe-sMz+)2024/09/04(水) 23:19:52.30ID:???0
Androidスマホでグーグルがマイクから音声を盗聴してた件やば過ぎるな
PCで動画見てたらその音声をスマホから盗聴してサーバに転送してAIで音声認識して何の動画見てるか特定したり
公共の場で盗聴して事前に収集したユーザの声と照合して周囲にいる人間全員特定して行動追跡したり滅茶苦茶エグイ事してた
レス数が950を超えています。1000を超えると書き込みができなくなります。

ニューススポーツなんでも実況