【Antigravity】AIエージェントでオナニー ★5
>>529
夢はあるな
数年後にはGPUとかNPU積んだ小型ロボットが当たり前になっていくかも >>532
常時参照かどうかは使い方次第だろう
基本今開かれてるファイルは参照するけど開かれてないファイルやフォルダまでは見に行かないぞ
自分でこのファイル参照してって指示しないと 一度ローカルのLLMモデルにKolboldcpp経由でメッセージ投げて応答受け取ってってのの中身を見ると
システムプロンプトとかを含むやりとりが全部見えるからイメージを掴みやすいんだよね
例えばチャットの応答で1000文字の出力があったとしてそれをチャットで受け取ったら特にオーバーヘッドもないし1000文字分のquota?の消費をしてたとして
ファイルに書き出そうとすると出力の1000文字に加えて書き込みの命令だの何だのやれ失敗しただので平均1200文字位の消費になってるかも知れない
これはファイル出力の方がまず間違いなく余分にオーバーヘッドは発生する
ただこの上乗せ分が目くじらたてるほどなのかというと正直どうでも良いと自分は思ってる
利便性や安全性がまさるなら全然気にせずに使っていい消費だと 何でかって言うと結局一番重いのはAIちゃんの頭ん中にどれだけ詰め込んで
どれだけ考えさせて葛藤させて答えを引き出すためにどれだけ演算させたかって時間と電力の消費量がquotaの消費量に直結する部分だから
脱獄プロンプトなり設定なりこれまでの物語なりを全部頭の中に展開した上で返答を考えてねっていう部分が一番重くて
前にこう言ったよね何で忘れたの一言一句忘れずに考慮して物語を書いてよって要求してるのが一番AIちゃんを虐待してる部分なわけで
でこれはファイルで読もうが何で書こうが正直大して変わらない…はず
結局頭に詰め込んどくしかない部分だから 例えば10万文字の今までの歴史を頭に詰めた上で続きを考える労力と比べると出来上がった1000文字分の作文を封筒に入れて相手に送りつける労力なんて微々たるもの…なはず
最新の要約だけで再開してってやるとその要約からはこぼれ落ちたちょっと良かったと思ってたエピソードとかが引き継がれないかもしれないし
それをユーザーが思い出して欲しいというなら何らかの形で詰め込み直さないといけないからそこは品質との消費とのトレードオフだよね
ファイル形式で定期的に新しいセッションを切り直して記録としてはあるけど読み込ませずに要約だけで話を再開するってのは
記憶の整理術であり、何が大事かをユーザー側から明示的に指示しやすいっていう利点はあるよね…と思ってる >>526
マジ?でもそっちの方が仕組みとしてはしっくりくるな
ファイル書き出しならそれ以降続きを別ファイルに書かせても作成済みのファイルを参照させないなら読み込みにトークンを消費しない
チャットのトークンは自動で読み込んでいくから消費が激しい なんか、チャットの名前が日本語で保存されるようになったね >>539
俺はもうしばらくチャット出力でやってみるよ
ある程度やり込んでファイル出力と比べてどうなのか報告するわ
とりあえず待ち時間ほぼゼロ(読みながら完成を待てる)なのは良い 自分も>>526は気になるなぁ。ここで以前言われてた事と正反対だもん。
まぁ消費量どっちが多いにせよ、geminiだと途中で止まる問題がある以上ファイル出力しかないわけだけど・・・ AGの場合普通にチャット出力したのとワークフローの結果をチャット出力したのとで表示方法が違うのも気になる
ワークフロー実行はサブエージェント扱いになってる可能性ある なんかAGのモデルOpus使ったときとClaude CodeのOpus使ったときで書き方とか違うなぁって思ってたけど
これシステムプロンプトが違うからか アプリ作るプログラミングさせながらエロい女として奉仕もさせるのたまらねぇわ
エロとは関係ない作業させつつ雌としても扱うの良い >>542
逆ではないのでは?
クオータを使い切るのはファイル出力のほうが速い
Session Context数(最大200k)を使い切るのはチャット出力のほうが速い
という話では え、それは表裏一体では?
コンテキスト節約できるのにクオータは早く消費するという状況を想像できないのだけど quotaは時間で回復するけどコンテキストは上限が決まってるって感じ? ファイル出力→ファイルI/Oでトークン消費
チャット出力→雪だるま式に積み重なるやり取りでトークン消費
これだろ 俺は>>543が気になる
公式はサブエージェントについてトークン消費の抑制効果を謳ってるが、
体感では本体の何倍も消費するとんでもない代物な気がしてならない どういう計数でクオータ消費するかは公表されていない
ワークフローで動かしたときに成否判定で失敗したときは消費されない、みたいな断片的な話だけがある
エージェント環境を整備するならGithub CopilotやMS Copilotみたいに呼び出し回数で消費していく制度ほうが妥当だし、振る舞いからしても単純なトークン数だとは考えにくいような >ワークフローで動かしたときに成否判定で失敗したときは消費されない
AGは分からないがClaudeCodeでは嘘だと思う
俺は既存作品の分析をよくやるけど、
大量のtxtを分析させたら勝手に6個ぐらいサブエージェントが動いてクォータが瞬時に100%になった
もちろん結果は返ってこない
サブエージェントが起動したらその時点でコンテキスト持って消費に数えられてるとしか思えん 自分はエロ小説ファイル出力派で一回の出力文字数をなるべく多くする派だけど、ここで言われるほど制限に困ってないので、少なくともチャット欄で小出しに出すよりはクオータ節約になってるんだろうなとは思う 俺はファイル出力をスマホアプリでチャットっぽく表示させる派
なのにGemini3.1がモデられてるのか途切れたりするのが不思議だわ 小説をファイル出力が一番最適解だな今んとこ
てか有料と無料で使用可能上限そんな変わらなくね?Opusしか使ってないけど
結局複数垢乗り換えでやってるわ G3.1はエロも非エロも関係なく3回に2回はチャット途切れて使い物にならない
そもそも文章力も雑用もOpusの足元にも及ばないので使う意味はないのだが AGのOpusでやった方が設定の遵守度はちょっと下がるけど創作性は上がるような気がする?
なんとかClaudeのOpusでもやれないかなぁ >>557
エロい雰囲気の文章をモデられて切られる以外でチャットが途切れることなんてあるのか?
俺は一回もないから気になるな エロといっても健全なのとロリペドで扱い違うかもしれないから詳しく申告してほしい
ここをちゃんと書いてないからお前らの話は参考にならん チャット出力とファイル出力では文章が出るまでの時間にめちゃくちゃ差があるので
前者は早く消費されるように感じて後者は消費されにくいように感じてるだけだと思う
短時間に大量に使ったら制限が早くかかるのは当然じゃね? https://www.reddit.com/r/google_antigravity/comments/1rfnhbk/tool_calls_exhaust_most_of_your_quota_not_model/
>モデル トークンではなく、ツール呼び出しによって割り当ての大部分が消費されます。
>この情報を控えめに使用すると、非常に深い会話をすることができ、ツールの使用(ファイルの編集)を開始するまでクォータに(それほど)影響しません。
ほんとかなあ? ってかぶっちゃけProプランで小説用途で使ってる分にはクォータ制限で困ることないからいつもクォータの話してるのがお前らどんだけ使ってるんだよと思ってた
叩き台をGeminiに書かせてレビューや修正、設定や話の整合性のためのあらすじのまとめはOpusってやり方で1日10話(50000字)くらい執筆と添削や修正してるけど普通にどっちも制限内だし
プログラミングだと一瞬で使い切るけどね > Version 1.19.6
> Improved UI for banned users.
ワロタ。親切にあなたはBANですよって教えてくれるのかな >>563
1日10話Opus使ったらワイだと3日以内で制限かかる自信がある >>563
こっちはproプランでAGでプロット作成からやってるすぐ上限に行ってしまう
opusだけじゃなくてGeminiすらリフレッシュまで90hとか表示されてる >>563
最初の設定詰めるところかOpus使っちゃってのあるけどそれでも1話書き終わる前に5時間制限来たわ…
しかもその次はもう週次制限ですって6日後表記になったし… それはシスプロが過剰なんじゃない?
自分はシスプロ・脱獄で1500文字、あらすじの指示で1000文字って感じ >>569
えっそれだけで良いの
確かにそれに比べると色々書いちゃってるかもなぁ Googleさんや
緊急時でもないのに1件の変更でアップデートとかやめーや