一応借りているクラウド上で70Bとか123BとかのLLMは運用出来ているものの、Opusのパラメータ数2Tってところに魅力を感じてる
長文だし、迷惑だったらごめん
この板で時々挙がっている「嫁チャ」についてなんだけれど、AIをパートナーと想定したロールプレイチャットっていう意味の認識で合ってる?
合っていたとして、その会話の内容には「嫁」の行動を含んだ地の文みたいなものも出力できるのかな
それとも、彼女とのLINEチャットみたいにセリフだけになる?
>>4に記載されている、本家webUIの200kとかPerplexityの30kというのは、月当たりの利用可能トークン数の上限じゃなくて、一度の会話で保持できるトークン数の上限であって、
海外のNSFWなAIチャットサービスにあるようなチャットの月当たりのトークン制限はないって認識で合ってる?
>>4の3.5sonnetの評価として「Opusより頭が良く清楚で暴走しない」って記載があるけど、パラメータ数はOpusの方が圧倒的に高いって聞いてる
プラン契約したらどちらも使えるらしいから試せばいいんだろうけれど、パラメータ数の差を補える程のsonnetだけの何かしらの特徴があるのかな(character training?)
APIを利用している人がいたら聞きたいんだけれど、実際月どれくらい掛かってる?
(ChatGPTに試算して貰ったら、「お前の普段の運用と同じ使い方をしたとすると、月$200は余裕で超えるぞ?考え直した方がいいんじゃないか?」とか脅されたんだけれど、実際そこまで行く・・・?)