インプットとアウトプットはそのまま入力出力で Cache%は入力のうちのキャッシュ(再利用されたプロンプト)の比率で、APICallsは何回LLMを呼び出したか、つまり12なら12回応答ということ
一般的にキャッシュのほうが入出力より安く設定されてて
https://platform.claude.com/docs/ja/about-claude/pricing Claudeだとこういう料金体系
AIにキャッシュヒット率なども考慮して計算して、って言えばAPI利用だったらいくらだったのか計算してくれるよ
多い少ないはやってる内容次第だからなんとも言えないけど、あえて言うなら、普通くらいじゃない?
チャットがメインかなって感じ