日次コスト推移

読み込み中…

日 × モデルの内訳

どの日に・どのモデルで・いくら使ったかのクロス集計 (成功リクエストの円コスト)。日合計・モデル合計も表示します。

読み込み中…

Cheapest モード削減レポート (Smart Routing ROI メータ)🚧 順次対応予定

Smart Routing の「Cheapest モード」を使った場合と、使わなかった場合 (ベースラインモデル = 顧客設定可、デフォルト Claude Sonnet) のコストを毎リクエストごとに比較し、累計削減額を実数値で表示します。「典型利用で 60-80% 削減」の抽象訴求を、お客様固有の利用パターンに対する実測ベースの削減実績として可視化します。稟議・経営報告・社内 ROI 試算に直接使える数値レポート。

💡 たとえば:経理「Smart Routing を有効化した先月、ベースライン (元々使っていた Sonnet) と比べていくら浮いたか経営に報告したい」、経営「Apimane の Smart Routing 有効化で、年換算でいくら削減できているか試算したい」、 CTO「開発チームごとに削減効果を比較し、ベストプラクティスを共有したい」、ベンダー稟議「他社 (OpenRouter / Portkey) と並列検討中。実測ベースで「Apimane なら年 ¥XX 万削減」と提示して採用判定に活用したい」といった ROI 立証ニーズ。

今月の Cheapest 削減累計

¥—

vs ベースライン (Claude Sonnet)

削減率

¥—%

ベースライン総額 ÷ 実支払額

年換算削減額

¥—

直近 3 ヶ月平均 × 12 で試算

💡 ベースラインモデルは設定変更可: デフォルトは claude-sonnet-4-6 (一般的な選定モデル) ですが、お客様の元々の運用に合わせて GPT-5 / Gemini Pro / カスタム指定も可能。/v2/settings/cheapest-baseline から順次設定対応予定。

📡 API スタブ (技術者向け): GET /v2/usage/cheapest-savings(順次対応、routing_decision 列の追加が前提で 501)

Fastest モード CX 改善レポート (B2B2C UX メータ)🚧 順次対応予定

Smart Routing の「Fastest モード」を使った場合と、使わなかった場合 (同タスク種別 × 同入力長クラスの統計推定) の応答時間 (p50/p95/p99) を比較し、顧客の顧客 (エンドユーザー) の体験向上を実数値で可視化します。「Cheapest 削減レポート」が経理/経営向けの ROI 指標であるのに対し、こちらはエンジニア / プロダクトマネージャー / CX 担当向けの UX 指標。 B2B2C SaaS のリテンション向上・SLA 達成・エンドユーザー満足度を可視化するメータです。

💡 たとえば:チャットボット運営「自社サービスの応答遅延が離脱率に直結している。Fastest モードで p95 がどれだけ改善するか、SLA 達成率がどう変わるかを実測で把握したい」、リアルタイム翻訳「会議同時通訳の p95 を 1 秒以下に保ちたい (会話のテンポを維持)」、コーディング支援 IDE「Cursor/Cline 連携で自動補完の遅延がエンジニアの集中を切る。Fastest 適用でどれだけ改善したか有償プラン更新の根拠にしたい」、音声対話エージェント「スマートスピーカー / IVR の「沈黙」が顧客ストレスに直結。p95 改善でトランザクション完了率がどう変わるか確認したい」といった B2B2C UX 改善ニーズ。

p50 改善幅

— ms

Fastest 未適用との中央値差

Fastest 適用率

— %

全リクエストに占める比率

SLA 達成率

— %

p95 < 1.5s (顧客設定可)

累計待機時間削減

— h

年換算、エンドユーザー機会損失

💡 ベースライン手法 (Cheapest と異なる): レイテンシは変動が大きいため、同タスク種別 × 同入力長クラス × 同期間の Fastest 未適用リクエスト群を統計推定。サンプル不足 (N<20) は「参考値」表示。外れ値除去 (IQR×1.5)。SLA 目標は p95 / p99 のパーセンタイル + 閾値 ms で顧客設定可能。

📡 API スタブ (技術者向け): GET /v2/usage/fastest-improvement(順次対応、SLA 目標は /v2/settings/sla-target で設定可。現状 501)

レイテンシ詳細 (p50 / p95 / p99)

期間内の成功応答 (2xx) の応答時間を統計的に分析します。タイムアウトや 5xx などの失敗は集計対象外。

p50 (中央値)

—

半数のリクエストはこの時間内

p95

—

95% のリクエストはこの時間内

p99

—

最遅 1% を除く全リクエスト

最大値

—

期間中の最も遅いリクエスト

該当期間に成功応答 (2xx) が無いためデータ不足です。期間/フィルタを変更してください。

Cheapest モード ROI

Cheapest モード (apimane-auto で最安候補を自動選択) の利用実績と、同期間に「手動でモデル指定したテキストチャット」の実効平均単価を基準にした推定節約額です。節約額は速報の推定値で、基準 = ご自身の利用データから算出しています。

該当期間に Cheapest モード (apimane-auto + cheapest) の成功リクエストがありません。

Fastest モードレイテンシ改善

Fastest モード (apimane-auto + fastest) の応答時間を、同期間の「Fastest 以外」リクエストの応答時間 (baseline) と比較した改善率です。成功応答 (2xx) のみ対象。改善率がプラスなら baseline より速いことを示します。

該当期間に Fastest モードの成功リクエストがありません。

キー別利用ログ (0 件)

該当データなし。

※ 行をクリックすると、そのキーの個別ログ (リクエスト単位) を期間内で表示します。