Smart Routing (自動モデル選定 + マルチプロバイダ・フェイルオーバー)✅ 提供中 (リクエスト単位で有効化)
リクエストごとに最適な AI モデルを自動で選ぶ任意機能です。既定はオフで、リクエスト単位でヘッダを付けたときだけ有効になります。 オン時でも明示的なモデル指定は常に優先されます (入力が context window を超える場合の自動切替のみ例外)。 軽いタスクを廉価モデルへ寄せるほどコストを抑えられます (削減率はタスク構成・元々お使いのモデルによって変わります)。
使い方 (リクエスト単位の opt-in)
X-Apimane-Smart-Routing: onSmart Routing を有効化 (または model: "apimane-auto" で自動選定)X-Apimane-Modecheapest (既定、最安優先) / balanced (タスク種別 × 入力長で品質帯を満たす最安) / fastest (速度系モデル優先)X-Apimane-Taskタスク種別の明示 (chat / summary / code / translate / reasoning)。 省略時はキーワードと入力長から推定 — 判定はメモリ上で瞬時に行い即破棄、プロンプト本文は保存しません (Zero-PII)マルチプロバイダ・フェイルオーバー (Smart Routing 有効リクエストで自動適用)
切替トリガー:5xx エラー連続 3 回 / 30 秒タイムアウト / レート制限到達 (429) のいずれか切替先の選定:別プロバイダの同等品質帯モデルを優先 (same_tier)。1 リクエストで最大 2 プロバイダまで切替切替時の通知:Discord / Slack へ即時通知 (運用ログ用)。応答には
x-apimane-fallback / x-apimane-model-used ヘッダが付きます復旧後の動作:ダウン検知したプロバイダは毎分のヘルスチェック (60 秒間隔) で復旧確認し、自動で元プロバイダに戻します🚧 順次対応予定 組織レベルの既定値 (ダッシュボードから全キー一括で Smart Routing を既定オンにする / 既定モードを保存する) は順次対応予定です。現在はリクエスト単位のヘッダ指定のみ対応しています。
📡 API (技術者向け): GET /v2/settings/routing で 現在の仕様 (モード一覧・フェイルオーバー閾値・有効化方法) を取得可能。
編集 API: PATCH /v2/settings/routing (組織既定値の保存) は 順次対応、現状は 501 Not Implemented。
関連ドキュメント: apimane.co.jp/#smart-routing (モード × タスク × フェイルオーバー戦略の詳細)
