Smart Routing (自動モデル選定 + マルチプロバイダ・フェイルオーバー)✅ 提供中 (組織既定値 + リクエスト単位 opt-in)

リクエストごとに最適な AI モデルを自動で選ぶ機能です。組織既定値を保存しておくと、ヘッダを付けないリクエストにも適用されます (リクエスト側ヘッダ指定が常に優先)。オン時でも明示的なモデル指定は常に優先されます (context window 超過時の自動切替のみ例外)。軽いタスクを廉価モデルへ寄せるほどコストを抑えられます (削減率はタスク構成・元々お使いのモデルによって変わります)。

組織既定値

読み込み中…

※ リクエスト時のヘッダ X-Apimane-Smart-Routing / X-Apimane-Mode は常に既定値より優先されます。

使い方 (リクエスト単位の opt-in / 組織既定値の上書き)

X-Apimane-Smart-Routing: onSmart Routing を有効化 (または model: "apimane-auto" で自動選定)X-Apimane-Modecheapest (最安優先) / balanced (タスク種別 × 入力長で品質帯を満たす最安) / fastest (速度系モデル優先)X-Apimane-Taskタスク種別の明示 (chat / summary / code / translate / reasoning)。省略時はキーワードと入力長から推定 — 判定はメモリ上で瞬時に行い即破棄、プロンプト本文は保存しません (Zero-PII)

マルチプロバイダ・フェイルオーバー (Smart Routing 有効リクエストで自動適用)

切替トリガー:5xx エラー連続 3 回 / 30 秒タイムアウト / レート制限到達 (429) のいずれか切替先の選定:別プロバイダの同等品質帯モデルを優先 (same_tier)。1 リクエストで最大 2 プロバイダまで切替切替時の通知:Discord / Slack へ即時通知 (運用ログ用)。応答には x-apimane-fallback / x-apimane-model-used ヘッダが付きます復旧後の動作:ダウン検知したプロバイダは毎分のヘルスチェック (60 秒間隔) で復旧確認し、自動で元プロバイダに戻します

📡 API (技術者向け): GET /v2/settings/routing で組織既定値+仕様を取得、PATCH /v2/settings/routing で保存 (default_mode / enabled_by_default)。
関連ドキュメント: apimane.co.jp/#smart-routing (モード × タスク × フェイルオーバー戦略の詳細)