执行步骤
- 先按任务分层:复杂推理用高能力模型,批量任务用高性价比模型。
- 至少配置主模型 + 降级模型两组路由,防止单供应商故障。
- 本地模型可用于隐私敏感任务,但要预留性能与能力冗余。
- 模型切换后复跑同一组样本任务,记录成功率、时延、Token 成本。
- 把模型配置集中在统一配置文件,避免分散写死导致排查困难。
- 设置预算触发策略:超阈值后自动降级到低成本模型。
按任务类型与预算选择模型,不再靠感觉切换。
希望快速解决当前问题的 OpenClaw 用户
8 分钟
你会得到一套可执行、可复现的处理步骤
openclaw doctor先完成本页验收项,再看同分类文章,把流程串成完整闭环。