跳转至

模型测试与选型实践

记录 OpenClaw 中各类模型的测试过程、选型理由和实践经验。

MiniMax 模型测试

测试背景

2026-03-11,在悟空 Bot 上测试 MiniMax Provider 的模型可用性。

Provider 状态

初始状态显示:

🧠 Model: minimax-portal/MiniMax-M2.1 · 🔑 oauth (minimax-portal:default)

模型列表发现

通过 /models minimax-portal 查看:

模型 说明
MiniMax-M2.5 最新文本模型
MiniMax-M2.1 稳定版文本模型
MiniMax-M2.1-lightning 快速推理版本
MiniMax-M2.5-highspeed 高速版本
VL-01 Vision-Language 多模态模型(推测)

重要发现:Provider 模型列表不是固定的,曾出现从 2 个到 5 个的变化。

M2.5 可用性测试

测试过程: 1. 执行模型切换:/model minimax-portal/MiniMax-M2.5 2. 确认切换成功:Model set to minimax-portal/MiniMax-M2.5 3. 发现问题:API 返回 401,token 可能有问题

结论: - 配置层面可用:模型已在列表中,可切换 - 调用层面存在风险:出现过 401 认证失败

VL-01 模型推测

Dad 追问 VL-01 是什么模型。

分析: - MiniMax 官方公开文档中未见 VL-01 - 推测为 Vision-Language 多模态模型 - 可能是测试阶段或内部模型

模型选型原则

按角色分配

基于实践总结的模型-角色匹配:

角色 推荐模型 原因
PM/协调 claude-opus-4.6 长上下文、复杂推理
架构设计 gpt-5.4 代码与系统设计能力强
数据分析 claude-opus-4.5 文档理解、分析能力
前端/UI gemini-3.1-pro-preview 多模态、交互探索
文档整理 gpt-5.2 成本低、稳定
巡检任务 gpt-4o/4.1 便宜、routine 任务

成本分层策略

核心原则:小模型做粗筛,大模型做精处理

典型流程: 1. 数据收集层:规则或脚本 2. 粗摘要层:低成本模型 (gpt-4.1) 3. 精摘要层:高能力模型 (gpt-5.4) 4. 投递层:定时任务发送

多模型协作

在自动剪辑项目中的实践:

初始方案: - 简单任务交给 GPT-4o - 复杂判断交给 GPT-5.4

Dad 修正: - "从头挑内容"本身需要创造力 - 内容挑选不应简单下放给 4o

最终分工: - 5.4:高价值创意决策(选片、叙事、主题、节奏) - 4o:低风险结构化任务(整理候选、补标签、格式化输出)

模型可用性验证

核心经验

模型名可见 ≠ 实际可用

必须做端到端验证,不能只看配置。

常见失败模式

模式 1:Provider 显示但不支持

HTTP 400: invalid_request_error: The requested model is not supported.
- 原因:Provider 列表可见,但当前路由/会话不支持 - 解决:尝试其他 Provider 或模型

模式 2:model_not_found

All models failed (2):
prism-foundry/FW-GLM-5: HTTP 404: Resource not found (model_not_found)
my-azure/gpt-5.4: HTTP 404: Resource not found (model_not_found)
- 原因:模型名、Provider、deployment 注册状态不一致 - 解决:检查 Provider 配置和 deployment 名称

模式 3:认证问题

401 Unauthorized
- 原因:Token/OAuth 过期或配置错误 - 解决:重新授权或检查环境变量

验证流程

  1. 查看 Provider 列表/models
  2. 查看模型列表/models <provider>
  3. 切换模型/model <provider/model>
  4. 验证状态/model status
  5. 实际调用测试:发送测试消息

本地配置排查

配置目录

  • /home/restry/.openclaw - OpenClaw 核心配置
  • /home/restry/.config - 运行时配置
  • /home/restry/.ollama - 本地模型环境

关键文件

  • openclaw.json - 主配置文件
  • agents/ - Agent 配置目录
  • workspace/skills/ - 技能配置

模型状态确认

状态查看命令

/status

输出示例:

🦞 OpenClaw 2026.3.8 (3caab92)
🧠 Model: minimax-portal/MiniMax-M2.5 · 🔑 oauth (minimax-portal:default)
📚 Context: 0/200k (0%) · 🧹 Compactions: 2
🧵 Session: agent:main:main • updated just now
⚙️ Runtime: direct · Think: low

关键信息: - Model:当前使用的模型 - 🔑:认证方式和状态 - Context:上下文使用情况 - Think:推理模式(off/low/high)

会话重置

当模型状态异常时:

/reset    # 重置当前会话
/new      # 创建新会话

里程碑

时间 事件
2026-03-11 15:13 确认默认模型 minimax-portal/MiniMax-M2.1
2026-03-11 16:16 完成 MiniMax-M2.5 切换测试
2026-03-11 16:18 发现 VL-01 多模态模型
2026-03-17 16:39 确认 M2.5 + oauth 认证正常

总结

模型测试与选型的核心要点:

  1. 先验证再使用:Provider 可见不代表可用
  2. 按角色匹配:不同任务使用不同模型
  3. 成本分层:routine 用便宜模型,关键决策用强模型
  4. 持续监控:模型可用性会动态变化