模型测试与选型实践¶
记录 OpenClaw 中各类模型的测试过程、选型理由和实践经验。
MiniMax 模型测试¶
测试背景¶
2026-03-11,在悟空 Bot 上测试 MiniMax Provider 的模型可用性。
Provider 状态¶
初始状态显示:
模型列表发现¶
通过 /models minimax-portal 查看:
| 模型 | 说明 |
|---|---|
| MiniMax-M2.5 | 最新文本模型 |
| MiniMax-M2.1 | 稳定版文本模型 |
| MiniMax-M2.1-lightning | 快速推理版本 |
| MiniMax-M2.5-highspeed | 高速版本 |
| VL-01 | Vision-Language 多模态模型(推测) |
重要发现:Provider 模型列表不是固定的,曾出现从 2 个到 5 个的变化。
M2.5 可用性测试¶
测试过程:
1. 执行模型切换:/model minimax-portal/MiniMax-M2.5
2. 确认切换成功:Model set to minimax-portal/MiniMax-M2.5
3. 发现问题:API 返回 401,token 可能有问题
结论: - 配置层面可用:模型已在列表中,可切换 - 调用层面存在风险:出现过 401 认证失败
VL-01 模型推测¶
Dad 追问 VL-01 是什么模型。
分析: - MiniMax 官方公开文档中未见 VL-01 - 推测为 Vision-Language 多模态模型 - 可能是测试阶段或内部模型
模型选型原则¶
按角色分配¶
基于实践总结的模型-角色匹配:
| 角色 | 推荐模型 | 原因 |
|---|---|---|
| PM/协调 | claude-opus-4.6 | 长上下文、复杂推理 |
| 架构设计 | gpt-5.4 | 代码与系统设计能力强 |
| 数据分析 | claude-opus-4.5 | 文档理解、分析能力 |
| 前端/UI | gemini-3.1-pro-preview | 多模态、交互探索 |
| 文档整理 | gpt-5.2 | 成本低、稳定 |
| 巡检任务 | gpt-4o/4.1 | 便宜、routine 任务 |
成本分层策略¶
核心原则:小模型做粗筛,大模型做精处理
典型流程: 1. 数据收集层:规则或脚本 2. 粗摘要层:低成本模型 (gpt-4.1) 3. 精摘要层:高能力模型 (gpt-5.4) 4. 投递层:定时任务发送
多模型协作¶
在自动剪辑项目中的实践:
初始方案: - 简单任务交给 GPT-4o - 复杂判断交给 GPT-5.4
Dad 修正: - "从头挑内容"本身需要创造力 - 内容挑选不应简单下放给 4o
最终分工: - 5.4:高价值创意决策(选片、叙事、主题、节奏) - 4o:低风险结构化任务(整理候选、补标签、格式化输出)
模型可用性验证¶
核心经验¶
模型名可见 ≠ 实际可用
必须做端到端验证,不能只看配置。
常见失败模式¶
模式 1:Provider 显示但不支持
- 原因:Provider 列表可见,但当前路由/会话不支持 - 解决:尝试其他 Provider 或模型模式 2:model_not_found
All models failed (2):
prism-foundry/FW-GLM-5: HTTP 404: Resource not found (model_not_found)
my-azure/gpt-5.4: HTTP 404: Resource not found (model_not_found)
模式 3:认证问题
- 原因:Token/OAuth 过期或配置错误 - 解决:重新授权或检查环境变量验证流程¶
- 查看 Provider 列表:
/models - 查看模型列表:
/models <provider> - 切换模型:
/model <provider/model> - 验证状态:
/model status - 实际调用测试:发送测试消息
本地配置排查¶
配置目录¶
/home/restry/.openclaw- OpenClaw 核心配置/home/restry/.config- 运行时配置/home/restry/.ollama- 本地模型环境
关键文件¶
openclaw.json- 主配置文件agents/- Agent 配置目录workspace/skills/- 技能配置
模型状态确认¶
状态查看命令¶
输出示例:
🦞 OpenClaw 2026.3.8 (3caab92)
🧠 Model: minimax-portal/MiniMax-M2.5 · 🔑 oauth (minimax-portal:default)
📚 Context: 0/200k (0%) · 🧹 Compactions: 2
🧵 Session: agent:main:main • updated just now
⚙️ Runtime: direct · Think: low
关键信息: - Model:当前使用的模型 - 🔑:认证方式和状态 - Context:上下文使用情况 - Think:推理模式(off/low/high)
会话重置¶
当模型状态异常时:
里程碑¶
| 时间 | 事件 |
|---|---|
| 2026-03-11 15:13 | 确认默认模型 minimax-portal/MiniMax-M2.1 |
| 2026-03-11 16:16 | 完成 MiniMax-M2.5 切换测试 |
| 2026-03-11 16:18 | 发现 VL-01 多模态模型 |
| 2026-03-17 16:39 | 确认 M2.5 + oauth 认证正常 |
总结¶
模型测试与选型的核心要点:
- 先验证再使用:Provider 可见不代表可用
- 按角色匹配:不同任务使用不同模型
- 成本分层:routine 用便宜模型,关键决策用强模型
- 持续监控:模型可用性会动态变化