模型测试与选型实践¶

记录 OpenClaw 中各类模型的测试过程、选型理由和实践经验。

MiniMax 模型测试¶

测试背景¶

2026-03-11，在悟空 Bot 上测试 MiniMax Provider 的模型可用性。

Provider 状态¶

初始状态显示：

🧠 Model: minimax-portal/MiniMax-M2.1 · 🔑 oauth (minimax-portal:default)

模型列表发现¶

通过 /models minimax-portal 查看：

模型	说明
MiniMax-M2.5	最新文本模型
MiniMax-M2.1	稳定版文本模型
MiniMax-M2.1-lightning	快速推理版本
MiniMax-M2.5-highspeed	高速版本
VL-01	Vision-Language 多模态模型（推测）

重要发现：Provider 模型列表不是固定的，曾出现从 2 个到 5 个的变化。

M2.5 可用性测试¶

测试过程： 1. 执行模型切换：/model minimax-portal/MiniMax-M2.5 2. 确认切换成功：Model set to minimax-portal/MiniMax-M2.5 3. 发现问题：API 返回 401，token 可能有问题

结论： - 配置层面可用：模型已在列表中，可切换 - 调用层面存在风险：出现过 401 认证失败

VL-01 模型推测¶

Dad 追问 VL-01 是什么模型。

分析： - MiniMax 官方公开文档中未见 VL-01 - 推测为 Vision-Language 多模态模型 - 可能是测试阶段或内部模型

模型选型原则¶

按角色分配¶

基于实践总结的模型-角色匹配：

角色	推荐模型	原因
PM/协调	claude-opus-4.6	长上下文、复杂推理
架构设计	gpt-5.4	代码与系统设计能力强
数据分析	claude-opus-4.5	文档理解、分析能力
前端/UI	gemini-3.1-pro-preview	多模态、交互探索
文档整理	gpt-5.2	成本低、稳定
巡检任务	gpt-4o/4.1	便宜、routine 任务

成本分层策略¶

核心原则：小模型做粗筛，大模型做精处理

典型流程： 1. 数据收集层：规则或脚本 2. 粗摘要层：低成本模型 (gpt-4.1) 3. 精摘要层：高能力模型 (gpt-5.4) 4. 投递层：定时任务发送

多模型协作¶

在自动剪辑项目中的实践：

初始方案： - 简单任务交给 GPT-4o - 复杂判断交给 GPT-5.4

Dad 修正： - "从头挑内容"本身需要创造力 - 内容挑选不应简单下放给 4o

最终分工： - 5.4：高价值创意决策（选片、叙事、主题、节奏） - 4o：低风险结构化任务（整理候选、补标签、格式化输出）

模型可用性验证¶

核心经验¶

模型名可见 ≠ 实际可用

必须做端到端验证，不能只看配置。

常见失败模式¶

模式 1：Provider 显示但不支持

HTTP 400: invalid_request_error: The requested model is not supported.

- 原因：Provider 列表可见，但当前路由/会话不支持 - 解决：尝试其他 Provider 或模型

模式 2：model_not_found

All models failed (2):
prism-foundry/FW-GLM-5: HTTP 404: Resource not found (model_not_found)
my-azure/gpt-5.4: HTTP 404: Resource not found (model_not_found)

- 原因：模型名、Provider、deployment 注册状态不一致 - 解决：检查 Provider 配置和 deployment 名称

模式 3：认证问题

401 Unauthorized

- 原因：Token/OAuth 过期或配置错误 - 解决：重新授权或检查环境变量

验证流程¶

查看 Provider 列表：/models
查看模型列表：/models <provider>
切换模型：/model <provider/model>
验证状态：/model status
实际调用测试：发送测试消息

本地配置排查¶

配置目录¶

/home/restry/.openclaw - OpenClaw 核心配置
/home/restry/.config - 运行时配置
/home/restry/.ollama - 本地模型环境

关键文件¶

openclaw.json - 主配置文件
agents/ - Agent 配置目录
workspace/skills/ - 技能配置

模型状态确认¶

状态查看命令¶

/status

输出示例：

🦞 OpenClaw 2026.3.8 (3caab92)
🧠 Model: minimax-portal/MiniMax-M2.5 · 🔑 oauth (minimax-portal:default)
📚 Context: 0/200k (0%) · 🧹 Compactions: 2
🧵 Session: agent:main:main • updated just now
⚙️ Runtime: direct · Think: low

关键信息： - Model：当前使用的模型 - 🔑：认证方式和状态 - Context：上下文使用情况 - Think：推理模式（off/low/high）

会话重置¶

当模型状态异常时：

/reset    # 重置当前会话
/new      # 创建新会话

里程碑¶

时间	事件
2026-03-11 15:13	确认默认模型 minimax-portal/MiniMax-M2.1
2026-03-11 16:16	完成 MiniMax-M2.5 切换测试
2026-03-11 16:18	发现 VL-01 多模态模型
2026-03-17 16:39	确认 M2.5 + oauth 认证正常

总结¶

模型测试与选型的核心要点：

先验证再使用：Provider 可见不代表可用
按角色匹配：不同任务使用不同模型
成本分层：routine 用便宜模型，关键决策用强模型
持续监控：模型可用性会动态变化