Overall benchmark scores for each Framework × Model combination. Empty cells indicate untested pairings.
| Framework \ Model | Flagship | Standard | Economy | Open Source | Other | |||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| claude-opus-4-5 | claude-opus-4.5 | claude-sonnet-4.5 | claude-sonnet-4.6 | gemini-2.5-pro | grok-4.20-beta | Manus-1.6-Lite | claude-3.5-sonnet | claude-sonnet-4 | deepseek-r1 | deepseek-reasoner | glm-4-plus | glm-4.7 | glm-5 | kimi-k2-thinking | kimi-k2.5 | moonshot-v1-128k | qvq-plus | qwen-max | qwen3-coder-plus | qwen3-max | qwen3.5-plus | MiniMax-M2.5 | deepseek-chat | gemini-2.5-flash | glm-4.5 | glm-4.5-air | glm-4.6 | moonshot-v1-auto | deepseek-v3.2 | llama-3.3-70b-instruct | llama-4-maverick | AI Assistant | WorkBuddy-Agent | auto | claude-opus-4-6 | gpt-5.3-codex | gpt-5.4 | k2p5 | miaoda-model-auto | |
| Claude Code | 86.7 | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | 100.0 | -- | -- | -- | -- |
| Manus | -- | -- | -- | -- | -- | -- | 100.0 | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- |
| OpenClaw | -- | 92.0 | 91.0 | 92.0 | 90.0 | 92.0 | -- | 90.0 | 91.0 | 90.0 | 88.0 | 83.3 | 86.0 | 89.0 | 87.0 | 85.0 | 83.0 | 86.0 | 80.0 | 88.0 | 87.0 | 88.0 | 100.0 | 100.0 | 88.0 | 85.0 | 84.0 | 84.0 | 80.0 | 89.0 | 86.0 | 89.0 | -- | -- | 100.0 | -- | 100.0 | 100.0 | 100.0 | 100.0 |
| OpenClaw (Miaoda) | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | 100.0 |
| WorkBuddy | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | 100.0 | 95.8 | -- | -- | -- | -- | -- | -- |