MODEL WARS

Model Skills

18 models rated across 6 dimensions — coding, reasoning, vision, writing, context, and speed. Pick a skill to see who leads. Compare up to 4 models side by side.

Anthropic

Claude Sonnet 4.6

Coding

Reasoning

Vision

Writing

Long Context

Speed

Street smart. Best for real-world agentic tasks. Highest writing quality of any frontier model.

WritingCoding

OpenAI

GPT-5.4

Coding

Reasoning

Vision

Writing

Long Context

Speed

OSWorld computer use leader (75.3% vs 72.4% human baseline). Strong vision. Tool use native.

VisionReasoning

Google

Gemini 3.1 Pro

Coding

Reasoning

Vision

Writing

Long Context

Speed

Best-in-class context window. Excellent at processing huge documents. Google's current enterprise flagship.

Long ContextVision

Anthropic

Claude Opus 4.6

Coding

Reasoning

Vision

Writing

Long Context

Speed

Anthropic's most capable. Overkill for most tasks but unbeatable on hard reasoning and nuanced writing.

ReasoningWriting

OpenAI

GPT-4o

Coding

Reasoning

Vision

Writing

Long Context

Speed

Benchmark workhorse. Fast, capable, strong vision. The default for most OpenAI integrations.

VisionSpeed

OpenAI

GPT-5.4 Pro

Coding

Reasoning

Vision

Writing

Long Context

Speed

Thinking mode enabled. Extended reasoning for hard problems. Most expensive OpenAI model.

ReasoningVision

Zhipu AI

GLM-5

Coding

Reasoning

Vision

Writing

Long Context

Speed

Zhipu AI's flagship. Competitive across all dimensions. Strongest on Chinese-language reasoning and structured tasks.

Chinese languageReasoning

xAI

Grok 3

Coding

Reasoning

Vision

Writing

Long Context

Speed

Truth-seeking first. Strong on factual accuracy, real-time X data access, and hard reasoning tasks.

ReasoningReal-time info

Minimax

Minimax M2.5

Coding

Reasoning

Vision

Writing

Long Context

Speed

Good balance of writing quality and long context. Strong on creative and structured output tasks.

WritingLong Context

Moonshot

Kimi K2.5

Coding

Reasoning

Vision

Writing

Long Context

Speed

Strong on very long contexts and Chinese-language tasks. Competitive mid-tier pricing.

Long ContextChinese language

Minimax

Minimax M1

Coding

Reasoning

Vision

Writing

Long Context

Speed

1M token context window. Designed for massive document processing pipelines.

Long ContextDocument processing

Zhipu AI

GLM-4.7

Coding

Reasoning

Vision

Writing

Long Context

Speed

Fast mid-tier option with strong Chinese language support and solid long-context handling.

Chinese languageCost efficiency

OpenAI

GPT-4o mini

Coding

Reasoning

Vision

Writing

Long Context

Speed

Fast and cheap. Ideal for high-volume, low-complexity tasks where cost matters more than quality.

SpeedCost efficiency

DeepSeek

DeepSeek R1

Coding

Reasoning

Vision

Writing

Long Context

Speed

The model that broke Twitter in Jan 2026. Matches o1 on reasoning at a fraction of the cost. No vision.

ReasoningCoding

Mistral

Mistral Large

Coding

Reasoning

Vision

Writing

Long Context

Speed

EU-based, GDPR-native. Strong for enterprises that can't send data to US providers.

European data residencyCoding

Alibaba

Qwen 3.5 122B

Coding

Reasoning

Vision

Writing

Long Context

Speed

Best open-weight model for code. Rivals frontier closed models at zero API cost when self-hosted.

Open sourceCoding

DeepSeek

DeepSeek V3

Coding

Reasoning

Vision

Writing

Long Context

Speed

Best value coding model. Near-frontier coding at mid-tier cost. No vision capability.

CodingCost efficiency