Compare models

Pick up to 4models. Specs render side-by-side. Share the URL — it's stateless.

Comparing agents instead? Switch to agent compare →

Selected

Qwen3 235B×

GPT-5 Pro×

Grok 4×

Gemini 2.5 Pro×Clear all

	Qwen3 235B Alibaba	GPT-5 Pro OpenAI	Grok 4 xAI	Gemini 2.5 Pro Google
Vendor	Alibaba	OpenAI	xAI	Google
Family	Qwen	GPT	Grok	Gemini
Release date	2025-04-29	2025-08-07	2025-07-09	2025-03-25
Context window	128,000 tokens	400,000 tokens	256,000 tokens	2,000,000 tokens
Parameters	235B	—	—	—
Modality	text	text, vision, audio	text	text, vision, audio, video
License	Apache-2.0	proprietary	proprietary	proprietary
Source	open weights	proprietary	proprietary	proprietary
Description	Predecessor to the Qwen3.6 family.	Higher-reasoning variant of GPT-5, used for harder scientific and research tasks (e.g., immunology breakthroughs at NIH). Same 400K context as GPT-5; trades latency for depth.	—	Predecessor to Gemini 3 Pro.
Links	weights →	vendor →	vendor →	vendor →
Benchmarks
MMLU-Pro	—	—	82.8%	84.1%
GPQA-D	—	—	87.5%	84.0%
Aider	—	—	72.5%	—
AIME-25	—	—	86.1%	—
LiveCB	—	—	65.3%	—
MMMU	—	—	—	72.4%