Skip to content

WBWikibenchmodel intelligence

Search models and benchmarksTab

Overview Models Benchmarks Providers Leaderboard Compare

Article Edit History

Chatbot Arena

Chatbot Arena

Category: general
Score unit: elo
Higher is better: yes

Crowdsourced pairwise preference Elo.

Leaderboard

#	Model	Provider	elo	Evaluated	Source
1	Gemini 2.0 Flash	Google DeepMind	1356	—
2	GPT-4o	OpenAI	1287	—
3	Claude 3.5 Sonnet	Anthropic	1271	—

Wikibench — community-edited AI benchmark data.AboutContent licensed CC BY-SA 4.0.