Anthropic: Claude Opus 4.7 vs Google: Gemini 3.5 Flash

Gemini 3.5 Flash (high) leads on average score with 9.5 vs 6.6. Claude Opus 4.7 has the lower benchmark cost at $0.505 vs $1.976. Claude Opus 4.7 is faster at 3.02s vs 15.07s, with pass rates of 72.7% vs 93.9%.

Recommended modelGemini 3.5 Flash (high)It has the strongest score in this comparison (9.5) and the best overall balance of cost and response time across all 2 models.

Last updated at: 2026-07-17

Metric	Claude Opus 4.7 Claude Opus 4.7 none Release: 2026-04-16	Gemini 3.5 Flash Gemini 3.5 Flash high Release: 2026-05-19

Metric	Claude Opus 4.7 Claude Opus 4.7 none Release: 2026-04-16	Gemini 3.5 Flash Gemini 3.5 Flash high Release: 2026-05-19
Score	6.6	9.5
Rank	#90	#2
Reliability	10.0	10.0
Consistency	8.6	9.3
Tests Correct
Attempt pass rate	72.7%	93.9%
Flaky tests	0	2
Total Runs	57	66
Cost per result	3.154	9.879
Total Cost	$0.505	$1.976
Input Price	$5.000 / 1M	$1.500 / 1M
Output Price	$25.000 / 1M	$9.000 / 1M
Total Input Tokens	69,576	107,137
Output Tokens	6,265	8,777
Reasoning Tokens	0	192,900
Response Time (avg)	3.02s	15.07s
Response Time (max)	18.27s	145.92s
Response Time (total)	57.44s	331.48s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#90 Claude Opus 4.7

none

Cost: $0.051
Time: 24.2s
Tokens: 2,181 tok

#2 Gemini 3.5 Flash

high

Cost: $0.208
Time: 118.2s
Tokens: 23,158 tok

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	8.3	10.0	75.0%	0		2.12s	894	522	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.57s	492	174	4,997

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	3.3	3.3	33.3%	0		2.84s	1,176	494	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		22.96s	8,118	456	47,129

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	4.8	5.0	50.0%	0		18.27s	37,740	3,504	0
Gemini 3.5 Flash	8.2	6.9	66.7%	1		84.14s	82,416	7,153	93,585

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	10.0	10.0	100.0%	0		2.15s	10,533	324	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		6.43s	7,548	279	8,466

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	7.7	10.0	66.7%	0		1.19s	1,020	78	0
Gemini 3.5 Flash	7.6	7.2	77.8%	1		14.09s	633	12	24,721

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	10.0	10.0	100.0%	0		3.47s	723	257	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.63s	486	115	1,650

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	10.0	10.0	100.0%	0		1.46s	939	114	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.35s	615	70	3,799

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	10.0	10.0	100.0%	0		2.46s	939	597	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.23s	558	241	4,940

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	10.0	10.0	100.0%	0		4.74s	15,339	372	0
Gemini 3.5 Flash	9.8	10.0	100.0%	0		4.96s	6,115	265	1,608

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	3.0	10.0	0.0%	0		1.46s	273	3	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.94s	156	12	2,005

Quick Compare

Switch Comparison Pair

Gemini 3.5 FlashhighvsGPT-5.6 Sollow Gemini 3.5 FlashhighvsGPT-5.6 Solmedium Gemini 3.5 FlashhighvsGPT-5.5low Gemini 3.5 FlashhighvsQwen3.7 Maxmedium Gemini 3.5 FlashhighvsGPT-5.5medium Gemini 3.5 FlashhighvsGPT-5.3-Codexmedium Claude Opus 4.8mediumvsGemini 3.5 Flashhigh Claude Opus 4.7mediumvsGemini 3.5 Flashhigh Gemini 3.5 FlashhighvsMuse Spark 1.1medium Claude Fable 5mediumvsGemini 3.5 Flashhigh Gemini 3.5 FlashhighvsGPT-5.4medium Gemini 3.5 FlashhighvsQwen3.6 Max Previewmedium