Claude Opus 4.7 (medium) vs Gemini 3.1 Flash Lite Preview (low)

Recommended model Claude Opus 4.7 (medium)

It has the best score here (8.7), while responding about 2.2x faster than Gemini 3.1 Flash Lite Preview (low).

Detailed comparison

Metric	Claude Opus 4.7 Claude Opus 4.7 medium Release: 2026-04-16	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Release: 2026-03-03

Metric	Claude Opus 4.7 Claude Opus 4.7 medium Release: 2026-04-16	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Release: 2026-03-03
Score	8.7	6.5
Rank	#20	#114
Reliability	10.0	10.0
Consistency	9.6	10.0
Tests Correct
Attempt pass rate	83.3%	59.1%
Flaky tests	1	0
Total Runs	66	66
Cost per result	8.201	4.969
Total Cost	$1.477	$0.646
Input Price	$5.000 / 1M	$0.250 / 1M
Output Price	$25.000 / 1M	$1.500 / 1M
Total Input Tokens	145,252	110,185
Output Tokens	24,948	14,717
Reasoning Tokens	5,042	397,483
Response Time (avg)	7.61s	16.70s
Response Time (max)	65.40s	309.35s
Response Time (total)	159.91s	367.47s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

low

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	894	348	0
Gemini 3.1 Flash Lite Preview	8.3	10.0	75.0%	0		2.12s	506	462	1,638

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	7.6	7.2	77.8%	1		12.96s	10,635	7,629	1,114
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		1.39s	8,138	660	1,060

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	10.0	10.0	100.0%	0		43.42s	104,347	15,459	3,928
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		160.63s	85,851	12,656	389,079

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	10,533	324	0
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.00s	7,455	291	696

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	630	51	0
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		2.36s	641	18	1,212

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	723	256	0
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		1.54s	490	69	384

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	939	114	0
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.49s	621	72	753

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	10.0	10.0	100.0%	0		2.43s	939	370	0
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.69s	566	243	1,248

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	15,339	373	0
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		9.54s	5,757	237	993

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Opus 4.7	3.0	10.0	0.0%	0		2.25s	273	24	0
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		1.35s	160	9	420

Switch Comparison Pair