Google: Gemini 3 Flash Preview vs OpenAI: GPT-5.5

Gemini 3 Flash Preview (medium) leads on average score with 9.6 vs 9.3. Gemini 3 Flash Preview (medium) has the lower benchmark cost at $0.742 vs $1.253. GPT-5.5 (low) is faster at 10.13s vs 19.20s, with pass rates of 98.5% vs 86.4%.

Recommended modelGemini 3 Flash Preview (medium)It has the best score here (9.6), while costing about 1.7x less than GPT-5.5 (low).

Last updated at: 2026-07-25

Metric	Gemini 3 Flash Preview Gemini 3 Flash Preview medium Release: 2025-12-17	GPT-5.5 GPT-5.5 low Release: 2026-04-24

Metric	Gemini 3 Flash Preview Gemini 3 Flash Preview medium Release: 2025-12-17	GPT-5.5 GPT-5.5 low Release: 2026-04-24
Score	9.6	9.3
Rank	#3	#9
Reliability	10.0	10.0
Consistency	9.7	10.0
Tests Correct
Attempt pass rate	98.5%	86.4%
Flaky tests	1	0
Total Runs	66	66
Cost per result	3.533	6.594
Total Cost	$0.742	$1.253
Input Price	$0.500 / 1M	$5.000 / 1M
Output Price	$3.000 / 1M	$30.000 / 1M
Total Input Tokens	87,861	80,058
Output Tokens	5,486	5,378
Reasoning Tokens	227,164	23,040
Response Time (avg)	19.20s	10.13s
Response Time (max)	117.26s	56.19s
Response Time (total)	422.42s	222.82s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#3 Gemini 3 Flash Preview

medium

Cost: $0.010
Time: 18.4s
Tokens: 3,351 tok

#9 GPT-5.5

low

Cost: $0.068
Time: 37.0s
Tokens: 2,339 tok

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		3.88s	494	330	3,216
GPT-5.5	10.0	10.0	100.0%	0		4.41s	606	238	1,020

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	8.6	7.6	88.9%	1		84.40s	8,122	462	161,084
GPT-5.5	10.0	10.0	100.0%	0		15.04s	7,302	423	6,402

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		26.75s	63,717	3,831	23,496
GPT-5.5	10.0	10.0	100.0%	0		13.73s	56,868	3,635	1,297

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		5.43s	7,548	279	4,893
GPT-5.5	10.0	10.0	100.0%	0		3.28s	7,140	228	157

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		15.27s	633	12	21,684
GPT-5.5	5.3	10.0	33.3%	0		28.05s	723	69	11,609

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		5.19s	486	72	1,905
GPT-5.5	10.0	10.0	100.0%	0		5.17s	477	133	245

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		4.04s	615	72	2,709
GPT-5.5	9.9	10.0	100.0%	0		3.74s	660	93	415

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		4.05s	558	183	4,365
GPT-5.5	10.0	10.0	100.0%	0		4.74s	642	279	954

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		12.60s	5,532	234	1,487
GPT-5.5	10.0	10.0	100.0%	0		4.96s	5,445	250	101

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		5.50s	156	11	2,325
GPT-5.5	3.0	10.0	0.0%	0		10.06s	195	30	840

Quick Compare

Switch Comparison Pair

Gemini 3 Flash PreviewmediumvsGPT-5.6 Sollow Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Claude Opus 5highvsGPT-5.5low Claude Opus 5mediumvsGPT-5.5low GPT-5.5lowvsQwen3.7 Maxmedium Gemini 3.5 FlashmediumvsGPT-5.5low Gemini 3.5 FlashhighvsGPT-5.5low Gemini 3 Flash PreviewmediumvsGPT-5.6 Solhigh Claude Opus 5highvsGemini 3 Flash Previewmedium Gemini 3.6 FlashhighvsGPT-5.5low GPT-5.5lowvsGrok 4.5high Claude Opus 4.8mediumvsGPT-5.5low