Gemini 3 Flash Preview (low) vs GPT-5.2 Chat

Recommended model Gemini 3 Flash Preview (low)

Its score stays close to the best score here (7.4 vs 8.0), while costing about 3.4x less than GPT-5.2 Chat.

Detailed comparison

Metric	Gemini 3 Flash Preview Gemini 3 Flash Preview low Release: 2025-12-17	GPT-5.2 Chat GPT-5.2 Chat none Release: 2025-12-11

Metric	Gemini 3 Flash Preview Gemini 3 Flash Preview low Release: 2025-12-17	GPT-5.2 Chat GPT-5.2 Chat none Release: 2025-12-11
Score	7.4	8.0
Rank	#70	#37
Reliability	10.0	10.0
Consistency	9.2	8.6
Tests Correct
Attempt pass rate	75.8%	74.2%
Flaky tests	2	4
Total Runs	66	66
Cost per result	1.101	4.308
Total Cost	$0.177	$0.604
Input Price	$0.500 / 1M	$1.750 / 1M
Output Price	$3.000 / 1M	$14.000 / 1M
Total Input Tokens	123,684	101,248
Output Tokens	9,572	30,424
Reasoning Tokens	28,518	0
Response Time (avg)	6.28s	7.65s
Response Time (max)	17.13s	38.52s
Response Time (total)	138.06s	168.39s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

low

none

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		3.48s	500	281	3,082
GPT-5.2 Chat	8.7	7.9	91.7%	1		3.40s	606	1,807	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	5.8	7.2	44.4%	1		6.00s	8,122	456	7,421
GPT-5.2 Chat	8.8	7.8	88.9%	1		9.82s	7,305	6,731	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	3.0	10.0	0.0%	0		10.20s	99,775	7,822	0
GPT-5.2 Chat	7.3	5.8	83.3%	1		13.91s	78,055	7,923	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		9.40s	7,261	279	3,656
GPT-5.2 Chat	10.0	10.0	100.0%	0		3.05s	7,140	980	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	5.3	7.2	44.4%	1		8.05s	645	12	6,410
GPT-5.2 Chat	5.3	10.0	33.3%	0		17.78s	723	7,810	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		3.68s	492	120	981
GPT-5.2 Chat	4.4	3.0	33.3%	1		3.20s	477	335	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	9.9	10.0	100.0%	0		7.02s	621	71	2,752
GPT-5.2 Chat	9.8	10.0	100.0%	0		5.51s	660	1,441	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		5.77s	562	288	3,168
GPT-5.2 Chat	7.7	10.0	66.7%	0		4.10s	642	1,603	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		4.99s	5,550	234	415
GPT-5.2 Chat	10.0	10.0	100.0%	0		4.68s	5,445	555	0

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		2.75s	156	9	633
GPT-5.2 Chat	3.0	10.0	0.0%	0		6.89s	195	1,239	0

Switch Comparison Pair