Gemini 3.1 Flash Lite (medium) vs Step 3.7 Flash (low)

Recommended model Gemini 3.1 Flash Lite (medium)

It has the best score here (7.3), while costing about 3.9x less than Step 3.7 Flash (low).

Detailed comparison

Metric	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium Release: 2026-05-08	Step 3.7 Flash Step 3.7 Flash low Release: 2026-05-29

Metric	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium Release: 2026-05-08	Step 3.7 Flash Step 3.7 Flash low Release: 2026-05-29
Score	7.3	7.3
Rank	#73	#75
Reliability	10.0	10.0
Consistency	9.2	8.1
Tests Correct
Attempt pass rate	62.1%	68.2%
Flaky tests	2	5
Total Runs	66	66
Cost per result	0.898	3.782
Total Cost	$0.117	$0.454
Input Price	$0.250 / 1M	$0.200 / 1M
Output Price	$1.500 / 1M	$1.150 / 1M
Total Input Tokens	104,918	103,833
Output Tokens	9,168	376,581
Reasoning Tokens	51,130	0
Response Time (avg)	4.27s	20.68s
Response Time (max)	26.22s	124.75s
Response Time (total)	94.02s	455.01s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

low

Invalid SVG

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	9.1	10.0	75.0%	0		2.39s	502	604	4,201
Step 3.7 Flash	8.7	7.9	91.7%	1		4.02s	756	10,896	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	5.5	10.0	33.3%	0		3.81s	8,134	459	8,978
Step 3.7 Flash	8.2	7.2	88.9%	1		9.46s	7,437	18,685	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	7.2	9.1	50.0%	0		18.55s	80,983	7,241	20,231
Step 3.7 Flash	7.3	5.8	83.3%	1		66.18s	77,415	93,682	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.60s	7,362	279	2,845
Step 3.7 Flash	7.3	5.8	83.3%	1		2.29s	7,398	2,667	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	2.9	7.2	11.1%	1		3.16s	643	15	5,165
Step 3.7 Flash	5.3	7.2	44.4%	1		43.31s	828	104,487	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.60s	488	84	1,142
Step 3.7 Flash	3.4	9.3	0.0%	0		7.00s	525	4,604	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	9.9	10.0	100.0%	0		2.59s	623	75	3,320
Step 3.7 Flash	9.8	10.0	100.0%	0		1.58s	735	1,857	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	7.6	7.2	77.8%	1		1.95s	568	165	2,450
Step 3.7 Flash	5.5	9.9	33.3%	0		1.84s	756	3,564	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		4.55s	5,457	234	921
Step 3.7 Flash	10.0	10.0	100.0%	0		3.25s	7,746	1,360	0

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		3.08s	158	12	1,877
Step 3.7 Flash	3.0	10.0	0.0%	0		124.75s	237	134,779	0

Switch Comparison Pair