Gemini 3.5 Flash vs Step 3.7 Flash (high)

Recommended model Gemini 3.5 Flash

It has the best score here (7.0), while responding about 6.5x faster than Step 3.7 Flash (high).

Detailed comparison

Metric	Gemini 3.5 Flash Gemini 3.5 Flash none Release: 2026-05-19	Step 3.7 Flash Step 3.7 Flash high Release: 2026-05-29

Metric	Gemini 3.5 Flash Gemini 3.5 Flash none Release: 2026-05-19	Step 3.7 Flash Step 3.7 Flash high Release: 2026-05-29
Score	7.0	6.9
Rank	#87	#94
Reliability	10.0	10.0
Consistency	8.9	8.0
Tests Correct
Attempt pass rate	74.2%	63.6%
Flaky tests	3	5
Total Runs	66	66
Cost per result	7.190	10.973
Total Cost	$1.079	$1.207
Input Price	$1.500 / 1M	$0.200 / 1M
Output Price	$9.000 / 1M	$1.150 / 1M
Total Input Tokens	13,843	98,691
Output Tokens	117,518	1,032,395
Reasoning Tokens	0	0
Response Time (avg)	9.93s	64.68s
Response Time (max)	64.36s	364.99s
Response Time (total)	178.68s	1423.01s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

high

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.53s	492	5,101	0
Step 3.7 Flash	10.0	10.0	100.0%	0		13.40s	696	42,656	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	8.8	7.8	88.9%	1		34.69s	8,122	75,927	0
Step 3.7 Flash	4.0	6.0	22.2%	1		206.21s	6,057	327,340	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0
Step 3.7 Flash	8.7	6.9	83.3%	1		41.23s	73,938	49,842	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	6.5	10.0	50.0%	0		8.10s	2,781	5,895	0
Step 3.7 Flash	10.0	10.0	100.0%	0		14.72s	7,368	23,113	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	7.6	7.2	77.8%	1		10.64s	633	17,910	0
Step 3.7 Flash	4.1	4.4	44.5%	2		149.64s	783	410,502	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.46s	486	1,620	0
Step 3.7 Flash	5.5	10.0	0.0%	0		4.17s	510	2,862	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	9.8	10.0	100.0%	0		3.38s	615	3,928	0
Step 3.7 Flash	9.8	10.0	100.0%	0		1.52s	705	2,010	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.13s	558	4,640	0
Step 3.7 Flash	5.3	7.2	44.4%	1		10.22s	711	25,422	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0
Step 3.7 Flash	10.0	10.0	100.0%	0		2.79s	7,701	1,172	0

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	2.8	1.6	33.3%	1		4.87s	156	2,497	0
Step 3.7 Flash	3.0	10.0	0.0%	0		149.34s	222	147,476	0

Switch Comparison Pair