North Mini Code (medium) vs GPT-5.4

Recommended model GPT-5.4

Its score stays close to the best score here (5.8 vs 5.9), while responding about 66.3x faster than North Mini Code (medium).

Detailed comparison

Metric	North Mini Code North Mini Code medium Release: 2026-06-18 Free Available	GPT-5.4 GPT-5.4 none Release: 2026-03-05

Metric	North Mini Code North Mini Code medium Release: 2026-06-18 Free Available	GPT-5.4 GPT-5.4 none Release: 2026-03-05
Score	5.9	5.8
Rank	#159	#161
Reliability	8.6	10.0
Consistency	8.5	9.2
Benchmark coverage	22/22 tests · 58/66 attempts	22/22 tests · 66/66 attempts
Tests Correct
Attempt pass rate	48.5%	34.9%
Flaky tests	4	2
Total Runs	58	66
Cost per result	0.000	5.663
Total Cost	$0.000	$0.397
Input Price	$0.000 / 1M	$2.500 / 1M
Output Price	$0.000 / 1M	$15.000 / 1M
Total Input Tokens	81,813	108,632
Output Tokens	424,772	8,321
Reasoning Tokens	1,342,029	0
Response Time (avg)	137.11s	2.07s
Response Time (max)	786.72s	15.63s
Response Time (total)	3016.42s	45.51s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

none

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
North Mini Code	8.4	10.0	75.0%	0		64.79s	324	64,441	68,535
GPT-5.4	3.2	8.0	8.3%	1		1.21s	606	406	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
North Mini Code	4.5	4.9	33.3%	2		320.43s	7,119	219,891	561,569
GPT-5.4	5.5	10.0	33.3%	0		1.62s	7,305	516	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
North Mini Code	2.9	5.8	16.7%	1		554.89s	63,682	0	472,040
GPT-5.4	3.0	10.0	0.0%	0		9.26s	85,439	6,195	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
North Mini Code	10.0	10.0	100.0%	0		24.06s	6,819	240	2,659
GPT-5.4	10.0	10.0	100.0%	0		1.04s	7,140	222	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
North Mini Code	5.3	7.2	44.4%	1		71.37s	621	8,483	104,079
GPT-5.4	5.3	7.2	44.4%	1		1.07s	723	50	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
North Mini Code	5.1	10.0	0.0%	0		25.08s	444	1,546	1,635
GPT-5.4	4.4	9.9	0.0%	0		1.78s	477	184	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
North Mini Code	9.8	10.0	100.0%	0		15.43s	379	909	1,339
GPT-5.4	6.5	10.0	50.0%	0		1.07s	660	81	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
North Mini Code	3.3	10.0	0.0%	0		19.70s	543	2,215	2,485
GPT-5.4	5.6	9.8	33.3%	0		1.44s	642	381	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
North Mini Code	10.0	10.0	100.0%	0		3.93s	1,776	41	563
GPT-5.4	10.0	10.0	100.0%	0		2.75s	5,445	246	0

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
North Mini Code	3.0	10.0	0.0%	0		305.02s	106	127,006	127,125
GPT-5.4	3.0	10.0	0.0%	0		990ms	195	40	0

Switch Comparison Pair