GPT-5.5 (low) vs Laguna Xs.2

Recommended model GPT-5.5 (low)

It has the strongest score in this comparison (9.3) and the best overall balance of cost and response time across all 2 models.

Detailed comparison

Metric	GPT-5.5 GPT-5.5 low Release: 2026-04-24	Laguna Xs.2 Laguna Xs.2 none Release: 2026-04-28 Free Available

Metric	GPT-5.5 GPT-5.5 low Release: 2026-04-24	Laguna Xs.2 Laguna Xs.2 none Release: 2026-04-28 Free Available
Score	9.3	3.8
Rank	#9	#221
Reliability	10.0	10.0
Consistency	10.0	8.6
Tests Correct
Attempt pass rate	86.4%	22.7%
Flaky tests	0	0
Total Runs	66	57
Cost per result	6.594	0.000
Total Cost	$1.253	$0.004
Input Price	$5.000 / 1M	$0.100 / 1M
Output Price	$30.000 / 1M	$0.200 / 1M
Total Input Tokens	80,058	33,675
Output Tokens	5,378	2,826
Reasoning Tokens	23,040	0
Response Time (avg)	10.13s	806ms
Response Time (max)	56.19s	2.01s
Response Time (total)	222.82s	12.09s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

low

none

No showcase result has been generated for this model yet.

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
GPT-5.5	10.0	10.0	100.0%	0		4.41s	606	238	1,020
Laguna Xs.2	3.0	10.0	0.0%	0		534ms	579	308	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
GPT-5.5	10.0	10.0	100.0%	0		15.04s	7,302	423	6,402
Laguna Xs.2	8.3	3.3	0.0%	0		1.96s	816	866	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
GPT-5.5	10.0	10.0	100.0%	0		13.73s	56,868	3,635	1,297
Laguna Xs.2	1.5	5.0	0.0%	0		2.01s	14,201	521	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
GPT-5.5	10.0	10.0	100.0%	0		3.28s	7,140	228	157
Laguna Xs.2	10.0	10.0	100.0%	0		646ms	7,734	246	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
GPT-5.5	5.3	10.0	33.3%	0		28.05s	723	69	11,609
Laguna Xs.2	5.3	10.0	33.3%	0		371ms	834	33	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
GPT-5.5	10.0	10.0	100.0%	0		5.17s	477	133	245
Laguna Xs.2	3.0	10.0	0.0%	0		0ms	0	0	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
GPT-5.5	9.9	10.0	100.0%	0		3.74s	660	93	415
Laguna Xs.2	6.5	10.0	50.0%	0		439ms	753	81	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
GPT-5.5	10.0	10.0	100.0%	0		4.74s	642	279	954
Laguna Xs.2	5.3	10.0	33.3%	0		650ms	453	379	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
GPT-5.5	10.0	10.0	100.0%	0		4.96s	5,445	250	101
Laguna Xs.2	3.0	10.0	0.0%	0		1.93s	8,305	392	0

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
GPT-5.5	3.0	10.0	0.0%	0		10.06s	195	30	840
Laguna Xs.2	3.0	10.0	0.0%	0		0ms	0	0	0

Switch Comparison Pair