Compare Charts Methodology

Language:

❤️ Made by XCS

AI BENCHY Compare

Trinity Large Preview vs OpenAI: GPT-5 Mini

Compare:

Last updated at: 2026-03-06

Metric	Trinity Large Preview none Release: 2026-01-27 Free Available	OpenAI: GPT-5 Mini medium Release: 2025-08-07
Rank	#45	#32
Avg Score	4.2	6.0
Consistency	9.6	8.9
Cost per result	0.000	1.457
Total Cost	$0.000	$0.117
Tests Correct
Attempt pass rate	33.3%	58.3%
Flaky tests	1	2
Total Runs	48	48
Output Tokens	1,837	5,826
Reasoning Tokens	0	48,768
Response Time (avg)	3.15s	25.14s
Response Time (max)	8.91s	88.15s
Response Time (total)	50.46s	402.29s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Avg Score vs Response Time (avg)

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
OpenAI: GPT-5 Mini	7.0	9.6	66.7%	0		16.45s	1,645	5,824

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
OpenAI: GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	754	11,520

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
OpenAI: GPT-5 Mini	9.9	10.0	100.0%	0		12.58s	453	3,200

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
OpenAI: GPT-5 Mini	10.0	7.2	22.2%	1		44.63s	293	14,016

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
OpenAI: GPT-5 Mini	4.0	10.0	0.0%	0		13.50s	349	1,856

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
OpenAI: GPT-5 Mini	7.5	6.6	83.3%	1		15.66s	318	4,992

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
OpenAI: GPT-5 Mini	4.3	9.8	33.3%	0		14.09s	1,527	5,760

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
OpenAI: GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	487	1,600

Quick Compare

Switch Comparison Pair

GPT-5 MinimediumvsGLM 5none GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none DeepSeek V3.2nonevsGPT-5 Minimedium Trinity Large PreviewnoneFree AvailablevsMiniMax M2.5medium Trinity Large PreviewnoneFree AvailablevsQwen3 Coder Nextmedium GPT-5 MinimediumvsQwen3.5-Flashnone Gemini 2.5 FlashnonevsGPT-5 Minimedium Claude Sonnet 4.6nonevsGPT-5 Minimedium Trinity Large PreviewnoneFree Availablevsgpt-oss-120bmediumFree Available GPT-5 MinimediumvsQwen3.5-122B-A10Bnone GPT-5 MinimediumvsQwen3.5-27Bnone Trinity Large PreviewnoneFree AvailablevsMercury 2medium