Vergelijken Grafieken Methodologie

Taal:

❤️ Made by XCS

AI BENCHY Compare

Trinity Large Preview vs OpenAI: GPT-4o-mini

Vergelijken:

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-03-06

Metriek	Trinity Large Preview none Releasedatum: 2026-01-27 Gratis beschikbaar	OpenAI: GPT-4o-mini none Releasedatum: 2024-07-18
Rang	#45	#47
Gem. score	4.2	4.0
Consistentie	9.6	10.0
Kosten per resultaat	0.000	0.114
Totale kosten	$0.000	$0.005
Correcte tests
Slaagpercentage per poging	33.3%	25.0%
Instabiele tests	1	0
Totaal runs	48 (16 x 3)	48 (16 x 3)
Uitvoer-tokens	1,837	1,594
Redeneer-tokens	0	0
Responstijd (gem.)	3.15s	2.07s
Responstijd (max)	8.91s	7.58s
Responstijd (totaal)	50.46s	18.60s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Gem. score vs Responstijd (gem.)

Categorie-uitsplitsing

Anti-AI-trucs	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
OpenAI: GPT-4o-mini	4.0	10.0	33.3%	0		1.83s	180	0

Gecombineerd	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
OpenAI: GPT-4o-mini	10.0	10.0	0.0%	0		7.58s	568	0

Gegevensparsering en extractie	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
OpenAI: GPT-4o-mini	9.9	10.0	100.0%	0		1.27s	183	0

Domeinspecifiek	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
OpenAI: GPT-4o-mini	10.0	10.0	0.0%	0		637ms	15	0

Algemene intelligentie	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
OpenAI: GPT-4o-mini	3.0	10.0	0.0%	0		909ms	66	0

Instructies opvolgen	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
OpenAI: GPT-4o-mini	4.5	10.0	0.0%	0		1.27s	69	0

Puzzle Solving	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
OpenAI: GPT-4o-mini	2.3	10.0	0.0%	0		1.30s	308	0

Toolaanroepen	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
OpenAI: GPT-4o-mini	10.0	10.0	100.0%	0		2.51s	205	0

Snelle vergelijking

Vergelijkingspaar wisselen

Trinity Large PreviewnoneGratis beschikbaarvsMiniMax M2.5medium GPT-4o-mininonevsQwen3 Coder Nextmedium MiniMax M2.5mediumvsGPT-4o-mininone Trinity Large PreviewnoneGratis beschikbaarvsQwen3 Coder Nextmedium Trinity Large PreviewnoneGratis beschikbaarvsgpt-oss-120bmediumGratis beschikbaar GPT-4o-mininonevsGLM 4.7 Flashmedium Trinity Large PreviewnoneGratis beschikbaarvsMercury 2medium Trinity Large PreviewnoneGratis beschikbaarvsGLM 4.7 Flashmedium Trinity Large PreviewnoneGratis beschikbaarvsQwen3.5-35B-A3Bmedium Trinity Large PreviewnoneGratis beschikbaarvsGPT-5 Nanomedium Mercury 2mediumvsGPT-4o-mininone GPT-4o-mininonevsQwen3.5-35B-A3Bmedium