Compară Grafice Metodologie

Limbă:

❤️ Made by XCS

AI BENCHY Compare

Trinity Large Preview vs Google: Gemini 3.1 Pro Preview

Compară:

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-06

Metrică	Trinity Large Preview none Lansare: 2026-01-27 Disponibil gratuit	Google: Gemini 3.1 Pro Preview medium Lansare: 2026-02-19
Rang	#45	#2
Scor mediu	4.2	9.4
Consistență	9.6	10.0
Cost per rezultat	0.000	3.417
Cost total	$0.000	$0.513
Teste corecte
Rată de trecere pe încercare	33.3%	93.8%
Teste instabile	1	0
Rulări totale	48 (16 x 3)	48 (16 x 3)
Tokenuri de ieșire	1,837	1,521
Tokenuri de raționament	0	35,656
Timp de răspuns (mediu)	3.15s	16.60s
Timp de răspuns (maxim)	8.91s	40.61s
Timp de răspuns (total)	50.46s	149.36s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor mediu vs Timp de răspuns (mediu)

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
Google: Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.52s	106	2,533

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
Google: Gemini 3.1 Pro Preview	9.0	10.0	100.0%	0		40.61s	432	9,281

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
Google: Gemini 3.1 Pro Preview	9.9	10.0	100.0%	0		7.72s	279	3,904

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
Google: Gemini 3.1 Pro Preview	7.0	10.0	66.7%	0		32.73s	18	12,424

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
Google: Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
Google: Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236

Puzzle Solving	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
Google: Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.15s	232	3,117

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
Google: Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982

Comparație rapidă

Schimbă perechea de comparație

Trinity Large PreviewnoneDisponibil gratuitvsMiniMax M2.5medium Trinity Large PreviewnoneDisponibil gratuitvsQwen3 Coder Nextmedium Trinity Large PreviewnoneDisponibil gratuitvsgpt-oss-120bmediumDisponibil gratuit Trinity Large PreviewnoneDisponibil gratuitvsMercury 2medium Trinity Large PreviewnoneDisponibil gratuitvsGLM 4.7 Flashmedium Trinity Large PreviewnoneDisponibil gratuitvsQwen3.5-35B-A3Bmedium Trinity Large PreviewnoneDisponibil gratuitvsGPT-5 Nanomedium Trinity Large PreviewnoneDisponibil gratuitvsGPT-5 Minimedium Gemini 3.1 Pro PreviewmediumvsGPT-5.2 Chatnone Trinity Large PreviewnoneDisponibil gratuitvsGrok 4.1 Fastmedium Gemini 3.1 Pro PreviewmediumvsGPT-5.3 Chatnone Trinity Large PreviewnoneDisponibil gratuitvsKimi K2.5medium