AI BENCHY Compare

Trinity Large Preview vs Google: Gemini 3.1 Pro Preview

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-16

Metrică	Trinity Large Preview Trinity Large Preview none Lansare: 2026-01-27 Disponibil gratuit	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Lansare: 2026-02-19

Metrică	Trinity Large Preview Trinity Large Preview none Lansare: 2026-01-27 Disponibil gratuit	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Lansare: 2026-02-19
Scor	5.3	9.6
Rang	#76	#2
Consistență	9.6	10.0
Teste corecte
Rată de trecere pe încercare	29.6%	94.4%
Teste instabile	1	0
Rulări totale	52	54
Cost per rezultat	0.000	3.400
Cost total	$0.000	$0.578
Preț de intrare	$0.000 / 1M	$2.000 / 1M
Preț de ieșire	$0.000 / 1M	$12.000 / 1M
Tokenuri de ieșire	1,985	1,932
Tokenuri de raționament	0	40,542
Timp de răspuns (mediu)	5.07s	15.96s
Timp de răspuns (maxim)	39.47s	40.61s
Timp de răspuns (total)	91.23s	175.52s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	3.0	10.0	0.0%	0		3.02s	593	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	112	3,218

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	6.3	10.0	0.0%	0		39.47s	142	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		19.88s	405	4,201

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	3.0	10.0	0.0%	0		8.91s	294	0
Gemini 3.1 Pro Preview	9.5	10.0	100.0%	0		40.61s	432	9,281

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	10.0	10.0	100.0%	0		3.26s	186	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	279	3,904

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	5.3	10.0	33.3%	0		877ms	25	0
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	18	12,424

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	4.4	9.9	0.0%	0		2.86s	124	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	4.1	6.7	16.7%	1		1.09s	63	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	5.4	10.0	33.3%	0		3.30s	291	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.15s	232	3,117

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982

Comparație rapidă

Schimbă perechea de comparație

Trinity Large PreviewnoneDisponibil gratuitvsMiniMax M2.7medium Trinity Large PreviewnoneDisponibil gratuitvsElephantmedium Trinity Large PreviewnoneDisponibil gratuitvsMistral Small 4medium Trinity Large PreviewnoneDisponibil gratuitvsMiniMax M2.5mediumDisponibil gratuit Claude Opus 4.7nonevsGemini 3.1 Pro Previewmedium Trinity Large PreviewnoneDisponibil gratuitvsgpt-oss-120bmediumDisponibil gratuit Trinity Large PreviewnoneDisponibil gratuitvsQwen3 Coder Nextmedium Trinity Large PreviewnoneDisponibil gratuitvsGLM 4.7 Flashmedium Trinity Large PreviewnoneDisponibil gratuitvsGPT-5 Nanomedium Trinity Large PreviewnoneDisponibil gratuitvsQwen3.5-9Bmedium Trinity Large PreviewnoneDisponibil gratuitvsMercury 2medium Trinity Large PreviewnoneDisponibil gratuitvsGrok 4.1 Fastmedium