Navigare
AI BENCHY
Compară Grafice Metodologie
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Trinity Large Preview vs OpenAI: GPT-5 Nano

Compară:

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-06

Metrică Trinity Large Preview none Lansare: 2026-01-27 Disponibil gratuit OpenAI: GPT-5 Nano medium Lansare: 2025-08-07
Rang #45 #34
Scor mediu 4.2 5.5
Consistență 9.6 7.0
Cost per rezultat 0.000 0.856
Cost total $0.000 $0.060
Teste corecte
Rată de trecere pe încercare 33.3% 60.4%
Teste instabile 1 6
Rulări totale 48 48
Tokenuri de ieșire 1,837 4,386
Tokenuri de raționament 0 142,080
Timp de răspuns (mediu) 3.15s 47.94s
Timp de răspuns (maxim) 8.91s 204.02s
Timp de răspuns (total) 50.46s 431.47s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor mediu vs Timp de răspuns (mediu)

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 10.0 10.0 0.0% 0 3.59s 587 0
OpenAI: GPT-5 Nano 7.0 10.0 66.7% 0 37.73s 1,107 19,968
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 10.0 10.0 0.0% 0 8.91s 294 0
OpenAI: GPT-5 Nano 10.0 10.0 100.0% 0 65.96s 578 17,984
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 9.9 10.0 100.0% 0 3.26s 186 0
OpenAI: GPT-5 Nano 10.0 1.7 50.0% 2 21.42s 453 10,560
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 4.0 10.0 33.3% 0 877ms 25 0
OpenAI: GPT-5 Nano 4.0 4.4 55.6% 2 204.02s 237 64,448
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 3.0 9.9 0.0% 0 2.86s 124 0
OpenAI: GPT-5 Nano 3.0 10.0 0.0% 0 17.51s 202 4,608
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 3.5 6.7 16.7% 1 1.09s 63 0
OpenAI: GPT-5 Nano 9.0 6.8 83.3% 1 11.90s 382 4,096
Puzzle Solving Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 4.0 10.0 33.3% 0 3.30s 291 0
OpenAI: GPT-5 Nano 4.0 7.2 44.4% 1 19.81s 869 13,440
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
OpenAI: GPT-5 Nano 10.0 10.0 100.0% 0 33.30s 558 6,976

Comparație rapidă

Schimbă perechea de comparație