Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

Trinity Large Preview vs inclusionAI: Ring-2.6-1T

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-03

Metrică Trinity Large Preview Trinity Large Preview none Lansare: 2026-01-27 Ring-2.6-1T Ring-2.6-1T medium Lansare: 2026-05-10
Scor 4.7 7.0
Rang #148 #74
Fiabilitate 10.0 10.0
Consistență 9.3 8.7
Teste corecte
Rată de trecere pe încercare 23.3% 63.3%
Teste instabile 2 3
Rulări totale 60 60
Cost per rezultat 0.017 0.000
Cost total $0.008 $0.033
Preț de intrare $0.243 / 1M $0.075 / 1M
Preț de ieșire $0.243 / 1M $0.625 / 1M
Total tokenuri de intrare 29,828 35,892
Tokenuri de ieșire 2,169 21,752
Tokenuri de raționament 0 42,754
Timp de răspuns (mediu) 2.98s 61.29s
Timp de răspuns (maxim) 14.34s 304.19s
Timp de răspuns (total) 56.57s 1164.50s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 3.1 10.0 0.0% 0 2.07s 651 550 0
Ring-2.6-1T 10.0 10.0 100.0% 0 42.21s 810 3,833 4,891
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 4.0 6.6 16.7% 1 14.34s 738 397 0
Ring-2.6-1T 6.5 10.0 50.0% 0 59.65s 834 1,369 3,985
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 3.0 10.0 0.0% 0 8.91s 12,053 294 0
Ring-2.6-1T 10.0 10.0 100.0% 0 304.19s 14,823 324 6,088
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 10.0 10.0 100.0% 0 3.26s 6,900 186 0
Ring-2.6-1T 6.5 10.0 50.0% 0 37.36s 8,046 840 1,937
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 5.3 10.0 33.3% 0 877ms 738 25 0
Ring-2.6-1T 3.5 4.4 33.3% 2 64.92s 873 9,744 15,013
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 4.5 10.0 0.0% 0 873ms 498 104 0
Ring-2.6-1T 4.1 10.0 0.0% 0 58.26s 561 150 583
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 3.5 10.0 0.0% 0 822ms 678 63 0
Ring-2.6-1T 9.8 10.0 100.0% 0 11.78s 774 266 1,831
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 3.6 7.7 11.1% 1 1.97s 669 265 0
Ring-2.6-1T 5.9 7.2 55.6% 1 20.73s 792 697 2,479
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 6,699 267 0
Ring-2.6-1T 10.0 10.0 100.0% 0 104.44s 8,136 234 1,531
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 3.0 10.0 0.0% 0 777ms 204 18 0
Ring-2.6-1T 3.0 10.0 0.0% 0 113.91s 243 4,295 4,416

Comparație rapidă

Schimbă perechea de comparație