Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

Trinity Large Preview vs Qwen: Qwen3.5-122B-A10B

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-03

Metrică Trinity Large Preview Trinity Large Preview none Lansare: 2026-01-27 Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Lansare: 2026-02-24
Scor 4.7 5.4
Rang #148 #131
Fiabilitate 10.0 10.0
Consistență 9.3 9.5
Teste corecte
Rată de trecere pe încercare 23.3% 33.3%
Teste instabile 2 1
Rulări totale 60 60
Cost per rezultat 0.017 0.380
Cost total $0.008 $0.019
Preț de intrare $0.243 / 1M $0.260 / 1M
Preț de ieșire $0.243 / 1M $2.080 / 1M
Total tokenuri de intrare 29,828 44,894
Tokenuri de ieșire 2,169 3,374
Tokenuri de raționament 0 0
Timp de răspuns (mediu) 2.98s 3.38s
Timp de răspuns (maxim) 14.34s 46.00s
Timp de răspuns (total) 56.57s 67.55s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 3.1 10.0 0.0% 0 2.07s 651 550 0
Qwen3.5-122B-A10B 4.8 10.0 25.0% 0 1.59s 696 312 0
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 4.0 6.6 16.7% 1 14.34s 738 397 0
Qwen3.5-122B-A10B 4.0 5.5 33.3% 1 2.14s 5,072 684 0
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 3.0 10.0 0.0% 0 8.91s 12,053 294 0
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 46.00s 20,175 1,137 0
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 10.0 10.0 100.0% 0 3.26s 6,900 186 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 1.01s 7,794 243 0
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 5.3 10.0 33.3% 0 877ms 738 25 0
Qwen3.5-122B-A10B 5.3 10.0 33.3% 0 465ms 789 15 0
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 4.5 10.0 0.0% 0 873ms 498 104 0
Qwen3.5-122B-A10B 5.0 10.0 0.0% 0 1.12s 522 66 0
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 3.5 10.0 0.0% 0 822ms 678 63 0
Qwen3.5-122B-A10B 6.3 10.0 50.0% 0 513ms 711 69 0
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 3.6 7.7 11.1% 1 1.97s 669 265 0
Qwen3.5-122B-A10B 3.8 10.0 0.0% 0 1.00s 714 575 0
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 6,699 267 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 2.04s 8,211 264 0
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Trinity Large Preview 3.0 10.0 0.0% 0 777ms 204 18 0
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 295ms 210 9 0

Comparație rapidă

Schimbă perechea de comparație