Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

inclusionAI: Ring-2.6-1T vs StepFun: Step 3.5 Flash

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-22

Metrică Ring-2.6-1T Ring-2.6-1T none Lansare: 2026-05-10 Step 3.5 Flash Step 3.5 Flash medium Lansare: 2026-02-01
Scor 7.2 7.4
Rang #62 #58
Fiabilitate 9.8 9.3
Consistență 9.1 8.7
Teste corecte
Rată de trecere pe încercare 62.5% 65.8%
Teste instabile 2 3
Rulări totale 60 57
Cost per rezultat 0.000 0.133
Cost total $0.000 $0.015
Preț de intrare $0.075 / 1M $0.090 / 1M
Preț de ieșire $0.625 / 1M $0.300 / 1M
Tokenuri de ieșire 39,954 90,397
Tokenuri de raționament 0 173,409
Timp de răspuns (mediu) 55.10s 43.29s
Timp de răspuns (maxim) 143.82s 170.45s
Timp de răspuns (total) 881.55s 562.74s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Ring-2.6-1T 9.2 8.4 91.7% 1 43.33s 5,575 0
Step 3.5 Flash 10.0 10.0 100.0% 0 40.57s 20,391 24,176
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Ring-2.6-1T 10.0 10.0 100.0% 0 143.82s 5,036 0
Step 3.5 Flash 3.0 6.0 50.0% 1 62.83s 12,098 0
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Ring-2.6-1T 0.0 0.0 0.0% 0 0ms 0 0
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Ring-2.6-1T 3.0 10.0 0.0% 0 45.87s 1,529 0
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Ring-2.6-1T 5.3 7.2 44.4% 1 73.40s 17,728 0
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Ring-2.6-1T 4.3 10.0 0.0% 0 15.63s 846 0
Step 3.5 Flash 5.5 10.0 0.0% 0 22.39s 240 3,506
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Ring-2.6-1T 9.8 10.0 100.0% 0 27.36s 2,004 0
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Ring-2.6-1T 7.7 10.0 66.7% 0 31.47s 3,469 0
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Ring-2.6-1T 0.0 0.0 0.0% 0 0ms 0 0
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Ring-2.6-1T 3.0 10.0 0.0% 0 133.60s 3,767 0
Step 3.5 Flash 3.0 10.0 0.0% 0 108.45s 2,354 10,372

Comparație rapidă

Schimbă perechea de comparație