Navigare
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 vs Xiaomi: MiMo-V2-Flash

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-15

Metrică GPT-5.4 GPT-5.4 medium Lansare: 2026-03-05 MiMo-V2-Flash MiMo-V2-Flash medium Lansare: 2025-12-16
Rang #9 #18
Scor 8.5 7.9
Consistență 8.5 9.5
Cost per rezultat 6.601 0.316
Cost total $0.793 $0.035
Teste corecte
Rată de trecere pe încercare 83.3% 72.9%
Teste instabile 3 1
Rulări totale 48 48
Tokenuri de ieșire 1,756 11,613
Tokenuri de raționament 46,642 106,714
Timp de răspuns (mediu) 20.05s 25.33s
Timp de răspuns (maxim) 100.41s 96.01s
Timp de răspuns (total) 320.87s 253.33s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
GPT-5.4 10.0 10.0 100.0% 0 5.02s 216 1,466
MiMo-V2-Flash 9.9 10.0 100.0% 0 16.79s 1,328 18,739
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
MiMo-V2-Flash 9.8 10.0 100.0% 0 75.68s 442 26,859
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
MiMo-V2-Flash 6.5 10.0 50.0% 0 0ms 153 0
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
MiMo-V2-Flash 5.9 7.2 55.6% 1 96.01s 8,374 42,461
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
MiMo-V2-Flash 4.0 10.0 0.0% 0 4.20s 87 488
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 75 3,504
Puzzle Solving Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
MiMo-V2-Flash 7.7 10.0 66.7% 0 3.77s 833 1,948
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 321 12,715

Comparație rapidă

Schimbă perechea de comparație