नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Nano vs Xiaomi: MiMo-V2.5-Pro

सारांश

GPT-5.4 Nano vs MiMo-V2.5-Pro benchmark तुलना: GPT-5.4 Nano average score मध्ये पुढे आहे: 7.5 vs 7.4. MiMo-V2.5-Pro चा benchmark खर्च कमी आहे: $0.106 vs $0.107. GPT-5.4 Nano वेगवान आहे: 11.95s vs 26.13s, pass rates 63.5% vs 68.3%.

शिफारस केलेले मॉडेल: GPT-5.4 Nano - It has the best score here (7.5), while responding about 2.2x faster than MiMo-V2.5-Pro.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक GPT-5.4 Nano GPT-5.4 Nano medium प्रकाशन: 2026-03-17 MiMo-V2.5-Pro MiMo-V2.5-Pro medium प्रकाशन: 2026-04-22
स्कोअर 7.5 7.4
क्रमांक #46 #51
विश्वसनीयता 10.0 10.0
सुसंगतता 8.4 8.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर 63.5% 68.3%
अस्थिर चाचण्या 4 4
एकूण रन 63 63
प्रति निकाल खर्च 0.969 2.541
एकूण खर्च $0.107 $0.106
इनपुट किंमत $0.200 / 1M $0.435 / 1M
आउटपुट किंमत $1.250 / 1M $0.870 / 1M
एकूण इनपुट टोकन्स 35,434 40,854
आउटपुट टोकन्स 3,014 5,015
रिझनिंग टोकन्स 76,520 97,742
प्रतिसाद वेळ (सरासरी) 11.95s 26.13s
प्रतिसाद वेळ (कमाल) 94.06s 130.77s
प्रतिसाद वेळ (एकूण) 250.98s 548.65s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#46 GPT-5.4 Nano

medium
खर्च
$0.007
वेळ
24.6s
टोकन्स
4,943 tok

#51 MiMo-V2.5-Pro

medium
अवैध SVG
खर्च
$0.000
वेळ
300.0s
टोकन्स
0 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 606 683 2,254
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.26s 621 323 1,179
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 6.1 4.7 66.7% 2 19.12s 7,305 516 20,778
MiMo-V2.5-Pro 6.2 4.7 66.7% 2 92.07s 6,543 780 51,218
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 12,345 349 5,719
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 15,060 348 11,870
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 7,140 234 516
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 7,746 260 8,383
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 619 60 43,325
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 630 275 17,023
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 477 179 443
MiMo-V2.5-Pro 5.5 10.0 0.0% 0 4.02s 492 155 163
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 660 95 521
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 672 82 803
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 4.1 7.2 22.2% 1 3.79s 642 594 1,408
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.31s 660 540 2,181
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 5,445 234 382
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 8,220 311 2,908
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 3.0 10.0 0.0% 0 4.81s 195 70 1,174
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 12.46s 210 1,941 2,014

झटपट तुलना

तुलना जोडी बदला