नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

xAI: Grok 4.20 Beta vs Xiaomi: MiMo-V2-Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-12

मेट्रिक Grok 4.20 Beta Grok 4.20 Beta medium प्रकाशन: 2026-03-12 MiMo-V2-Flash MiMo-V2-Flash medium प्रकाशन: 2025-12-16
क्रमांक #24 #22
सरासरी स्कोअर 7.0 7.2
सुसंगतता 9.0 9.5
प्रति निकाल खर्च 5.989 0.316
एकूण खर्च $0.599 $0.035
बरोबर चाचण्या
प्रति प्रयत्न पास दर 70.8% 72.9%
अस्थिर चाचण्या 2 1
एकूण रन 48 48
आउटपुट टोकन्स 1,481 11,613
रिझनिंग टोकन्स 86,628 106,714
प्रतिसाद वेळ (सरासरी) 8.89s 25.33s
प्रतिसाद वेळ (कमाल) 24.21s 96.01s
प्रतिसाद वेळ (एकूण) 142.18s 253.33s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

सरासरी स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.19s 262 6,289
MiMo-V2-Flash 9.7 10.0 100.0% 0 16.79s 1,328 18,739
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 227 12,212
MiMo-V2-Flash 9.0 10.0 100.0% 0 75.68s 442 26,859
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 9.9 10.0 100.0% 0 4.01s 180 5,281
MiMo-V2-Flash 5.5 10.0 50.0% 0 0ms 153 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 4.0 10.0 33.3% 0 21.33s 251 40,255
MiMo-V2-Flash 4.0 7.2 55.6% 1 96.01s 8,374 42,461
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 72 3,440
MiMo-V2-Flash 3.0 10.0 0.0% 0 4.20s 87 488
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 9.0 10.0 50.0% 0 4.97s 57 7,107
MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 75 3,504
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.85s 249 6,660
MiMo-V2-Flash 7.0 10.0 66.7% 0 3.77s 833 1,948
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 10.0 10.0 0.0% 0 12.39s 183 5,384
MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 321 12,715

झटपट तुलना

तुलना जोडी बदला