नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Inception: Mercury 2 vs Xiaomi: MiMo-V2-Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-11

मेट्रिक Mercury 2 Mercury 2 medium प्रकाशन: 2026-02-24 MiMo-V2-Flash MiMo-V2-Flash none प्रकाशन: 2025-12-16
स्कोअर 6.5 4.5
क्रमांक #51 #88
सुसंगतता 8.6 7.8
बरोबर चाचण्या
प्रति प्रयत्न पास दर 53.7% 27.8%
अस्थिर चाचण्या 3 5
एकूण रन 54 54
प्रति निकाल खर्च 0.580 0.753
एकूण खर्च $0.047 $0.023
???? ??? $0.250 / 1M $0.090 / 1M
????? ??? $0.750 / 1M $0.290 / 1M
आउटपुट टोकन्स 3,972 68,522
रिझनिंग टोकन्स 48,333 0
प्रतिसाद वेळ (सरासरी) 2.21s 2.79s
प्रतिसाद वेळ (कमाल) 14.63s 19.68s
प्रतिसाद वेळ (एकूण) 37.51s 39.08s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
MiMo-V2-Flash 3.2 8.0 8.3% 1 1.19s 865 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 10.0 10.0 100.0% 0 1.53s 249 2,213
MiMo-V2-Flash 6.3 3.7 33.3% 1 2.79s 726 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
MiMo-V2-Flash 3.0 10.0 0.0% 0 2.87s 330 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
MiMo-V2-Flash 2.9 5.8 16.7% 1 19.68s 161 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
MiMo-V2-Flash 5.3 7.2 44.4% 1 564ms 24 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
MiMo-V2-Flash 4.6 10.0 0.0% 0 1.67s 104 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
MiMo-V2-Flash 6.5 10.0 50.0% 0 857ms 69 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.9 7.5 22.2% 1 934ms 354 2,758
MiMo-V2-Flash 3.6 7.2 22.2% 1 1.38s 65,971 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956
MiMo-V2-Flash 10.0 10.0 100.0% 0 2.28s 272 0

झटपट तुलना

तुलना जोडी बदला