नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 vs Xiaomi: MiMo-V2-Pro

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-20

मेट्रिक GPT-5.4 GPT-5.4 none प्रकाशन: 2026-03-05 MiMo-V2-Pro MiMo-V2-Pro none प्रकाशन: 2026-03-18
स्कोअर 5.6 5.8
क्रमांक #55 #54
सुसंगतता 9.0 8.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर 39.2% 45.1%
अस्थिर चाचण्या 2 3
एकूण रन 51 51
प्रति निकाल खर्च 1.573 0.659
एकूण खर्च $0.095 $0.040
???? ??? $2.500 / 1M $1.000 / 1M
????? ??? $15.000 / 1M $3.000 / 1M
आउटपुट टोकन्स 1,837 1,721
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 1.43s 2.31s
प्रतिसाद वेळ (कमाल) 2.89s 6.58s
प्रतिसाद वेळ (एकूण) 24.27s 39.25s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 3.2 8.0 8.3% 1 1.21s 406 0
MiMo-V2-Pro 3.5 8.0 16.7% 1 1.80s 315 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 3.0 10.0 0.0% 0 2.89s 291 0
MiMo-V2-Pro 3.0 10.0 0.0% 0 6.58s 333 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 1.04s 222 0
MiMo-V2-Pro 10.0 10.0 100.0% 0 1.39s 249 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 5.3 7.2 44.4% 1 1.07s 50 0
MiMo-V2-Pro 5.3 7.2 44.4% 1 1.78s 26 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 4.4 9.9 0.0% 0 1.78s 184 0
MiMo-V2-Pro 4.3 9.9 0.0% 0 2.44s 125 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 6.5 10.0 50.0% 0 1.07s 81 0
MiMo-V2-Pro 6.5 10.0 50.0% 0 2.51s 69 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 5.6 9.8 33.3% 0 1.52s 357 0
MiMo-V2-Pro 6.0 7.1 55.6% 1 1.83s 327 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
MiMo-V2-Pro 10.0 10.0 100.0% 0 4.39s 277 0

झटपट तुलना

तुलना जोडी बदला