नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs Xiaomi: MiMo-V2.5

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-22

मेट्रिक GPT-5.3 Chat GPT-5.3 Chat none प्रकाशन: 2026-03-03 MiMo-V2.5 MiMo-V2.5 medium प्रकाशन: 2026-04-22
स्कोअर 7.7 7.8
क्रमांक #38 #35
सुसंगतता 8.6 8.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 68.5% 74.1%
अस्थिर चाचण्या 3 3
एकूण रन 54 54
प्रति निकाल खर्च 3.082 2.102
एकूण खर्च $0.340 $0.253
???? ??? $1.750 / 1M $0.400 / 1M
????? ??? $14.000 / 1M $2.000 / 1M
आउटपुट टोकन्स 20,784 2,840
रिझनिंग टोकन्स 0 116,242
प्रतिसाद वेळ (सरासरी) 5.88s 13.71s
प्रतिसाद वेळ (कमाल) 18.33s 86.93s
प्रतिसाद वेळ (एकूण) 105.90s 246.73s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 3,167 0
MiMo-V2.5 10.0 10.0 100.0% 0 1.98s 303 2,022
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 10.0 10.0 100.0% 0 9.32s 1,436 0
MiMo-V2.5 10.0 10.0 100.0% 0 31.48s 488 14,813
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
MiMo-V2.5 3.8 2.5 33.3% 1 1.55s 118 170
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 8.3 10.0 50.0% 0 3.29s 1,455 0
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424

झटपट तुलना

तुलना जोडी बदला