नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.2 vs Xiaomi: MiMo-V2-Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-29

मेट्रिक GPT-5.2 GPT-5.2 medium प्रकाशन: 2025-12-11 MiMo-V2-Flash MiMo-V2-Flash medium प्रकाशन: 2025-12-16
स्कोअर 7.5 7.5
क्रमांक #52 #53
विश्वसनीयता लागू नाही लागू नाही
सुसंगतता 8.1 8.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 72.2% 70.4%
अस्थिर चाचण्या 4 3
एकूण रन 54 54
प्रति निकाल खर्च 3.193 0.341
एकूण खर्च $0.352 $0.038
???? ??? $1.750 / 1M $0.090 / 1M
????? ??? $14.000 / 1M $0.290 / 1M
आउटपुट टोकन्स 2,705 12,387
रिझनिंग टोकन्स 18,977 115,182
प्रतिसाद वेळ (सरासरी) 14.04s 23.36s
प्रतिसाद वेळ (कमाल) 77.80s 96.01s
प्रतिसाद वेळ (एकूण) 154.41s 280.34s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 6.5 8.0 58.3% 1 7.81s 567 2,002
MiMo-V2-Flash 8.1 7.9 83.3% 1 15.85s 1,674 23,559
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 10.0 10.0 100.0% 0 15.12s 467 2,166
MiMo-V2-Flash 4.7 1.6 66.7% 1 13.03s 428 3,648
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 10.0 10.0 100.0% 0 14.06s 291 1,757
MiMo-V2-Flash 9.8 10.0 100.0% 0 75.68s 442 26,859
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 10.0 10.0 100.0% 0 3.15s 234 420
MiMo-V2-Flash 6.5 10.0 50.0% 0 0ms 153 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 5.9 7.2 55.6% 1 77.80s 42 10,342
MiMo-V2-Flash 5.9 7.2 55.6% 1 96.01s 8,374 42,461
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 3.7 9.7 0.0% 0 4.32s 162 269
MiMo-V2-Flash 4.0 10.0 0.0% 0 4.20s 87 488
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 9.9 10.0 100.0% 0 3.12s 94 614
MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 75 3,504
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 7.7 7.3 77.8% 1 5.47s 609 938
MiMo-V2-Flash 7.7 10.0 66.7% 0 3.77s 833 1,948
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 4.7 1.6 66.7% 1 10.30s 239 469
MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 321 12,715

झटपट तुलना

तुलना जोडी बदला