नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.5 vs Xiaomi: MiMo-V2-Flash

सारांश

GPT-5.5 vs MiMo-V2-Flash benchmark तुलना: GPT-5.5 average score मध्ये पुढे आहे: 9.3 vs 7.1. MiMo-V2-Flash चा benchmark खर्च कमी आहे: $0.043 vs $0.907. GPT-5.5 वेगवान आहे: 9.76s vs 20.11s, pass rates 85.7% vs 65.1%.

शिफारस केलेले मॉडेल: GPT-5.5 - It has the best score here (9.3), while responding about 2.1x faster than MiMo-V2-Flash.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-07-02

मेट्रिक GPT-5.5 GPT-5.5 low प्रकाशन: 2026-04-24 MiMo-V2-Flash MiMo-V2-Flash medium प्रकाशन: 2025-12-16
स्कोअर 9.3 7.1
क्रमांक #4 #64
विश्वसनीयता 10.0 10.0
सुसंगतता 10.0 8.8
बरोबर चाचण्या
प्रति प्रयत्न पास दर 85.7% 65.1%
अस्थिर चाचण्या 0 3
एकूण रन 63 63
प्रति निकाल खर्च 5.035 0.343
एकूण खर्च $0.907 $0.043
इनपुट किंमत $5.000 / 1M $0.100 / 1M
आउटपुट किंमत $30.000 / 1M $0.300 / 1M
एकूण इनपुट टोकन्स 34,209 40,111
आउटपुट टोकन्स 2,046 12,476
रिझनिंग टोकन्स 22,460 125,039
प्रतिसाद वेळ (सरासरी) 9.76s 20.11s
प्रतिसाद वेळ (कमाल) 56.19s 96.01s
प्रतिसाद वेळ (एकूण) 204.92s 301.59s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#4 GPT-5.5

low
खर्च
$0.068
वेळ
37.0s
टोकन्स
2,339 tok

#64 MiMo-V2-Flash

medium
अवैध SVG
खर्च
$0.020
वेळ
284.1s
टोकन्स
65,689 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
MiMo-V2-Flash 8.1 7.9 83.3% 1 15.85s 621 1,674 23,559
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
MiMo-V2-Flash 6.0 7.2 55.6% 1 10.71s 7,177 474 13,505
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
MiMo-V2-Flash 9.8 10.0 100.0% 0 75.68s 18,676 442 26,859
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
MiMo-V2-Flash 6.5 10.0 50.0% 0 0ms 2,622 153 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
MiMo-V2-Flash 5.9 7.2 55.6% 1 96.01s 739 8,374 42,461
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
MiMo-V2-Flash 4.0 10.0 0.0% 0 4.20s 492 87 488
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 678 75 3,504
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
MiMo-V2-Flash 7.7 10.0 66.7% 0 3.87s 670 864 1,948
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 8,220 321 12,715
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840
MiMo-V2-Flash 3.0 10.0 0.0% 0 1.96s 216 12 0

झटपट तुलना

तुलना जोडी बदला