नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.5 vs Xiaomi: MiMo-V2-Flash

सारांश

GPT-5.5 vs MiMo-V2-Flash benchmark तुलना: GPT-5.5 average score मध्ये पुढे आहे: 9.3 vs 4.3. MiMo-V2-Flash चा benchmark खर्च कमी आहे: $0.025 vs $0.907. MiMo-V2-Flash वेगवान आहे: 2.76s vs 9.76s, pass rates 85.7% vs 25.4%.

शिफारस केलेले मॉडेल: GPT-5.5 - It has the strongest score in this comparison (9.3) and the best overall balance of cost and response time across all 2 models.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-07-02

मेट्रिक GPT-5.5 GPT-5.5 low प्रकाशन: 2026-04-24 MiMo-V2-Flash MiMo-V2-Flash none प्रकाशन: 2025-12-16
स्कोअर 9.3 4.3
क्रमांक #4 #164
विश्वसनीयता 10.0 6.7
सुसंगतता 10.0 8.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर 85.7% 25.4%
अस्थिर चाचण्या 0 4
एकूण रन 63 63
प्रति निकाल खर्च 5.035 0.584
एकूण खर्च $0.907 $0.025
इनपुट किंमत $5.000 / 1M $0.100 / 1M
आउटपुट किंमत $30.000 / 1M $0.300 / 1M
एकूण इनपुट टोकन्स 34,209 36,851
आउटपुट टोकन्स 2,046 68,882
रिझनिंग टोकन्स 22,460 0
प्रतिसाद वेळ (सरासरी) 9.76s 2.76s
प्रतिसाद वेळ (कमाल) 56.19s 19.68s
प्रतिसाद वेळ (एकूण) 204.92s 46.99s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#4 GPT-5.5

low
खर्च
$0.068
वेळ
37.0s
टोकन्स
2,339 tok

#164 MiMo-V2-Flash

none
खर्च
$0.001
वेळ
7.7s
टोकन्स
1,481 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
MiMo-V2-Flash 3.2 8.0 8.3% 1 1.19s 645 865 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
MiMo-V2-Flash 4.3 7.9 11.1% 1 2.64s 7,442 763 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
MiMo-V2-Flash 3.0 10.0 0.0% 0 2.87s 15,075 330 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
MiMo-V2-Flash 2.9 5.8 16.7% 1 19.68s 2,622 161 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
MiMo-V2-Flash 5.3 7.2 44.4% 1 564ms 753 24 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
MiMo-V2-Flash 4.6 10.0 0.0% 0 1.67s 498 104 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
MiMo-V2-Flash 6.5 10.0 50.0% 0 857ms 684 69 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
MiMo-V2-Flash 5.3 10.0 33.3% 0 1.86s 678 66,282 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
MiMo-V2-Flash 10.0 10.0 100.0% 0 2.28s 8,238 272 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840
MiMo-V2-Flash 3.0 10.0 0.0% 0 1.82s 216 12 0

झटपट तुलना

तुलना जोडी बदला