नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.5 vs Xiaomi: MiMo-V2.5-Pro

सारांश

GPT-5.5 vs MiMo-V2.5-Pro benchmark तुलना: GPT-5.5 average score में आगे है: 9.3 vs 5.5. MiMo-V2.5-Pro की benchmark लागत कम है: $0.017 vs $0.907. MiMo-V2.5-Pro तेज है: 1.78s vs 9.76s, pass rates 85.7% vs 39.7%.

अनुशंसित मॉडल: GPT-5.5 - It has the strongest score in this comparison (9.3) and the best overall balance of cost and response time across all 2 models.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक GPT-5.5 GPT-5.5 low रिलीज़: 2026-04-24 MiMo-V2.5-Pro MiMo-V2.5-Pro none रिलीज़: 2026-04-22
स्कोर 9.3 5.5
रैंक #4 #119
विश्वसनीयता 10.0 10.0
संगति 10.0 8.6
सही परीक्षण
प्रति प्रयास पास दर 85.7% 39.7%
अस्थिर टेस्ट 0 4
कुल रन 63 63
प्रति परिणाम लागत 5.035 0.648
कुल लागत $0.907 $0.017
इनपुट कीमत $5.000 / 1M $0.435 / 1M
आउटपुट कीमत $30.000 / 1M $0.870 / 1M
कुल इनपुट टोकन 34,209 30,724
आउटपुट टोकन 2,046 3,043
रीजनिंग टोकन 22,460 0
प्रतिक्रिया समय (औसत) 9.76s 1.78s
प्रतिक्रिया समय (अधिकतम) 56.19s 8.32s
प्रतिक्रिया समय (कुल) 204.92s 37.42s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#4 GPT-5.5

low
लागत
$0.068
समय
37.0s
टोकन
2,339 tok

#119 MiMo-V2.5-Pro

none
लागत
$0.004
समय
46.4s
टोकन
4,025 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
MiMo-V2.5-Pro 3.3 8.1 8.3% 1 2.67s 645 994 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
MiMo-V2.5-Pro 4.3 7.8 22.2% 1 1.41s 6,559 485 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 3.54s 4,695 596 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 1.32s 7,758 249 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 877ms 753 27 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
MiMo-V2.5-Pro 4.0 10.0 0.0% 0 2.58s 498 87 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
MiMo-V2.5-Pro 6.4 10.0 50.0% 0 1.03s 684 66 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
MiMo-V2.5-Pro 6.7 4.7 77.8% 2 1.30s 678 267 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.30s 8,238 258 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 1.89s 216 14 0

त्वरित तुलना

तुलना जोड़ी बदलें