नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: GPT-5.5 vs Xiaomi: MiMo-V2.5

सारांश

GPT-5.5 vs MiMo-V2.5 benchmark तुलना: GPT-5.5 average score में आगे है: 9.3 vs 5.1. MiMo-V2.5 की benchmark लागत कम है: $0.007 vs $0.907. MiMo-V2.5 तेज है: 2.20s vs 9.76s, pass rates 85.7% vs 27.0%.

अनुशंसित मॉडल: GPT-5.5 - It has the strongest score in this comparison (9.3) and the best overall balance of cost and response time across all 2 models.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक GPT-5.5 GPT-5.5 low रिलीज़: 2026-04-24 MiMo-V2.5 MiMo-V2.5 none रिलीज़: 2026-04-22
स्कोर 9.3 5.1
रैंक #5 #139
विश्वसनीयता 10.0 10.0
संगति 10.0 9.6
सही परीक्षण
प्रति प्रयास पास दर 85.7% 27.0%
अस्थिर टेस्ट 0 1
कुल रन 63 63
प्रति परिणाम लागत 5.035 0.413
कुल लागत $0.907 $0.007
इनपुट कीमत $5.000 / 1M $0.140 / 1M
आउटपुट कीमत $30.000 / 1M $0.280 / 1M
कुल इनपुट टोकन 34,209 41,985
आउटपुट टोकन 2,046 2,267
रीजनिंग टोकन 22,460 0
प्रतिक्रिया समय (औसत) 9.76s 2.20s
प्रतिक्रिया समय (अधिकतम) 56.19s 6.86s
प्रतिक्रिया समय (कुल) 204.92s 46.21s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#5 GPT-5.5

low
Cost
$0.068
Time
37.0s
Tokens
2,339 tok

#139 MiMo-V2.5

none
Cost
$0.007
Time
267.4s
Tokens
25,283 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
MiMo-V2.5 3.5 8.0 16.7% 1 2.19s 645 282 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
MiMo-V2.5 5.5 10.0 33.3% 0 3.24s 7,440 696 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
MiMo-V2.5 3.0 10.0 0.0% 0 2.36s 15,075 330 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
MiMo-V2.5 6.5 10.0 50.0% 0 1.01s 7,758 366 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
MiMo-V2.5 3.0 10.0 0.0% 0 756ms 753 27 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
MiMo-V2.5 4.4 9.9 0.0% 0 6.86s 498 81 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
MiMo-V2.5 6.5 10.0 50.0% 0 751ms 684 72 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
MiMo-V2.5 5.4 10.0 33.3% 0 2.13s 678 166 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
MiMo-V2.5 10.0 10.0 100.0% 0 2.43s 8,238 231 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840
MiMo-V2.5 3.0 10.0 0.0% 0 3.89s 216 16 0

त्वरित तुलना

तुलना जोड़ी बदलें