नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: GPT-5.3 Chat vs Xiaomi: MiMo-V2.5

सारांश

GPT-5.3 Chat vs MiMo-V2.5 benchmark तुलना: MiMo-V2.5 average score में आगे है: 7.3 vs 7.2. MiMo-V2.5 की benchmark लागत कम है: $0.063 vs $0.433. GPT-5.3 Chat तेज है: 6.34s vs 27.11s, pass rates 66.7% vs 69.8%.

अनुशंसित मॉडल: MiMo-V2.5 - It has the best score here (7.3), while costing about 6.9x less than GPT-5.3 Chat.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-04

मेट्रिक GPT-5.3 Chat GPT-5.3 Chat none रिलीज़: 2026-03-03 MiMo-V2.5 MiMo-V2.5 medium रिलीज़: 2026-04-22
स्कोर 7.2 7.3
रैंक #63 #56
विश्वसनीयता 10.0 10.0
संगति 8.1 8.1
सही परीक्षण
प्रति प्रयास पास दर 66.7% 69.8%
अस्थिर टेस्ट 5 5
कुल रन 63 63
प्रति परिणाम लागत 3.605 2.966
कुल लागत $0.433 $0.063
इनपुट कीमत $1.750 / 1M $0.140 / 1M
आउटपुट कीमत $14.000 / 1M $0.280 / 1M
कुल इनपुट टोकन 34,209 41,838
आउटपुट टोकन 26,617 2,827
रीजनिंग टोकन 0 198,898
प्रतिक्रिया समय (औसत) 6.34s 27.11s
प्रतिक्रिया समय (अधिकतम) 18.33s 162.44s
प्रतिक्रिया समय (कुल) 133.13s 569.38s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#63 GPT-5.3 Chat

none
Cost
$0.008
Time
8.1s
Tokens
634 tok

#56 MiMo-V2.5

medium
Cost
$0.002
Time
54.8s
Tokens
5,247 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 606 3,167 0
MiMo-V2.5 10.0 10.0 100.0% 0 4.14s 621 281 1,739
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 5.6 4.7 55.6% 2 10.52s 7,302 6,632 0
MiMo-V2.5 6.2 4.7 66.7% 2 97.14s 7,422 557 81,977
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 11,019 2,614 0
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 15,060 363 7,609
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 7,140 942 0
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 7,746 306 5,714
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 723 8,264 0
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 735 507 49,478
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 477 319 0
MiMo-V2.5 5.4 2.5 66.7% 1 5.37s 492 121 418
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 660 1,491 0
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 672 88 801
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 642 1,758 0
MiMo-V2.5 8.2 7.2 88.9% 1 20.25s 660 279 33,254
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 5,445 861 0
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 8,220 303 2,424
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 195 569 0
MiMo-V2.5 3.0 10.0 0.0% 0 51.29s 210 22 15,484

त्वरित तुलना

तुलना जोड़ी बदलें