نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 vs Xiaomi: MiMo-V2.5

خلاصہ

GPT-5.4 vs MiMo-V2.5 benchmark موازنہ: GPT-5.4 average score میں آگے ہے: 5.8 vs 5.1. MiMo-V2.5 کی benchmark لاگت کم ہے: $0.007 vs $0.122. GPT-5.4 تیز ہے: 1.42s vs 2.20s، pass rates 36.5% vs 27.0%.

تجویز کردہ ماڈل: MiMo-V2.5 - Its score stays close to the best score here (5.1 vs 5.8), while costing about 18.7x less than GPT-5.4.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-12

میٹرک GPT-5.4 GPT-5.4 none اجرا: 2026-03-05 MiMo-V2.5 MiMo-V2.5 none اجرا: 2026-04-22
اسکور 5.8 5.1
درجہ #116 #139
اعتماد پذیری 10.0 10.0
تسلسل 9.2 9.6
درست ٹیسٹس
فی کوشش کامیابی کی شرح 36.5% 27.0%
غیر مستحکم ٹیسٹ 2 1
کل رنز 63 63
فی نتیجہ لاگت 1.740 0.413
کل لاگت $0.122 $0.007
ان پٹ قیمت $2.500 / 1M $0.140 / 1M
آؤٹ پٹ قیمت $15.000 / 1M $0.280 / 1M
کل ان پٹ ٹوکنز 34,212 41,985
آؤٹ پٹ ٹوکنز 2,417 2,267
ریزننگ ٹوکنز 0 0
ردِعمل کا وقت (اوسط) 1.42s 2.20s
ردِعمل کا وقت (زیادہ سے زیادہ) 2.95s 6.86s
ردِعمل کا وقت (کل) 29.87s 46.21s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#116 GPT-5.4

none
Cost
$0.026
Time
18.1s
Tokens
1,792 tok

#139 MiMo-V2.5

none
Cost
$0.007
Time
267.4s
Tokens
25,283 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 3.2 8.0 8.3% 1 1.21s 606 406 0
MiMo-V2.5 3.5 8.0 16.7% 1 2.19s 645 282 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 5.5 10.0 33.3% 0 1.62s 7,305 516 0
MiMo-V2.5 5.5 10.0 33.3% 0 3.24s 7,440 696 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 3.0 10.0 0.0% 0 2.89s 11,019 291 0
MiMo-V2.5 3.0 10.0 0.0% 0 2.36s 15,075 330 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 10.0 10.0 100.0% 0 1.04s 7,140 222 0
MiMo-V2.5 6.5 10.0 50.0% 0 1.01s 7,758 366 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 5.3 7.2 44.4% 1 1.07s 723 50 0
MiMo-V2.5 3.0 10.0 0.0% 0 756ms 753 27 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 4.4 9.9 0.0% 0 1.78s 477 184 0
MiMo-V2.5 4.4 9.9 0.0% 0 6.86s 498 81 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 6.5 10.0 50.0% 0 1.07s 660 81 0
MiMo-V2.5 6.5 10.0 50.0% 0 751ms 684 72 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 5.6 9.8 33.3% 0 1.44s 642 381 0
MiMo-V2.5 5.4 10.0 33.3% 0 2.13s 678 166 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 10.0 10.0 100.0% 0 2.75s 5,445 246 0
MiMo-V2.5 10.0 10.0 100.0% 0 2.43s 8,238 231 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 3.0 10.0 0.0% 0 990ms 195 40 0
MiMo-V2.5 3.0 10.0 0.0% 0 3.89s 216 16 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں