نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs Xiaomi: MiMo-V2.5

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-22

میٹرک GPT-5.3 Chat GPT-5.3 Chat none اجرا: 2026-03-03 MiMo-V2.5 MiMo-V2.5 medium اجرا: 2026-04-22
اسکور 7.7 7.8
درجہ #38 #35
تسلسل 8.6 8.6
درست ٹیسٹس
فی کوشش کامیابی کی شرح 68.5% 74.1%
غیر مستحکم ٹیسٹ 3 3
کل رنز 54 54
فی نتیجہ لاگت 3.082 2.102
کل لاگت $0.340 $0.253
?? ?? ???? $1.750 / 1M $0.400 / 1M
??? ?? ???? $14.000 / 1M $2.000 / 1M
آؤٹ پٹ ٹوکنز 20,784 2,840
ریزننگ ٹوکنز 0 116,242
ردِعمل کا وقت (اوسط) 5.88s 13.71s
ردِعمل کا وقت (زیادہ سے زیادہ) 18.33s 86.93s
ردِعمل کا وقت (کل) 105.90s 246.73s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 3,167 0
MiMo-V2.5 10.0 10.0 100.0% 0 1.98s 303 2,022
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 10.0 10.0 100.0% 0 9.32s 1,436 0
MiMo-V2.5 10.0 10.0 100.0% 0 31.48s 488 14,813
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
MiMo-V2.5 3.8 2.5 33.3% 1 1.55s 118 170
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 8.3 10.0 50.0% 0 3.29s 1,455 0
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں