نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.7 Plus vs Xiaomi: MiMo-V2-Flash

خلاصہ

Qwen3.7 Plus vs MiMo-V2-Flash benchmark موازنہ: Qwen3.7 Plus average score میں آگے ہے: 7.2 vs 7.1. Qwen3.7 Plus کی benchmark لاگت کم ہے: $0.023 vs $0.043. Qwen3.7 Plus تیز ہے: 2.85s vs 20.11s، pass rates 47.6% vs 65.1%.

تجویز کردہ ماڈل: Qwen3.7 Plus - It has the best score here (7.2), while costing about 1.9x less than MiMo-V2-Flash.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-12

میٹرک Qwen3.7 Plus Qwen3.7 Plus none اجرا: 2026-06-03 MiMo-V2-Flash MiMo-V2-Flash medium اجرا: 2025-12-16
اسکور 7.2 7.1
درجہ #61 #62
اعتماد پذیری 10.0 10.0
تسلسل 10.0 8.8
درست ٹیسٹس
فی کوشش کامیابی کی شرح 47.6% 65.1%
غیر مستحکم ٹیسٹ 0 3
کل رنز 63 63
فی نتیجہ لاگت 0.276 0.343
کل لاگت $0.023 $0.043
ان پٹ قیمت $0.320 / 1M $0.100 / 1M
آؤٹ پٹ قیمت $1.280 / 1M $0.300 / 1M
کل ان پٹ ٹوکنز 42,510 40,111
آؤٹ پٹ ٹوکنز 6,578 12,476
ریزننگ ٹوکنز 0 125,039
ردِعمل کا وقت (اوسط) 2.85s 20.11s
ردِعمل کا وقت (زیادہ سے زیادہ) 29.38s 96.01s
ردِعمل کا وقت (کل) 59.86s 301.59s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#61 Qwen3.7 Plus

none
Cost
$0.019
Time
213.5s
Tokens
11,960 tok

#62 MiMo-V2-Flash

medium
Invalid SVG
Cost
$0.020
Time
284.1s
Tokens
65,689 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.7 Plus 6.5 10.0 50.0% 0 1.38s 696 349 0
MiMo-V2-Flash 8.1 7.9 83.3% 1 15.85s 621 1,674 23,559
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.7 Plus 5.5 10.0 33.3% 0 2.15s 7,911 639 0
MiMo-V2-Flash 6.0 7.2 55.6% 1 10.71s 7,177 474 13,505
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.7 Plus 10.0 10.0 100.0% 0 29.38s 14,952 4,505 0
MiMo-V2-Flash 9.8 10.0 100.0% 0 75.68s 18,676 442 26,859
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.7 Plus 10.0 10.0 100.0% 0 1.43s 7,794 243 0
MiMo-V2-Flash 6.5 10.0 50.0% 0 0ms 2,622 153 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.7 Plus 3.0 10.0 0.0% 0 868ms 789 18 0
MiMo-V2-Flash 5.9 7.2 55.6% 1 96.01s 739 8,374 42,461
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.7 Plus 5.3 10.0 0.0% 0 1.33s 522 78 0
MiMo-V2-Flash 4.0 10.0 0.0% 0 4.20s 492 87 488
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.7 Plus 6.3 10.0 50.0% 0 929ms 711 72 0
MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 678 75 3,504
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.7 Plus 7.7 10.0 66.7% 0 1.71s 714 443 0
MiMo-V2-Flash 7.7 10.0 66.7% 0 3.87s 670 864 1,948
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.7 Plus 10.0 10.0 100.0% 0 3.54s 8,211 222 0
MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 8,220 321 12,715
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.7 Plus 3.0 10.0 0.0% 0 1.21s 210 9 0
MiMo-V2-Flash 3.0 10.0 0.0% 0 1.96s 216 12 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں