نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs Qwen: Qwen3.6 27B

خلاصہ

Kimi K2.5 vs Qwen3.6 27B benchmark موازنہ: Kimi K2.5 average score میں آگے ہے: 6.8 vs 5.6. Qwen3.6 27B کی benchmark لاگت کم ہے: $0.025 vs $0.328. Qwen3.6 27B تیز ہے: 3.72s vs 98.43s، pass rates 68.3% vs 47.6%.

تجویز کردہ ماڈل: Qwen3.6 27B - It offers the best overall trade-off: a competitive score (5.6), lower cost than Kimi K2.5, and balanced response time.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-10

میٹرک Kimi K2.5 Kimi K2.5 medium اجرا: 2026-01-27 Qwen3.6 27B Qwen3.6 27B none اجرا: 2026-04-20
اسکور 6.8 5.6
درجہ #77 #119
اعتماد پذیری 10.0 10.0
تسلسل 6.9 7.6
درست ٹیسٹس
فی کوشش کامیابی کی شرح 68.3% 47.6%
غیر مستحکم ٹیسٹ 8 6
کل رنز 63 63
فی نتیجہ لاگت 3.704 0.467
کل لاگت $0.328 $0.025
ان پٹ قیمت $0.400 / 1M $0.290 / 1M
آؤٹ پٹ قیمت $1.900 / 1M $2.400 / 1M
کل ان پٹ ٹوکنز 34,312 52,721
آؤٹ پٹ ٹوکنز 48,379 3,812
ریزننگ ٹوکنز 157,747 0
ردِعمل کا وقت (اوسط) 98.43s 3.72s
ردِعمل کا وقت (زیادہ سے زیادہ) 281.00s 11.82s
ردِعمل کا وقت (کل) 1378.03s 78.08s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#77 MoonshotAI: Kimi K2.5

medium
Cost
$0.030
Time
58.6s
Tokens
8,683 tok

#119 Qwen3.6 27B

none
Cost
$0.009
Time
83.0s
Tokens
4,549 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 634 2,789 8,880
Qwen3.6 27B 3.8 3.7 41.7% 3 2.83s 696 490 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 6.1 4.6 66.7% 2 217.49s 6,935 5,705 74,693
Qwen3.6 27B 5.5 10.0 33.3% 0 4.16s 7,913 539 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 11,280 703 3,713
Qwen3.6 27B 3.0 10.0 0.0% 0 9.95s 22,497 1,401 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 7,020 563 7,940
Qwen3.6 27B 7.3 5.8 83.3% 1 2.06s 7,788 248 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 485 20,753 30,564
Qwen3.6 27B 7.7 10.0 66.7% 0 3.03s 789 24 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 480 3,815 4,262
Qwen3.6 27B 5.2 9.9 0.0% 0 1.07s 522 72 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 675 5,371 6,547
Qwen3.6 27B 6.2 5.8 66.7% 1 1.92s 711 49 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 5.3 7.3 44.4% 1 43.23s 659 8,426 12,692
Qwen3.6 27B 5.3 7.2 44.4% 1 5.15s 714 639 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 5,933 242 812
Qwen3.6 27B 9.5 10.0 100.0% 0 6.74s 10,881 339 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 3.0 10.0 0.0% 0 83.95s 211 12 7,644
Qwen3.6 27B 3.0 10.0 0.0% 0 4.03s 210 11 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں