#126
Moonshot AI
اجرا: 2026-01-27
ٹیسٹ کیا گیا: 2026-05-22 00:03
moonshotai/kimi-k2.5::none
(medium)
(none)
?? ?? ????
$0.400 / 1M
??? ?? ????
$1.900 / 1M
غیر مستحکم ٹیسٹ
3
غیر مستحکم ٹیسٹس میں رنز کے درمیان ملے جلے نتائج آئے (کم از کم ایک کامیاب اور ایک ناکام).
رن ہسٹری
| ٹیسٹ کیا گیا | اسکور | اعتماد پذیری | درست ٹیسٹس | کل لاگت | موازنہ کریں |
|---|---|---|---|---|---|
| 2026-05-22 00:03 سوٹ بدل گیا | 5.3 | 10.0 | $0.026 | موجودہ رن | |
| 2026-04-20 17:48 پہلا ریکارڈ شدہ رن | 5.5 | دستیاب نہیں | $0.017 | موازنہ کریں |
اس رن میں مختلف بینچ مارک سوٹ استعمال ہوا تھا۔ تاریخی تبدیلی سمجھتے وقت سوٹ کی تبدیلی کو بھی ذہن میں رکھیں۔
چارٹس
پہلا ماڈل منتخب کریں، پھر دوسرا ماڈل کلک کریں تاکہ سائیڈ بائی سائیڈ صفحہ کھلے۔
اسکور vs کل لاگت
ردِعمل کا وقت (اوسط)
اسکور vs ردِعمل کا وقت (اوسط)
کل آؤٹ پٹ ٹوکنز
اسکور vs کل آؤٹ پٹ ٹوکنز
فوری موازنہ
Kimi K2.5nonevsMiMo-V2-PrononeKimi K2.5nonevsGLM 4.7 FlashnoneKimi K2.5nonevsOwl AlphanoneKimi K2.5nonevsKimi K2.6noneKimi K2.5nonevsCobuddymediumمفت دستیابKimi K2.5nonevsgpt-oss-120bmediumمفت دستیابKimi K2.5nonevsGemini 3 Flash PreviewmediumKimi K2.5nonevsGemini 3.5 FlashhighKimi K2.5nonevsRing-2.6-1TmediumKimi K2.5nonevsGemini 3.5 Flashlow
زمرہ وار تفصیل
| زمرہ | اسکور | تسلسل | درست ٹیسٹس |
|---|---|---|---|
| اینٹی اے آئی چالیں | 3.6 | 8.4 | |
| کوڈنگ | 6.8 | 10.0 | |
| مشترکہ | 2.8 | 2.1 | |
| ڈیٹا پارسنگ اور استخراج | 7.3 | 5.8 | |
| ڈومین مخصوص | 5.3 | 10.0 | |
| عمومی ذہانت | 10.0 | 10.0 | |
| ہدایات کی پیروی | 6.5 | 10.0 | |
| پہیلی حل کرنا | 3.0 | 10.0 | |
| ٹول کالنگ | 10.0 | 10.0 | |
| معلومات عامہ | 3.0 | 10.0 |