AI BENCHY Compare
MoonshotAI: Kimi K2.5 vs OpenAI: GPT-5.5
بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-24
| میٹرک | Kimi K2.5 Kimi K2.5 medium | GPT-5.5 GPT-5.5 none |
|---|---|---|
| اسکور | 7.0 | 6.8 |
| درجہ | #54 | #58 |
| اعتماد پذیری | دستیاب نہیں | دستیاب نہیں |
| تسلسل | 6.8 | 8.3 |
| درست ٹیسٹس | ||
| فی کوشش کامیابی کی شرح | 72.2% | 61.1% |
| غیر مستحکم ٹیسٹ | 7 | 4 |
| کل رنز | 54 | 54 |
| فی نتیجہ لاگت | 2.444 | 2.162 |
| کل لاگت | $0.220 | $0.195 |
| ?? ?? ???? | $0.440 / 1M | $5.000 / 1M |
| ??? ?? ???? | $2.000 / 1M | $30.000 / 1M |
| آؤٹ پٹ ٹوکنز | 42,176 | 1,910 |
| ریزننگ ٹوکنز | 84,870 | 0 |
| ردِعمل کا وقت (اوسط) | 72.43s | 1.83s |
| ردِعمل کا وقت (زیادہ سے زیادہ) | 150.77s | 5.56s |
| ردِعمل کا وقت (کل) | 796.70s | 32.86s |
اسکور بمقابلہ کل لاگت
ردِعمل کا وقت (اوسط)
اسکور vs ردِعمل کا وقت (اوسط)
کل آؤٹ پٹ ٹوکنز
اسکور vs کل آؤٹ پٹ ٹوکنز
زمرہ وار تفصیل
فوری موازنہ
موازنہ کی جوڑی تبدیل کریں
Nemotron 3 Supermediumمفت دستیابvsGPT-5.5noneGPT-5.5nonevsGrok 4.1 FastmediumGemma 4 31Bnoneمفت دستیابvsKimi K2.5mediumGPT-5.5nonevsGrok 4.20mediumKimi K2.5mediumvsQwen3.5 Plus 2026-02-15noneMercury 2mediumvsGPT-5.5noneDeepSeek V4 PrononevsKimi K2.5mediumKimi K2.5mediumvsGLM 5noneClaude Sonnet 4.6nonevsKimi K2.5mediumKimi K2.5mediumvsMiMo-V2-OmninoneKimi K2.5mediumvsGPT-5.3 ChatnoneGPT-5.5nonevsQwen3.5-35B-A3Bmedium