AI BENCHY Compare
Inception: Mercury 2 vs OpenAI: GPT-5.4
بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-16
| میٹرک | Mercury 2 Mercury 2 medium | GPT-5.4 GPT-5.4 none |
|---|---|---|
| اسکور | 6.5 | 5.9 |
| درجہ | #53 | #65 |
| تسلسل | 8.6 | 9.1 |
| درست ٹیسٹس | ||
| فی کوشش کامیابی کی شرح | 53.7% | 42.6% |
| غیر مستحکم ٹیسٹ | 3 | 2 |
| کل رنز | 54 | 54 |
| فی نتیجہ لاگت | 0.580 | 1.477 |
| کل لاگت | $0.047 | $0.104 |
| ?? ?? ???? | $0.250 / 1M | $2.500 / 1M |
| ??? ?? ???? | $0.750 / 1M | $15.000 / 1M |
| آؤٹ پٹ ٹوکنز | 3,972 | 2,317 |
| ریزننگ ٹوکنز | 48,333 | 0 |
| ردِعمل کا وقت (اوسط) | 2.21s | 1.51s |
| ردِعمل کا وقت (زیادہ سے زیادہ) | 14.63s | 2.95s |
| ردِعمل کا وقت (کل) | 37.51s | 27.21s |
اسکور بمقابلہ کل لاگت
ردِعمل کا وقت (اوسط)
اسکور vs ردِعمل کا وقت (اوسط)
کل آؤٹ پٹ ٹوکنز
اسکور vs کل آؤٹ پٹ ٹوکنز
زمرہ وار تفصیل
فوری موازنہ
موازنہ کی جوڑی تبدیل کریں
Mercury 2mediumvsMiMo-V2-OmninoneMercury 2mediumvsGLM 5noneMiniMax M2.5mediumمفت دستیابvsGPT-5.4noneMistral Small 4mediumvsGPT-5.4noneMercury 2mediumvsQwen3.5 Plus 2026-02-15noneMercury 2mediumvsGLM 5V TurbononeMercury 2mediumvsQwen3.5-FlashnoneGemma 4 26B A4Bnoneمفت دستیابvsMercury 2mediumSeed-2.0-LitenonevsMercury 2mediumGemini 2.5 FlashnonevsMercury 2mediumMercury 2mediumvsQwen3.5-35B-A3BnoneDeepSeek V3.2nonevsMercury 2medium