#50
Mercury 2
Inception · اجرا: 2026-02-24 · inception/mercury-2::none
اوسط اسکور
31
فی نتیجہ لاگت
0.196
تسلسل
89
کل لاگت
$0.006
درست ٹیسٹس
3
کوئی ٹیسٹ تبھی مکمل کامیاب شمار ہوگا جب اس کے تمام رنز کامیاب ہوں
غلط ٹیسٹس
12
فی کوشش کامیابی کی شرح: 26.7%
غیر مستحکم ٹیسٹ
2
ردِعمل کا وقت: اوسط 594ms · کل 8.91s · زیادہ سے زیادہ 1.27s
غلط جواب: 11 ہدایات پر عمل نہیں کیا: 1
اسکور کے لحاظ سے سرفہرست ماڈلز
پہلا ماڈل منتخب کریں، پھر دوسرا ماڈل کلک کریں تاکہ سائیڈ بائی سائیڈ صفحہ کھلے۔
فوری موازنہ
Mercury 2nonevsQwen3 Coder NextnoneMercury 2nonevsQwen3 Coder NextmediumMercury 2nonevsKimi K2.5noneMercury 2nonevsGrok 4.1 FastnoneMercury 2nonevsGLM 4.7 FlashnoneMercury 2nonevsGLM 4.7 FlashmediumMercury 2nonevsGemini 3 Flash PreviewmediumMercury 2nonevsGemini 3.1 Pro PreviewmediumMercury 2nonevsStep 3.5 Flashmediumمفت دستیاب
زمرہ وار تفصیل
| زمرہ | اوسط اسکور | تسلسل | درست ٹیسٹس |
|---|---|---|---|
| Anti-AI Tricks | 100 | 100 | 0/3 |
| Combined | 100 | 100 | 0/1 |
| Data parsing and extraction | 55 | 59 | 1/2 |
| Domain specific | 40 | 72 | 1/3 |
| Instructions following | 35 | 100 | 0/2 |
| Puzzle Solving | 100 | 100 | 0/3 |
| Tool Calling | 100 | 100 | 1/1 |