#57
Anthropic
اجرا: 2026-02-05
ٹیسٹ کیا گیا: 2026-05-08 13:38
anthropic/claude-opus-4.6::medium
?? ?? ????
$5.000 / 1M
??? ?? ????
$25.000 / 1M
غیر مستحکم ٹیسٹ
2
غیر مستحکم ٹیسٹس میں رنز کے درمیان ملے جلے نتائج آئے (کم از کم ایک کامیاب اور ایک ناکام).
چارٹس
پہلا ماڈل منتخب کریں، پھر دوسرا ماڈل کلک کریں تاکہ سائیڈ بائی سائیڈ صفحہ کھلے۔
اسکور vs کل لاگت
ردِعمل کا وقت (اوسط)
اسکور vs ردِعمل کا وقت (اوسط)
کل آؤٹ پٹ ٹوکنز
اسکور vs کل آؤٹ پٹ ٹوکنز
فوری موازنہ
Claude Opus 4.6mediumvsKimi K2.6mediumClaude Opus 4.6mediumvsGemini 3.1 Flash LitelowClaude Opus 4.6mediumvsGPT-5.2 ChatnoneClaude Opus 4.6mediumvsQwen3.5-FlashmediumClaude Opus 4.6mediumvsGemini 3.1 Flash Lite PreviewnoneClaude Opus 4.6mediumvsGPT-5.3 ChatnoneClaude Opus 4.6mediumvsGemini 3 Flash PreviewmediumClaude Opus 4.6mediumvsGemini 3.5 FlashlowClaude Opus 4.6mediumvsRing-2.6-1Tmedium
زمرہ وار تفصیل
| زمرہ | اسکور | تسلسل | درست ٹیسٹس |
|---|---|---|---|
| اینٹی اے آئی چالیں | 6.4 | 5.8 | |
| کوڈنگ | 10.0 | 10.0 | |
| مشترکہ | 10.0 | 10.0 | |
| ڈیٹا پارسنگ اور استخراج | 10.0 | 10.0 | |
| ڈومین مخصوص | 3.0 | 10.0 | |
| عمومی ذہانت | 10.0 | 10.0 | |
| ہدایات کی پیروی | 10.0 | 10.0 | |
| پہیلی حل کرنا | 7.7 | 10.0 | |
| ٹول کالنگ | 10.0 | 10.0 | |
| معلومات عامہ | 3.0 | 10.0 |