نیویگیشن
AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs OpenAI: GPT-5.3-Codex

ماڈل کا نام:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے : 2026-02-27 15:16

خلاصہ

میٹرک Anthropic: Claude Opus 4.6 medium اجرا: ریلیز کی تاریخ نامعلوم OpenAI: GPT-5.3-Codex medium اجرا: ریلیز کی تاریخ نامعلوم
درجہ #20 #7
اسکور 6.07 7.93
تسلسل 8.80 8.84
فی نتیجہ لاگت 10.992 4.641
کل لاگت $0.880 $0.465
درست ٹیسٹس
غلط ٹیسٹس 6 4
فی کوشش کامیابی کی شرح 61.9% 78.6%
غیر مستحکم ٹیسٹ 2 2
آؤٹ پٹ ٹوکنز 19,576 1,201
ریزننگ ٹوکنز 11,081 30,056

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 4.00 4.41 55.6% 2 897 1,000
OpenAI: GPT-5.3-Codex 10.00 10.00 100.0% 0 216 1,421
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 10.00 10.00 100.0% 0 668 763
OpenAI: GPT-5.3-Codex 10.00 10.00 100.0% 0 234 735
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 1.00 10.00 0.0% 0 16,328 7,928
OpenAI: GPT-5.3-Codex 4.00 7.21 55.6% 1 64 25,308
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 9.50 9.99 100.0% 0 266 468
OpenAI: GPT-5.3-Codex 9.00 10.00 50.0% 0 93 693
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 7.00 10.00 66.7% 0 556 593
OpenAI: GPT-5.3-Codex 7.00 7.38 77.8% 1 340 1,407
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 10.00 10.00 100.0% 0 861 329
OpenAI: GPT-5.3-Codex 10.00 10.00 100.0% 0 254 492

موازنہ کی جوڑی تبدیل کریں