AI BENCHY
موازنہ کریں
❤️ Made by XCS
Your ad here

ماڈل کا نام

OpenAI: GPT-5.3-Codex

استدلال (medium)

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے : 24 فروری، 2026

میٹرک OpenAI: GPT-5.3-Codex
درجہ#6
کمپنیOpenAI
Score 7.77
تسلسل 8.75
فی نتیجہ لاگت 4.9342
کل لاگت $0.44408
درست ٹیسٹس
فی کوشش کامیابی کی شرح 76.9%
غیر مستحکم ٹیسٹ 2
آؤٹ پٹ ٹوکنز 947
ریزننگ ٹوکنز 29,564
ردِعمل کا وقت (اوسط)17944ms
ردِعمل کا وقت (کل)233267ms
ردِعمل کا وقت (زیادہ سے زیادہ)100927ms

زمرہ وار تفصیل

زمرہ مکمل طور پر کامیاب ٹیسٹ Score تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ استدلال اسکور ردِعمل کا وقت (اوسط) لاگت
اینٹی اے آئی چالیں 10.00 10.00 100.0% 0 6.00 4687ms $0.02371
ڈیٹا پارسنگ اور استخراج 10.00 10.00 100.0% 0 1.25 3180ms $0.02600
ڈومین مخصوص 4.00 7.21 55.6% 1 1.00 64314ms $0.35664
ہدایات کی پیروی 9.00 10.00 50.0% 0 1.00 3037ms $0.01216
Puzzle Solving 7.00 7.38 77.8% 1 6.00 4610ms $0.02559

موازنہ کیے گئے ماڈلز

OpenAI: GPT-5.3-Codex کا موازنہ اس کے ساتھ کریں...

#5 · Google

Google: Gemini 3 Flash Preview

استدلال (low)

Score: 8.23

تسلسل: 8.71

فی کوشش کامیابی کی شرح: 82.0%

غیر مستحکم ٹیسٹ: 2

فی نتیجہ لاگت: 0.6173

درست ٹیسٹس:

کل لاگت: $0.06174

موازنہ کریں

#7 · OpenAI

OpenAI: GPT-5.2

استدلال (medium)

Score: 7.38

تسلسل: 8.73

فی کوشش کامیابی کی شرح: 76.9%

غیر مستحکم ٹیسٹ: 2

فی نتیجہ لاگت: 2.5637

درست ٹیسٹس:

کل لاگت: $0.23074

موازنہ کریں

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

استدلال (medium)

Score: 8.54

تسلسل: 9.35

فی کوشش کامیابی کی شرح: 87.2%

غیر مستحکم ٹیسٹ: 1

فی نتیجہ لاگت: 2.1621

درست ٹیسٹس:

کل لاگت: $0.23784

موازنہ کریں

فوری موازنہ

OpenAI: GPT-5.3-Codex کا موازنہ اس کے ساتھ کریں...