نیویگیشن
AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.3-Codex vs Qwen: Qwen3.5-122B-A10B

ماڈل کا نام:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے : 2026-02-27 15:16

خلاصہ

میٹرک OpenAI: GPT-5.3-Codex medium اجرا: ریلیز کی تاریخ نامعلوم Qwen: Qwen3.5-122B-A10B medium اجرا: ریلیز کی تاریخ نامعلوم
درجہ #7 #13
اسکور 7.93 6.77
تسلسل 8.84 8.22
فی نتیجہ لاگت 4.641 5.137
کل لاگت $0.465 $0.463
درست ٹیسٹس
غلط ٹیسٹس 4 5
فی کوشش کامیابی کی شرح 78.6% 76.2%
غیر مستحکم ٹیسٹ 2 3
آؤٹ پٹ ٹوکنز 1,201 16,751
ریزننگ ٹوکنز 30,056 125,394

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.3-Codex 10.00 10.00 100.0% 0 216 1,421
Qwen: Qwen3.5-122B-A10B 10.00 10.00 100.0% 0 248 10,486
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.3-Codex 10.00 10.00 100.0% 0 234 735
Qwen: Qwen3.5-122B-A10B 9.88 10.00 100.0% 0 270 16,558
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.3-Codex 4.00 7.21 55.6% 1 64 25,308
Qwen: Qwen3.5-122B-A10B 1.00 7.21 11.1% 1 15,537 64,889
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.3-Codex 9.00 10.00 50.0% 0 93 693
Qwen: Qwen3.5-122B-A10B 5.50 5.92 83.3% 1 77 7,372
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.3-Codex 7.00 7.38 77.8% 1 340 1,407
Qwen: Qwen3.5-122B-A10B 7.00 7.21 88.9% 1 297 24,863
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.3-Codex 10.00 10.00 100.0% 0 254 492
Qwen: Qwen3.5-122B-A10B 10.00 10.00 100.0% 0 322 1,226

موازنہ کی جوڑی تبدیل کریں