نیویگیشن
AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.2 vs Qwen: Qwen3.5-27B

ماڈل کا نام:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے : 2026-02-27 15:16

خلاصہ

میٹرک OpenAI: GPT-5.2 medium اجرا: ریلیز کی تاریخ نامعلوم Qwen: Qwen3.5-27B medium اجرا: ریلیز کی تاریخ نامعلوم
درجہ #12 #5
اسکور 6.93 8.55
تسلسل 8.22 9.55
فی نتیجہ لاگت 2.780 2.950
کل لاگت $0.251 $0.325
درست ٹیسٹس
غلط ٹیسٹس 5 3
فی کوشش کامیابی کی شرح 76.2% 83.3%
غیر مستحکم ٹیسٹ 3 1
آؤٹ پٹ ٹوکنز 1,869 1,091
ریزننگ ٹوکنز 14,190 131,807

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.2 7.00 7.28 77.8% 1 549 2,002
Qwen: Qwen3.5-27B 10.00 10.00 100.0% 0 102 8,956
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.2 10.00 10.00 100.0% 0 234 499
Qwen: Qwen3.5-27B 9.88 10.00 100.0% 0 270 16,150
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.2 4.00 7.21 55.6% 1 42 9,690
Qwen: Qwen3.5-27B 4.00 10.00 33.3% 0 43 52,368
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.2 9.50 10.00 100.0% 0 95 587
Qwen: Qwen3.5-27B 9.00 6.88 83.3% 1 97 11,638
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.2 8.00 10.00 66.7% 0 710 943
Qwen: Qwen3.5-27B 10.00 10.00 100.0% 0 231 41,372
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.2 1.00 1.62 66.7% 1 239 469
Qwen: Qwen3.5-27B 10.00 10.00 100.0% 0 348 1,323

موازنہ کی جوڑی تبدیل کریں