نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

موازنہ کیے گئے ماڈلز

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-24

میٹرک GPT-5.5 GPT-5.5 medium اجرا: 2026-04-24 GPT-5.4 GPT-5.4 medium اجرا: 2026-03-05 Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium اجرا: 2026-02-19 Claude Opus 4.7 Claude Opus 4.7 medium اجرا: 2026-04-16
اسکور 9.0 8.2 9.6 9.2
درجہ #5 #18 #2 #3
اعتماد پذیری دستیاب نہیں دستیاب نہیں دستیاب نہیں دستیاب نہیں
تسلسل 9.2 8.7 10.0 10.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 87.0% 79.6% 94.4% 88.9%
غیر مستحکم ٹیسٹ 2 3 0 0
کل رنز 54 54 54 54
فی نتیجہ لاگت 19.226 6.399 3.400 2.790
کل لاگت $2.884 $0.832 $0.578 $0.447
?? ?? ???? $5.000 / 1M $2.500 / 1M $2.000 / 1M $5.000 / 1M
??? ?? ???? $30.000 / 1M $15.000 / 1M $12.000 / 1M $25.000 / 1M
آؤٹ پٹ ٹوکنز 1,920 2,169 1,932 5,375
ریزننگ ٹوکنز 89,632 48,732 40,542 1,341
ردِعمل کا وقت (اوسط) 32.75s 18.63s 15.96s 3.53s
ردِعمل کا وقت (زیادہ سے زیادہ) 332.10s 100.41s 40.61s 21.45s
ردِعمل کا وقت (کل) 589.59s 335.26s 175.52s 60.03s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.5 10.0 10.0 100.0% 0 4.66s 250 1,335
GPT-5.4 8.3 10.0 75.0% 0 4.11s 240 1,511
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 348 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.5 10.0 10.0 100.0% 0 9.09s 318 1,391
GPT-5.4 10.0 10.0 100.0% 0 13.03s 389 2,045
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 19.88s 405 4,201
Claude Opus 4.7 10.0 10.0 100.0% 0 6.41s 1,141 257
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.5 10.0 10.0 100.0% 0 19.29s 312 2,841
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 2,369 1,084
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.5 10.0 10.0 100.0% 0 4.18s 234 593
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 324 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.5 5.3 7.2 44.4% 1 164.14s 67 79,625
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 51 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.5 10.0 10.0 100.0% 0 4.16s 138 223
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 256 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.5 10.0 10.0 100.0% 0 3.36s 93 538
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 114 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.5 8.6 7.9 77.8% 1 6.78s 250 2,254
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
Claude Opus 4.7 10.0 10.0 100.0% 0 2.51s 399 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.5 10.0 10.0 100.0% 0 10.57s 258 832
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 373 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں