نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

موازنہ کیے گئے ماڈلز

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-04

میٹرک GPT-5.2 Chat GPT-5.2 Chat none اجرا: 2025-12-11 GPT-5.3 Chat GPT-5.3 Chat none اجرا: 2026-03-03 Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low اجرا: 2026-03-03
اسکور 7.9 7.2 7.4
درجہ #24 #63 #50
اعتماد پذیری 10.0 10.0 10.0
تسلسل 8.9 8.1 10.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 74.6% 66.7% 61.9%
غیر مستحکم ٹیسٹ 3 5 0
کل رنز 63 63 63
فی نتیجہ لاگت 2.803 3.605 0.196
کل لاگت $0.393 $0.433 $0.026
ان پٹ قیمت $1.750 / 1M $1.750 / 1M $0.250 / 1M
آؤٹ پٹ قیمت $14.000 / 1M $14.000 / 1M $1.500 / 1M
کل ان پٹ ٹوکنز 34,212 34,209 32,715
آؤٹ پٹ ٹوکنز 23,744 26,617 2,286
ریزننگ ٹوکنز 0 0 9,166
ردِعمل کا وقت (اوسط) 7.13s 6.34s 2.77s
ردِعمل کا وقت (زیادہ سے زیادہ) 38.52s 18.33s 11.91s
ردِعمل کا وقت (کل) 149.69s 133.13s 58.12s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 606 1,807 0
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 606 3,167 0
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 506 462 1,638
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 Chat 8.8 7.8 88.9% 1 9.82s 7,305 6,731 0
GPT-5.3 Chat 5.6 4.7 55.6% 2 10.52s 7,302 6,632 0
Gemini 3.1 Flash Lite Preview 5.5 10.0 33.3% 0 1.39s 8,138 660 1,060
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 11,019 1,243 0
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 11,019 2,614 0
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 8,381 225 762
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 7,140 980 0
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 7,140 942 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 7,455 291 696
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 723 7,810 0
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 723 8,264 0
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 641 18 1,212
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 477 335 0
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 477 319 0
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 490 69 384
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 Chat 9.8 10.0 100.0% 0 5.51s 660 1,441 0
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 660 1,491 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 621 72 753
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.10s 642 1,603 0
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 642 1,758 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.69s 566 243 1,248
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 5,445 555 0
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 5,445 861 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 5,757 237 993
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.2 Chat 3.0 10.0 0.0% 0 6.89s 195 1,239 0
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 195 569 0
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 1.35s 160 9 420

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں