نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs Google: Gemini 3 Flash Preview

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-16

میٹرک Claude Opus 4.7 Claude Opus 4.7 none اجرا: 2026-04-16 Gemini 3 Flash Preview Gemini 3 Flash Preview low اجرا: 2025-12-17
اسکور 9.2 8.8
درجہ #4 #5
تسلسل 10.0 9.5
درست ٹیسٹس
فی کوشش کامیابی کی شرح 88.9% 85.2%
غیر مستحکم ٹیسٹ 0 1
کل رنز 54 54
فی نتیجہ لاگت 3.155 0.604
کل لاگت $0.505 $0.091
?? ?? ???? $5.000 / 1M $0.500 / 1M
??? ?? ???? $25.000 / 1M $3.000 / 1M
آؤٹ پٹ ٹوکنز 6,326 2,018
ریزننگ ٹوکنز 0 23,273
ردِعمل کا وقت (اوسط) 3.13s 6.01s
ردِعمل کا وقت (زیادہ سے زیادہ) 18.27s 14.72s
ردِعمل کا وقت (کل) 56.33s 108.12s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 8.3 10.0 75.0% 0 2.12s 522 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.48s 281 3,082
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 2.84s 494 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.94s 426 2,717
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 9.5 10.0 100.0% 0 18.27s 3,504 0
Gemini 3 Flash Preview 3.0 10.0 0.0% 0 3.27s 326 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 2.15s 324 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.40s 279 3,656
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 7.7 10.0 66.7% 0 1.19s 78 0
Gemini 3 Flash Preview 5.3 7.2 44.4% 1 8.05s 12 6,410
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 3.47s 257 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.68s 120 981
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 1.46s 114 0
Gemini 3 Flash Preview 9.9 10.0 100.0% 0 7.02s 71 2,752
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 2.58s 661 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.11s 269 3,260
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 4.74s 372 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.99s 234 415

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں