نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Google: Gemini 3.1 Flash Lite

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-19

میٹرک Claude Opus 4.6 Claude Opus 4.6 medium اجرا: 2026-02-05 Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal اجرا: 2026-05-08
اسکور 7.4 6.8
درجہ #57 #75
اعتماد پذیری 10.0 10.0
تسلسل 9.1 8.7
درست ٹیسٹس
فی کوشش کامیابی کی شرح 66.7% 59.7%
غیر مستحکم ٹیسٹ 2 3
کل رنز 57 57
فی نتیجہ لاگت 14.243 0.111
کل لاگت $1.710 $0.012
?? ?? ???? $5.000 / 1M $0.250 / 1M
??? ?? ???? $25.000 / 1M $1.500 / 1M
آؤٹ پٹ ٹوکنز 37,874 2,457
ریزننگ ٹوکنز 21,390 0
ردِعمل کا وقت (اوسط) 24.59s 1.41s
ردِعمل کا وقت (زیادہ سے زیادہ) 83.40s 4.49s
ردِعمل کا وقت (کل) 295.08s 26.72s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
Gemini 3.1 Flash Lite 8.3 10.0 75.0% 0 1.10s 639 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.31s 636 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.53s 357 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.04s 279 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 1.02s 15 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 791ms 63 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 932ms 72 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
Gemini 3.1 Flash Lite 6.0 4.6 66.7% 2 2.15s 153 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 3.51s 234 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 3.0 10.0 0.0% 0 63.24s 8,045 2,452
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 724ms 9 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں