نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs Google: Gemini 3.1 Flash Lite Preview

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-16

میٹرک Claude Opus 4.7 Claude Opus 4.7 medium اجرا: 2026-04-16 Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none اجرا: 2026-03-03
اسکور 9.2 7.9
درجہ #3 #29
تسلسل 10.0 9.6
درست ٹیسٹس
فی کوشش کامیابی کی شرح 88.9% 70.4%
غیر مستحکم ٹیسٹ 0 1
کل رنز 54 54
فی نتیجہ لاگت 2.790 0.130
کل لاگت $0.447 $0.016
?? ?? ???? $5.000 / 1M $0.250 / 1M
??? ?? ???? $25.000 / 1M $1.500 / 1M
آؤٹ پٹ ٹوکنز 5,375 5,361
ریزننگ ٹوکنز 1,341 0
ردِعمل کا وقت (اوسط) 3.53s 1.30s
ردِعمل کا وقت (زیادہ سے زیادہ) 21.45s 3.39s
ردِعمل کا وقت (کل) 60.03s 23.42s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 348 0
Gemini 3.1 Flash Lite Preview 7.5 8.4 66.7% 1 1.04s 1,092 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 6.41s 1,141 257
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.47s 640 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 2,369 1,084
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 3.20s 339 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 324 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.22s 399 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 51 0
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 942ms 568 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 256 0
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 741ms 69 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 114 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.13s 574 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 2.51s 399 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 972ms 898 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 373 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.39s 782 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں