نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs Poolside: Laguna XS 2.1

خلاصہ

Gemini 3.5 Flash vs Laguna XS 2.1 benchmark موازنہ: Laguna XS 2.1 average score میں آگے ہے: 7.0 vs 6.8. Laguna XS 2.1 کی benchmark لاگت کم ہے: $0.036 vs $0.108. Gemini 3.5 Flash تیز ہے: 1.57s vs 30.08s، pass rates 68.3% vs 44.4%.

تجویز کردہ ماڈل: Laguna XS 2.1 - It has the best score here (7.0), while costing about 3.0x less than Gemini 3.5 Flash.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-07-02

میٹرک Gemini 3.5 Flash Gemini 3.5 Flash minimal اجرا: 2026-05-19 Laguna XS 2.1 Laguna XS 2.1 medium اجرا: 2026-07-02 مفت دستیاب
اسکور 6.8 7.0
درجہ #74 #67
اعتماد پذیری 10.0 10.0
تسلسل 9.6 9.6
درست ٹیسٹس
فی کوشش کامیابی کی شرح 68.3% 44.4%
غیر مستحکم ٹیسٹ 1 1
کل رنز 63 63
فی نتیجہ لاگت 0.767 0.392
کل لاگت $0.108 $0.036
ان پٹ قیمت $1.500 / 1M $0.060 / 1M
آؤٹ پٹ قیمت $9.000 / 1M $0.120 / 1M
کل ان پٹ ٹوکنز 39,847 45,324
آؤٹ پٹ ٹوکنز 5,277 25,761
ریزننگ ٹوکنز 0 268,677
ردِعمل کا وقت (اوسط) 1.57s 30.08s
ردِعمل کا وقت (زیادہ سے زیادہ) 5.51s 155.23s
ردِعمل کا وقت (کل) 33.02s 631.77s

جنریشن شوکیس

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#74 Gemini 3.5 Flash

minimal
لاگت
$0.041
وقت
20.4s
ٹوکنز
4,608 tok

#67 Laguna XS 2.1

medium
لاگت
$0.001
وقت
30.6s
ٹوکنز
4,678 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 6.5 10.0 50.0% 0 892ms 492 405 0
Laguna XS 2.1 4.8 10.0 25.0% 0 41.96s 774 353 73,090
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 5.6 9.9 33.3% 0 2.75s 8,122 3,456 0
Laguna XS 2.1 5.5 10.0 33.3% 0 70.35s 7,995 23,767 83,258
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 3.0 10.0 0.0% 0 3.56s 15,780 404 0
Laguna XS 2.1 9.6 10.0 100.0% 0 13.43s 18,033 507 5,908
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.66s 7,548 279 0
Laguna XS 2.1 10.0 10.0 100.0% 0 4.50s 7,734 234 3,129
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 899ms 633 12 0
Laguna XS 2.1 2.9 7.2 11.1% 1 65.66s 834 17 91,533
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 922ms 486 117 0
Laguna XS 2.1 5.0 10.0 0.0% 0 4.15s 537 119 1,375
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 6.4 5.8 66.7% 1 893ms 615 76 0
Laguna XS 2.1 9.8 10.0 100.0% 0 2.57s 753 82 1,844
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.45s 558 282 0
Laguna XS 2.1 5.3 10.0 33.3% 0 3.43s 771 357 3,355
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.79s 5,457 234 0
Laguna XS 2.1 10.0 10.0 100.0% 0 3.01s 7,638 309 748
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 3.0 10.0 0.0% 0 1.76s 156 12 0
Laguna XS 2.1 3.0 10.0 0.0% 0 10.88s 255 16 4,437

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں