نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Google: Gemma 4 26B A4B

خلاصہ

Claude Opus 4.8 vs Gemma 4 26B A4B benchmark موازنہ: Claude Opus 4.8 average score میں آگے ہے: 7.7 vs 7.2. Gemma 4 26B A4B کی benchmark لاگت کم ہے: $0.045 vs $1.270. Claude Opus 4.8 تیز ہے: 10.83s vs 63.41s، pass rates 79.4% vs 69.8%.

تجویز کردہ ماڈل: Gemma 4 26B A4B - Its score stays close to the best score here (7.2 vs 7.7), while costing about 28.9x less than Claude Opus 4.8.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-07-02

میٹرک Claude Opus 4.8 Claude Opus 4.8 low اجرا: 2026-05-28 Gemma 4 26B A4B Gemma 4 26B A4B medium اجرا: 2026-04-03 مفت دستیاب
اسکور 7.7 7.2
درجہ #38 #61
اعتماد پذیری 10.0 10.0
تسلسل 8.8 9.2
درست ٹیسٹس
فی کوشش کامیابی کی شرح 79.4% 69.8%
غیر مستحکم ٹیسٹ 3 2
کل رنز 63 63
فی نتیجہ لاگت 8.466 0.361
کل لاگت $1.270 $0.045
ان پٹ قیمت $5.000 / 1M $0.060 / 1M
آؤٹ پٹ قیمت $25.000 / 1M $0.330 / 1M
کل ان پٹ ٹوکنز 60,946 40,252
آؤٹ پٹ ٹوکنز 31,771 28,000
ریزننگ ٹوکنز 6,831 100,490
ردِعمل کا وقت (اوسط) 10.83s 63.41s
ردِعمل کا وقت (زیادہ سے زیادہ) 127.97s 369.32s
ردِعمل کا وقت (کل) 227.39s 1268.28s

جنریشن شوکیس

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#38 Claude Opus 4.8

low
لاگت
$0.031
وقت
14.1s
ٹوکنز
1,345 tok

#61 Gemma 4 26B A4B

medium
غلط SVG
لاگت
$0.000
وقت
300.0s
ٹوکنز
0 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.30s 834 793 371
Gemma 4 26B A4B 10.0 10.0 100.0% 0 6.20s 816 1,142 3,045
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 6.6 4.6 77.8% 2 7.58s 10,590 3,637 809
Gemma 4 26B A4B 2.9 10.0 0.0% 0 272.54s 5,062 14,838 44,567
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 9.8 10.0 100.0% 0 20.84s 23,500 2,216 1,081
Gemma 4 26B A4B 9.6 10.0 100.0% 0 73.55s 17,092 5,415 13,112
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 6.3 5.8 66.7% 1 2.27s 10,503 310 0
Gemma 4 26B A4B 10.0 10.0 100.0% 0 16.51s 8,334 1,567 2,827
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 5.3 10.0 33.3% 0 45.53s 975 23,311 3,908
Gemma 4 26B A4B 2.9 4.4 22.2% 2 23.62s 516 2,469 7,105
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 2.55s 708 231 0
Gemma 4 26B A4B 10.0 10.0 100.0% 0 29.76s 567 25 5,075
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 9.8 10.0 100.0% 0 2.78s 909 111 221
Gemma 4 26B A4B 10.0 10.0 100.0% 0 17.54s 777 887 4,470
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.01s 894 592 184
Gemma 4 26B A4B 10.0 10.0 100.0% 0 5.79s 801 410 2,128
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 6.85s 11,775 370 35
Gemma 4 26B A4B 10.0 10.0 100.0% 0 9.01s 6,096 450 1,256
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 3.0 10.0 0.0% 0 5.48s 258 200 222
Gemma 4 26B A4B 3.0 10.0 0.0% 0 180.87s 191 797 16,905

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں