نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemma 4 31B vs OpenAI: gpt-oss-120b

خلاصہ

Gemma 4 31B vs gpt-oss-120b benchmark موازنہ: gpt-oss-120b average score میں آگے ہے: 6.7 vs 6.3. gpt-oss-120b کی benchmark لاگت کم ہے: $0.013 vs $0.033. gpt-oss-120b تیز ہے: 22.28s vs 56.55s، pass rates 69.8% vs 52.4%.

تجویز کردہ ماڈل: gpt-oss-120b - It has the best score here (6.7), while costing about 2.7x less than Gemma 4 31B.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-18

میٹرک Gemma 4 31B Gemma 4 31B medium اجرا: 2026-04-02 مفت دستیاب gpt-oss-120b gpt-oss-120b medium اجرا: 2025-08-05 مفت دستیاب
اسکور 6.3 6.7
درجہ #88 #78
اعتماد پذیری 10.0 10.0
تسلسل 9.4 8.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 69.8% 52.4%
غیر مستحکم ٹیسٹ 1 5
کل رنز 63 63
فی نتیجہ لاگت 0.257 0.141
کل لاگت $0.033 $0.013
ان پٹ قیمت $0.120 / 1M $0.039 / 1M
آؤٹ پٹ قیمت $0.350 / 1M $0.180 / 1M
کل ان پٹ ٹوکنز 17,957 39,084
آؤٹ پٹ ٹوکنز 22,356 20,013
ریزننگ ٹوکنز 65,726 50,233
ردِعمل کا وقت (اوسط) 56.55s 22.28s
ردِعمل کا وقت (زیادہ سے زیادہ) 437.40s 68.16s
ردِعمل کا وقت (کل) 1074.41s 311.96s

جنریشن شوکیس

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#88 Gemma 4 31B

medium
لاگت
$0.002
وقت
45.7s
ٹوکنز
2,696 tok

#78 gpt-oss-120b

medium
لاگت
$0.001
وقت
26.7s
ٹوکنز
555 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 816 962 2,046
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 1,314 3,518 2,177
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemma 4 31B 4.3 5.8 22.2% 1 219.76s 5,568 11,098 33,212
gpt-oss-120b 5.9 7.0 55.6% 1 38.37s 7,782 3,365 11,973
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 11,535 694 5,072
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 8,334 1,822 2,951
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 7,476 241 1,114
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 876 4,349 8,985
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 1,266 6,784 20,606
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 567 105 888
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 659 107 387
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 777 533 2,035
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 1,036 126 1,799
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemma 4 31B 9.9 10.0 100.0% 0 26.91s 801 1,795 5,595
gpt-oss-120b 5.3 7.2 44.4% 1 21.71s 1,190 1,790 2,264
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 6,514 287 1,083
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemma 4 31B 3.0 10.0 0.0% 0 90.14s 218 1,692 10,014
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 312 3,101 3,758

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں