نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs OpenAI: gpt-oss-120b

خلاصہ

Gemini 3.1 Flash Lite vs gpt-oss-120b benchmark موازنہ: Gemini 3.1 Flash Lite average score میں آگے ہے: 6.4 vs 5.4. gpt-oss-120b کی benchmark لاگت کم ہے: $0.010 vs $0.013. Gemini 3.1 Flash Lite تیز ہے: 1.33s vs 21.61s، pass rates 54.0% vs 38.6%.

تجویز کردہ ماڈل: Gemini 3.1 Flash Lite - It has the best score here (6.4), while responding about 16.3x faster than gpt-oss-120b.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-10

میٹرک Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal اجرا: 2026-05-08 gpt-oss-120b gpt-oss-120b none اجرا: 2025-08-05 مفت دستیاب
اسکور 6.4 5.4
درجہ #88 #127
اعتماد پذیری 10.0 10.0
تسلسل 8.8 9.1
درست ٹیسٹس
فی کوشش کامیابی کی شرح 54.0% 38.6%
غیر مستحکم ٹیسٹ 3 2
کل رنز 63 57
فی نتیجہ لاگت 0.130 0.168
کل لاگت $0.013 $0.010
ان پٹ قیمت $0.250 / 1M $0.039 / 1M
آؤٹ پٹ قیمت $1.500 / 1M $0.180 / 1M
کل ان پٹ ٹوکنز 36,973 9,081
آؤٹ پٹ ٹوکنز 2,487 51,664
ریزننگ ٹوکنز 0 0
ردِعمل کا وقت (اوسط) 1.33s 21.61s
ردِعمل کا وقت (زیادہ سے زیادہ) 4.49s 113.71s
ردِعمل کا وقت (کل) 27.91s 345.79s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#88 Gemini 3.1 Flash Lite

minimal
Cost
$0.001
Time
3.7s
Tokens
635 tok

#127 gpt-oss-120b

none
No showcase result has been generated for this model yet.
Cost
$0.000
Time
-
Tokens
0 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite 8.3 10.0 75.0% 0 1.10s 500 639 0
gpt-oss-120b 6.5 10.0 50.0% 0 32.84s 1,336 8,676 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite 5.5 10.0 33.3% 0 831ms 8,126 666 0
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 901 3,232 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.53s 12,870 357 0
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.04s 7,552 279 0
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 2,421 598 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 1.02s 641 15 0
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 1,294 29,483 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 791ms 490 63 0
gpt-oss-120b 4.8 10.0 0.0% 0 10.79s 584 615 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 932ms 615 72 0
gpt-oss-120b 9.8 10.0 100.0% 0 5.06s 1,043 1,940 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite 6.0 4.6 66.7% 2 2.15s 564 153 0
gpt-oss-120b 6.0 7.2 55.6% 1 8.21s 1,188 3,982 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 3.51s 5,457 234 0
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 724ms 158 9 0
gpt-oss-120b 3.0 10.0 0.0% 0 47.29s 314 3,138 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں