نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: gpt-oss-120b

خلاصہ

Gemini 3.1 Flash Lite Preview vs gpt-oss-120b benchmark موازنہ: gpt-oss-120b average score میں آگے ہے: 6.7 vs 6.5. gpt-oss-120b کی benchmark لاگت کم ہے: $0.013 vs $0.026. Gemini 3.1 Flash Lite Preview تیز ہے: 2.77s vs 22.28s، pass rates 61.9% vs 52.4%.

تجویز کردہ ماڈل: Gemini 3.1 Flash Lite Preview - Its score stays close to the best score here (6.5 vs 6.7), while responding about 8.1x faster than gpt-oss-120b.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-12

میٹرک Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low اجرا: 2026-03-03 gpt-oss-120b gpt-oss-120b medium اجرا: 2025-08-05 مفت دستیاب
اسکور 6.5 6.7
درجہ #81 #78
اعتماد پذیری 10.0 10.0
تسلسل 10.0 8.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 61.9% 52.4%
غیر مستحکم ٹیسٹ 0 5
کل رنز 63 63
فی نتیجہ لاگت 0.196 0.141
کل لاگت $0.026 $0.013
ان پٹ قیمت $0.250 / 1M $0.039 / 1M
آؤٹ پٹ قیمت $1.500 / 1M $0.180 / 1M
کل ان پٹ ٹوکنز 32,715 39,084
آؤٹ پٹ ٹوکنز 2,286 20,013
ریزننگ ٹوکنز 9,166 50,233
ردِعمل کا وقت (اوسط) 2.77s 22.28s
ردِعمل کا وقت (زیادہ سے زیادہ) 11.91s 68.16s
ردِعمل کا وقت (کل) 58.12s 311.96s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#81 Gemini 3.1 Flash Lite Preview

low
Cost
$0.002
Time
3.7s
Tokens
1,203 tok

#78 gpt-oss-120b

medium
Cost
$0.001
Time
26.7s
Tokens
555 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 506 462 1,638
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 1,314 3,518 2,177
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 5.5 10.0 33.3% 0 1.39s 8,138 660 1,060
gpt-oss-120b 5.9 7.0 55.6% 1 38.37s 7,782 3,365 11,973
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 8,381 225 762
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 11,535 694 5,072
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 7,455 291 696
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 7,476 241 1,114
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 641 18 1,212
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 1,266 6,784 20,606
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 490 69 384
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 659 107 387
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 621 72 753
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 1,036 126 1,799
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.69s 566 243 1,248
gpt-oss-120b 5.3 7.2 44.4% 1 21.71s 1,190 1,790 2,264
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 5,757 237 993
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 6,514 287 1,083
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 1.35s 160 9 420
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 312 3,101 3,758

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں