نیویگیشن
AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 2.5 Flash vs OpenAI: gpt-oss-120b

موازنہ کریں:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-03

میٹرک Google: Gemini 2.5 Flash none اجرا: 2025-06-17 OpenAI: gpt-oss-120b medium اجرا: 2025-08-05 مفت دستیاب
درجہ #36 #34
اوسط اسکور 5.34 5.64
تسلسل 9.40 7.55
فی نتیجہ لاگت 0.107 0.101
کل لاگت $0.007 $0.008
درست ٹیسٹس
فی کوشش کامیابی کی شرح 47.6% 59.5%
غیر مستحکم ٹیسٹ 1 4
آؤٹ پٹ ٹوکنز 826 11,407
ریزننگ ٹوکنز 0 26,106

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Google: Gemini 2.5 Flash 1.00 10.00 0.0% 0 99 0
OpenAI: gpt-oss-120b 7.00 9.81 66.7% 0 3,463 2,077
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Google: Gemini 2.5 Flash 9.88 10.00 100.0% 0 279 0
OpenAI: gpt-oss-120b 5.50 5.87 66.7% 1 241 1,114
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Google: Gemini 2.5 Flash 4.00 7.21 55.6% 1 12 0
OpenAI: gpt-oss-120b 1.00 4.41 22.2% 2 6,018 18,520
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Google: Gemini 2.5 Flash 8.00 9.99 50.0% 0 70 0
OpenAI: gpt-oss-120b 10.00 10.00 100.0% 0 120 1,770
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Google: Gemini 2.5 Flash 4.67 10.00 33.3% 0 132 0
OpenAI: gpt-oss-120b 5.00 7.13 44.4% 1 1,278 1,542
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Google: Gemini 2.5 Flash 10.00 10.00 100.0% 0 234 0
OpenAI: gpt-oss-120b 9.00 9.97 100.0% 0 287 1,083

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں