التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs OpenAI: gpt-oss-120b

الملخص

مقارنة benchmark بين Gemini 3.5 Flash و gpt-oss-120b: يتقدم Gemini 3.5 Flash في متوسط النتيجة بـ 9.8 مقابل 6.7. لدى gpt-oss-120b تكلفة benchmark أقل عند $0.011 مقابل $1.115. Gemini 3.5 Flash أسرع عند 8.84s مقابل 22.28s، مع معدلات نجاح 96.8% مقابل 52.4%.

النموذج الموصى به: Gemini 3.5 Flash - It has the best score here (9.8), while responding about 2.5x faster than gpt-oss-120b.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-02

المقياس Gemini 3.5 Flash Gemini 3.5 Flash high الإصدار: 2026-05-19 gpt-oss-120b gpt-oss-120b medium الإصدار: 2025-08-05 متاح مجانًا
النتيجة 9.8 6.7
الترتيب #1 #81
الموثوقية 10.0 10.0
الاتساق 9.6 8.0
اختبارات صحيحة
معدل النجاح لكل محاولة 96.8% 52.4%
اختبارات غير مستقرة 1 5
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 5.575 0.141
إجمالي التكلفة $1.115 $0.011
سعر الإدخال $1.500 / 1M $0.030 / 1M
سعر الإخراج $9.000 / 1M $0.150 / 1M
إجمالي رموز الإدخال 37,594 39,084
رموز الإخراج 1,975 20,013
رموز الاستدلال 115,638 50,233
زمن الاستجابة (المتوسط) 8.84s 22.28s
زمن الاستجابة (الحد الأقصى) 34.82s 68.16s
زمن الاستجابة (الإجمالي) 185.57s 311.96s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#1 Gemini 3.5 Flash

high
التكلفة
$0.208
الوقت
118.2s
الرموز
23,158 tok

#81 gpt-oss-120b

medium
التكلفة
$0.001
الوقت
26.7s
الرموز
555 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.57s 492 174 4,997
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 1,314 3,518 2,177
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.96s 8,118 456 47,129
gpt-oss-120b 5.9 7.0 55.6% 1 38.37s 7,782 3,365 11,973
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.37s 12,873 351 16,323
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 11,535 694 5,072
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.43s 7,548 279 8,466
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 7,476 241 1,114
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemini 3.5 Flash 7.6 7.2 77.8% 1 14.09s 633 12 24,721
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 1,266 6,784 20,606
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.63s 486 115 1,650
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 659 107 387
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.35s 615 70 3,799
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 1,036 126 1,799
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.23s 558 241 4,940
gpt-oss-120b 5.3 7.2 44.4% 1 21.71s 1,190 1,790 2,264
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemini 3.5 Flash 9.8 10.0 100.0% 0 4.96s 6,115 265 1,608
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 6,514 287 1,083
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.94s 156 12 2,005
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 312 3,101 3,758

مقارنة سريعة

تبديل زوج المقارنة