التنقل
AI BENCHY
قارن الرسوم البيانية
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.2

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس Google: Gemini 3.1 Flash Lite Preview high الإصدار: 2026-03-03 OpenAI: GPT-5.2 medium الإصدار: 2025-12-11
الترتيب #9 #19
متوسط الدرجة 7.77 6.93
الاتساق 9.99 8.22
التكلفة لكل نتيجة 17.286 2.780
إجمالي التكلفة $1.729 $0.251
اختبارات صحيحة
معدل النجاح لكل محاولة 71.4% 76.2%
اختبارات غير مستقرة 0 3
رموز الإخراج 831 1,869
رموز الاستدلال 1,148,955 14,190

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 10.00 10.00 100.0% 0 144 193,077
OpenAI: GPT-5.2 7.00 7.28 77.8% 1 549 2,002
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 9.88 10.00 100.0% 0 279 6,186
OpenAI: GPT-5.2 10.00 10.00 100.0% 0 234 499
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 4.00 10.00 33.3% 0 18 566,202
OpenAI: GPT-5.2 4.00 7.21 55.6% 1 42 9,690
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 8.00 9.96 50.0% 0 69 190,053
OpenAI: GPT-5.2 9.50 10.00 100.0% 0 95 587
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 7.00 10.00 66.7% 0 87 190,953
OpenAI: GPT-5.2 8.00 10.00 66.7% 0 710 943
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 10.00 10.00 100.0% 0 234 2,484
OpenAI: GPT-5.2 1.00 1.62 66.7% 1 239 469

مقارنة سريعة

تبديل زوج المقارنة