التنقل
AI BENCHY
قارن الرسوم البيانية
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.3-Codex

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس Google: Gemini 3.1 Flash Lite Preview low الإصدار: 2026-03-03 OpenAI: GPT-5.3-Codex medium الإصدار: 2026-02-05
الترتيب #8 #7
متوسط الدرجة 7.84 7.93
الاتساق 10.00 8.84
التكلفة لكل نتيجة 0.151 4.641
إجمالي التكلفة $0.016 $0.465
اختبارات صحيحة
معدل النجاح لكل محاولة 71.4% 78.6%
اختبارات غير مستقرة 0 2
رموز الإخراج 1,317 1,201
رموز الاستدلال 6,126 30,056

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 7.00 10.00 66.7% 0 456 1,224
OpenAI: GPT-5.3-Codex 10.00 10.00 100.0% 0 216 1,421
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 9.88 10.00 100.0% 0 291 696
OpenAI: GPT-5.3-Codex 10.00 10.00 100.0% 0 234 735
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 4.00 10.00 33.3% 0 18 1,212
OpenAI: GPT-5.3-Codex 4.00 7.21 55.6% 1 64 25,308
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 8.50 10.00 50.0% 0 72 753
OpenAI: GPT-5.3-Codex 9.00 10.00 50.0% 0 93 693
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 10.00 10.00 100.0% 0 243 1,248
OpenAI: GPT-5.3-Codex 7.00 7.38 77.8% 1 340 1,407
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 10.00 10.00 100.0% 0 237 993
OpenAI: GPT-5.3-Codex 10.00 10.00 100.0% 0 254 492

مقارنة سريعة

تبديل زوج المقارنة