AI BENCHY Compare
Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.3-Codex
قارن:
تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03
| المقياس | Google: Gemini 3.1 Flash Lite Preview none الإصدار: 2026-03-03 | OpenAI: GPT-5.3-Codex medium الإصدار: 2026-02-05 |
|---|---|---|
| الترتيب | #10 | #7 |
| متوسط الدرجة | 7.70 | 7.93 |
| الاتساق | 9.54 | 8.84 |
| التكلفة لكل نتيجة | 0.116 | 4.641 |
| إجمالي التكلفة | $0.011 | $0.465 |
| اختبارات صحيحة | ||
| معدل النجاح لكل محاولة | 69.1% | 78.6% |
| اختبارات غير مستقرة | 1 | 2 |
| رموز الإخراج | 4,307 | 1,201 |
| رموز الاستدلال | 0 | 30,056 |
الدرجة مقابل التكلفة الإجمالية
تفصيل الفئات
| حيل مضادة للذكاء الاصطناعي | النتيجة | الاتساق | معدل النجاح لكل محاولة | اختبارات غير مستقرة | اختبارات صحيحة | رموز الإخراج | رموز الاستدلال |
|---|---|---|---|---|---|---|---|
| Google: Gemini 3.1 Flash Lite Preview | 6.00 | 7.85 | 55.6% | 1 | 1,086 | 0 | |
| OpenAI: GPT-5.3-Codex | 10.00 | 10.00 | 100.0% | 0 | 216 | 1,421 |
| تحليل البيانات واستخراجها | النتيجة | الاتساق | معدل النجاح لكل محاولة | اختبارات غير مستقرة | اختبارات صحيحة | رموز الإخراج | رموز الاستدلال |
|---|---|---|---|---|---|---|---|
| Google: Gemini 3.1 Flash Lite Preview | 9.88 | 10.00 | 100.0% | 0 | 399 | 0 | |
| OpenAI: GPT-5.3-Codex | 10.00 | 10.00 | 100.0% | 0 | 234 | 735 |
| خاص بالمجال | النتيجة | الاتساق | معدل النجاح لكل محاولة | اختبارات غير مستقرة | اختبارات صحيحة | رموز الإخراج | رموز الاستدلال |
|---|---|---|---|---|---|---|---|
| Google: Gemini 3.1 Flash Lite Preview | 4.00 | 10.00 | 33.3% | 0 | 568 | 0 | |
| OpenAI: GPT-5.3-Codex | 4.00 | 7.21 | 55.6% | 1 | 64 | 25,308 |
| اتباع التعليمات | النتيجة | الاتساق | معدل النجاح لكل محاولة | اختبارات غير مستقرة | اختبارات صحيحة | رموز الإخراج | رموز الاستدلال |
|---|---|---|---|---|---|---|---|
| Google: Gemini 3.1 Flash Lite Preview | 9.00 | 10.00 | 50.0% | 0 | 574 | 0 | |
| OpenAI: GPT-5.3-Codex | 9.00 | 10.00 | 50.0% | 0 | 93 | 693 |
| Puzzle Solving | النتيجة | الاتساق | معدل النجاح لكل محاولة | اختبارات غير مستقرة | اختبارات صحيحة | رموز الإخراج | رموز الاستدلال |
|---|---|---|---|---|---|---|---|
| Google: Gemini 3.1 Flash Lite Preview | 10.00 | 10.00 | 100.0% | 0 | 898 | 0 | |
| OpenAI: GPT-5.3-Codex | 7.00 | 7.38 | 77.8% | 1 | 340 | 1,407 |
| استدعاء الأدوات | النتيجة | الاتساق | معدل النجاح لكل محاولة | اختبارات غير مستقرة | اختبارات صحيحة | رموز الإخراج | رموز الاستدلال |
|---|---|---|---|---|---|---|---|
| Google: Gemini 3.1 Flash Lite Preview | 10.00 | 10.00 | 100.0% | 0 | 782 | 0 | |
| OpenAI: GPT-5.3-Codex | 10.00 | 10.00 | 100.0% | 0 | 254 | 492 |
مقارنة سريعة
تبديل زوج المقارنة
Gemini 3.1 Flash Lite PreviewlowvsGPT-5.3-CodexmediumGemini 3.1 Flash Lite PreviewhighvsGPT-5.3-CodexmediumClaude Sonnet 4.6mediumvsGemini 3.1 Flash Lite PreviewnoneGemini 3.1 Flash Lite PreviewnonevsGLM 5mediumGemini 3 Flash PreviewlowvsGPT-5.3-CodexmediumGemini 3.1 Flash Lite PreviewnonevsStep 3.5 Flashmediumمتاح مجانًاDeepSeek V3.2mediumvsGemini 3.1 Flash Lite PreviewnoneGemini 3 Flash PreviewnonevsGPT-5.3-CodexmediumGemini 3.1 Flash Lite PreviewnonevsGPT-5.2mediumGemini 3.1 Flash Lite PreviewnonevsQwen3.5-27BmediumGemini 3.1 Flash Lite PreviewnonevsQwen3.5-122B-A10BmediumGemini 3.1 Flash Lite PreviewnonevsQwen3.5 Plus 2026-02-15medium