| حيل مضادة للذكاء الاصطناعي | يُعد الاختبار ناجحًا بالكامل فقط إذا نجحت كل التكرارات الخاصة به. لا توجد إجابات فاشلة. زمن الاستجابة (المتوسط) 3496ms زمن الاستجابة (الحد الأقصى) 4305ms زمن الاستجابة (الإجمالي) 10487ms يُعد الاختبار ناجحًا بالكامل فقط إذا نجحت كل التكرارات الخاصة به. الترتيب: #5/29 86% Google: Gemini 3 Flash Preview - الاستدلال (medium) 100.0% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 100.0% Google: Gemini 3 Pro Preview - الاستدلال (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 100.0% Google: Gemini 3 Flash Preview - الاستدلال (low) 100.0% MoonshotAI: Kimi K2.5 - بدون استدلال 0.0% 0.0% 100.0% | 10.00 متوسط الدرجة عبر جميع اختبارات القياس. الترتيب: #5/29 86% Google: Gemini 3 Flash Preview - الاستدلال (medium) 10.00 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 10.00 Google: Gemini 3 Pro Preview - الاستدلال (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 10.00 Google: Gemini 3 Flash Preview - الاستدلال (low) 10.00 Z.ai: GLM 4.7 Flash - بدون استدلال 1.00 1.00 10.00 | 10.00 تعكس درجة الاتساق ثبات النتائج بين التكرارات (10 = ثابت جدًا، حتى لو كان خطأً بشكل ثابت). الترتيب: #5/29 86% Google: Gemini 3 Flash Preview - الاستدلال (medium) 10.00 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 10.00 Google: Gemini 3 Pro Preview - الاستدلال (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 10.00 Google: Gemini 3 Flash Preview - الاستدلال (low) 10.00 Anthropic: Claude Opus 4.6 - الاستدلال (medium) 4.41 4.41 10.00 | 100.0% معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التكرارات. الترتيب: #5/29 86% Google: Gemini 3 Flash Preview - الاستدلال (medium) 100.0% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 100.0% Google: Gemini 3 Pro Preview - الاستدلال (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 100.0% Google: Gemini 3 Flash Preview - الاستدلال (low) 100.0% xAI: Grok 4.1 Fast - بدون استدلال 0.0% 0.0% 100.0% | 0 الاختبارات غير المستقرة لها نتائج مختلطة بين التكرارات (نجاح واحد على الأقل وفشل واحد على الأقل). الترتيب: #5/29 86% Google: Gemini 3 Flash Preview - الاستدلال (medium) 0 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 0 Google: Gemini 3 Pro Preview - الاستدلال (medium) 0 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 0 Google: Gemini 3 Flash Preview - الاستدلال (low) 0 Anthropic: Claude Opus 4.6 - الاستدلال (medium) 2 0 2 | 6.23 يقيس وضوح وكفاءة واتساق الاستدلال بشكل مستقل عن صحة الإجابة النهائية. ملاحظة: في بعض نماذج Gemini يتوفر نص استدلال جزئي فقط، لذلك قد تكون درجة الاستدلال أقل من الواقع. الترتيب: #14/19 28% Anthropic: Claude Opus 4.6 - الاستدلال (medium) 10.00 OpenAI: gpt-oss-120b - الاستدلال (medium) 10.00 Anthropic: Claude Sonnet 4.6 - الاستدلال (medium) 9.89 Z.ai: GLM 5 - الاستدلال (medium) 9.83 StepFun: Step 3.5 Flash - الاستدلال (medium) 9.83 Google: Gemini 3 Flash Preview - الاستدلال (low) 6.23 Qwen: Qwen3 Coder Next - الاستدلال (medium) 4.00 4.00 10.00 | 3496ms | $0.00844 إجمالي التكلفة الترتيب: #16/29 46% StepFun: Step 3.5 Flash - الاستدلال (medium) $0.00000 OpenAI: GPT-4o-mini - بدون استدلال $0.00018 Z.ai: GLM 4.7 Flash - بدون استدلال $0.00020 Xiaomi: MiMo-V2-Flash - بدون استدلال $0.00024 xAI: Grok 4.1 Fast - بدون استدلال $0.00049 Google: Gemini 3 Flash Preview - الاستدلال (low) $0.00844 Anthropic: Claude Opus 4.6 - الاستدلال (medium) $0.05049 $0.00000 $0.05049 |
| تحليل البيانات واستخراجها | يُعد الاختبار ناجحًا بالكامل فقط إذا نجحت كل التكرارات الخاصة به. لا توجد إجابات فاشلة. زمن الاستجابة (المتوسط) 9460ms زمن الاستجابة (الحد الأقصى) 14717ms زمن الاستجابة (الإجمالي) 18919ms يُعد الاختبار ناجحًا بالكامل فقط إذا نجحت كل التكرارات الخاصة به. الترتيب: #5/29 86% Google: Gemini 3 Flash Preview - الاستدلال (medium) 100.0% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 100.0% Google: Gemini 3 Pro Preview - الاستدلال (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 100.0% Google: Gemini 3 Flash Preview - الاستدلال (low) 100.0% Z.ai: GLM 4.7 Flash - بدون استدلال 0.0% 0.0% 100.0% | 10.00 متوسط الدرجة عبر جميع اختبارات القياس. الترتيب: #5/29 86% Google: Gemini 3 Flash Preview - الاستدلال (medium) 10.00 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 10.00 Google: Gemini 3 Pro Preview - الاستدلال (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 10.00 Google: Gemini 3 Flash Preview - الاستدلال (low) 10.00 Z.ai: GLM 4.7 Flash - بدون استدلال 0.50 0.50 10.00 | 10.00 تعكس درجة الاتساق ثبات النتائج بين التكرارات (10 = ثابت جدًا، حتى لو كان خطأً بشكل ثابت). الترتيب: #5/29 86% Google: Gemini 3 Flash Preview - الاستدلال (medium) 10.00 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 10.00 Google: Gemini 3 Pro Preview - الاستدلال (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 10.00 Google: Gemini 3 Flash Preview - الاستدلال (low) 10.00 Z.ai: GLM 5 - الاستدلال (medium) 5.56 5.56 10.00 | 100.0% معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التكرارات. الترتيب: #5/29 86% Google: Gemini 3 Flash Preview - الاستدلال (medium) 100.0% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 100.0% Google: Gemini 3 Pro Preview - الاستدلال (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 100.0% Google: Gemini 3 Flash Preview - الاستدلال (low) 100.0% Xiaomi: MiMo-V2-Flash - بدون استدلال 16.7% 0.0% 100.0% | 0 الاختبارات غير المستقرة لها نتائج مختلطة بين التكرارات (نجاح واحد على الأقل وفشل واحد على الأقل). الترتيب: #5/29 86% Google: Gemini 3 Flash Preview - الاستدلال (medium) 0 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 0 Google: Gemini 3 Pro Preview - الاستدلال (medium) 0 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 0 Google: Gemini 3 Flash Preview - الاستدلال (low) 0 Z.ai: GLM 5 - الاستدلال (medium) 1 0 1 | 4.73 يقيس وضوح وكفاءة واتساق الاستدلال بشكل مستقل عن صحة الإجابة النهائية. ملاحظة: في بعض نماذج Gemini يتوفر نص استدلال جزئي فقط، لذلك قد تكون درجة الاستدلال أقل من الواقع. الترتيب: #17/19 11% OpenAI: gpt-oss-120b - الاستدلال (medium) 10.00 Z.ai: GLM 4.7 Flash - الاستدلال (medium) 9.87 Anthropic: Claude Sonnet 4.6 - الاستدلال (medium) 9.83 Anthropic: Claude Opus 4.6 - الاستدلال (medium) 9.83 Z.ai: GLM 5 - الاستدلال (medium) 9.80 Google: Gemini 3 Flash Preview - الاستدلال (low) 4.73 OpenAI: GPT-5.3-Codex - الاستدلال (medium) 1.25 1.25 10.00 | 9460ms | $0.01354 إجمالي التكلفة الترتيب: #18/29 39% StepFun: Step 3.5 Flash - الاستدلال (medium) $0.00000 Xiaomi: MiMo-V2-Flash - الاستدلال (medium) $0.00029 Xiaomi: MiMo-V2-Flash - بدون استدلال $0.00029 Z.ai: GLM 4.7 Flash - بدون استدلال $0.00050 OpenAI: gpt-oss-120b - الاستدلال (medium) $0.00052 Google: Gemini 3 Flash Preview - الاستدلال (low) $0.01354 Anthropic: Claude Opus 4.6 - الاستدلال (medium) $0.07755 $0.00000 $0.07755 |
| خاص بالمجال | يُعد الاختبار ناجحًا بالكامل فقط إذا نجحت كل التكرارات الخاصة به. إجابة خاطئة: 2 زمن الاستجابة (المتوسط) 8314ms زمن الاستجابة (الحد الأقصى) 14399ms زمن الاستجابة (الإجمالي) 24941ms يُعد الاختبار ناجحًا بالكامل فقط إذا نجحت كل التكرارات الخاصة به. الترتيب: #8/29 75% Google: Gemini 3 Flash Preview - الاستدلال (medium) 100.0% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 66.7% Google: Gemini 3 Flash Preview - بدون استدلال 66.7% Anthropic: Claude Sonnet 4.6 - بدون استدلال 66.7% Z.ai: GLM 4.7 Flash - بدون استدلال 66.7% Google: Gemini 3 Flash Preview - الاستدلال (low) 33.3% Anthropic: Claude Sonnet 4.6 - الاستدلال (medium) 0.0% 0.0% 100.0% | 4.00 متوسط الدرجة عبر جميع اختبارات القياس. الترتيب: #8/29 75% Google: Gemini 3 Flash Preview - الاستدلال (medium) 10.00 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 7.00 Google: Gemini 3 Flash Preview - بدون استدلال 7.00 Anthropic: Claude Sonnet 4.6 - بدون استدلال 7.00 Z.ai: GLM 4.7 Flash - بدون استدلال 7.00 Google: Gemini 3 Flash Preview - الاستدلال (low) 4.00 Anthropic: Claude Sonnet 4.6 - الاستدلال (medium) 1.00 1.00 10.00 | 4.41 تعكس درجة الاتساق ثبات النتائج بين التكرارات (10 = ثابت جدًا، حتى لو كان خطأً بشكل ثابت). الترتيب: #23/29 21% Google: Gemini 3 Flash Preview - الاستدلال (medium) 10.00 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 10.00 Google: Gemini 3 Pro Preview - الاستدلال (medium) 10.00 Google: Gemini 3 Flash Preview - بدون استدلال 10.00 Anthropic: Claude Sonnet 4.6 - بدون استدلال 10.00 Google: Gemini 3 Flash Preview - الاستدلال (low) 4.41 4.41 10.00 | 55.5% معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التكرارات. الترتيب: #11/29 64% Google: Gemini 3 Flash Preview - الاستدلال (medium) 100.0% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 66.7% Google: Gemini 3 Flash Preview - بدون استدلال 66.7% Anthropic: Claude Sonnet 4.6 - بدون استدلال 66.7% Z.ai: GLM 4.7 Flash - بدون استدلال 66.7% Google: Gemini 3 Flash Preview - الاستدلال (low) 55.5% Z.ai: GLM 5 - بدون استدلال 0.0% 0.0% 100.0% | 2 الاختبارات غير المستقرة لها نتائج مختلطة بين التكرارات (نجاح واحد على الأقل وفشل واحد على الأقل). الترتيب: #23/29 21% Google: Gemini 3 Flash Preview - الاستدلال (medium) 0 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 0 Google: Gemini 3 Pro Preview - الاستدلال (medium) 0 Google: Gemini 3 Flash Preview - بدون استدلال 0 Anthropic: Claude Sonnet 4.6 - بدون استدلال 0 Google: Gemini 3 Flash Preview - الاستدلال (low) 2 0 2 | 1.83 يقيس وضوح وكفاءة واتساق الاستدلال بشكل مستقل عن صحة الإجابة النهائية. ملاحظة: في بعض نماذج Gemini يتوفر نص استدلال جزئي فقط، لذلك قد تكون درجة الاستدلال أقل من الواقع. الترتيب: #18/19 6% Xiaomi: MiMo-V2-Flash - الاستدلال (medium) 8.72 OpenAI: gpt-oss-120b - الاستدلال (medium) 8.53 StepFun: Step 3.5 Flash - الاستدلال (medium) 8.44 Z.ai: GLM 5 - الاستدلال (medium) 8.43 Z.ai: GLM 4.7 Flash - الاستدلال (medium) 8.21 Google: Gemini 3 Flash Preview - الاستدلال (low) 1.83 OpenAI: GPT-5.3-Codex - الاستدلال (medium) 1.00 1.00 8.72 | 8314ms | $0.01993 إجمالي التكلفة الترتيب: #18/29 39% StepFun: Step 3.5 Flash - الاستدلال (medium) $0.00000 Z.ai: GLM 4.7 Flash - بدون استدلال $0.00005 Xiaomi: MiMo-V2-Flash - بدون استدلال $0.00008 Qwen: Qwen3 Coder Next - بدون استدلال $0.00010 Qwen: Qwen3 Coder Next - الاستدلال (medium) $0.00010 Google: Gemini 3 Flash Preview - الاستدلال (low) $0.01993 Anthropic: Claude Sonnet 4.6 - الاستدلال (medium) $0.64205 $0.00000 $0.64205 |
| اتباع التعليمات | يُعد الاختبار ناجحًا بالكامل فقط إذا نجحت كل التكرارات الخاصة به. لم يتبع التعليمات: 1 زمن الاستجابة (المتوسط) 7016ms زمن الاستجابة (الحد الأقصى) 7350ms زمن الاستجابة (الإجمالي) 14031ms يُعد الاختبار ناجحًا بالكامل فقط إذا نجحت كل التكرارات الخاصة به. الترتيب: #14/29 54% Google: Gemini 3 Flash Preview - الاستدلال (medium) 100.0% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 100.0% Google: Gemini 3 Pro Preview - الاستدلال (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 100.0% OpenAI: GPT-5.2 - الاستدلال (medium) 100.0% Google: Gemini 3 Flash Preview - الاستدلال (low) 50.0% xAI: Grok 4.1 Fast - بدون استدلال 0.0% 0.0% 100.0% | 7.50 متوسط الدرجة عبر جميع اختبارات القياس. الترتيب: #15/29 50% Google: Gemini 3 Flash Preview - الاستدلال (medium) 10.00 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 10.00 Anthropic: Claude Sonnet 4.6 - الاستدلال (medium) 10.00 Z.ai: GLM 5 - بدون استدلال 10.00 OpenAI: gpt-oss-120b - الاستدلال (medium) 10.00 Google: Gemini 3 Flash Preview - الاستدلال (low) 7.50 xAI: Grok 4.1 Fast - بدون استدلال 1.00 1.00 10.00 | 9.99 تعكس درجة الاتساق ثبات النتائج بين التكرارات (10 = ثابت جدًا، حتى لو كان خطأً بشكل ثابت). الترتيب: #17/29 43% Google: Gemini 3 Flash Preview - الاستدلال (medium) 10.00 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 10.00 Google: Gemini 3 Pro Preview - الاستدلال (medium) 10.00 OpenAI: GPT-5.3-Codex - الاستدلال (medium) 10.00 OpenAI: GPT-5.2 - الاستدلال (medium) 10.00 Google: Gemini 3 Flash Preview - الاستدلال (low) 9.99 Xiaomi: MiMo-V2-Flash - الاستدلال (medium) 5.80 5.80 10.00 | 50.0% معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التكرارات. الترتيب: #19/29 36% Google: Gemini 3 Flash Preview - الاستدلال (medium) 100.0% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 100.0% Google: Gemini 3 Pro Preview - الاستدلال (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 100.0% OpenAI: GPT-5.2 - الاستدلال (medium) 100.0% Google: Gemini 3 Flash Preview - الاستدلال (low) 50.0% xAI: Grok 4.1 Fast - بدون استدلال 0.0% 0.0% 100.0% | 0 الاختبارات غير المستقرة لها نتائج مختلطة بين التكرارات (نجاح واحد على الأقل وفشل واحد على الأقل). الترتيب: #5/29 86% Google: Gemini 3 Flash Preview - الاستدلال (medium) 0 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 0 Google: Gemini 3 Pro Preview - الاستدلال (medium) 0 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 0 Google: Gemini 3 Flash Preview - الاستدلال (low) 0 Google: Gemini 3 Flash Preview - بدون استدلال 1 0 1 | 5.00 يقيس وضوح وكفاءة واتساق الاستدلال بشكل مستقل عن صحة الإجابة النهائية. ملاحظة: في بعض نماذج Gemini يتوفر نص استدلال جزئي فقط، لذلك قد تكون درجة الاستدلال أقل من الواقع. الترتيب: #17/19 11% Anthropic: Claude Sonnet 4.6 - الاستدلال (medium) 10.00 Z.ai: GLM 5 - الاستدلال (medium) 9.75 StepFun: Step 3.5 Flash - الاستدلال (medium) 9.67 Anthropic: Claude Opus 4.6 - الاستدلال (medium) 9.50 OpenAI: gpt-oss-120b - الاستدلال (medium) 9.50 Google: Gemini 3 Flash Preview - الاستدلال (low) 5.00 OpenAI: GPT-5.3-Codex - الاستدلال (medium) 1.00 1.00 10.00 | 7016ms | $0.00878 إجمالي التكلفة الترتيب: #20/29 32% StepFun: Step 3.5 Flash - الاستدلال (medium) $0.00000 Z.ai: GLM 4.7 Flash - بدون استدلال $0.00006 Xiaomi: MiMo-V2-Flash - بدون استدلال $0.00008 Qwen: Qwen3 Coder Next - بدون استدلال $0.00013 Qwen: Qwen3 Coder Next - الاستدلال (medium) $0.00014 Google: Gemini 3 Flash Preview - الاستدلال (low) $0.00878 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) $0.03134 $0.00000 $0.03134 |
| Puzzle Solving | يُعد الاختبار ناجحًا بالكامل فقط إذا نجحت كل التكرارات الخاصة به. لا توجد إجابات فاشلة. زمن الاستجابة (المتوسط) 6440ms زمن الاستجابة (الحد الأقصى) 10274ms زمن الاستجابة (الإجمالي) 19319ms يُعد الاختبار ناجحًا بالكامل فقط إذا نجحت كل التكرارات الخاصة به. الترتيب: #5/29 86% Google: Gemini 3 Flash Preview - الاستدلال (medium) 100.0% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 100.0% Google: Gemini 3 Pro Preview - الاستدلال (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 100.0% Google: Gemini 3 Flash Preview - الاستدلال (low) 100.0% StepFun: Step 3.5 Flash - الاستدلال (medium) 0.0% 0.0% 100.0% | 10.00 متوسط الدرجة عبر جميع اختبارات القياس. الترتيب: #4/29 89% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 10.00 Google: Gemini 3 Pro Preview - الاستدلال (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 10.00 Google: Gemini 3 Flash Preview - الاستدلال (low) 10.00 Anthropic: Claude Sonnet 4.6 - الاستدلال (medium) 10.00 Xiaomi: MiMo-V2-Flash - الاستدلال (medium) 1.00 1.00 10.00 | 10.00 تعكس درجة الاتساق ثبات النتائج بين التكرارات (10 = ثابت جدًا، حتى لو كان خطأً بشكل ثابت). الترتيب: #5/29 86% Google: Gemini 3 Flash Preview - الاستدلال (medium) 10.00 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 10.00 Google: Gemini 3 Pro Preview - الاستدلال (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 10.00 Google: Gemini 3 Flash Preview - الاستدلال (low) 10.00 MiniMax: MiniMax M2.5 - الاستدلال (medium) 4.79 4.79 10.00 | 100.0% معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التكرارات. الترتيب: #5/29 86% Google: Gemini 3 Flash Preview - الاستدلال (medium) 100.0% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 100.0% Google: Gemini 3 Pro Preview - الاستدلال (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 100.0% Google: Gemini 3 Flash Preview - الاستدلال (low) 100.0% OpenAI: GPT-4o-mini - بدون استدلال 0.0% 0.0% 100.0% | 0 الاختبارات غير المستقرة لها نتائج مختلطة بين التكرارات (نجاح واحد على الأقل وفشل واحد على الأقل). الترتيب: #5/29 86% Google: Gemini 3 Flash Preview - الاستدلال (medium) 0 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 0 Google: Gemini 3 Pro Preview - الاستدلال (medium) 0 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 0 Google: Gemini 3 Flash Preview - الاستدلال (low) 0 OpenAI: GPT-5 Nano - الاستدلال (medium) 2 0 2 | 7.50 يقيس وضوح وكفاءة واتساق الاستدلال بشكل مستقل عن صحة الإجابة النهائية. ملاحظة: في بعض نماذج Gemini يتوفر نص استدلال جزئي فقط، لذلك قد تكون درجة الاستدلال أقل من الواقع. الترتيب: #13/19 33% Z.ai: GLM 5 - الاستدلال (medium) 9.50 Anthropic: Claude Sonnet 4.6 - الاستدلال (medium) 9.44 Anthropic: Claude Opus 4.6 - الاستدلال (medium) 9.44 MoonshotAI: Kimi K2.5 - الاستدلال (medium) 9.26 StepFun: Step 3.5 Flash - الاستدلال (medium) 9.22 Google: Gemini 3 Flash Preview - الاستدلال (low) 7.50 Qwen: Qwen3 Coder Next - الاستدلال (medium) 4.33 4.33 9.50 | 6440ms | $0.01105 إجمالي التكلفة الترتيب: #17/29 43% StepFun: Step 3.5 Flash - الاستدلال (medium) $0.00000 Z.ai: GLM 4.7 Flash - بدون استدلال $0.00008 OpenAI: GPT-4o-mini - بدون استدلال $0.00028 xAI: Grok 4.1 Fast - بدون استدلال $0.00053 Qwen: Qwen3 Coder Next - الاستدلال (medium) $0.00058 Google: Gemini 3 Flash Preview - الاستدلال (low) $0.01105 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) $0.05508 $0.00000 $0.05508 |