| حيل مضادة للذكاء الاصطناعي | يُعد الاختبار ناجحًا بالكامل فقط إذا نجحت كل التكرارات الخاصة به. إجابة خاطئة: 3 زمن الاستجابة (المتوسط) 11378ms زمن الاستجابة (الحد الأقصى) 11378ms زمن الاستجابة (الإجمالي) 11378ms يُعد الاختبار ناجحًا بالكامل فقط إذا نجحت كل التكرارات الخاصة به. الترتيب: #24/29 18% Google: Gemini 3 Flash Preview - الاستدلال (medium) 100.0% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 100.0% Google: Gemini 3 Pro Preview - الاستدلال (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 100.0% Google: Gemini 3 Flash Preview - الاستدلال (low) 100.0% MoonshotAI: Kimi K2.5 - بدون استدلال 0.0% 0.0% 100.0% | 2.67 متوسط الدرجة عبر جميع اختبارات القياس. الترتيب: #24/29 18% Google: Gemini 3 Flash Preview - الاستدلال (medium) 10.00 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 10.00 Google: Gemini 3 Pro Preview - الاستدلال (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 10.00 Google: Gemini 3 Flash Preview - الاستدلال (low) 10.00 MoonshotAI: Kimi K2.5 - بدون استدلال 2.67 Z.ai: GLM 4.7 Flash - بدون استدلال 1.00 1.00 10.00 | 7.86 تعكس درجة الاتساق ثبات النتائج بين التكرارات (10 = ثابت جدًا، حتى لو كان خطأً بشكل ثابت). الترتيب: #20/29 32% Google: Gemini 3 Flash Preview - الاستدلال (medium) 10.00 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 10.00 Google: Gemini 3 Pro Preview - الاستدلال (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 10.00 Google: Gemini 3 Flash Preview - الاستدلال (low) 10.00 MoonshotAI: Kimi K2.5 - بدون استدلال 7.86 Anthropic: Claude Opus 4.6 - الاستدلال (medium) 4.41 4.41 10.00 | 11.1% معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التكرارات. الترتيب: #26/29 11% Google: Gemini 3 Flash Preview - الاستدلال (medium) 100.0% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 100.0% Google: Gemini 3 Pro Preview - الاستدلال (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 100.0% Google: Gemini 3 Flash Preview - الاستدلال (low) 100.0% MoonshotAI: Kimi K2.5 - بدون استدلال 11.1% xAI: Grok 4.1 Fast - بدون استدلال 0.0% 0.0% 100.0% | 1 الاختبارات غير المستقرة لها نتائج مختلطة بين التكرارات (نجاح واحد على الأقل وفشل واحد على الأقل). الترتيب: #24/29 18% Google: Gemini 3 Flash Preview - الاستدلال (medium) 0 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 0 Google: Gemini 3 Pro Preview - الاستدلال (medium) 0 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 0 Google: Gemini 3 Flash Preview - الاستدلال (low) 0 MoonshotAI: Kimi K2.5 - بدون استدلال 1 Anthropic: Claude Opus 4.6 - الاستدلال (medium) 2 0 2 | - يقيس وضوح وكفاءة واتساق الاستدلال بشكل مستقل عن صحة الإجابة النهائية. الترتيب: #19/19 0% Anthropic: Claude Opus 4.6 - الاستدلال (medium) 10.00 OpenAI: gpt-oss-120b - الاستدلال (medium) 10.00 Anthropic: Claude Sonnet 4.6 - الاستدلال (medium) 9.89 Z.ai: GLM 5 - الاستدلال (medium) 9.83 StepFun: Step 3.5 Flash - الاستدلال (medium) 9.83 Qwen: Qwen3 Coder Next - الاستدلال (medium) 4.00 4.00 10.00 | 11378ms | $0.00121 إجمالي التكلفة الترتيب: #11/29 64% StepFun: Step 3.5 Flash - الاستدلال (medium) $0.00000 OpenAI: GPT-4o-mini - بدون استدلال $0.00018 Z.ai: GLM 4.7 Flash - بدون استدلال $0.00020 Xiaomi: MiMo-V2-Flash - بدون استدلال $0.00024 xAI: Grok 4.1 Fast - بدون استدلال $0.00049 MoonshotAI: Kimi K2.5 - بدون استدلال $0.00121 Anthropic: Claude Opus 4.6 - الاستدلال (medium) $0.05049 $0.00000 $0.05049 |
| تحليل البيانات واستخراجها | يُعد الاختبار ناجحًا بالكامل فقط إذا نجحت كل التكرارات الخاصة به. إجابة خاطئة: 1 زمن الاستجابة (المتوسط) 0ms زمن الاستجابة (الحد الأقصى) 0ms زمن الاستجابة (الإجمالي) 0ms يُعد الاختبار ناجحًا بالكامل فقط إذا نجحت كل التكرارات الخاصة به. الترتيب: #25/29 14% Google: Gemini 3 Flash Preview - الاستدلال (medium) 100.0% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 100.0% Google: Gemini 3 Pro Preview - الاستدلال (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 100.0% Google: Gemini 3 Flash Preview - الاستدلال (low) 100.0% MoonshotAI: Kimi K2.5 - بدون استدلال 50.0% Z.ai: GLM 4.7 Flash - بدون استدلال 0.0% 0.0% 100.0% | 5.50 متوسط الدرجة عبر جميع اختبارات القياس. الترتيب: #23/29 21% Google: Gemini 3 Flash Preview - الاستدلال (medium) 10.00 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 10.00 Google: Gemini 3 Pro Preview - الاستدلال (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 10.00 Google: Gemini 3 Flash Preview - الاستدلال (low) 10.00 MoonshotAI: Kimi K2.5 - بدون استدلال 5.50 Z.ai: GLM 4.7 Flash - بدون استدلال 0.50 0.50 10.00 | 5.81 تعكس درجة الاتساق ثبات النتائج بين التكرارات (10 = ثابت جدًا، حتى لو كان خطأً بشكل ثابت). الترتيب: #26/29 11% Google: Gemini 3 Flash Preview - الاستدلال (medium) 10.00 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 10.00 Google: Gemini 3 Pro Preview - الاستدلال (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 10.00 Google: Gemini 3 Flash Preview - الاستدلال (low) 10.00 MoonshotAI: Kimi K2.5 - بدون استدلال 5.81 Z.ai: GLM 5 - الاستدلال (medium) 5.56 5.56 10.00 | 83.3% معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التكرارات. الترتيب: #23/29 21% Google: Gemini 3 Flash Preview - الاستدلال (medium) 100.0% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 100.0% Google: Gemini 3 Pro Preview - الاستدلال (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 100.0% Google: Gemini 3 Flash Preview - الاستدلال (low) 100.0% MoonshotAI: Kimi K2.5 - بدون استدلال 83.3% Xiaomi: MiMo-V2-Flash - بدون استدلال 16.7% 0.0% 100.0% | 1 الاختبارات غير المستقرة لها نتائج مختلطة بين التكرارات (نجاح واحد على الأقل وفشل واحد على الأقل). الترتيب: #27/29 7% Google: Gemini 3 Flash Preview - الاستدلال (medium) 0 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 0 Google: Gemini 3 Pro Preview - الاستدلال (medium) 0 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 0 Google: Gemini 3 Flash Preview - الاستدلال (low) 0 MoonshotAI: Kimi K2.5 - بدون استدلال 1 Z.ai: GLM 5 - الاستدلال (medium) 1 0 1 | - يقيس وضوح وكفاءة واتساق الاستدلال بشكل مستقل عن صحة الإجابة النهائية. الترتيب: #19/19 0% OpenAI: gpt-oss-120b - الاستدلال (medium) 10.00 Z.ai: GLM 4.7 Flash - الاستدلال (medium) 9.87 Anthropic: Claude Sonnet 4.6 - الاستدلال (medium) 9.83 Anthropic: Claude Opus 4.6 - الاستدلال (medium) 9.83 Z.ai: GLM 5 - الاستدلال (medium) 9.80 OpenAI: GPT-5.3-Codex - الاستدلال (medium) 1.25 1.25 10.00 | 0ms | $0.00455 إجمالي التكلفة الترتيب: #16/29 46% StepFun: Step 3.5 Flash - الاستدلال (medium) $0.00000 Xiaomi: MiMo-V2-Flash - الاستدلال (medium) $0.00029 Xiaomi: MiMo-V2-Flash - بدون استدلال $0.00029 Z.ai: GLM 4.7 Flash - بدون استدلال $0.00050 OpenAI: gpt-oss-120b - الاستدلال (medium) $0.00052 MoonshotAI: Kimi K2.5 - بدون استدلال $0.00455 Anthropic: Claude Opus 4.6 - الاستدلال (medium) $0.07755 $0.00000 $0.07755 |
| خاص بالمجال | يُعد الاختبار ناجحًا بالكامل فقط إذا نجحت كل التكرارات الخاصة به. إجابة خاطئة: 2 زمن الاستجابة (المتوسط) 0ms زمن الاستجابة (الحد الأقصى) 0ms زمن الاستجابة (الإجمالي) 0ms يُعد الاختبار ناجحًا بالكامل فقط إذا نجحت كل التكرارات الخاصة به. الترتيب: #16/29 46% Google: Gemini 3 Flash Preview - الاستدلال (medium) 100.0% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 66.7% Google: Gemini 3 Flash Preview - بدون استدلال 66.7% Anthropic: Claude Sonnet 4.6 - بدون استدلال 66.7% Z.ai: GLM 4.7 Flash - بدون استدلال 66.7% MoonshotAI: Kimi K2.5 - بدون استدلال 33.3% Anthropic: Claude Sonnet 4.6 - الاستدلال (medium) 0.0% 0.0% 100.0% | 4.00 متوسط الدرجة عبر جميع اختبارات القياس. الترتيب: #16/29 46% Google: Gemini 3 Flash Preview - الاستدلال (medium) 10.00 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 7.00 Google: Gemini 3 Flash Preview - بدون استدلال 7.00 Anthropic: Claude Sonnet 4.6 - بدون استدلال 7.00 Z.ai: GLM 4.7 Flash - بدون استدلال 7.00 MoonshotAI: Kimi K2.5 - بدون استدلال 4.00 Anthropic: Claude Sonnet 4.6 - الاستدلال (medium) 1.00 1.00 10.00 | 10.00 تعكس درجة الاتساق ثبات النتائج بين التكرارات (10 = ثابت جدًا، حتى لو كان خطأً بشكل ثابت). الترتيب: #10/29 68% Google: Gemini 3 Flash Preview - الاستدلال (medium) 10.00 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 10.00 Google: Gemini 3 Pro Preview - الاستدلال (medium) 10.00 Google: Gemini 3 Flash Preview - بدون استدلال 10.00 Anthropic: Claude Sonnet 4.6 - بدون استدلال 10.00 MoonshotAI: Kimi K2.5 - بدون استدلال 10.00 Google: Gemini 3 Flash Preview - الاستدلال (low) 4.41 4.41 10.00 | 33.3% معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التكرارات. الترتيب: #21/29 29% Google: Gemini 3 Flash Preview - الاستدلال (medium) 100.0% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 66.7% Google: Gemini 3 Flash Preview - بدون استدلال 66.7% Anthropic: Claude Sonnet 4.6 - بدون استدلال 66.7% Z.ai: GLM 4.7 Flash - بدون استدلال 66.7% MoonshotAI: Kimi K2.5 - بدون استدلال 33.3% Z.ai: GLM 5 - بدون استدلال 0.0% 0.0% 100.0% | 0 الاختبارات غير المستقرة لها نتائج مختلطة بين التكرارات (نجاح واحد على الأقل وفشل واحد على الأقل). الترتيب: #10/29 68% Google: Gemini 3 Flash Preview - الاستدلال (medium) 0 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 0 Google: Gemini 3 Pro Preview - الاستدلال (medium) 0 Google: Gemini 3 Flash Preview - بدون استدلال 0 Anthropic: Claude Sonnet 4.6 - بدون استدلال 0 MoonshotAI: Kimi K2.5 - بدون استدلال 0 Google: Gemini 3 Flash Preview - الاستدلال (low) 2 0 2 | - يقيس وضوح وكفاءة واتساق الاستدلال بشكل مستقل عن صحة الإجابة النهائية. الترتيب: #19/19 0% Xiaomi: MiMo-V2-Flash - الاستدلال (medium) 8.72 OpenAI: gpt-oss-120b - الاستدلال (medium) 8.53 StepFun: Step 3.5 Flash - الاستدلال (medium) 8.44 Z.ai: GLM 5 - الاستدلال (medium) 8.43 Z.ai: GLM 4.7 Flash - الاستدلال (medium) 8.21 OpenAI: GPT-5.3-Codex - الاستدلال (medium) 1.00 1.00 8.72 | 0ms | $0.00027 إجمالي التكلفة الترتيب: #8/29 75% StepFun: Step 3.5 Flash - الاستدلال (medium) $0.00000 Z.ai: GLM 4.7 Flash - بدون استدلال $0.00005 Xiaomi: MiMo-V2-Flash - بدون استدلال $0.00008 Qwen: Qwen3 Coder Next - بدون استدلال $0.00010 Qwen: Qwen3 Coder Next - الاستدلال (medium) $0.00010 MoonshotAI: Kimi K2.5 - بدون استدلال $0.00027 Anthropic: Claude Sonnet 4.6 - الاستدلال (medium) $0.64205 $0.00000 $0.64205 |
| اتباع التعليمات | يُعد الاختبار ناجحًا بالكامل فقط إذا نجحت كل التكرارات الخاصة به. إجابة خاطئة: 1 زمن الاستجابة (المتوسط) 0ms زمن الاستجابة (الحد الأقصى) 0ms زمن الاستجابة (الإجمالي) 0ms يُعد الاختبار ناجحًا بالكامل فقط إذا نجحت كل التكرارات الخاصة به. الترتيب: #24/29 18% Google: Gemini 3 Flash Preview - الاستدلال (medium) 100.0% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 100.0% Google: Gemini 3 Pro Preview - الاستدلال (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 100.0% OpenAI: GPT-5.2 - الاستدلال (medium) 100.0% MoonshotAI: Kimi K2.5 - بدون استدلال 50.0% xAI: Grok 4.1 Fast - بدون استدلال 0.0% 0.0% 100.0% | 5.00 متوسط الدرجة عبر جميع اختبارات القياس. الترتيب: #24/29 18% Google: Gemini 3 Flash Preview - الاستدلال (medium) 10.00 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 10.00 Anthropic: Claude Sonnet 4.6 - الاستدلال (medium) 10.00 Z.ai: GLM 5 - بدون استدلال 10.00 OpenAI: gpt-oss-120b - الاستدلال (medium) 10.00 MoonshotAI: Kimi K2.5 - بدون استدلال 5.00 xAI: Grok 4.1 Fast - بدون استدلال 1.00 1.00 10.00 | 9.99 تعكس درجة الاتساق ثبات النتائج بين التكرارات (10 = ثابت جدًا، حتى لو كان خطأً بشكل ثابت). الترتيب: #20/29 32% Google: Gemini 3 Flash Preview - الاستدلال (medium) 10.00 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 10.00 Google: Gemini 3 Pro Preview - الاستدلال (medium) 10.00 OpenAI: GPT-5.3-Codex - الاستدلال (medium) 10.00 OpenAI: GPT-5.2 - الاستدلال (medium) 10.00 MoonshotAI: Kimi K2.5 - بدون استدلال 9.99 Xiaomi: MiMo-V2-Flash - الاستدلال (medium) 5.80 5.80 10.00 | 50.0% معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التكرارات. الترتيب: #24/29 18% Google: Gemini 3 Flash Preview - الاستدلال (medium) 100.0% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 100.0% Google: Gemini 3 Pro Preview - الاستدلال (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 100.0% OpenAI: GPT-5.2 - الاستدلال (medium) 100.0% MoonshotAI: Kimi K2.5 - بدون استدلال 50.0% xAI: Grok 4.1 Fast - بدون استدلال 0.0% 0.0% 100.0% | 0 الاختبارات غير المستقرة لها نتائج مختلطة بين التكرارات (نجاح واحد على الأقل وفشل واحد على الأقل). الترتيب: #19/29 36% Google: Gemini 3 Flash Preview - الاستدلال (medium) 0 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 0 Google: Gemini 3 Pro Preview - الاستدلال (medium) 0 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 0 Google: Gemini 3 Flash Preview - الاستدلال (low) 0 MoonshotAI: Kimi K2.5 - بدون استدلال 0 Google: Gemini 3 Flash Preview - بدون استدلال 1 0 1 | - يقيس وضوح وكفاءة واتساق الاستدلال بشكل مستقل عن صحة الإجابة النهائية. الترتيب: #19/19 0% Anthropic: Claude Sonnet 4.6 - الاستدلال (medium) 10.00 Z.ai: GLM 5 - الاستدلال (medium) 9.75 StepFun: Step 3.5 Flash - الاستدلال (medium) 9.67 Anthropic: Claude Opus 4.6 - الاستدلال (medium) 9.50 OpenAI: gpt-oss-120b - الاستدلال (medium) 9.50 OpenAI: GPT-5.3-Codex - الاستدلال (medium) 1.00 1.00 10.00 | 0ms | $0.00035 إجمالي التكلفة الترتيب: #7/29 79% StepFun: Step 3.5 Flash - الاستدلال (medium) $0.00000 Z.ai: GLM 4.7 Flash - بدون استدلال $0.00006 Xiaomi: MiMo-V2-Flash - بدون استدلال $0.00008 Qwen: Qwen3 Coder Next - بدون استدلال $0.00013 Qwen: Qwen3 Coder Next - الاستدلال (medium) $0.00014 MoonshotAI: Kimi K2.5 - بدون استدلال $0.00035 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) $0.03134 $0.00000 $0.03134 |
| Puzzle Solving | يُعد الاختبار ناجحًا بالكامل فقط إذا نجحت كل التكرارات الخاصة به. إجابة خاطئة: 2 لم يتبع التعليمات: 1 زمن الاستجابة (المتوسط) 0ms زمن الاستجابة (الحد الأقصى) 0ms زمن الاستجابة (الإجمالي) 0ms يُعد الاختبار ناجحًا بالكامل فقط إذا نجحت كل التكرارات الخاصة به. الترتيب: #24/29 18% Google: Gemini 3 Flash Preview - الاستدلال (medium) 100.0% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 100.0% Google: Gemini 3 Pro Preview - الاستدلال (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 100.0% Google: Gemini 3 Flash Preview - الاستدلال (low) 100.0% MoonshotAI: Kimi K2.5 - بدون استدلال 0.0% StepFun: Step 3.5 Flash - الاستدلال (medium) 0.0% 0.0% 100.0% | 2.00 متوسط الدرجة عبر جميع اختبارات القياس. الترتيب: #23/29 21% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 10.00 Google: Gemini 3 Pro Preview - الاستدلال (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 10.00 Google: Gemini 3 Flash Preview - الاستدلال (low) 10.00 Anthropic: Claude Sonnet 4.6 - الاستدلال (medium) 10.00 MoonshotAI: Kimi K2.5 - بدون استدلال 2.00 Xiaomi: MiMo-V2-Flash - الاستدلال (medium) 1.00 1.00 10.00 | 9.92 تعكس درجة الاتساق ثبات النتائج بين التكرارات (10 = ثابت جدًا، حتى لو كان خطأً بشكل ثابت). الترتيب: #14/29 54% Google: Gemini 3 Flash Preview - الاستدلال (medium) 10.00 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 10.00 Google: Gemini 3 Pro Preview - الاستدلال (medium) 10.00 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 10.00 Google: Gemini 3 Flash Preview - الاستدلال (low) 10.00 MoonshotAI: Kimi K2.5 - بدون استدلال 9.92 MiniMax: MiniMax M2.5 - الاستدلال (medium) 4.79 4.79 10.00 | 0.0% معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التكرارات. الترتيب: #26/29 11% Google: Gemini 3 Flash Preview - الاستدلال (medium) 100.0% Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 100.0% Google: Gemini 3 Pro Preview - الاستدلال (medium) 100.0% Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 100.0% Google: Gemini 3 Flash Preview - الاستدلال (low) 100.0% MoonshotAI: Kimi K2.5 - بدون استدلال 0.0% OpenAI: GPT-4o-mini - بدون استدلال 0.0% 0.0% 100.0% | 0 الاختبارات غير المستقرة لها نتائج مختلطة بين التكرارات (نجاح واحد على الأقل وفشل واحد على الأقل). الترتيب: #14/29 54% Google: Gemini 3 Flash Preview - الاستدلال (medium) 0 Google: Gemini 3.1 Pro Preview - الاستدلال (medium) 0 Google: Gemini 3 Pro Preview - الاستدلال (medium) 0 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) 0 Google: Gemini 3 Flash Preview - الاستدلال (low) 0 MoonshotAI: Kimi K2.5 - بدون استدلال 0 OpenAI: GPT-5 Nano - الاستدلال (medium) 2 0 2 | - يقيس وضوح وكفاءة واتساق الاستدلال بشكل مستقل عن صحة الإجابة النهائية. الترتيب: #19/19 0% Z.ai: GLM 5 - الاستدلال (medium) 9.50 Anthropic: Claude Sonnet 4.6 - الاستدلال (medium) 9.44 Anthropic: Claude Opus 4.6 - الاستدلال (medium) 9.44 MoonshotAI: Kimi K2.5 - الاستدلال (medium) 9.26 StepFun: Step 3.5 Flash - الاستدلال (medium) 9.22 Qwen: Qwen3 Coder Next - الاستدلال (medium) 4.33 4.33 9.50 | 0ms | $0.00090 إجمالي التكلفة الترتيب: #9/29 71% StepFun: Step 3.5 Flash - الاستدلال (medium) $0.00000 Z.ai: GLM 4.7 Flash - بدون استدلال $0.00008 OpenAI: GPT-4o-mini - بدون استدلال $0.00028 xAI: Grok 4.1 Fast - بدون استدلال $0.00053 Qwen: Qwen3 Coder Next - الاستدلال (medium) $0.00058 MoonshotAI: Kimi K2.5 - بدون استدلال $0.00090 Qwen: Qwen3.5 Plus 2026-02-15 - الاستدلال (medium) $0.05508 $0.00000 $0.05508 |