ترتيب النماذج لفئة حل الألغاز

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في حل الألغاز، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات. الترتيب حسب: المقياس ↑.

النماذج المعروضة

متوسط درجة حل الألغاز

6.7

أفضل نموذج

Step 3.5 Flash 0.0

أسباب الفشل

مع سبب الفشل إجابة خاطئة204 مع سبب الفشل لم يتبع التعليمات90 مع سبب الفشل خطأ API12 مع سبب الفشل تنسيق إضافي8 مع سبب الفشل انتهت المهلة5 مع سبب الفشل لا توجد إجابة3

216/216

الترتيب	النموذج	الشركة	درجة حل الألغاز	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#204	Laguna Xs.2 medium	Poolside	5.3	4.1	$0.015	1/3	1.93s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.015 زمن الاستجابة (المتوسط) 1.93s
#206	MiMo-V2-Flash none	Xiaomi	5.3	4.0	$0.025	1/3	1.86s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.025 زمن الاستجابة (المتوسط) 1.86s
#211	Laguna Xs.2 none	Poolside	5.3	3.8	$0.004	1/3	650ms
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.004 زمن الاستجابة (المتوسط) 650ms
#81	Kimi K2.5 medium	Moonshot AI	5.3	7.0	$0.600	1/3	43.2s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.600 زمن الاستجابة (المتوسط) 43.2s
#154	Owl Alpha none	Openrouter	5.4	5.6	$0.000	1/3	4.18s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 4.18s
#64	LongCat 2.0 medium	Meituan	5.4	7.4	$0.478	1/3	8.84s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.478 زمن الاستجابة (المتوسط) 8.84s
#82	Mercury 2 medium	Inception	5.4	7.0	$0.093	1/3	949ms
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.093 زمن الاستجابة (المتوسط) 949ms
#142	GPT-5.4 Mini none	OpenAI	5.4	5.9	$0.095	1/3	836ms
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.095 زمن الاستجابة (المتوسط) 836ms
#174	MiMo-V2.5 none	Xiaomi	5.4	5.1	$0.025	1/3	2.13s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.025 زمن الاستجابة (المتوسط) 2.13s
#186	GPT-5.4 Nano none	OpenAI	5.4	4.8	$0.041	1/3	1.25s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.041 زمن الاستجابة (المتوسط) 1.25s
#55	Nemotron 3 Ultra medium	NVIDIA	5.5	7.5	$0.774	1/3	3.54s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.774 زمن الاستجابة (المتوسط) 3.54s
#176	GLM 5 Turbo none	Z.ai	5.5	5.1	$0.047	1/3	2.65s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.047 زمن الاستجابة (المتوسط) 2.65s
#183	Nemotron 3 Super none	NVIDIA	5.5	4.9	$0.008	1/3	2.36s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.008 زمن الاستجابة (المتوسط) 2.36s
#71	Step 3.7 Flash low	Stepfun	5.5	7.3	$0.454	1/3	1.84s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.454 زمن الاستجابة (المتوسط) 1.84s
#145	GPT-5.4 none	OpenAI	5.6	5.8	$0.397	1/3	1.44s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.397 زمن الاستجابة (المتوسط) 1.44s

ترتيب حل الألغاز

تصفية النماذج

أفضل النماذج حسب درجة حل الألغاز

درجة حل الألغاز مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)