AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs OpenAI: GPT-4o-mini

الملخص

مقارنة benchmark بين Kimi K2.5 و GPT-4o-mini: يتقدم Kimi K2.5 في متوسط النتيجة بـ 5.5 مقابل 5.0. لدى GPT-4o-mini تكلفة benchmark أقل عند $0.006 مقابل $0.027. GPT-4o-mini أسرع عند 1.77s مقابل 13.18s، مع معدلات نجاح 34.9% مقابل 23.8%.

النموذج الموصى به: Kimi K2.5 - It has the strongest score in this comparison (5.5) and the best overall balance of cost and response time across all 2 models.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-02

المقياس	Kimi K2.5 Kimi K2.5 none الإصدار: 2026-01-27	GPT-4o-mini GPT-4o-mini none الإصدار: 2024-07-18

المقياس	Kimi K2.5 Kimi K2.5 none الإصدار: 2026-01-27	GPT-4o-mini GPT-4o-mini none الإصدار: 2024-07-18
النتيجة	5.5	5.0
الترتيب	#122	#144
الموثوقية	10.0	10.0
الاتساق	8.9	9.9
اختبارات صحيحة
معدل النجاح لكل محاولة	34.9%	23.8%
اختبارات غير مستقرة	3	0
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	0.442	0.119
إجمالي التكلفة	$0.027	$0.006
سعر الإدخال	$0.375 / 1M	$0.150 / 1M
سعر الإخراج	$2.025 / 1M	$0.600 / 1M
إجمالي رموز الإدخال	36,034	31,518
رموز الإخراج	6,657	1,982
رموز الاستدلال	0	0
زمن الاستجابة (المتوسط)	13.18s	1.77s
زمن الاستجابة (الحد الأقصى)	42.13s	7.58s
زمن الاستجابة (الإجمالي)	184.47s	24.80s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#122 MoonshotAI: Kimi K2.5

none

التكلفة: $0.015
الوقت: 89.1s
الرموز: 5,421 tok

#144 GPT-4o-mini

none

التكلفة: $0.001
الوقت: 6.6s
الرموز: 742 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Kimi K2.5	3.6	8.4	8.3%	1		6.24s	652	373	0
GPT-4o-mini	4.8	10.0	25.0%	0		1.34s	618	186	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Kimi K2.5	5.5	10.0	33.3%	0		24.56s	7,311	4,708	0
GPT-4o-mini	3.2	9.6	0.0%	0		1.63s	7,314	367	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Kimi K2.5	2.8	2.1	33.3%	1		19.16s	12,264	748	0
GPT-4o-mini	3.0	10.0	0.0%	0		7.58s	8,298	568	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Kimi K2.5	7.3	5.8	83.3%	1		42.13s	7,180	187	0
GPT-4o-mini	10.0	10.0	100.0%	0		1.27s	7,161	183	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Kimi K2.5	5.3	10.0	33.3%	0		4.38s	753	29	0
GPT-4o-mini	3.0	10.0	0.0%	0		637ms	732	15	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Kimi K2.5	10.0	10.0	100.0%	0		4.00s	483	76	0
GPT-4o-mini	4.0	10.0	0.0%	0		909ms	480	66	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Kimi K2.5	6.5	10.0	50.0%	0		2.67s	677	60	0
GPT-4o-mini	6.3	10.0	50.0%	0		1.11s	666	69	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Kimi K2.5	3.0	10.0	0.0%	0		4.04s	667	236	0
GPT-4o-mini	3.5	10.0	0.0%	0		1.21s	651	308	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Kimi K2.5	10.0	10.0	100.0%	0		13.99s	5,835	220	0
GPT-4o-mini	10.0	10.0	100.0%	0		2.51s	5,400	205	0

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Kimi K2.5	3.0	10.0	0.0%	0		3.90s	212	20	0
GPT-4o-mini	3.0	10.0	0.0%	0		794ms	198	15	0

مقارنة سريعة

تبديل زوج المقارنة

CobuddymediumvsGPT-4o-mininone Mistral Small 4mediumvsGPT-4o-mininone MiniMax M2.5mediumvsGPT-4o-mininone MiniMax M2.7mediumvsGPT-4o-mininone GPT-4o-mininonevsQwen3 Coder Nextmedium MiniMax M2.7mediumvsKimi K2.5none North Mini Codemediumمتاح مجانًاvsKimi K2.5none Mistral Small 4mediumvsKimi K2.5none CobuddymediumvsKimi K2.5none Gemini 3.1 Flash LiteminimalvsKimi K2.5none GPT-4o-mininonevsGLM 4.7 Flashmedium MiniMax M2.5mediumvsKimi K2.5none