AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Hunter Alpha

الملخص

مقارنة benchmark بين Gemini 3 Flash Preview و Hunter Alpha: يتقدم Gemini 3 Flash Preview في متوسط النتيجة بـ 9.8 مقابل 5.7. لدى Hunter Alpha تكلفة benchmark أقل عند $0.000 مقابل $0.667. Hunter Alpha أسرع عند 4.70s مقابل 18.64s، مع معدلات نجاح 98.4% مقابل 46.3%.

النموذج الموصى به: Gemini 3 Flash Preview - It has the strongest score in this comparison (9.8) and the best overall balance of cost and response time across all 2 models.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-10

المقياس	Gemini 3 Flash Preview Gemini 3 Flash Preview medium الإصدار: 2025-12-17	Hunter Alpha Hunter Alpha none الإصدار: 2026-03-11

المقياس	Gemini 3 Flash Preview Gemini 3 Flash Preview medium الإصدار: 2025-12-17	Hunter Alpha Hunter Alpha none الإصدار: 2026-03-11
النتيجة	9.8	5.7
الترتيب	#1	#117
الموثوقية	10.0	غير متاح
الاتساق	9.7	8.2
اختبارات صحيحة
معدل النجاح لكل محاولة	98.4%	46.3%
اختبارات غير مستقرة	1	4
إجمالي مرات التشغيل	63	52
التكلفة لكل نتيجة	3.335	0.000
إجمالي التكلفة	$0.667	$0.000
سعر الإدخال	$0.500 / 1M	$0.000 / 1M
سعر الإخراج	$3.000 / 1M	$0.000 / 1M
إجمالي رموز الإدخال	37,017	34,329
رموز الإخراج	2,006	2,264
رموز الاستدلال	214,153	0
زمن الاستجابة (المتوسط)	18.64s	4.70s
زمن الاستجابة (الحد الأقصى)	117.26s	15.17s
زمن الاستجابة (الإجمالي)	391.35s	79.86s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#1 Gemini 3 Flash Preview

medium

Cost: $0.010
Time: 17.9s
Tokens: 3,236 tok

#117 Hunter Alpha

none

Hunter Alpha was a stealth model revealed on March 18th as an early testing version of MiMo-V2-Pro. Find it here: https://openrouter.ai/xiaomi/mimo-v2-pro

Cost: $0.000
Time: 0.0s
Tokens: 0 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		3.88s	494	330	3,216
Hunter Alpha	3.5	8.0	16.7%	1		3.81s	645	779	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3 Flash Preview	8.6	7.6	88.9%	1		84.40s	8,122	462	161,084
Hunter Alpha	3.0	10.0	0.0%	0		0ms	0	0	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		22.42s	12,873	351	10,485
Hunter Alpha	3.0	10.0	0.0%	0		15.17s	15,075	379	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		5.43s	7,548	279	4,893
Hunter Alpha	10.0	10.0	100.0%	0		8.49s	7,758	249	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		15.27s	633	12	21,684
Hunter Alpha	5.3	10.0	33.3%	0		2.33s	753	27	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		5.19s	486	72	1,905
Hunter Alpha	6.1	3.1	66.7%	1		2.71s	498	91	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		4.04s	615	72	2,709
Hunter Alpha	6.4	10.0	50.0%	0		2.82s	684	69	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		4.05s	558	183	4,365
Hunter Alpha	5.8	4.4	66.7%	2		3.71s	678	335	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		12.60s	5,532	234	1,487
Hunter Alpha	10.0	10.0	100.0%	0		6.02s	8,238	335	0

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		5.50s	156	11	2,325
Hunter Alpha	-	-	-	-	-	-	-	-	-

مقارنة سريعة

تبديل زوج المقارنة