Claude Opus 4.7 (medium) vs Gemini 3.1 Flash Lite Preview (low)

يتقدم Claude Opus 4.7 (medium) في متوسط النتيجة بـ 8.7 مقابل 6.5. لدى Gemini 3.1 Flash Lite Preview (low) تكلفة benchmark أقل عند $0.646 مقابل $1.477. Claude Opus 4.7 (medium) أسرع عند 7.61s مقابل 16.70s، مع معدلات نجاح 83.3% مقابل 59.1%.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-25

الترتيب: #20
إجمالي رموز الإخراج: 29,990
زمن الاستجابة (المتوسط): 7.61s
إجمالي التكلفة: $1.477

الترتيب: #114
إجمالي رموز الإخراج: 412,200
زمن الاستجابة (المتوسط): 16.70s
إجمالي التكلفة: $0.646

النموذج الموصى به Claude Opus 4.7 (medium)

It has the best score here (8.7), while responding about 2.2x faster than Gemini 3.1 Flash Lite Preview (low).

مقارنة تفصيلية

المقياس	Claude Opus 4.7 Claude Opus 4.7 medium الإصدار: 2026-04-16	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low الإصدار: 2026-03-03

المقياس	Claude Opus 4.7 Claude Opus 4.7 medium الإصدار: 2026-04-16	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low الإصدار: 2026-03-03
النتيجة	8.7	6.5
الترتيب	#20	#114
الموثوقية	10.0	10.0
الاتساق	9.6	10.0
اختبارات صحيحة
معدل النجاح لكل محاولة	83.3%	59.1%
اختبارات غير مستقرة	1	0
إجمالي مرات التشغيل	66	66
التكلفة لكل نتيجة	8.201	4.969
إجمالي التكلفة	$1.477	$0.646
سعر الإدخال	$5.000 / 1M	$0.250 / 1M
سعر الإخراج	$25.000 / 1M	$1.500 / 1M
إجمالي رموز الإدخال	145,252	110,185
رموز الإخراج	24,948	14,717
رموز الاستدلال	5,042	397,483
زمن الاستجابة (المتوسط)	7.61s	16.70s
زمن الاستجابة (الحد الأقصى)	65.40s	309.35s
زمن الاستجابة (الإجمالي)	159.91s	367.47s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#20 Claude Opus 4.7

medium

التكلفة: $0.059
الوقت: 26.8s
الرموز: 2,475 tok

#114 Gemini 3.1 Flash Lite Preview

low

التكلفة: $0.002
الوقت: 3.7s
الرموز: 1,203 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

الفئة:

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	894	348	0
Gemini 3.1 Flash Lite Preview	8.3	10.0	75.0%	0		2.12s	506	462	1,638

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.7	7.6	7.2	77.8%	1		12.96s	10,635	7,629	1,114
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		1.39s	8,138	660	1,060

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.7	10.0	10.0	100.0%	0		43.42s	104,347	15,459	3,928
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		160.63s	85,851	12,656	389,079

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	10,533	324	0
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.00s	7,455	291	696

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	630	51	0
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		2.36s	641	18	1,212

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	723	256	0
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		1.54s	490	69	384

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	939	114	0
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.49s	621	72	753

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.7	10.0	10.0	100.0%	0		2.43s	939	370	0
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.69s	566	243	1,248

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	15,339	373	0
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		9.54s	5,757	237	993

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.7	3.0	10.0	0.0%	0		2.25s	273	24	0
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		1.35s	160	9	420

مقارنة سريعة

تبديل زوج المقارنة