التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs Google: Gemini 3 Flash Preview

الملخص

مقارنة benchmark بين Claude Opus 4.7 و Gemini 3 Flash Preview: يتقدم Claude Opus 4.7 في متوسط النتيجة بـ 8.9 مقابل 8.4. لدى Gemini 3 Flash Preview تكلفة benchmark أقل عند $0.111 مقابل $0.505. Claude Opus 4.7 أسرع عند 3.02s مقابل 5.76s، مع معدلات نجاح 84.2% مقابل 79.4%.

النموذج الموصى به: Gemini 3 Flash Preview - Its score stays close to the best score here (8.4 vs 8.9), while costing about 4.6x less than Claude Opus 4.7.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-04

المقياس Claude Opus 4.7 Claude Opus 4.7 none الإصدار: 2026-04-16 Gemini 3 Flash Preview Gemini 3 Flash Preview low الإصدار: 2025-12-17
النتيجة 8.9 8.4
الترتيب #8 #16
الموثوقية 10.0 10.0
الاتساق 10.0 9.2
اختبارات صحيحة
معدل النجاح لكل محاولة 84.2% 79.4%
اختبارات غير مستقرة 0 2
إجمالي مرات التشغيل 57 63
التكلفة لكل نتيجة 3.154 0.689
إجمالي التكلفة $0.505 $0.111
سعر الإدخال $5.000 / 1M $0.500 / 1M
سعر الإخراج $25.000 / 1M $3.000 / 1M
إجمالي رموز الإدخال 69,576 36,769
رموز الإخراج 6,265 2,076
رموز الاستدلال 0 28,518
زمن الاستجابة (المتوسط) 3.02s 5.76s
زمن الاستجابة (الحد الأقصى) 18.27s 14.72s
زمن الاستجابة (الإجمالي) 57.44s 120.93s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#8 Claude Opus 4.7

none
Cost
$0.051
Time
24.2s
Tokens
2,181 tok

#16 Gemini 3 Flash Preview

low
Cost
$0.007
Time
12.1s
Tokens
2,289 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Claude Opus 4.7 8.3 10.0 75.0% 0 2.12s 894 522 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.48s 500 281 3,082
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Claude Opus 4.7 10.0 10.0 100.0% 0 2.84s 1,176 494 0
Gemini 3 Flash Preview 5.8 7.2 44.4% 1 6.00s 8,122 456 7,421
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Claude Opus 4.7 9.5 10.0 100.0% 0 18.27s 37,740 3,504 0
Gemini 3 Flash Preview 3.0 10.0 0.0% 0 3.27s 12,860 326 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Claude Opus 4.7 10.0 10.0 100.0% 0 2.15s 10,533 324 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.40s 7,261 279 3,656
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Claude Opus 4.7 7.7 10.0 66.7% 0 1.19s 1,020 78 0
Gemini 3 Flash Preview 5.3 7.2 44.4% 1 8.05s 645 12 6,410
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Claude Opus 4.7 10.0 10.0 100.0% 0 3.47s 723 257 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.68s 492 120 981
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Claude Opus 4.7 10.0 10.0 100.0% 0 1.46s 939 114 0
Gemini 3 Flash Preview 9.9 10.0 100.0% 0 7.02s 621 71 2,752
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Claude Opus 4.7 10.0 10.0 100.0% 0 2.46s 939 597 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.77s 562 288 3,168
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Claude Opus 4.7 10.0 10.0 100.0% 0 4.74s 15,339 372 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.99s 5,550 234 415
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Claude Opus 4.7 3.0 10.0 0.0% 0 1.46s 273 3 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 2.75s 156 9 633

مقارنة سريعة

تبديل زوج المقارنة