#105 GPT-5.4 Nano
none- Cost
- $0.008
- Time
- 46.1s
- Tokens
- 5,735 tok
الملخص
يسجل GPT-5.4 Nano نتيجة 4.5 في AI BENCHY ويحتل المرتبة #105. لديه موثوقية غير متاح، ومعدل نجاح 31.5%، وتكلفة إجمالية $0.009، ومتوسط زمن استجابة 1.40s.
ما الذي يجعل GPT-5.4 Nano مميزًا: يبرز أكثر في البرمجة حيث يحتل #1، بينما تعد تحليل البيانات واستخراجها أضعف نقاطه عند #11. إنه سريع بشكل ملحوظ مقارنة بالنماذج المشابهة.
4.5
الاتساق
7.1
غير متاح
إجمالي رموز الإخراج
2,762
إجمالي رموز الإدخال
0
سعر الإدخال
$0.200 / 1M
سعر الإخراج
$1.250 / 1M
اختبارات غير مستقرة
7
الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).
Generation showcase
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
سجل التشغيل
| تم الاختبار في | النتيجة | الموثوقية | اختبارات صحيحة | إجمالي التكلفة | قارن |
|---|---|---|---|---|---|
| 2026-06-04 13:45 تمت إضافة اختبار جديد | 4.7 | 10.0 | $0.011 | قارن | |
| 2026-05-22 00:19 تغيّرت المجموعة | 4.5 | 10.0 | $0.010 | قارن | |
| 2026-04-11 01:44 أول تشغيل مسجل | 4.5 | غير متاح | $0.009 | التشغيل الحالي |
مقارنة التشغيلات
| التشغيل | النتيجة | الاتساق | الموثوقية | اختبارات صحيحة | اختبارات غير مستقرة | إجمالي رموز الإخراج | إجمالي رموز الإدخال | إجمالي التكلفة | زمن الاستجابة (المتوسط) |
|---|---|---|---|---|---|---|---|---|---|
| 2026-04-11 01:44 · أول تشغيل مسجل | 4.5 | 7.1 | غير متاح | 2/18 | 7 | 2,762 | 0 | $0.009 | 1.40s |
| 2026-05-22 00:19 · تغيّرت المجموعة | 4.5 | 7.6 | 10.0 | 3/20 | 6 | 2,804 | 0 | $0.010 | 1.33s |
| الفرق | 0.0 | -0.5 | -1 | +1 | -42 | 0 | -$0.001 | +64ms |
استخدم هذان التشغيلان مجموعتي اختبارات مختلفتين، لذلك تعكس الفروقات تغييرات النموذج وتغييرات المجموعة معاً.
اختر النموذج الأول، ثم انقر على نموذج ثانٍ لفتح صفحة مقارنة جنبًا إلى جنب.
| الفئة | النتيجة | الاتساق | اختبارات صحيحة |
|---|---|---|---|
| حيل مضادة للذكاء الاصطناعي | 3.5 | 8.0 | |
| البرمجة | 7.1 | 3.7 | |
| مجمّع | 3.0 | 10.0 | |
| تحليل البيانات واستخراجها | 6.5 | 10.0 | |
| خاص بالمجال | 2.9 | 4.4 | |
| الذكاء العام | 3.8 | 2.5 | |
| اتباع التعليمات | 5.0 | 6.8 | |
| حل الألغاز | 3.7 | 7.3 | |
| استدعاء الأدوات | 10.0 | 10.0 |