AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
Your ad here

#33

GPT-5 Mini

OpenAI · اجرا: 2025-08-07 · openai/gpt-5-mini::medium

اوسط اسکور

5.77

فی نتیجہ لاگت

1.200

تسلسل

8.80

کل لاگت

$0.084

درست ٹیسٹس

7

کوئی ٹیسٹ تبھی مکمل کامیاب شمار ہوگا جب اس کے تمام رنز کامیاب ہوں

غلط ٹیسٹس

7

فی کوشش کامیابی کی شرح: 57.1%

غیر مستحکم ٹیسٹ

2

ردِعمل کا وقت: اوسط 21.47s · کل 300.64s · زیادہ سے زیادہ 82.55s

ہدایات پر عمل نہیں کیا: 3 غلط جواب: 3 ٹائم آؤٹ: 1

اسکور کے لحاظ سے سرفہرست ماڈلز

پہلا ماڈل منتخب کریں، پھر دوسرا ماڈل کلک کریں تاکہ سائیڈ بائی سائیڈ صفحہ کھلے۔

فوری موازنہ

زمرہ وار تفصیل

زمرہ اوسط اسکور تسلسل درست ٹیسٹس
Anti-AI Tricks 7.00 9.62 2/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 1.00 7.21 0/3
Instructions following 7.00 6.64 1/2
Puzzle Solving 4.34 9.78 1/3
Tool Calling 10.00 10.00 1/1