AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
Your ad here

#44

GPT-5.4

OpenAI · اجرا: 2026-03-05 · openai/gpt-5.4::none

اوسط اسکور

46

فی نتیجہ لاگت

1.496

تسلسل

89

کل لاگت

$0.090

درست ٹیسٹس

6

کوئی ٹیسٹ تبھی مکمل کامیاب شمار ہوگا جب اس کے تمام رنز کامیاب ہوں

غلط ٹیسٹس

9

فی کوشش کامیابی کی شرح: 44.4%

غیر مستحکم ٹیسٹ

2

ردِعمل کا وقت: اوسط 1.46s · کل 21.86s · زیادہ سے زیادہ 2.89s

غلط جواب: 8 ہدایات پر عمل نہیں کیا: 1

اسکور کے لحاظ سے سرفہرست ماڈلز

پہلا ماڈل منتخب کریں، پھر دوسرا ماڈل کلک کریں تاکہ سائیڈ بائی سائیڈ صفحہ کھلے۔

فوری موازنہ

زمرہ وار تفصیل

زمرہ اوسط اسکور تسلسل درست ٹیسٹس
Anti-AI Tricks 100 73 0/3
Combined 100 100 0/1
Data parsing and extraction 99 100 2/2
Domain specific 40 72 1/3
Instructions following 55 100 1/2
Puzzle Solving 40 98 1/3
Tool Calling 100 100 1/1