#12
GPT-5.2 Chat
OpenAI · اجرا: 2025-12-11 · openai/gpt-5.2-chat::none
اوسط اسکور
7.42
فی نتیجہ لاگت
2.261
تسلسل
9.45
کل لاگت
$0.227
درست ٹیسٹس
10
کوئی ٹیسٹ تبھی مکمل کامیاب شمار ہوگا جب اس کے تمام رنز کامیاب ہوں
غلط ٹیسٹس
4
فی کوشش کامیابی کی شرح: 73.8%
غیر مستحکم ٹیسٹ
1
ردِعمل کا وقت: اوسط 7.16s · کل 100.19s · زیادہ سے زیادہ 38.52s
غلط جواب: 3
ہدایات پر عمل نہیں کیا: 1
اسکور کے لحاظ سے سرفہرست ماڈلز
پہلا ماڈل منتخب کریں، پھر دوسرا ماڈل کلک کریں تاکہ سائیڈ بائی سائیڈ صفحہ کھلے۔
فوری موازنہ
GPT-5.2 ChatnonevsClaude Sonnet 4.6mediumGPT-5.2 ChatnonevsGLM 5mediumGPT-5.2 ChatnonevsGemini 3.1 Flash Lite PreviewnoneGPT-5.2 ChatnonevsGPT-5.3 ChatnoneGPT-5.2 ChatnonevsGemini 3.1 Flash Lite PreviewhighGPT-5.2 ChatnonevsGemini 3 Flash PreviewnoneGPT-5.2 ChatnonevsGemini 3 Flash PreviewmediumGPT-5.2 ChatnonevsGemini 3.1 Pro PreviewmediumGPT-5.2 ChatnonevsStep 3.5 Flashmediumمفت دستیاب
زمرہ وار تفصیل
| زمرہ | اوسط اسکور | تسلسل | درست ٹیسٹس |
|---|---|---|---|
| Anti-AI Tricks | 10.00 | 10.00 | 3/3 |
| Data parsing and extraction | 9.88 | 10.00 | 2/2 |
| Domain specific | 4.00 | 10.00 | 1/3 |
| Instructions following | 5.50 | 6.13 | 1/2 |
| Puzzle Solving | 7.00 | 10.00 | 2/3 |
| Tool Calling | 10.00 | 10.00 | 1/1 |