ڈومین مخصوص x ٹائم آؤٹ درجہ بندی

دیکھیں کہ ڈومین مخصوص میں کن AI ماڈلز کو ٹائم آؤٹ پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↑.

دکھائے گئے ماڈلز

کل ناکامیاں

سب سے زیادہ متاثر ماڈل

Claude Sonnet 4.6 1

ناکامی کی وجوہات

غلط جواب412 ٹائم آؤٹ43 اضافی فارمیٹنگ17 کوئی جواب نہیں8 API خرابی7 ہدایات پر عمل نہیں کیا1

زمرے

ڈومین مخصوص43 کوڈنگ26 مشترکہ5 پہیلی حل کرنا5 اینٹی اے آئی چالیں4 عمومی ذہانت4 ڈیٹا پارسنگ اور استخراج1 ہدایات کی پیروی1

32/32

درجہ	ماڈل	کمپنی	ٹائم آؤٹ کی تعداد	زمرہ اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#40	Claude Sonnet 4.6 medium	Anthropic	1	2.9	$2.057	0/3	0ms
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $2.057 ردِعمل کا وقت (اوسط) 0ms
#42	GLM 5 medium	Z.ai	1	3.5	$0.307	0/3	0ms
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.307 ردِعمل کا وقت (اوسط) 0ms
#80	Seed-2.0-Mini medium	Bytedance Seed	3	3.0	$0.101	0/3	0ms
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.101 ردِعمل کا وقت (اوسط) 0ms
#15	Claude Opus 4.7 medium	Anthropic	1	7.7	$1.477	2/3	1.17s
کل ٹیسٹس 3 غلط ٹیسٹس 1 کل لاگت $1.477 ردِعمل کا وقت (اوسط) 1.17s
#109	Mimo V2 PRO medium	Xiaomi	1	5.3	$0.333	1/3	8.82s
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.333 ردِعمل کا وقت (اوسط) 8.82s
#184	Hunter Alpha medium	OpenRouter	1	3.0	$0.000	0/3	10.5s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 10.5s
#140	Nemotron 3 Super medium	NVIDIA	1	2.9	$0.050	0/3	16.2s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.050 ردِعمل کا وقت (اوسط) 16.2s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	1	5.3	$0.437	1/3	17.5s
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.437 ردِعمل کا وقت (اوسط) 17.5s
#172	MiniMax M2.7 medium	Minimax	2	3.0	$0.163	0/3	19.0s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.163 ردِعمل کا وقت (اوسط) 19.0s
#95	Gemma 4 26B A4B medium	Google	1	2.9	$0.089	0/3	23.6s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.089 ردِعمل کا وقت (اوسط) 23.6s
#76	DeepSeek V3.2 medium	DeepSeek	1	2.9	$0.078	0/3	24.3s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.078 ردِعمل کا وقت (اوسط) 24.3s
#74	GLM 5.1 medium	Z.ai	1	5.3	$0.535	1/3	29.8s
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.535 ردِعمل کا وقت (اوسط) 29.8s
#26	GPT-5 Mini medium	OpenAI	1	3.6	$0.237	0/3	44.6s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.237 ردِعمل کا وقت (اوسط) 44.6s
#38	GLM 5.2 medium	Z.ai	1	4.1	$0.222	0/3	45.5s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.222 ردِعمل کا وقت (اوسط) 45.5s
#49	GLM 5 Turbo medium	Z.ai	1	2.9	$0.323	0/3	71.1s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.323 ردِعمل کا وقت (اوسط) 71.1s

ماڈلز فلٹر کریں

ٹائم آؤٹ کی تعداد کے لحاظ سے سرفہرست ماڈلز

ٹائم آؤٹ کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز

تخمینی ضائع لاگت کے لحاظ سے سرفہرست ماڈلز

ڈومین مخصوص: ٹائم آؤٹ

ماڈلز فلٹر کریں

ٹائم آؤٹ کی تعداد کے لحاظ سے سرفہرست ماڈلز

ٹائم آؤٹ کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز

تخمینی ضائع لاگت کے لحاظ سے سرفہرست ماڈلز