API خرابی ناکامی درجہ بندی

دیکھیں کہ کن AI ماڈلز میں API خرابی سب سے زیادہ ہوتا ہے، تاکہ آپ انتخاب سے پہلے قابلِ اعتماد ہونے کے خطرات سمجھ سکیں۔ ترتیب دیں حسب: اسکور ↓.

دکھائے گئے ماڈلز

کل ناکامیاں

161

سب سے زیادہ متاثر ماڈل

Muse Spark 1.1 1

زمرے

زمرہ کوڈنگ میں45 زمرہ مشترکہ میں26 زمرہ ٹول کالنگ میں17 زمرہ اینٹی اے آئی چالیں میں14 زمرہ ڈیٹا پارسنگ اور استخراج میں14 زمرہ معلومات عامہ میں13 زمرہ عمومی ذہانت میں12 زمرہ پہیلی حل کرنا میں12 زمرہ ڈومین مخصوص میں7 زمرہ ہدایات کی پیروی میں1

68/68

درجہ	ماڈل	کمپنی	API خرابی کی تعداد	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#27	Muse Spark 1.1 high	Meta	1	8.1	$1.694	12/22	31.5s
کل ٹیسٹس 22 غلط ٹیسٹس 10 کل لاگت $1.694 ردِعمل کا وقت (اوسط) 31.5s
#32	Inkling medium	Thinkingmachines	1	8.0	$0.391	15/22	16.2s
کل ٹیسٹس 22 غلط ٹیسٹس 7 کل لاگت $0.391 ردِعمل کا وقت (اوسط) 16.2s
#33	Kimi K3 max	Moonshot AI	2	8.0	$3.112	16/22	122.5s
کل ٹیسٹس 22 غلط ٹیسٹس 6 کل لاگت $3.112 ردِعمل کا وقت (اوسط) 122.5s
#37	Qwen3.6 Plus medium	Qwen	1	7.8	$0.405	15/22	43.1s
کل ٹیسٹس 22 غلط ٹیسٹس 7 کل لاگت $0.405 ردِعمل کا وقت (اوسط) 43.1s
#46	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
کل ٹیسٹس 22 غلط ٹیسٹس 12 کل لاگت $0.200 ردِعمل کا وقت (اوسط) 79.1s
#51	Nemotron 3 Ultra medium	NVIDIA	1	7.5	$0.774	13/22	32.2s
کل ٹیسٹس 22 غلط ٹیسٹس 9 کل لاگت $0.774 ردِعمل کا وقت (اوسط) 32.2s
#52	Kimi K2.7 Code medium	Moonshot AI	1	7.5	$0.751	12/22	84.2s
کل ٹیسٹس 22 غلط ٹیسٹس 10 کل لاگت $0.751 ردِعمل کا وقت (اوسط) 84.2s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	1	7.5	$0.437	14/22	89.2s
کل ٹیسٹس 22 غلط ٹیسٹس 8 کل لاگت $0.437 ردِعمل کا وقت (اوسط) 89.2s
#60	LongCat 2.0 medium	Meituan	1	7.4	$0.478	12/22	136.6s
کل ٹیسٹس 22 غلط ٹیسٹس 10 کل لاگت $0.478 ردِعمل کا وقت (اوسط) 136.6s
#62	KAT-Coder-Pro V2.5 low	Kwaipilot	1	7.4	$0.387	11/22	19.5s
کل ٹیسٹس 22 غلط ٹیسٹس 11 کل لاگت $0.387 ردِعمل کا وقت (اوسط) 19.5s
#74	GLM 5.1 medium	Z.ai	1	7.1	$0.535	13/22	46.8s
کل ٹیسٹس 22 غلط ٹیسٹس 9 کل لاگت $0.535 ردِعمل کا وقت (اوسط) 46.8s
#76	DeepSeek V3.2 medium	DeepSeek	2	7.0	$0.078	11/22	68.6s
کل ٹیسٹس 22 غلط ٹیسٹس 11 کل لاگت $0.078 ردِعمل کا وقت (اوسط) 68.6s
#79	Gemini 3.5 Flash none	Google	4	7.0	$1.079	15/22	9.93s
کل ٹیسٹس 22 غلط ٹیسٹس 7 کل لاگت $1.079 ردِعمل کا وقت (اوسط) 9.93s
#81	KAT-Coder-Pro V2.5 medium	Kwaipilot	1	6.9	$0.467	11/22	24.0s
کل ٹیسٹس 22 غلط ٹیسٹس 11 کل لاگت $0.467 ردِعمل کا وقت (اوسط) 24.0s
#84	MiMo-V2.5-Pro medium	Xiaomi	1	6.9	$0.187	12/22	33.9s
کل ٹیسٹس 22 غلط ٹیسٹس 10 کل لاگت $0.187 ردِعمل کا وقت (اوسط) 33.9s

1 2 3 4 5

→

API خرابی ناکامیاں

ماڈلز فلٹر کریں

API خرابی کی تعداد کے لحاظ سے سرفہرست ماڈلز

API خرابی کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز