API خرابی ناکامی درجہ بندی

دیکھیں کہ کن AI ماڈلز میں API خرابی سب سے زیادہ ہوتا ہے، تاکہ آپ انتخاب سے پہلے قابلِ اعتماد ہونے کے خطرات سمجھ سکیں۔ ترتیب دیں حسب: درست ٹیسٹس ↑.

دکھائے گئے ماڈلز

کل ناکامیاں

161

سب سے زیادہ متاثر ماڈل

Nemotron 3 Nano Omni 30b A3b Reasoning 6

زمرے

زمرہ کوڈنگ میں45 زمرہ مشترکہ میں26 زمرہ ٹول کالنگ میں17 زمرہ اینٹی اے آئی چالیں میں14 زمرہ ڈیٹا پارسنگ اور استخراج میں14 زمرہ معلومات عامہ میں13 زمرہ عمومی ذہانت میں12 زمرہ پہیلی حل کرنا میں12 زمرہ ڈومین مخصوص میں7 زمرہ ہدایات کی پیروی میں1

68/68

درجہ	ماڈل	کمپنی	API خرابی کی تعداد	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#173	DeepSeek V3.2 none	DeepSeek	4	5.0	$0.054	6/22	18.3s
کل ٹیسٹس 22 غلط ٹیسٹس 16 کل لاگت $0.054 ردِعمل کا وقت (اوسط) 18.3s
#178	Ling-2.6-flash none	Inclusionai	2	4.9	$0.002	6/22	10.7s
کل ٹیسٹس 22 غلط ٹیسٹس 16 کل لاگت $0.002 ردِعمل کا وقت (اوسط) 10.7s
#195	Elephant Alpha medium	Openrouter	3	4.3	$0.000	6/21	1.27s
کل ٹیسٹس 21 غلط ٹیسٹس 15 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 1.27s
#198	Laguna Xs.2 medium	Poolside	4	4.1	$0.015	6/19	6.73s
کل ٹیسٹس 19 غلط ٹیسٹس 13 کل لاگت $0.015 ردِعمل کا وقت (اوسط) 6.73s
#206	gpt-oss-120b none	OpenAI	3	3.7	$0.010	6/19	21.6s
کل ٹیسٹس 19 غلط ٹیسٹس 13 کل لاگت $0.010 ردِعمل کا وقت (اوسط) 21.6s
#144	KAT-Coder-Air V2.5 high	Kwaipilot	3	5.6	$0.077	7/22	15.9s
کل ٹیسٹس 22 غلط ٹیسٹس 15 کل لاگت $0.077 ردِعمل کا وقت (اوسط) 15.9s
#158	KAT-Coder-Air V2.5 low	Kwaipilot	2	5.4	$0.041	7/22	10.1s
کل ٹیسٹس 22 غلط ٹیسٹس 15 کل لاگت $0.041 ردِعمل کا وقت (اوسط) 10.1s
#147	Mimo V2 PRO none	Xiaomi	1	5.6	$0.045	7/21	2.27s
کل ٹیسٹس 21 غلط ٹیسٹس 14 کل لاگت $0.045 ردِعمل کا وقت (اوسط) 2.27s
#188	Cobuddy medium	Baidu	1	4.7	$0.000	7/21	39.9s
کل ٹیسٹس 21 غلط ٹیسٹس 14 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 39.9s
#196	Hunter Alpha none	OpenRouter	1	4.2	$0.000	6/18	4.70s
کل ٹیسٹس 18 غلط ٹیسٹس 12 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 4.70s
#129	Nemotron 3 Ultra none	NVIDIA	1	6.1	$0.095	8/22	3.87s
کل ٹیسٹس 22 غلط ٹیسٹس 14 کل لاگت $0.095 ردِعمل کا وقت (اوسط) 3.87s
#140	Nemotron 3 Super medium	NVIDIA	4	5.7	$0.050	8/22	52.0s
کل ٹیسٹس 22 غلط ٹیسٹس 14 کل لاگت $0.050 ردِعمل کا وقت (اوسط) 52.0s
#149	KAT-Coder-Air V2.5 medium	Kwaipilot	1	5.6	$0.048	8/22	8.42s
کل ٹیسٹس 22 غلط ٹیسٹس 14 کل لاگت $0.048 ردِعمل کا وقت (اوسط) 8.42s
#202	Grok Build 0.1 none	X AI	3	4.0	$0.547	7/19	28.7s
کل ٹیسٹس 19 غلط ٹیسٹس 12 کل لاگت $0.547 ردِعمل کا وقت (اوسط) 28.7s
#146	Owl Alpha medium	Openrouter	1	5.6	$0.000	8/21	11.9s
کل ٹیسٹس 21 غلط ٹیسٹس 13 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 11.9s

←

1 2 3 4 5

→

API خرابی ناکامیاں

ماڈلز فلٹر کریں

API خرابی کی تعداد کے لحاظ سے سرفہرست ماڈلز

API خرابی کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز