API خرابی ناکامی درجہ بندی

دیکھیں کہ کن AI ماڈلز میں API خرابی سب سے زیادہ ہوتا ہے، تاکہ آپ انتخاب سے پہلے قابلِ اعتماد ہونے کے خطرات سمجھ سکیں۔ ترتیب دیں حسب: درست ٹیسٹس ↑.

دکھائے گئے ماڈلز

کل ناکامیاں

161

سب سے زیادہ متاثر ماڈل

Nemotron 3 Nano Omni 30b A3b Reasoning 6

زمرے

زمرہ کوڈنگ میں45 زمرہ مشترکہ میں26 زمرہ ٹول کالنگ میں17 زمرہ اینٹی اے آئی چالیں میں14 زمرہ ڈیٹا پارسنگ اور استخراج میں14 زمرہ معلومات عامہ میں13 زمرہ عمومی ذہانت میں12 زمرہ پہیلی حل کرنا میں12 زمرہ ڈومین مخصوص میں7 زمرہ ہدایات کی پیروی میں1

68/68

درجہ	ماڈل	کمپنی	API خرابی کی تعداد	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#157	Mimo V2 Omni none	Xiaomi	1	5.5	$0.021	8/21	2.44s
کل ٹیسٹس 21 غلط ٹیسٹس 13 کل لاگت $0.021 ردِعمل کا وقت (اوسط) 2.44s
#137	North Mini Code medium	Cohere	1	5.9	$0.000	9/22	137.1s
کل ٹیسٹس 22 غلط ٹیسٹس 13 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 137.1s
#179	Ring-2.6-1T none	Inclusionai	6	4.8	$0.026	9/22	55.1s
کل ٹیسٹس 22 غلط ٹیسٹس 13 کل لاگت $0.026 ردِعمل کا وقت (اوسط) 55.1s
#181	Grok 4.20 Multi Agent Beta medium	X AI	2	4.8	$5.599	8/18	9.69s
کل ٹیسٹس 18 غلط ٹیسٹس 10 کل لاگت $5.599 ردِعمل کا وقت (اوسط) 9.69s
#184	Hunter Alpha medium	OpenRouter	1	4.7	$0.000	8/18	10.3s
کل ٹیسٹس 18 غلط ٹیسٹس 10 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 10.3s
#46	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
کل ٹیسٹس 22 غلط ٹیسٹس 12 کل لاگت $0.200 ردِعمل کا وقت (اوسط) 79.1s
#91	LongCat 2.0 low	Meituan	1	6.7	$0.391	10/22	100.3s
کل ٹیسٹس 22 غلط ٹیسٹس 12 کل لاگت $0.391 ردِعمل کا وقت (اوسط) 100.3s
#115	Gemma 4 31B none	Google	2	6.2	$0.035	10/22	5.34s
کل ٹیسٹس 22 غلط ٹیسٹس 12 کل لاگت $0.035 ردِعمل کا وقت (اوسط) 5.34s
#175	Qwen3.6 Plus Preview medium	Qwen	8	4.9	$0.000	9/19	15.2s
کل ٹیسٹس 19 غلط ٹیسٹس 10 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 15.2s
#186	Laguna M.1 medium	Poolside	4	4.7	$0.033	9/19	14.7s
کل ٹیسٹس 19 غلط ٹیسٹس 10 کل لاگت $0.033 ردِعمل کا وقت (اوسط) 14.7s
#134	Mimo V2 Omni medium	Xiaomi	1	5.9	$0.683	10/21	41.2s
کل ٹیسٹس 21 غلط ٹیسٹس 11 کل لاگت $0.683 ردِعمل کا وقت (اوسط) 41.2s
#153	Hy3 preview low	Tencent	7	5.5	$0.015	10/21	24.6s
کل ٹیسٹس 21 غلط ٹیسٹس 11 کل لاگت $0.015 ردِعمل کا وقت (اوسط) 24.6s
#62	KAT-Coder-Pro V2.5 low	Kwaipilot	1	7.4	$0.387	11/22	19.5s
کل ٹیسٹس 22 غلط ٹیسٹس 11 کل لاگت $0.387 ردِعمل کا وقت (اوسط) 19.5s
#76	DeepSeek V3.2 medium	DeepSeek	2	7.0	$0.078	11/22	68.6s
کل ٹیسٹس 22 غلط ٹیسٹس 11 کل لاگت $0.078 ردِعمل کا وقت (اوسط) 68.6s
#81	KAT-Coder-Pro V2.5 medium	Kwaipilot	1	6.9	$0.467	11/22	24.0s
کل ٹیسٹس 22 غلط ٹیسٹس 11 کل لاگت $0.467 ردِعمل کا وقت (اوسط) 24.0s

←

1 2 3 4 5

→

API خرابی ناکامیاں

ماڈلز فلٹر کریں

API خرابی کی تعداد کے لحاظ سے سرفہرست ماڈلز

API خرابی کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز