API خرابی ناکامی درجہ بندی

دیکھیں کہ کن AI ماڈلز میں API خرابی سب سے زیادہ ہوتا ہے، تاکہ آپ انتخاب سے پہلے قابلِ اعتماد ہونے کے خطرات سمجھ سکیں۔ ترتیب دیں حسب: ناکامیوں کی تعداد ↑.

دکھائے گئے ماڈلز

کل ناکامیاں

161

سب سے زیادہ متاثر ماڈل

Muse Spark 1.1 1

زمرے

زمرہ کوڈنگ میں45 زمرہ مشترکہ میں26 زمرہ ٹول کالنگ میں17 زمرہ اینٹی اے آئی چالیں میں14 زمرہ ڈیٹا پارسنگ اور استخراج میں14 زمرہ معلومات عامہ میں13 زمرہ عمومی ذہانت میں12 زمرہ پہیلی حل کرنا میں12 زمرہ ڈومین مخصوص میں7 زمرہ ہدایات کی پیروی میں1

68/68

درجہ	ماڈل	کمپنی	API خرابی کی تعداد	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#200	MiMo-V2-Flash none	Xiaomi	1	4.0	$0.025	4/21	2.76s
کل ٹیسٹس 21 غلط ٹیسٹس 17 کل لاگت $0.025 ردِعمل کا وقت (اوسط) 2.76s
#204	Qwen3.5-9B medium	Qwen	1	3.8	$0.036	3/22	82.2s
کل ٹیسٹس 22 غلط ٹیسٹس 19 کل لاگت $0.036 ردِعمل کا وقت (اوسط) 82.2s
#33	Kimi K3 max	Moonshot AI	2	8.0	$3.112	16/22	122.5s
کل ٹیسٹس 22 غلط ٹیسٹس 6 کل لاگت $3.112 ردِعمل کا وقت (اوسط) 122.5s
#76	DeepSeek V3.2 medium	DeepSeek	2	7.0	$0.078	11/22	68.6s
کل ٹیسٹس 22 غلط ٹیسٹس 11 کل لاگت $0.078 ردِعمل کا وقت (اوسط) 68.6s
#90	Qwen3.6 35B A3B medium	Qwen	2	6.7	$0.746	13/22	58.1s
کل ٹیسٹس 22 غلط ٹیسٹس 9 کل لاگت $0.746 ردِعمل کا وقت (اوسط) 58.1s
#108	Ring-2.6-1T medium	Inclusionai	2	6.3	$0.103	11/22	68.7s
کل ٹیسٹس 22 غلط ٹیسٹس 11 کل لاگت $0.103 ردِعمل کا وقت (اوسط) 68.7s
#110	Gemma 4 31B medium	Google	2	6.3	$0.163	14/22	75.4s
کل ٹیسٹس 22 غلط ٹیسٹس 8 کل لاگت $0.163 ردِعمل کا وقت (اوسط) 75.4s
#115	Gemma 4 31B none	Google	2	6.2	$0.035	10/22	5.34s
کل ٹیسٹس 22 غلط ٹیسٹس 12 کل لاگت $0.035 ردِعمل کا وقت (اوسط) 5.34s
#158	KAT-Coder-Air V2.5 low	Kwaipilot	2	5.4	$0.041	7/22	10.1s
کل ٹیسٹس 22 غلط ٹیسٹس 15 کل لاگت $0.041 ردِعمل کا وقت (اوسط) 10.1s
#161	Qwen3.6 35B A3B none	Qwen	2	5.3	$0.061	4/22	5.52s
کل ٹیسٹس 22 غلط ٹیسٹس 18 کل لاگت $0.061 ردِعمل کا وقت (اوسط) 5.52s
#167	Mistral Small 4 medium	Mistral	2	5.1	$0.096	5/22	10.8s
کل ٹیسٹس 22 غلط ٹیسٹس 17 کل لاگت $0.096 ردِعمل کا وقت (اوسط) 10.8s
#178	Ling-2.6-flash none	Inclusionai	2	4.9	$0.002	6/22	10.7s
کل ٹیسٹس 22 غلط ٹیسٹس 16 کل لاگت $0.002 ردِعمل کا وقت (اوسط) 10.7s
#181	Grok 4.20 Multi Agent Beta medium	X AI	2	4.8	$5.599	8/18	9.69s
کل ٹیسٹس 18 غلط ٹیسٹس 10 کل لاگت $5.599 ردِعمل کا وقت (اوسط) 9.69s
#183	Trinity Large Preview none	Arcee AI	2	4.8	$0.008	4/21	2.98s
کل ٹیسٹس 21 غلط ٹیسٹس 17 کل لاگت $0.008 ردِعمل کا وقت (اوسط) 2.98s
#100	Hy3 preview medium	Tencent	3	6.5	$0.018	14/21	16.3s
کل ٹیسٹس 21 غلط ٹیسٹس 7 کل لاگت $0.018 ردِعمل کا وقت (اوسط) 16.3s

←

1 2 3 4 5

→

API خرابی ناکامیاں

ماڈلز فلٹر کریں

API خرابی کی تعداد کے لحاظ سے سرفہرست ماڈلز

API خرابی کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز