ڈیٹا پارسنگ اور استخراج x API خرابی درجہ بندی

دیکھیں کہ ڈیٹا پارسنگ اور استخراج میں کن AI ماڈلز کو API خرابی پیش آنے کا سب سے زیادہ امکان ہے، تاکہ آپ کمزوریاں جلدی پہچان سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.

دکھائے گئے ماڈلز

کل ناکامیاں

سب سے زیادہ متاثر ماڈل

Qwen3.5-35B-A3B 1

ناکامی کی وجوہات

غلط جواب41 API خرابی14 کوئی جواب نہیں8 اضافی فارمیٹنگ6 ٹائم آؤٹ1

زمرے

کوڈنگ45 مشترکہ26 ٹول کالنگ17 اینٹی اے آئی چالیں14 ڈیٹا پارسنگ اور استخراج14 معلومات عامہ13 عمومی ذہانت12 پہیلی حل کرنا12 ڈومین مخصوص7 ہدایات کی پیروی1

14/14

درجہ	ماڈل	کمپنی	API خرابی کی تعداد	زمرہ اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#119	Qwen3.5-35B-A3B medium	Qwen	1	7.3	$0.837	1/2	59.3s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.837 ردِعمل کا وقت (اوسط) 59.3s
#114	Qwen3.5-Flash medium	Qwen	1	7.3	$0.139	1/2	57.0s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.139 ردِعمل کا وقت (اوسط) 57.0s
#179	Ring-2.6-1T none	Inclusionai	1	3.0	$0.026	0/2	45.9s
کل ٹیسٹس 2 غلط ٹیسٹس 2 کل لاگت $0.026 ردِعمل کا وقت (اوسط) 45.9s
#200	MiMo-V2-Flash none	Xiaomi	1	2.9	$0.025	0/2	19.7s
کل ٹیسٹس 2 غلط ٹیسٹس 2 کل لاگت $0.025 ردِعمل کا وقت (اوسط) 19.7s
#135	Hy3 preview high	Tencent	1	6.5	$0.048	1/2	12.1s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.048 ردِعمل کا وقت (اوسط) 12.1s
#202	Grok Build 0.1 none	X AI	1	3.8	$0.547	0/2	9.33s
کل ٹیسٹس 2 غلط ٹیسٹس 2 کل لاگت $0.547 ردِعمل کا وقت (اوسط) 9.33s
#79	Gemini 3.5 Flash none	Google	1	6.5	$1.079	1/2	8.10s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $1.079 ردِعمل کا وقت (اوسط) 8.10s
#206	gpt-oss-120b none	OpenAI	1	6.5	$0.010	1/2	7.12s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.010 ردِعمل کا وقت (اوسط) 7.12s
#153	Hy3 preview low	Tencent	1	6.5	$0.015	1/2	5.85s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.015 ردِعمل کا وقت (اوسط) 5.85s
#100	Hy3 preview medium	Tencent	1	6.5	$0.018	1/2	5.25s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.018 ردِعمل کا وقت (اوسط) 5.25s
#199	Hy3 preview none	Tencent	1	6.5	$0.003	1/2	2.85s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.003 ردِعمل کا وقت (اوسط) 2.85s
#167	Mistral Small 4 medium	Mistral	1	7.3	$0.096	1/2	1.23s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.096 ردِعمل کا وقت (اوسط) 1.23s
#113	MiMo-V2-Flash medium	Xiaomi	1	6.5	$0.043	1/2	0ms
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.043 ردِعمل کا وقت (اوسط) 0ms
#209	Step 3.5 Flash none	Stepfun	1	1.5	$0.020	0/1	0ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.020 ردِعمل کا وقت (اوسط) 0ms

ماڈلز فلٹر کریں

API خرابی کی تعداد کے لحاظ سے سرفہرست ماڈلز

API خرابی کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز

تخمینی ضائع لاگت کے لحاظ سے سرفہرست ماڈلز

ڈیٹا پارسنگ اور استخراج: API خرابی

ماڈلز فلٹر کریں

API خرابی کی تعداد کے لحاظ سے سرفہرست ماڈلز

API خرابی کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز

تخمینی ضائع لاگت کے لحاظ سے سرفہرست ماڈلز