Clasament Parsare și extragere de date x Eroare API

Vezi ce modele AI au cele mai mari șanse să întâmpine Eroare API la Parsare și extragere de date, ca să găsești mai repede punctele slabe. Sortează după: Teste corecte ↓.

Modele afișate

Eșecuri totale

Modelul cel mai afectat

Gemini 3.5 Flash 1

Motive de eșec

Răspuns greșit41 Eroare API14 Fără răspuns8 Formatare suplimentară6 Timp expirat1

Categorii

Programare45 Combinat26 Apelare instrumente17 Parsare și extragere de date14 Trucuri anti-AI14 Cultură generală13 Inteligență generală12 Rezolvare de puzzle-uri12 Specific domeniului7 Respectarea instrucțiunilor1

14/14

Rang	Model	Companie	Număr de Eroare API	Scor de categorie	Cost total	Teste corecte	Timp de răspuns (mediu)
#79	Gemini 3.5 Flash none	Google	1	6.5	$1.079	1/2	8.10s
Total teste 2 Teste greșite 1 Cost total $1.079 Timp de răspuns (mediu) 8.10s
#100	Hy3 preview medium	Tencent	1	6.5	$0.018	1/2	5.25s
Total teste 2 Teste greșite 1 Cost total $0.018 Timp de răspuns (mediu) 5.25s
#113	MiMo-V2-Flash medium	Xiaomi	1	6.5	$0.043	1/2	0ms
Total teste 2 Teste greșite 1 Cost total $0.043 Timp de răspuns (mediu) 0ms
#114	Qwen3.5-Flash medium	Qwen	1	7.3	$0.139	1/2	57.0s
Total teste 2 Teste greșite 1 Cost total $0.139 Timp de răspuns (mediu) 57.0s
#119	Qwen3.5-35B-A3B medium	Qwen	1	7.3	$0.837	1/2	59.3s
Total teste 2 Teste greșite 1 Cost total $0.837 Timp de răspuns (mediu) 59.3s
#135	Hy3 preview high	Tencent	1	6.5	$0.048	1/2	12.1s
Total teste 2 Teste greșite 1 Cost total $0.048 Timp de răspuns (mediu) 12.1s
#153	Hy3 preview low	Tencent	1	6.5	$0.015	1/2	5.85s
Total teste 2 Teste greșite 1 Cost total $0.015 Timp de răspuns (mediu) 5.85s
#167	Mistral Small 4 medium	Mistral	1	7.3	$0.096	1/2	1.23s
Total teste 2 Teste greșite 1 Cost total $0.096 Timp de răspuns (mediu) 1.23s
#199	Hy3 preview none	Tencent	1	6.5	$0.003	1/2	2.85s
Total teste 2 Teste greșite 1 Cost total $0.003 Timp de răspuns (mediu) 2.85s
#206	gpt-oss-120b none	OpenAI	1	6.5	$0.010	1/2	7.12s
Total teste 2 Teste greșite 1 Cost total $0.010 Timp de răspuns (mediu) 7.12s
#179	Ring-2.6-1T none	Inclusionai	1	3.0	$0.026	0/2	45.9s
Total teste 2 Teste greșite 2 Cost total $0.026 Timp de răspuns (mediu) 45.9s
#200	MiMo-V2-Flash none	Xiaomi	1	2.9	$0.025	0/2	19.7s
Total teste 2 Teste greșite 2 Cost total $0.025 Timp de răspuns (mediu) 19.7s
#202	Grok Build 0.1 none	X AI	1	3.8	$0.547	0/2	9.33s
Total teste 2 Teste greșite 2 Cost total $0.547 Timp de răspuns (mediu) 9.33s
#209	Step 3.5 Flash none	Stepfun	1	1.5	$0.020	0/1	0ms
Total teste 1 Teste greșite 1 Cost total $0.020 Timp de răspuns (mediu) 0ms

Filtrează modelele

Top modele după Număr de Eroare API

Număr de Eroare API vs Scor

Top modele după Timp de răspuns (mediu)

Top modele după Cost irosit estimat

Parsare și extragere de date: Eroare API

Filtrează modelele

Top modele după Număr de Eroare API

Număr de Eroare API vs Scor

Top modele după Timp de răspuns (mediu)

Top modele după Cost irosit estimat