Clasament Specific domeniului x Timp expirat

Vezi ce modele AI au cele mai mari șanse să întâmpine Timp expirat la Specific domeniului, ca să găsești mai repede punctele slabe. Sortează după: Timp de răspuns (mediu) ↑.

Modele afișate

Eșecuri totale

Modelul cel mai afectat

Claude Sonnet 4.6 1

Motive de eșec

Răspuns greșit412 Timp expirat43 Formatare suplimentară17 Fără răspuns8 Eroare API7 Nu a urmat instrucțiunile1

Categorii

Specific domeniului43 Programare26 Combinat5 Rezolvare de puzzle-uri5 Inteligență generală4 Trucuri anti-AI4 Parsare și extragere de date1 Respectarea instrucțiunilor1

32/32

Rang	Model	Companie	Număr de Timp expirat	Scor de categorie	Cost total	Teste corecte	Timp de răspuns (mediu)
#40	Claude Sonnet 4.6 medium	Anthropic	1	2.9	$2.057	0/3	0ms
Total teste 3 Teste greșite 3 Cost total $2.057 Timp de răspuns (mediu) 0ms
#42	GLM 5 medium	Z.ai	1	3.5	$0.307	0/3	0ms
Total teste 3 Teste greșite 3 Cost total $0.307 Timp de răspuns (mediu) 0ms
#80	Seed-2.0-Mini medium	Bytedance Seed	3	3.0	$0.101	0/3	0ms
Total teste 3 Teste greșite 3 Cost total $0.101 Timp de răspuns (mediu) 0ms
#15	Claude Opus 4.7 medium	Anthropic	1	7.7	$1.477	2/3	1.17s
Total teste 3 Teste greșite 1 Cost total $1.477 Timp de răspuns (mediu) 1.17s
#109	Mimo V2 PRO medium	Xiaomi	1	5.3	$0.333	1/3	8.82s
Total teste 3 Teste greșite 2 Cost total $0.333 Timp de răspuns (mediu) 8.82s
#184	Hunter Alpha medium	OpenRouter	1	3.0	$0.000	0/3	10.5s
Total teste 3 Teste greșite 3 Cost total $0.000 Timp de răspuns (mediu) 10.5s
#140	Nemotron 3 Super medium	NVIDIA	1	2.9	$0.050	0/3	16.2s
Total teste 3 Teste greșite 3 Cost total $0.050 Timp de răspuns (mediu) 16.2s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	1	5.3	$0.437	1/3	17.5s
Total teste 3 Teste greșite 2 Cost total $0.437 Timp de răspuns (mediu) 17.5s
#172	MiniMax M2.7 medium	Minimax	2	3.0	$0.163	0/3	19.0s
Total teste 3 Teste greșite 3 Cost total $0.163 Timp de răspuns (mediu) 19.0s
#95	Gemma 4 26B A4B medium	Google	1	2.9	$0.089	0/3	23.6s
Total teste 3 Teste greșite 3 Cost total $0.089 Timp de răspuns (mediu) 23.6s
#76	DeepSeek V3.2 medium	DeepSeek	1	2.9	$0.078	0/3	24.3s
Total teste 3 Teste greșite 3 Cost total $0.078 Timp de răspuns (mediu) 24.3s
#74	GLM 5.1 medium	Z.ai	1	5.3	$0.535	1/3	29.8s
Total teste 3 Teste greșite 2 Cost total $0.535 Timp de răspuns (mediu) 29.8s
#26	GPT-5 Mini medium	OpenAI	1	3.6	$0.237	0/3	44.6s
Total teste 3 Teste greșite 3 Cost total $0.237 Timp de răspuns (mediu) 44.6s
#38	GLM 5.2 medium	Z.ai	1	4.1	$0.222	0/3	45.5s
Total teste 3 Teste greșite 3 Cost total $0.222 Timp de răspuns (mediu) 45.5s
#49	GLM 5 Turbo medium	Z.ai	1	2.9	$0.323	0/3	71.1s
Total teste 3 Teste greșite 3 Cost total $0.323 Timp de răspuns (mediu) 71.1s

Filtrează modelele

Top modele după Număr de Timp expirat

Număr de Timp expirat vs Scor

Top modele după Timp de răspuns (mediu)

Top modele după Cost irosit estimat

Specific domeniului: Timp expirat

Filtrează modelele

Top modele după Număr de Timp expirat

Număr de Timp expirat vs Scor

Top modele după Timp de răspuns (mediu)

Top modele după Cost irosit estimat