Clasament Inteligență generală x Răspuns greșit

Vezi ce modele AI au cele mai mari șanse să întâmpine Răspuns greșit la Inteligență generală, ca să găsești mai repede punctele slabe. Sortează după: Timp de răspuns (mediu) ↑.

Modele afișate

Eșecuri totale

Modelul cel mai afectat

Granite 4.1 8B 1

Motive de eșec

Nu a urmat instrucțiunile78 Răspuns greșit59 Eroare API12 Timp expirat4

Categorii

Specific domeniului412 Trucuri anti-AI293 Programare252 Rezolvare de puzzle-uri201 Cultură generală168 Combinat68 Respectarea instrucțiunilor61 Inteligență generală59 Parsare și extragere de date41 Apelare instrumente3

59/59

Rang	Model	Companie	Număr de Răspuns greșit	Scor de categorie	Cost total	Teste corecte	Timp de răspuns (mediu)
#201	Granite 4.1 8B none	IBM Granite	1	4.0	$0.007	0/1	499ms
Total teste 1 Teste greșite 1 Cost total $0.007 Timp de răspuns (mediu) 499ms
#160	Laguna XS 2.1 none	Poolside	1	5.0	$0.008	0/1	529ms
Total teste 1 Teste greșite 1 Cost total $0.008 Timp de răspuns (mediu) 529ms
#118	Gemini 2.5 Flash none	Google	1	5.0	$0.017	0/1	615ms
Total teste 1 Teste greșite 1 Cost total $0.017 Timp de răspuns (mediu) 615ms
#197	Grok 4.20 none	X AI	1	4.8	$0.057	0/1	659ms
Total teste 1 Teste greșite 1 Cost total $0.057 Timp de răspuns (mediu) 659ms
#165	Mistral Small 4 none	Mistral	1	4.0	$0.022	0/1	729ms
Total teste 1 Teste greșite 1 Cost total $0.022 Timp de răspuns (mediu) 729ms
#151	GLM 5.1 none	Z.ai	1	5.0	$0.164	0/1	790ms
Total teste 1 Teste greșite 1 Cost total $0.164 Timp de răspuns (mediu) 790ms
#164	Inkling none	Thinkingmachines	1	5.0	$0.147	0/1	859ms
Total teste 1 Teste greșite 1 Cost total $0.147 Timp de răspuns (mediu) 859ms
#174	GPT-4o-mini none	OpenAI	1	4.0	$0.010	0/1	909ms
Total teste 1 Teste greșite 1 Cost total $0.010 Timp de răspuns (mediu) 909ms
#177	Nemotron 3 Super none	NVIDIA	1	4.6	$0.008	0/1	950ms
Total teste 1 Teste greșite 1 Cost total $0.008 Timp de răspuns (mediu) 950ms
#122	Gemini 3.1 Flash Lite none	Google	1	4.0	$0.046	0/1	992ms
Total teste 1 Teste greșite 1 Cost total $0.046 Timp de răspuns (mediu) 992ms
#159	GPT-5.6 Luna none	OpenAI	1	5.0	$0.142	0/1	1.00s
Total teste 1 Teste greșite 1 Cost total $0.142 Timp de răspuns (mediu) 1.00s
#132	GPT-5.6 Terra none	OpenAI	1	5.0	$0.349	0/1	1.03s
Total teste 1 Teste greșite 1 Cost total $0.349 Timp de răspuns (mediu) 1.03s
#105	Gemini 3.1 Flash Lite low	Google	1	4.0	$0.621	0/1	1.37s
Total teste 1 Teste greșite 1 Cost total $0.621 Timp de răspuns (mediu) 1.37s
#178	Ling-2.6-flash none	Inclusionai	1	4.0	$0.002	0/1	1.45s
Total teste 1 Teste greșite 1 Cost total $0.002 Timp de răspuns (mediu) 1.45s
#83	GPT-5.6 Sol none	OpenAI	1	6.5	$0.524	0/1	1.52s
Total teste 1 Teste greșite 1 Cost total $0.524 Timp de răspuns (mediu) 1.52s

Filtrează modelele

Top modele după Număr de Răspuns greșit

Număr de Răspuns greșit vs Scor

Top modele după Timp de răspuns (mediu)

Top modele după Cost irosit estimat

Inteligență generală: Răspuns greșit

Filtrează modelele

Top modele după Număr de Răspuns greșit

Număr de Răspuns greșit vs Scor

Top modele după Timp de răspuns (mediu)

Top modele după Cost irosit estimat