Clasament modele pentru Cultură generală

Categorie AI BENCHY

Vezi ce modele AI se descurcă cel mai bine la Cultură generală, care rămân fiabile și unde apar cele mai mari diferențe.

Modele afișate

Media pentru Scor Cultură generală

3.1

Cel mai bun model

Gemini 3.5 Flash 10.0

Motive de eșec

Cu motivul de eșec Răspuns greșit133 Cu motivul de eșec Eroare API13 Cu motivul de eșec Fără răspuns8

169/169

Rang	Model	Companie	Scor Cultură generală	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#97	Qwen3.5-Flash none	Qwen	3.0	6.1	$0.005	0/1	588ms
Total teste 1 Teste greșite 1 Cost total $0.005 Timp de răspuns (mediu) 588ms
#98	Gemma 4 31B none	Google	3.0	6.1	$0.004	0/1	1.25s
Total teste 1 Teste greșite 1 Cost total $0.004 Timp de răspuns (mediu) 1.25s
#99	Nemotron 3 Ultra 550b A55b none	NVIDIA	3.0	6.1	$0.027	0/1	1.83s
Total teste 1 Teste greșite 1 Cost total $0.027 Timp de răspuns (mediu) 1.83s
#100	Qwen3.6 Max Preview none	Qwen	3.0	6.0	$0.075	0/1	1.97s
Total teste 1 Teste greșite 1 Cost total $0.075 Timp de răspuns (mediu) 1.97s
#101	GLM 5 none	Z.ai	3.0	6.0	$0.027	0/1	3.62s
Total teste 1 Teste greșite 1 Cost total $0.027 Timp de răspuns (mediu) 3.62s
#102	Qwen3.6 Flash none	Qwen	3.0	6.0	$0.015	0/1	649ms
Total teste 1 Teste greșite 1 Cost total $0.015 Timp de răspuns (mediu) 649ms
#103	Qwen3.5-35B-A3B none	Qwen	3.0	5.9	$0.012	0/1	493ms
Total teste 1 Teste greșite 1 Cost total $0.012 Timp de răspuns (mediu) 493ms
#104	Qwen3.5-27B none	Qwen	3.0	5.9	$0.015	0/1	599ms
Total teste 1 Teste greșite 1 Cost total $0.015 Timp de răspuns (mediu) 599ms
#105	GLM 5V Turbo none	Z.ai	3.0	5.9	$0.052	0/1	2.23s
Total teste 1 Teste greșite 1 Cost total $0.052 Timp de răspuns (mediu) 2.23s
#106	Qwen3.5 Plus 2026-02-15 none	Qwen	3.0	5.8	$0.016	0/1	1.11s
Total teste 1 Teste greșite 1 Cost total $0.016 Timp de răspuns (mediu) 1.11s
#107	North Mini Code medium	Cohere	3.0	5.8	$0.000	0/1	305.0s
Total teste 1 Teste greșite 1 Cost total $0.000 Timp de răspuns (mediu) 305.0s
#108	Owl Alpha medium	Openrouter	3.0	5.8	$0.000	0/1	2.38s
Total teste 1 Teste greșite 1 Cost total $0.000 Timp de răspuns (mediu) 2.38s
#109	Mimo V2 PRO none	Xiaomi	3.0	5.8	$0.045	0/1	1.63s
Total teste 1 Teste greșite 1 Cost total $0.045 Timp de răspuns (mediu) 1.63s
#110	Owl Alpha none	Openrouter	3.0	5.8	$0.000	0/1	2.50s
Total teste 1 Teste greșite 1 Cost total $0.000 Timp de răspuns (mediu) 2.50s
#111	Kimi K2.6 none	Moonshot AI	3.0	5.8	$0.079	0/1	1.36s
Total teste 1 Teste greșite 1 Cost total $0.079 Timp de răspuns (mediu) 1.36s

Clasament Cultură generală

Filtrează modelele

Top modele după Scor Cultură generală

Scor Cultură generală vs cost total

Top modele după Timp de răspuns (mediu)