Clasament modele pentru Cultură generală

Categorie AI BENCHY

Vezi ce modele AI se descurcă cel mai bine la Cultură generală, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Teste corecte ↓.

Modele afișate

Media pentru Scor Cultură generală

3.1

Cel mai bun model

Gemini 3.5 Flash 10.0

Motive de eșec

Cu motivul de eșec Răspuns greșit133 Cu motivul de eșec Eroare API13 Cu motivul de eșec Fără răspuns8

169/169

Rang	Model	Companie	Scor Cultură generală	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#91	Gemini 3 PRO Preview medium	Google	3.0	6.2	$0.385	0/1	0ms
Total teste 1 Teste greșite 1 Cost total $0.385 Timp de răspuns (mediu) 0ms
#92	Seed-2.0-Lite none	Bytedance Seed	3.0	6.2	$0.019	0/1	1.96s
Total teste 1 Teste greșite 1 Cost total $0.019 Timp de răspuns (mediu) 1.96s
#93	Gemini 2.5 Flash none	Google	3.0	6.2	$0.016	0/1	1.15s
Total teste 1 Teste greșite 1 Cost total $0.016 Timp de răspuns (mediu) 1.15s
#94	Gemini 3.1 Flash Lite minimal	Google	3.0	6.1	$0.013	0/1	724ms
Total teste 1 Teste greșite 1 Cost total $0.013 Timp de răspuns (mediu) 724ms
#95	Gemini 3.1 Flash Lite Preview high	Google	0.0	6.1	$2.310	0/0	0ms
Total teste 0 Teste greșite 0 Cost total $2.310 Timp de răspuns (mediu) 0ms
#96	Gemini 3.1 Flash Lite none	Google	3.0	6.1	$0.013	0/1	733ms
Total teste 1 Teste greșite 1 Cost total $0.013 Timp de răspuns (mediu) 733ms
#97	Qwen3.5-Flash none	Qwen	3.0	6.1	$0.005	0/1	588ms
Total teste 1 Teste greșite 1 Cost total $0.005 Timp de răspuns (mediu) 588ms
#98	Gemma 4 31B none	Google	3.0	6.1	$0.004	0/1	1.25s
Total teste 1 Teste greșite 1 Cost total $0.004 Timp de răspuns (mediu) 1.25s
#99	Nemotron 3 Ultra 550b A55b none	NVIDIA	3.0	6.1	$0.027	0/1	1.83s
Total teste 1 Teste greșite 1 Cost total $0.027 Timp de răspuns (mediu) 1.83s
#100	Qwen3.6 Max Preview none	Qwen	3.0	6.0	$0.075	0/1	1.97s
Total teste 1 Teste greșite 1 Cost total $0.075 Timp de răspuns (mediu) 1.97s
#101	GLM 5 none	Z.ai	3.0	6.0	$0.027	0/1	3.62s
Total teste 1 Teste greșite 1 Cost total $0.027 Timp de răspuns (mediu) 3.62s
#102	Qwen3.6 Flash none	Qwen	3.0	6.0	$0.015	0/1	649ms
Total teste 1 Teste greșite 1 Cost total $0.015 Timp de răspuns (mediu) 649ms
#103	Qwen3.5-35B-A3B none	Qwen	3.0	5.9	$0.012	0/1	493ms
Total teste 1 Teste greșite 1 Cost total $0.012 Timp de răspuns (mediu) 493ms
#104	Qwen3.5-27B none	Qwen	3.0	5.9	$0.015	0/1	599ms
Total teste 1 Teste greșite 1 Cost total $0.015 Timp de răspuns (mediu) 599ms
#105	GLM 5V Turbo none	Z.ai	3.0	5.9	$0.052	0/1	2.23s
Total teste 1 Teste greșite 1 Cost total $0.052 Timp de răspuns (mediu) 2.23s

Clasament Cultură generală

Filtrează modelele

Top modele după Scor Cultură generală

Scor Cultură generală vs cost total

Top modele după Timp de răspuns (mediu)