Clasament modele pentru Cultură generală

Categorie AI BENCHY

Vezi ce modele AI se descurcă cel mai bine la Cultură generală, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Cost total ↓.

Modele afișate

Media pentru Scor Cultură generală

3.1

Cel mai bun model

Grok 4.20 Multi Agent Beta 0.0

Motive de eșec

Cu motivul de eșec Răspuns greșit133 Cu motivul de eșec Eroare API13 Cu motivul de eșec Fără răspuns8

169/169

Rang	Model	Companie	Scor Cultură generală	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#84	Gemini 3.1 Flash Lite Preview none	Google	3.0	6.4	$0.018	0/1	814ms
Total teste 1 Teste greșite 1 Cost total $0.018 Timp de răspuns (mediu) 814ms
#126	DeepSeek V3.2 none	DeepSeek	3.0	5.3	$0.017	0/1	17.2s
Total teste 1 Teste greșite 1 Cost total $0.017 Timp de răspuns (mediu) 17.2s
#119	MiMo-V2.5-Pro none	Xiaomi	3.0	5.5	$0.017	0/1	1.89s
Total teste 1 Teste greșite 1 Cost total $0.017 Timp de răspuns (mediu) 1.89s
#106	Qwen3.5 Plus 2026-02-15 none	Qwen	3.0	5.8	$0.016	0/1	1.11s
Total teste 1 Teste greșite 1 Cost total $0.016 Timp de răspuns (mediu) 1.11s
#93	Gemini 2.5 Flash none	Google	3.0	6.2	$0.016	0/1	1.15s
Total teste 1 Teste greșite 1 Cost total $0.016 Timp de răspuns (mediu) 1.15s
#104	Qwen3.5-27B none	Qwen	3.0	5.9	$0.015	0/1	599ms
Total teste 1 Teste greșite 1 Cost total $0.015 Timp de răspuns (mediu) 599ms
#102	Qwen3.6 Flash none	Qwen	3.0	6.0	$0.015	0/1	649ms
Total teste 1 Teste greșite 1 Cost total $0.015 Timp de răspuns (mediu) 649ms
#94	Gemini 3.1 Flash Lite minimal	Google	3.0	6.1	$0.013	0/1	724ms
Total teste 1 Teste greșite 1 Cost total $0.013 Timp de răspuns (mediu) 724ms
#96	Gemini 3.1 Flash Lite none	Google	3.0	6.1	$0.013	0/1	733ms
Total teste 1 Teste greșite 1 Cost total $0.013 Timp de răspuns (mediu) 733ms
#78	gpt-oss-120b medium	OpenAI	3.0	6.7	$0.013	0/1	26.5s
Total teste 1 Teste greșite 1 Cost total $0.013 Timp de răspuns (mediu) 26.5s
#103	Qwen3.5-35B-A3B none	Qwen	3.0	5.9	$0.012	0/1	493ms
Total teste 1 Teste greșite 1 Cost total $0.012 Timp de răspuns (mediu) 493ms
#151	Mercury 2 none	Inception	3.0	4.6	$0.011	0/1	548ms
Total teste 1 Teste greșite 1 Cost total $0.011 Timp de răspuns (mediu) 548ms
#145	GPT-5.4 Nano none	OpenAI	3.0	4.8	$0.011	0/1	773ms
Total teste 1 Teste greșite 1 Cost total $0.011 Timp de răspuns (mediu) 773ms
#164	gpt-oss-120b none	OpenAI	3.0	4.0	$0.010	0/1	47.3s
Total teste 1 Teste greșite 1 Cost total $0.010 Timp de răspuns (mediu) 47.3s
#130	Qwen3 Coder Next none	Qwen	3.0	5.1	$0.009	0/1	601ms
Total teste 1 Teste greșite 1 Cost total $0.009 Timp de răspuns (mediu) 601ms

Clasament Cultură generală

Filtrează modelele

Top modele după Scor Cultură generală

Scor Cultură generală vs cost total

Top modele după Timp de răspuns (mediu)