Clasament modele pentru Cultură generală

Categorie AI BENCHY

Vezi ce modele AI se descurcă cel mai bine la Cultură generală, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Timp de răspuns (mediu) ↓.

Modele afișate

Media pentru Scor Cultură generală

3.1

Cel mai bun model

Kimi K2.7 Code 3.0

Motive de eșec

Cu motivul de eșec Răspuns greșit133 Cu motivul de eșec Eroare API13 Cu motivul de eșec Fără răspuns8

169/169

Rang	Model	Companie	Scor Cultură generală	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#114	Mimo V2 Omni none	Xiaomi	3.0	5.7	$0.021	0/1	1.30s
Total teste 1 Teste greșite 1 Cost total $0.021 Timp de răspuns (mediu) 1.30s
#98	Gemma 4 31B none	Google	3.0	6.1	$0.004	0/1	1.25s
Total teste 1 Teste greșite 1 Cost total $0.004 Timp de răspuns (mediu) 1.25s
#60	Qwen3.7 Plus none	Qwen	3.0	7.2	$0.023	0/1	1.21s
Total teste 1 Teste greșite 1 Cost total $0.023 Timp de răspuns (mediu) 1.21s
#93	Gemini 2.5 Flash none	Google	3.0	6.2	$0.016	0/1	1.15s
Total teste 1 Teste greșite 1 Cost total $0.016 Timp de răspuns (mediu) 1.15s
#106	Qwen3.5 Plus 2026-02-15 none	Qwen	3.0	5.8	$0.016	0/1	1.11s
Total teste 1 Teste greșite 1 Cost total $0.016 Timp de răspuns (mediu) 1.11s
#67	Gemini 3 Flash Preview none	Google	3.0	6.9	$0.025	0/1	1.07s
Total teste 1 Teste greșite 1 Cost total $0.025 Timp de răspuns (mediu) 1.07s
#143	Ling-2.6-flash none	Inclusionai	3.0	4.9	$0.001	0/1	1.06s
Total teste 1 Teste greșite 1 Cost total $0.001 Timp de răspuns (mediu) 1.06s
#112	GPT-5.4 none	OpenAI	3.0	5.8	$0.122	0/1	990ms
Total teste 1 Teste greșite 1 Cost total $0.122 Timp de răspuns (mediu) 990ms
#68	Qwen3.7 Max none	Qwen	3.0	6.9	$0.054	0/1	856ms
Total teste 1 Teste greșite 1 Cost total $0.054 Timp de răspuns (mediu) 856ms
#84	Gemini 3.1 Flash Lite Preview none	Google	3.0	6.4	$0.018	0/1	814ms
Total teste 1 Teste greșite 1 Cost total $0.018 Timp de răspuns (mediu) 814ms
#139	GPT-4o-mini none	OpenAI	3.0	5.0	$0.006	0/1	794ms
Total teste 1 Teste greșite 1 Cost total $0.006 Timp de răspuns (mediu) 794ms
#121	Gemma 4 26B A4B none	Google	3.0	5.5	$0.004	0/1	778ms
Total teste 1 Teste greșite 1 Cost total $0.004 Timp de răspuns (mediu) 778ms
#137	Trinity Large Preview none	Arcee AI	3.0	5.0	$0.008	0/1	777ms
Total teste 1 Teste greșite 1 Cost total $0.008 Timp de răspuns (mediu) 777ms
#145	GPT-5.4 Nano none	OpenAI	3.0	4.8	$0.011	0/1	773ms
Total teste 1 Teste greșite 1 Cost total $0.011 Timp de răspuns (mediu) 773ms
#96	Gemini 3.1 Flash Lite none	Google	3.0	6.1	$0.013	0/1	733ms
Total teste 1 Teste greșite 1 Cost total $0.013 Timp de răspuns (mediu) 733ms

Clasament Cultură generală

Filtrează modelele

Top modele după Scor Cultură generală

Scor Cultură generală vs cost total

Top modele după Timp de răspuns (mediu)