Clasament modele pentru Cultură generală

Categorie AI BENCHY

Vezi ce modele AI se descurcă cel mai bine la Cultură generală, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Cost total ↑.

Modele afișate

Media pentru Scor Cultură generală

3.1

Cel mai bun model

North Mini Code 3.0

Motive de eșec

Cu motivul de eșec Răspuns greșit133 Cu motivul de eșec Eroare API13 Cu motivul de eșec Fără răspuns8

169/169

Rang	Model	Companie	Scor Cultură generală	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#117	DeepSeek V4 Flash none	DeepSeek	3.0	5.5	$0.007	0/1	3.07s
Total teste 1 Teste greșite 1 Cost total $0.007 Timp de răspuns (mediu) 3.07s
#161	Grok 4.1 Fast none	X AI	3.0	4.0	$0.008	0/1	731ms
Total teste 1 Teste greșite 1 Cost total $0.008 Timp de răspuns (mediu) 731ms
#137	Trinity Large Preview none	Arcee AI	3.0	5.0	$0.008	0/1	777ms
Total teste 1 Teste greșite 1 Cost total $0.008 Timp de răspuns (mediu) 777ms
#148	Qwen3 Coder Next medium	Qwen	3.0	4.7	$0.008	0/1	399ms
Total teste 1 Teste greșite 1 Cost total $0.008 Timp de răspuns (mediu) 399ms
#130	Qwen3 Coder Next none	Qwen	3.0	5.1	$0.009	0/1	601ms
Total teste 1 Teste greșite 1 Cost total $0.009 Timp de răspuns (mediu) 601ms
#164	gpt-oss-120b none	OpenAI	3.0	4.0	$0.010	0/1	47.3s
Total teste 1 Teste greșite 1 Cost total $0.010 Timp de răspuns (mediu) 47.3s
#145	GPT-5.4 Nano none	OpenAI	3.0	4.8	$0.011	0/1	773ms
Total teste 1 Teste greșite 1 Cost total $0.011 Timp de răspuns (mediu) 773ms
#151	Mercury 2 none	Inception	3.0	4.6	$0.011	0/1	548ms
Total teste 1 Teste greșite 1 Cost total $0.011 Timp de răspuns (mediu) 548ms
#103	Qwen3.5-35B-A3B none	Qwen	3.0	5.9	$0.012	0/1	493ms
Total teste 1 Teste greșite 1 Cost total $0.012 Timp de răspuns (mediu) 493ms
#78	gpt-oss-120b medium	OpenAI	3.0	6.7	$0.013	0/1	26.5s
Total teste 1 Teste greșite 1 Cost total $0.013 Timp de răspuns (mediu) 26.5s
#96	Gemini 3.1 Flash Lite none	Google	3.0	6.1	$0.013	0/1	733ms
Total teste 1 Teste greșite 1 Cost total $0.013 Timp de răspuns (mediu) 733ms
#94	Gemini 3.1 Flash Lite minimal	Google	3.0	6.1	$0.013	0/1	724ms
Total teste 1 Teste greșite 1 Cost total $0.013 Timp de răspuns (mediu) 724ms
#102	Qwen3.6 Flash none	Qwen	3.0	6.0	$0.015	0/1	649ms
Total teste 1 Teste greșite 1 Cost total $0.015 Timp de răspuns (mediu) 649ms
#104	Qwen3.5-27B none	Qwen	3.0	5.9	$0.015	0/1	599ms
Total teste 1 Teste greșite 1 Cost total $0.015 Timp de răspuns (mediu) 599ms
#93	Gemini 2.5 Flash none	Google	3.0	6.2	$0.016	0/1	1.15s
Total teste 1 Teste greșite 1 Cost total $0.016 Timp de răspuns (mediu) 1.15s

Clasament Cultură generală

Filtrează modelele

Top modele după Scor Cultură generală

Scor Cultură generală vs cost total

Top modele după Timp de răspuns (mediu)