Clasament modele pentru Cultură generală

Categorie AI BENCHY

Vezi ce modele AI se descurcă cel mai bine la Cultură generală, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Cost total ↑.

Modele afișate

Media pentru Scor Cultură generală

3.1

Cel mai bun model

Motive de eșec

Cu motivul de eșec Răspuns greșit133 Cu motivul de eșec Eroare API13 Cu motivul de eșec Fără răspuns8

169/169

Rang	Model	Companie	Scor Cultură generală	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#95	Gemini 3.1 Flash Lite Preview high	Google	0.0	6.1	$2.310	0/0	0ms
Total teste 0 Teste greșite 0 Cost total $2.310 Timp de răspuns (mediu) 0ms
#6	Claude Fable 5 medium	Anthropic	3.0	9.2	$3.165	0/1	25.6s
Total teste 1 Teste greșite 1 Cost total $3.165 Timp de răspuns (mediu) 25.6s
#9	GPT-5.5 medium	OpenAI	2.8	9.0	$3.679	0/1	37.9s
Total teste 1 Teste greșite 1 Cost total $3.679 Timp de răspuns (mediu) 37.9s
#136	Grok 4.20 Multi Agent Beta medium	X AI	0.0	5.0	$5.599	0/0	0ms
Total teste 0 Teste greșite 0 Cost total $5.599 Timp de răspuns (mediu) 0ms

Clasament Cultură generală